Skip to content

dsakryk/iiiFinalProject

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

4 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

iiiProject
|---CrawlerAndETL                                
    爬蟲與ETL
    |---Steam
        |---Crawler
            |---all_steam_pages.py               
                抓取Steam美國網站上所有遊戲網頁的連結
            |---CrawlerLBHaboutXML2.py           
                藉由先前的連結檔案,抓取價格記錄與網頁內容
            |---CrawlerLBHaboutXMLFromUSA.py     
                抓取美國網站的所有價格記錄與網頁內容
            |---CrawlerLBHaboutXMLMoreThan18.py  
                抓取18禁的遊戲價格記錄與網頁內容
            |---CrawlerSteamPagesLinksLYT.py     
                抽出所有遊戲頁面連結
        |---Extrat
            |---ExtractAllContent.py             
                將所有抓下來的遊戲網頁進行抽取的動作(需修改檔案路徑)
            |---ExtractSubContent.py             
                將所有抓下來的遊戲補充包網頁進行抽取的動作(需修改檔案路徑)
            |---ExtractAllContentForTest.py      
                第二步驟的測試檔
            |---ExtractPriceHistory.py           
                將價格紀錄網頁擷取儲存成csv
            |---ExtractSteamTag.py               
                抽出該遊戲的所有遊戲標籤
        |---Transform
            |---OrganizeSteamPrice.py            
                將Steam的每天日期價格補齊
    |---IsThereAnyDeal
        |---CrawlerAndExtract
            |---historyAjaxs(inputIsHttpLink).py 
                抓取歷史價格
        |---Transform
            |---isthereanydeal_to_MetaCritic.py
            |---isthereanydeal_to_Steam.py   
                取得兩網站對應的遊戲名稱
    |---MetaCritic
        |---MGameETL.py                          
            MetaCritic.com 的內容爬取程式
        |---MContentCrawler.py        
        |---MGameLinkCrawler.py
        |---MNavLinkCrawler.py    
    |---PythonETL
        |---DetermineTheStatus.py                
            判斷價格狀態程式 0無變化 1有降價 2有漲價
        |---OFFER3.py                            
            樞紐轉換的程式
    |---SQLServer
        |---Query
            |---SQLQueryClass1023.sql            
                日期期間狀態的判斷程式
            |---SQLQuerydatediffcount.sql        
                計算每個日期區間有幾筆特價記錄
        |---Scalar Function
            |---INIDOUTSNAME_ID.sql              
                輸入ID輸出SNAME
            |---INSGNAMEOUTID_SGNAME.sql         
                輸入SGNAME輸出ID
            |---INTINTEGER.sql                   
                判斷大於0的值
            |---SCORE_SCORE,ID.sql               
                為了補齊SCORE,沒有的就使用評論分數的平均
            |---VACATION_DATE.sql                
                判斷是否為假日
        |---Stored Procedure
            |---CLASSBIGTABLE.sql                
                邏輯式回歸使用的大表 JOIN SGAMETAGTF
                , SLANGUAGES, ALLCLUSTER_1639, SPROFILE.SCORE
            |---CSATTR.sql                       
                邏輯式回歸使用的大表 JOIN 日期區間判斷, SGAMETAGTF, 
            |---GPHISTORY_ID,COM.sql             
                輸入ID, company 輸出歷史價格資料
            |---IPLOGICDATE.sql                  
                邏輯式回歸使用的日期分開格式
            |---IPRICEVT.sql                     
                IPrice連接假期判斷
            |---MERGETABLE.sql                   
                MERGE TABLE WITH SGAMETAGTF,SLANGUAGES,PAMK_1639
            |---SPLOGICDATE.sql                  
                CREATION DATE TABLE WITH ID CONTROL
            |---AllScalarFunction.sql            
                包含所有的function
|---HowToUse                                     
    分析方法與連結資料庫使用的R檔
|---analysisData                                 
    資料分析 內含專題的時間序列分群、 邏輯式迴歸與時間序列分類整合檔
    |---data
        |---getDay
            |---forTestLogisticPredict.RDS
            |---logisticRegressionModel.RDS
            |---Model.RDS
        |---oGetClusterName
            |---allGameName_Tags_ClusterNumber.RDS
        |---toShinyServer
            |---gameDetail.csv
        |---alltags.RDS
        |---ForCRASHNew.csv
        |---originprice.csv
        |---unitTest.RDS
    |---generateResult.R                         
        計算結果,並以list型態回傳遊戲名、折扣數與天數
        (內含時間序列分群、邏輯式迴歸、時間序列分類)
    |---getDiscount.R                            
        計算折扣數
    |---ourTreasure.R                            
        尚未整合的generate.R 
    |---unitTest.RDS                             
        用來測試各function的檔案
|---WebDesign                                    
    網頁作品,內含專題的作品
    |---ShinyProduct                             
        專題作品
        |---gamePredict                          
            遊戲價格預測作品
        |---analysisMD                           
            部分研究方法體驗
|---test         
    測試檔案
|---tools                                        
    將多個csv合併成一個csv

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors