Kaggle大師教您用Python玩資料科學,比賽拿獎金 | 做自己 - 2024年7月

Kaggle大師教您用Python玩資料科學,比賽拿獎金

作者:石原祥太郎村田秀樹
出版社:碁峰
出版日期:2021年04月12日
ISBN:9789865027681
語言:繁體中文
售價:432元

  本書是利用Python參加機器學習競賽「kaggle」的入門書。一開始先以適合初學者學習的「Titanic:Machine Learning from Disater」競賽學習Kaggle的基礎。從中除了可學習實踐Titanic的方法,還能掌握自行參加競賽所需的知識。 
 
本書特色
 
  .為了kaggle撰寫的習作教學書籍 
  .每一章或每一節都有具體的主題,可讓讀者按部就班地掌握需要的知識 
  .解說各種表單、圖片檔、文字檔的操作方法,作為進入下一個競賽的路標。 
  .兩位執筆者都擁有「Kaggle Master」的稱號,也有賺到獎金的經驗 
  .除了說明之外,還有兩位筆者的對談,從不同的角度介紹Kaggle的魅力 
  .會為程式設計與Python的初學者詳細講解範例程式 

作者簡介
 
石原祥太郎(u++) 
 
  .Kaggle Master(kaggle.com/sishihara)。 
  .2019年4月於「PetFinder.my Adoption Prediction」競賽獲得冠軍。 
  .2019年12月協助舉辦「Kaggle Days Tokyo」的競賽。 
  .於2019年3月在Qiita公開的Kaggle入門文章得到1600個讚。 
  .於日本經濟新聞社從事資料分析。 
 
村田秀樹(咖哩) 
 
  .Kaggle Master(kaggle.com/currypurin)。 
  .2018年8月於「Santander Value Prediction Challenge」競賽得到solo gold medal(第8名)。 
  .2019年6月於「LANL Earthquake Prediction」競賽得到第三名。 
  .為了Kaggle初學者所寫的同人誌《Kaggle的習作》累計賣出2500本。 
  .從2018年7月開始成為專職Kaggler。 

第1章|了解Kaggle 
1.1 何謂Kaggle 
1.2 於Kaggle使用的機器學習 
1.3 建立Kaggle的帳號 
1.4 Competitions 頁面的概要 
1.5 不需另行建置環境的「Notebooks」的使用方法 

第2章|著手進行Titanic 
2.1 先submit !試著寫進順位表 
2.2 掌握全貌!了解submit之前的處理流程 
2.3 找出下一步!試著進行探索式資料分析 
2.4 在此拉開差距!基於假設建立新的特徵值 
2.5 決策樹是最強的演算法?試著使用各種機器學習演算法 
2.6 機器學習演算法的心情?試著調整超參數 
2.7 在submit 之前!了解「Cross Validation」的重要性 
2.8 「三個臭皮匠,勝過一個諸葛亮!」體驗集成學習 

第3章|往Titanic的下個階段前進 
3.1 操作多個表格 
3.2 操作影像資料 
3.3 操作文字資料 

第4章|為了進一步學習 
4.1 挑選競賽的方法 
4.2 初學者適用的參賽方式 
4.3 可選擇的分析環境 
4.4 值得參考的資料、文獻、連結 
4.5 第4 章總結 

附錄A|範例程式碼詳細解說


相關書籍