跳至內容

Kaggle

出自Taiwan Tongues 台語維基
於 2025年8月23日 (六) 15:05 由 TaiwanTonguesApiRobot留言 | 貢獻 所做的修訂 (從 JSON 檔案批量匯入)

(差異) ←上個修訂 | 已批准修訂 (差異) | 最新修訂 (差異) | 下個修訂→ (差異)

Kaggle是一个數據建模和數據分析競賽平台。企業佮研究者會當佇其中發布數據,統計學者佮數據咧挖專家會當佇咧其上進行競賽以產生上好的模型。這一眾包模式依賴佇這事實,也有濟濟的策略通用來解決強欲所有預測建模的問題,研究者無可能佇一開始就了解啥物方法對特定的問題是上為有效的。Kaggle 的目標是咧試圖通過眾包的形式來解決這一難題,進一步數據科學成做一場運動。二空一七年三月八日谷歌官方博客宣佈收購 Kaggle。

競賽流程

Kaggle 中組織一場競賽的過程如下。

一 . 競賽主持人準備數據佮問題的描述。Kaggle 對這一過程佮競賽的建構、數據的匿名化佮集做最後獲勝的模型提供諮詢服務。 二 . 參與者通過無仝的方法進行實驗,互相競賽以上優的模型。對大多數的參與者,𪜶的提交會根據預測精度被隨評分,閣佇實時的積分榜頂懸咧顯示。 三 . 伊過後佇咧截止時間過後,競賽主持人為「全球性的,永久性的,袂使撤銷佮免版稅地使用獲獎作品」支付彼个獎金。亦即競賽獲勝者的算法、軟體佮相關的智慧財產權是非排伊性的,除非講特別指明。

除了公開競賽以外,Kaggle 閣向活跳參與者提供私底下的比賽,閣有為大學團體提供 Kaggle-in-Class 項目。

影響

根據 Kaggle 官方提供的數據,Kaggle 佇咧全球的範圍內底有欲倚二十萬名數據科學家,專業領域對計算機科學到統計學、經濟學佮數學。Kaggle 嘛捌和 NASA、維基百科、德勤佮好事來達合作舉辦競賽。其中的一項獎項有三百萬美金的競賽是 Heritage Health Prize,目的是通過病人看病佮食藥仔蹛院等數據預測明年病人蹛院的天數。另外一項佮微軟合作的競賽是旨咧提懸 Kinect 的手勢識別精度。

Kaggle 的競賽佇愛滋病研究、棋牌評級佮交通預測方面取得成果。因為遮的成果產生一系列的學術論文。產生這一結果的原因是實時積分榜促使參加者不斷改進以試圖超越當前的最佳實踐。獲勝的方法定定佇咧 Kaggle 的博客 _ No Free Hunch _ 上展示。

融資

二空一一年,Kaggle 對創辦地澳大利亞墨爾本搬徙來到美國舊金山,佇十一月宣佈向矽谷投資者進行規模為一千一百萬美金的首輪融資。指數風險投資公司佮科斯拉風險投資公司成做 Kaggle 上大的股東,而且 PayPal 聯合創始人馬克斯 ・ 列夫琴嘛有參加這个輪投資並成做 Kaggle 的董事局主席。另外一个出名的投資人是經濟學家,Google 首席經濟師哈爾 ・ 范里安。伊叫 Kaggle 提供一種「共全世界上有才調的數據科學家組織起來並使各種規模的機構攏會當觸著」的方式。

參見

  • 數據科學
  • TopCoder

參考資料

擴展閱讀

  • " Competition shines light on dark matter " , Office of Science and Technology Policy , Whitehouse website , June 二千空一十一
  • " May the best algorithm win . . . " , _ The Wall Street Journal _ , March 二千空一十一
  • " Kaggle contest aims to boost Wikipedia editors " , _ New Scientist _ , July 二千空一十一
  • " Verification of systems biology research in the age of collaborative competition " , _ Nature Nanotechnology _ , September 二千空一十一

外部連結

  • 官方網站
  • _ No Free Hunch _ , the Kaggle blog