ELFOpenGo
ELF OpenGo是 Facebook AI Research 團隊(FAIR)所開發的電腦圍棋軟體佮所釋出來的資料。
簡介
ELF OpenGo 是 Facebook AI Research 團隊(FAIR)依照 DeepMind 佇科學期刊《自然》頂懸對 AlphaGo Zero 所發表的論文《Mastering the game of Go without human knowledge》佮 AlphaZero 的論文《Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm》所實在做出來的開源電腦圍棋程式,也就是無咧使用人類棋譜佮累積的圍棋智識,干焦實在做圍棋規則,使用單一類神經網路對自我對弈中學習(無成 AlphaGo 以人類的角度思考,設計矣 Policy Network 佮 Value Network)。
訓練網路使用二十 blocks x 兩百二十四 filters,在兩千個 GPU 下訓練兩禮拜,相比並 AlphaGo Zero 使用的二十 blocks x 兩百五十六 filters 版本略小寡(AlphaGo Zero 另外閣有四十喔 blocks x 兩百五十六 filters)。
因為 Facebook 所有的計算資源,產生出高品質的訓練網路資料佮對局棋譜,真濟有仝款的演算法抑是講 AlphaGo 相關論文內容的圍棋軟體攏積極測試 ELF OpenGo 所提供的訓練資料。
成績
著電腦
Leela Zero
Leela Zero 是目前少數有公開程式碼並公開訓練網路資料的圍棋軟體,而且猶原有志願者繼續投入資源計算演化,故不時予人當做其他圍棋軟體的基準。
由 Facebook 家己測試,ELF OpenGo 佮 Leela Zero 對戰的成績為一百九十八 : 二。佇咧 Leela Zero 的進度網站頂懸嘛定定會較現有訓練網路佮 ELF OpenGo 的較。
CGOS
志願者佇 CGOS 最使用 Leela Zero 的程式 ia̋n-jín 以及由 ELF OpenGo 公開的訓練網路(v 零)轉換做 Leela Zero 格式的訓練網路(即 Hash 值 ` 六十二 b 五千四百十七 b ` 的訓練網路,數號 ` LZ _ 六十二 b 五百四十一 _ ELF _ 千六百 `)做對弈測試,毋過因為目前佇 CGOS 試起來毋是 ELF Go 的程式 ia̋n-jín,臭奶呆 ELF OpenGo 的訓練資料佇轉換以後的影響。節甲二空一八年五月三十號 ( 二千空一十八拍五鋪三十 ),著弈已經超過一千盤,BayesElo 分數差不多三千七百七十分。
著人
Facebook 佮韓國棋院合作,以中國規則佮韓國的世界頂尖棋手對弈(貼目七孵五目), 佇電腦每一步限制五十秒(使用單機單張 NVIDIA Tesla V 一百), 人類無限時間的前提落來,一个人至少下兩局,達到十四 : 零的成績,著弈對手包括金志錫、申真響、朴永訓以及崔哲瀚。
相關連結
- AlphaGo Zero,所參考論文的電腦圍棋軟體。
- Darkforest,頂一代 Facebook 所開發的電腦圍棋軟體。
- Leela Zero,另外一套嘛是照 AlphaGo Zero 所實在做的開源電腦圍棋軟體,佇咧 ELF OpenGo 測試的時陣予人當做較基準。
- 電腦圍棋
- 圍棋軟體
參考資料
註解
外部連結
- 官方網站
- pytorch / ELF : ELF : a platform for game research