<?xml version="1.0"?>
<feed xmlns="http://www.w3.org/2005/Atom" xml:lang="zh-Hant-TW">
	<id>https://wiki.taigi.ima.org.tw/w/index.php?action=history&amp;feed=atom&amp;title=AlphaZero</id>
	<title>AlphaZero - 修訂紀錄</title>
	<link rel="self" type="application/atom+xml" href="https://wiki.taigi.ima.org.tw/w/index.php?action=history&amp;feed=atom&amp;title=AlphaZero"/>
	<link rel="alternate" type="text/html" href="https://wiki.taigi.ima.org.tw/w/index.php?title=AlphaZero&amp;action=history"/>
	<updated>2026-06-03T18:19:13Z</updated>
	<subtitle>本 wiki 上此頁面的修訂紀錄</subtitle>
	<generator>MediaWiki 1.43.1</generator>
	<entry>
		<id>https://wiki.taigi.ima.org.tw/w/index.php?title=AlphaZero&amp;diff=358407&amp;oldid=prev</id>
		<title>TaiwanTonguesApiRobot：​從 JSON 檔案批量匯入</title>
		<link rel="alternate" type="text/html" href="https://wiki.taigi.ima.org.tw/w/index.php?title=AlphaZero&amp;diff=358407&amp;oldid=prev"/>
		<updated>2025-08-22T03:05:17Z</updated>

		<summary type="html">&lt;p&gt;從 JSON 檔案批量匯入&lt;/p&gt;
&lt;p&gt;&lt;b&gt;新頁面&lt;/b&gt;&lt;/p&gt;&lt;div&gt;&amp;#039;&amp;#039;&amp;#039;AlphaZero&amp;#039;&amp;#039;&amp;#039;是 DeepMind 所開發的人工智慧軟體。&lt;br /&gt;
&lt;br /&gt;
==簡介==&lt;br /&gt;
&lt;br /&gt;
AlphaZero 使用佮 AlphaGo Zero 類似但是閣較一般性的演算法，咧無做傷濟改變的前提落，並且演算法對圍棋延伸到將棋佮西洋棋上。AlphaZero 佮 AlphaGo Zero 無仝的所在佇咧：&lt;br /&gt;
&lt;br /&gt;
* AlphaZero 的超參數是寫死的。&lt;br /&gt;
* AlphaZero 這馬會斷更新人工神經網路。&lt;br /&gt;
* 圍棋佇咧某一寡狀況是對稱抑是會當轉踅的，AlphaGo Zero 的程式利用這個特性降低計算複雜性，AlphaZero 因為延伸到將棋佮西洋棋伊是提掉這段程式。&lt;br /&gt;
* 西洋棋有已經知影佮局終局資料庫，所以乎 AlphaZero 利用這个終局的資料庫納入計算。&lt;br /&gt;
&lt;br /&gt;
==佮 Stockfish 以及 elmo 的較==&lt;br /&gt;
&lt;br /&gt;
AlphaZero 是無蒙特卡洛樹搜揣，每秒只會當揣八萬步（西洋棋）與四萬步（將棋）， 比較起來 Stockfish 每秒會當七千萬步，以及 elmo 每秒會當三千五百萬步，AlphaZero 是利用類神經網路提昇矣搜揣的品質。&lt;br /&gt;
&lt;br /&gt;
==訓練==&lt;br /&gt;
&lt;br /&gt;
AlphaZero 使用五 , 空粒第一代的 TPU 進行訓練。&lt;br /&gt;
&lt;br /&gt;
==成績==&lt;br /&gt;
&lt;br /&gt;
===西洋棋===&lt;br /&gt;
&lt;br /&gt;
佇四點鐘的訓練了後（大約自我訓練四千四百萬局）， AlphaZero 用二十八勝七十二佮空敗的成績拍敗 Stockfish。&lt;br /&gt;
&lt;br /&gt;
===將棋===&lt;br /&gt;
&lt;br /&gt;
你若十二點鐘的訓練了後（大約是自我訓練兩千四百萬局）， AlphaZero 以九十勝二佮八敗的成績拍敗 elmo。&lt;br /&gt;
&lt;br /&gt;
===圍棋===&lt;br /&gt;
&lt;br /&gt;
佇咧三十四點鐘的訓練了後（大約是自我訓練兩千一百萬局）， AlphaZero 以六十勝四十敗的成績拍敗 AlphaGo Zero。&lt;br /&gt;
&lt;br /&gt;
==相關連結==&lt;br /&gt;
&lt;br /&gt;
* AlphaGo Zero&lt;br /&gt;
* DeepMind&lt;br /&gt;
* ELF OpenGo&lt;br /&gt;
* KataGo&lt;br /&gt;
&lt;br /&gt;
==參考資料==&lt;br /&gt;
&lt;br /&gt;
==外部連結==&lt;br /&gt;
&lt;br /&gt;
* Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm，AlphaZero 的論文。&lt;br /&gt;
* Game Downloads，AlphaZero 佮西洋棋軟體 Stockfish 的對弈記錄。&lt;br /&gt;
* Chess . com Youtube playlist for AlphaZero vs . Stockfish&lt;br /&gt;
&lt;br /&gt;
[[分類: 待校正]]&lt;/div&gt;</summary>
		<author><name>TaiwanTonguesApiRobot</name></author>
	</entry>
</feed>