2012-04-30(Mon)

店長與武宮正樹的四子局

譯自:http://taisen.mycom.co.jp/taisen/contents/igo/meien/meien_44.htm

(王銘琬老師的網誌「銘琬事件簿」)

 

是友是敵?

最近將棋界中米長老師(米長邦雄九段)和將棋軟體邦可拉茲(ボンクラーズ)的對局是在賽前就成為很大的話題,但前幾天所舉行的圍棋職業棋士和電腦的對戰卻是在對局後受到熱烈的注目。這是因為圍棋對局軟體「Zen」以頂尖職業棋士武宮老師(武宮正樹九段)為對手,竟然在五子局與四子局中獲得二連勝,顯現出了超乎預期的強大潛力。我自己也受邀擔任這次對局的解說,卻也為對局的內容與結果感到非常驚訝。

 

圍棋的對局軟體雖然在業餘初段的水準上碰壁了很長一段時間,但卻在採用了「蒙地卡羅」法之後一口氣變強了很多。在圍棋軟體中的所使用的蒙地卡羅法,是在選擇著手時,使用術語稱為「掃盡(Play Out)」的形式,讓電腦亂數計算下到終局的結果;這樣將所有可能落點的選項經過多次計算,再從中挑選出其中勝率最高的一點來落子的方法就是蒙地卡羅法。(在銘琬事件簿第三十集「完敗蒙地卡羅」有更加詳細的說明,有興趣的人請參考看看)。

 

「Zen」這套軟體在電腦圍棋程式互相之間的比賽中,也獲得了壓倒性的好成績,可以說毫無疑問的是世界最強圍棋軟體。它會參考至今為止職業棋士所下出的實戰棋型來充實「掃盡」的內容,也花了心血在落點搜尋的方法上,而能夠針對有潛力的著手進行更深入的計算。甚至還能在下一次的對局中把至今為止「掃盡」的結果利用到次一手的搜尋上,而大大提升計算的效率。

 

即便如此,我認為以上也還是不脫蒙地卡羅法的本質。隨著電腦性能的進步,能夠「掃盡」的數量也成為次方等級的增加起來,但在「想不出來、讀不出來、計算不出一手價值多大」的局面中,電腦雖然可判斷出何處是大場,卻還是無法判斷出何處是急場吧。所以我的看法是,如果不能找到甚麼更重大的要素加入蒙地卡羅法中,還是不可能達到和人類匹敵的水準。

 

在和武宮老師所下的第一局五子棋中,「Zen」靠著「鬆懈型志在中央」的本性,以十一目之差領先到底。此時,它不過給我以往我所了解的「Zen」一貫確實下法的印象而已。然而,到了一局改局差的第二局四子棋時就不一樣了。

 

圖1

Zen_Takemiya1

 

面對蒙地卡羅法的軟體時,使用不照定石的測試下法是行不通的,或者應該說是它自己就會不照定石而走出別的下法出來。例如白9是普通的定石,但黑10就下出了令人想要尖叫出來的一著。不過到白17為止,若能拿到先手,還算是相當可行的下法。

 

接下來就是黑18了。普通在A位附近打入就算不錯,但這是一般的感覺;此刻解說的大橋五段(大橋拓文五段)卻直言預測:「根據我最近和Zen下過的感覺來看,它很有可能下在18位」。本來蒙地卡羅法是用亂數計算的結果當作結論,所以即便出現了同樣的局面也未必會使用同樣的下法。但這樣卻仍然可以預測出它的下法,可以看成是Zen具有自己的「棋風」了呢。而黑18的這手棋也完全符合我長年主張的「朝向弱子間的寬廣處接點」理論,也等於向我主張的另一個理論「蒙地卡羅法即使能判斷出大場,卻不知何處是急場」加上了「不對」的證明。

 

圖2

Zen_Takemiya2

 

之後經過各處的接戰後,白1吃掉左上角,讓我覺得果然四子對電腦來說還是太勉強時,才開始顯現出它的厲害之處。

 

黑2、4、6這三手棋全部是下在「朝向寬廣處的接點」。而黑8看起來雖然像是壞棋,卻還是逼著白下出了白9。然後白15後的次一手又讓人驚呼出來。

 

圖3

Zen_Takemiya3

 

就在下邊黑棋如果被白下到此圖6位會受不了之時,黑棋卻搶佔了黑1的攻防要點,一面強調右邊三連星佈陣的重要性,接下來還有瞄著A位而牽制白棋下在6位的效果。白2雖然用很有效率的方式接應,但黑3、5基本上還是可以封住白棋,這樣黑地非常之大。白棋雖然回手下到期盼的6位,但由於黑棋已經把右邊封住而能看輕下邊黑棋,反而可以撤出此地去下黑7。此點也是白棋非常想下之處,因此可以說黑棋這一連串的騰挪是完全不給白棋任何機會。

 

圖4

Zen_Takemiya4

 

白棋當然不可能會在此圖中的4位應,因為等於是被黑棋先手便宜。勢之所趨只能在白1衝出,但黑2卻變成了嚴厲而先手獲利超過20目的大棋。然後回手又下出黑6的樸實好手。再來面對白7時,黑8、10又簡直是完美的對應。

 

從圖2開始的最重要之中盤戰中,在超過三十手以上的戰鬥裡,Zen的黑棋幾乎和白棋打成平分秋色、不相上下。由於蒙地卡羅法是把「勝利」當作唯一評量基準,所以形勢不到緊迫之刻,是不會拿出真本事認真(?)起來的。此局從2圖開始,就在給大家看它認真起來是甚麼樣子。無論如何,棋子都往要點、急場上走去。雖然很想說這是偶爾碰巧下得很好,但反過來看正因為它是機器,即使再戰一場應該也會保持一定的水準才對。那到底該怎麼解釋才好哩?

 

冷靜想想,所謂的搶下「急場」比較好,理由不就是其「結果上較好」嗎?所以如果程式能做出正確的模擬計算,則選擇急場也是理所當然之事吧。不過,由於蒙地卡羅法的模擬基本上是亂數式的下下去,才會給人判斷不出急場的先入為主之見。

 

然而如果能在「掃盡」的過程中花功夫,而能達成找到「亂數上看起來不錯的好棋」,以結果來看不就等於是棋子會下去急場的方向上了吧?就好像職業棋士也會在半目輸贏的檢討中,在沒辦法明顯看出好壞時會說「看起來黑勝之圖比較多」的話一樣。因此,搞不好蒙地卡羅法真的是蘊含了不起能力的方法呢。

 

「Zen」從四年前開始,就以每年進步幾乎一子的速率進步著。至今為止從開發時間之短、開發人力之少、以及電腦硬體性能還會繼續進步的角度來看圍棋對局軟體的話,利用蒙地卡羅法的圍棋對局軟體還會持續進步下去,這應該是不管怎麼看都很合理的看法吧。如果能照現在這樣順利的進度發展下去,雖然不見得看得準,但推測它在數年之後就能到達接近職業棋士一較高下的實力,應該不是甚麼奇怪之事吧?

 

電腦程式贏了職業棋士四子局的結果甚至在NHK的新聞中也被報導出來,可見社會上對此之高度關切。在其中也可以看到「人類與機器的對決」般的圖像。不過在圍棋軟體上(也許不管在哪個領域上也都是這樣),在蒙地卡羅演算法的「掃盡」過程與結果要加上怎樣的獨特心思,還是屬於人類創造力的領域。與其說這是人類與機器的對決,感覺上不如說這是職業棋士與程式師之間的人類之戰才對呢。

 

此外,對峙於棋盤兩側的對手,雖說當下是敵人卻也能成為好友;但在人類與圍棋軟體之間,是否也能在一面競爭中一面變成無可取代的朋友呢?我認為運氣好的話,在圍棋上電腦應該也能像在其他領域做出貢獻一樣,走向協助人類的關係才對。不過,為了小心起見,還是得注意會不會出現莎拉‧康納(譯註:Sarah Connor,電影魔鬼終結者中的主角)的襲擊事件啊。

trackback url


引用此文章(FC2部落格用戶)

trackback

發表留言

只對管理員顯示

留言

自我介紹

Tony BC Huang

Author:Tony BC Huang
天秤 AB型

最新文章
最新留言
最新引用
月曆
07 | 2017/08 | 09
- - 1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30 31 - -
月份存檔
類別
統計
訪客累計人数:
部落軌道
搜尋欄
工商服務頻道
廣告
連結
RSS連結
加為好友

和此人成爲好友