趙治勳是日本史上獲得最多頭銜的棋士,2016年11月他以二勝一敗擊敗日本製圍棋AI的DeepZengo後,記者問他:「DeepZengo下得像誰呢?」趙治勳毫不猶豫地說:「像王銘琬!」這並不值得高興,因為DeepZengo是他手下敗將,不過這還是說明,經過緊密的對局過程,可以感覺我的空壓法與AI的下法有相似的地方。
空壓法與AI最基本的相同,在以概率為基礎這一點,AI用強大的計算力算出概率本身,直接選擇勝率較高的著點;空壓法是用概率為基礎做推理與判斷,至今圍棋技術為了獲得確定的知識,在思考時排除概率的想法,雖然有時會用「可能性較高」來解釋棋局,不過是為了完成說明的比喻性字眼,不是根本的思考依據。
從人工智慧的角度來看 圍棋可說是概率的大海
空壓法是盡可能排除既有圍棋知識,純粹用著手所得到的概率回報,去思考次一手,這並非異想天開,其實是很自然的事情,AlphaGo的雙劍,「蒙地卡羅方法」與深層學習的單位「人工神經網路」都是以概率處理對象的技術,從AI來看,圍棋可說是概率的大海。
最近的腦科學研究,發現人腦的活動與「貝氏網路(Bayesian network)」很相似,貝氏網路就是將因果關係用概率去記述的模式,用概率去理解圍棋,對人類本來就是很自然的。
圍棋在自己還沒算清楚前,對遊戲人來說,其實都只是概率的對象,本書在於介紹,人可以藉由自己的判斷,以概率為依據,去建構自己的圍棋,在本書上集的〈開天篇〉第四章,對人在棋盤上如何面對概率就有不少敘述。
以我個人的能力,盡可能用概率思考圍棋得到的結論是,圍棋可以用「從寬廣方面壓迫對方」(壓)這個觀點去理解,也是制勝的唯一方法,而要達成這個目的必須「開創比對方大的有利空間」(空),這兩點也是「空」、「壓」法的核心。
圍棋知識至今是由局部的探討開始,像積木般的架構全局,而空壓法是跳開局部,一開始就以全局的命題為首要目標,這也是與AI共通的因素。
用空壓法去觀察AlphaGo、或AlphaGo進階版Master的棋,是一點都沒有違和感的。
圖1Master黑棋,黑1、3是Master愛用的手法,就空壓法觀點,黑棋這樣確保了「比對方大的有利空間」。
圖2這是傳統下法,扣掉貼目,有利空間的優位不明顯。
圖3實戰手順,黑棋「比對方大的有利空間」逼白進入後,黑棋進行「從寬廣方面壓迫對方」的動作,不過黑17的凌厲攻擊,不是我下得出來的。
圖4Master白棋也是一樣,白10、12,下邊14逼後的16、18已無需多作講解,20−28的「壓」之後,白棋30退讓後,還有足夠的有利空間。
圖5白1是傳統下法,與圖4成為不一樣的局面。
圖6黑1後,手拔3、5擴大模樣。
圖7黑9以下,往白棋小目「壓」過去,再黑15跳睥睨全局,從我來看,因為AI本身實力強大,運用空壓法比我更為靈活。
從空壓法去看圍棋AI的下法,到Master的水平為止,我覺得沒有問題,很多人說AI下的棋看不懂,空壓法或許可以成為我們理解AI圍棋的切入口。
圍棋深奧無比,目前並不能斷定Master的下法優於傳統下法,不過空壓法的觀點,應該能對欣賞AI的棋局有所幫助。
為什麼要下棋?因為,下棋太快樂了!
圍棋重要的是怎麼去想,在同樣邏輯下的思考,有時會因人而有不同的答案,可是它們可以說是近親;而在不同思考下,就算結果下同一個地方,其實是偶然撞在一起,毫不相干的路人。
空壓法的起點是認為圍棋的變化是無限的,必須要這樣的前提才可能運用概率純粹思考, 然而若圍棋的變化是無限的,詮釋AI的方法當然不限於空壓法,每一個人可以用自己的觀點去看待AI圍棋,而運用空壓法,也可以用每一個人主觀的推理與判斷,得出不同的次一手。
圍棋書的形式往往非常固定,本書避開大多數棋書的寫法,嘗試介紹圍棋多元的樂趣,而在講解圍棋的部分,盡量不用客觀的圍棋看法,而從對局者本身的主觀去探討圍棋;另一方面,本書的內容均取自我自己的正式比賽,可說是真槍實彈,理應具有一點客觀的技術價值。
每當我迷失下棋方向時,我都會回到一個原點問題──「為什麼要下棋?」我最後得到的答案總是一樣的「因為下棋太快樂了」;除了快樂,下棋本身不會帶給人任何好處,正因為如此,不管AI棋力如何進步,圍棋將永遠為我們的人生平添幾分幸福。
本文取材自《新棋紀樂園 開天篇-序章》(新版),感謝大塊出版授權刊登
作者/王銘琬
出版社/大塊