在人工智能的研究中,除了和計算機科學、神經科學相關外,其實還有仿生學。我們可以試著從進化生物學的角度來看看這件不尋常的事。
在生物學的視角里,進入人工智能視野的生物有機體有許多種。其中最簡單的生命形態是一種被稱為多頭絨泡菌(Physarum Polycephalum)的黏菌(屬于原生生物中的阿米巴Amoebozoa),這種生物是一種單細胞生物,最有趣的特點是在平板培養基上,它們細胞的“生長路線”對于平面交通網絡等的設計和算法具有參考價值。
如果將黏菌的食物源按照地圖上一個國家的城市的位置進行擺放的話,那么黏菌生長路線形成的網絡與現實中比較完備的公路、鐵路等網絡具有很高的相似性。也就是說,雖然從生物學的角度看,黏菌不屬于多細胞動物,沒有神經細胞分化,也沒有腦,但是其細胞生長對于食物源化學信號的感知和反應已經可以為人工智能的設計提供參考。
為什么黏菌的生長可以從一個食物源開始,以非常接近最短路線的方式到達其它食物源呢?究其原因,單細胞的屬性是一個因素。作為具有很強變形能力的單細胞(阿米巴也叫變形蟲),細胞膜的局部形變突出是它們對食物源化學信號濃度梯度做出的反應。如果向著某個方向形變之后感受到的食物源濃度更高,它就繼續生長;如果感受到的濃度更低就保持或退回,這和所有基于似然值進行搜索的策略是一樣的。
相對來說,雖然脊椎動物循環系統、昆蟲氣管系統在個體發育的形態建成過程中也具有類似的氧氣濃度依賴性,但是多細胞的分化方式決定了“修改”不再有用的結構時,需要以細胞“程序化死亡”的方式進行(可以理解為降解掉細胞),而不能像變形蟲一樣降解掉細胞內部的相關細胞骨架。
在智能程度相對比較高的生物有機體中,最著名的兩類可能是社會性昆蟲(蜚蠊目的白蟻,膜翅目的蟻科、蜜蜂科、胡蜂科等)和靈長目動物。這兩類動物在“智能”方面既有相同點,也有不同點。
在相同的一面,它們的個體都具有腦占身體比重高的特點。這個指標往往是衡量生物有機體智能高低的一個關鍵指標,指標高的生物的確常在智能方面有更復雜的行為和更好的表現,例如軟體動物門中的頭足綱動物Cephalopoda(章魚、魷魚等);另外一個共同點是,這兩類動物的種內個體間關系都很復雜。雖然包括人類在內的靈長目動物的社會性與社會性昆蟲的真社會性有所區別,但是畢竟都存在復雜的個體間關系。事實上,腦體比重高和種內復雜個體間關系這兩個特點往往相伴而生(例如鯨目動物Cetacea也是這樣)。對于兩者之間的因果關系,一般普遍認為群體性與個體間協作行為的需求是前提、是基礎。
圖片來源:Wikipedia
在不同的一面,靈長類動物的個體能力要高于社會性昆蟲的個體能力,兩者分屬于生態學上的“K對策生物”和“r對策生物”——前者一般繁殖率低、后代個體數量少、個體大、壽命長;后者則相反。也就是說,雖然社會性昆蟲個體的腦體比重在昆蟲中是相對高的,但是每一個單獨的個體很難表現出比較復雜的智能行為,只有群體才能表現出協同捕食、筑巢等復雜行為,具有個體數量依賴性。也因此,社會性昆蟲會被稱為“superorganism”。不過,數量多也是有好處的。
在社會性昆蟲中,螞蟻是以收集——捕食為主,大多在地面爬行。相對來說螞蟻的行為既復雜又容易被觀察,為蟻群算法(Ant Colony Algorithms)的提出提供了基礎。
類似螞蟻尋路的“蟻群算法”。圖片來源:sciencedirect.com
蟻群算法最早由馬洛克·多瑞哥(Marco Dorigo)在博士論文工作期間提出2,是群智能方法(swarm intelligence methods)的一種,可以為人們解決路徑優化的問題提供幫助。簡單來講,比如我們想要解決“一個多面體上的兩點,怎么走才最短”這個問題時,我們可以不斷地在一個點釋放“螞蟻”,這些“螞蟻”會在多面體上運動并走到另外一個點。當“螞蟻”數量足夠多時,我們就能得到在特定條件下,某條“螞蟻”走出的“最優”路線。
說到人工智能,就必須提到與DeepMind公司同為英國人的圖靈(Alan Turing, 1912-1954)和彭羅斯(Roger Penrose, 1931-)。前者是人工智能的奠基人(同時也提出了生物有機體發育過程中模式建成的理論),后者作為數學和物理學領域國際頂尖的學者,曾經寫過著名的科普讀物《皇帝新腦》(The Emperor's New Mind)。彭羅斯教授指出,即使人工智能和人腦原理在算法本質上可能沒有區別,但是從硬件方面來說有一個不同:人腦是一個動態系統。
在現生的靈長目動物中,人的腦體比重是最高的、腦的絕對容量是最大的、個體間關系是最復雜的。關于人類大腦容量的進化,有研究顯示,人類大腦容量增加并非勻速的,而是與外界環境的周期性密切相關。而人類腦容量增加最顯著的時期往往是氣候變化最為劇烈的時期3。看來人類智力的進化歷史,就是一部人類生于憂患的歷史。
而沿著彭羅斯教授的思路,我們可以看到DeepMind仍然和人腦有很大不同,因為他/她還不是一個可以自主運行的系統,還需要“人”的參與。反過來說,人類的智慧進步過程中,通過輸入和輸出的持續反饋,人腦的硬件結構并沒有直接被外界干預,而人腦的思維(算法)又是完全依賴于各種細胞和分子構件的硬件。相比之下,DeepMind可能還不會通過輸入和輸出的各種反饋而自己改變源程序,仍然要依靠人類設計者團隊去優化算法。
即使DeepMind或其它人工智能圍棋軟件能夠有一天能不再需要人類設計者團隊而自行獨立改進算法;即使這些電腦軟件能在圍棋聯賽和國際比賽中能夠持續勝出,我們生物的大腦仍然具有一個方面的優勢——能量效率。人類大腦的耗能在對戰過程中肯定還是要低得多。
一般來說,人類大腦的耗能大概是20-30W。當然,下棋時大腦全功率運轉,這個數字還可能往上升。不過AlphaGo的耗能呢?根據計算,“AlphaGo分布式版本(1202個CPU,176個GPU,打敗樊麾的那個)所有計算元件耗能應該超過200000W,總耗能沒準會翻倍。”計算耗能差不多是人類大腦的一萬倍。
當然,圍棋軟件使用了遠超過人類大腦耗能的硬件,這本身會是潛在的不公平。也許在算法不斷提高的未來,相同的耗能下的計算量會大大增加,不過從某種意義上來說,這也體現了人類智能和人工智能的不同。
人類的知識進步本來就是拉馬克式遺傳或者叫獲得性遺傳,這源于人類的長壽命和世代重疊,后來各種信息介質的發明不斷強化了這一點。由于DeepMind目前還做不到這一點,因此至少目前AlphaGo仍然可以被視為人類知識積累在計算機硬件輔助下的一種“延伸”,而不是一種簡單的并行或競爭關系。