跨界
我是理科生
混進了一詩歌群
學習與賞析
詩歌中的意象與意境
有天好奇地問了句
為什么
詩歌一天能寫好多
科研一年才一點點
靈感怎么差那么多?
于是
群里炸開了鍋
有人說
科研哪要靈感
有人說
科研和科學研究
你知道區別嗎
有人說
你做的是科研嗎
一點數學也沒有
我只好
展示了一些
我在
數學鄙視鏈
最底端的
統計學成果
還有
物理教學的
一點心得
結果
整個群里
只有
兩個理科生
在激烈地
辯論著
偶爾會有人發表情包?場
群主最后
不得不出面
嗨,兩位同學
這里是文學群
請不要討論不相關的內容
個體成群后,才便于延續和壯大。人類和非人智能體在結成群體的進程中,從生存需求的共生到精神需求的依賴,經歷了蜿蜒曲折的變化和調整,最終形成了精彩紛呈、各式各樣的群體。而聚集成群的個體,會與獨立存在或獨處時,有一些明顯的區別[1]。那群體的行為是如何體現的呢?它對智能有何影響,又有哪些錯覺呢?
一、群體智能
人類對群體行為的研究年代比較悠久。我國著名科學家錢學森先生在上世紀90年代曾提出綜合集成研討廳的體系。他強調專家群體應以人機結合的方式進行協同研討,共同對復雜巨系統的挑戰性問題進行研究。而將群體行為關聯至智能學習則常從兩個方面出發,一是分析宏觀的群體表現,一是審視微觀的群體行為。宏觀主要從非人智能體的角度著手,以觀察動物的群體行為為主。
天上的飛鳥比較容易看到的,但是形成能變換各種形狀的飛鳥群卻已不多見(圖1)。不多見的原因與人類曾過度使用化學藥品和肥料有關,美國科普作家蕾切爾·卡遜在其1962年的科普書《寂靜的春天》介紹過。不過偶爾還能見到些,所以1995年Eberhart和Kennedy博士就分析了飛鳥集群覓食的行為。他們發現當鳥群需要的食物處在鳥群生活的某個區域時,在搜索食物時,每只鳥不僅會受自己飛行的路徑影響,還會受和它相鄰鳥群的局部飛行路線,以及鳥群以群體的整體飛行路線所影響。鳥群會通過共享這些個體和群體的信息,并通過不斷交換和更新這些信息,最終鳥群能用“最優”的效率找到食物。基于這一觀察,Eberhart和Kennedy博士提出了一套群體智能算法,稱為鳥群優化算法 (Bird Swarm Optimization)。如果把每只鳥假設成一顆粒子,一群鳥群則構成粒子群,則鳥群算法還有個更一般的名字,叫粒子群優化算法 (Particle Swarm Optimization,簡稱PSO)[2]。
不僅天上的飛鳥有群體行為,地上的走獸穴蟻也有,而其中最方便觀察、能頻繁見到、密度又極高的群體是螞蟻(圖1)。于是,意大利的學者Dorigo和Maniezzo等觀察了螞蟻的覓食行為,在上世紀90年代提出了蟻群系統 (Ant System或Ant Colony System)。不同于飛鳥,螞蟻是通過一邊行路一邊釋放“信息素”的物質(英文為:pheromone。通俗點講,是體味的一種)來形成群體覓食行為的。螞蟻會沿著“信息素”濃度高的路徑來行走,同時它走過的時候也會留下自己的追蹤“信息素”,進一步強化了可能到達食物的最短路徑。同時, “信息素”會隨時間的增長而揮發,以保證路徑搜索不易僵化,失去靈活性。通過信息素的反復增強和淡化過程,蟻群就能沿最短路徑到達食物了[3]。
蟻群和鳥群優化算法是文獻中最經典的兩個群體智能算法。事實上,非人智能體的群體行為有很強的多樣性,如果留意觀察各種群體的行為表現,還能找到更多很有新意的群體智能算法。
舉例來說,美國德州奧斯丁議會大橋有群蝙蝠群。據估計,橋下生存了150萬只墨西哥無尾蝙蝠(圖1)。每到傍晚時分就會出洞,成群飛行去覓食,已是當地最負盛名的旅游景點。對飛行類群體智能行為感興趣、希望找到新算法的不妨去觀察觀察。海洋中的魚群也自有其特點。較小的魚偏好成團,形成比較大的形狀,如圖1。與飛鳥不同,研究表明,小魚愛成群的原因是較個體而言,魚群的體積要大得多,能夠讓潛在的捕食者誤以為是比它大的生物體,從而不敢冒然攻擊,也就讓小魚多了生存的機會。除了覓食和生存行為,遷徒行為也可以研究。比如大雁南飛時的,頭雁引航的人字形隊現象。在遷徒中,頭雁與其它從雁在決定路線方面的決策權方面顯然存在大的差異。
圖1:從上到下,從左到右:鳥群、蟻群、蝙蝠群、魚群
當然,動物的群體行為也并非始終優于個體,常常是機會與風險并存。比如,蟻群靠追蹤“信息素”來覓食的行為就不是百分之百安全。假如有一只引路的工蟻碰巧離開了有“信息素”的路徑,跟著它集體覓食的螞蟻都會離開路徑,極端情況下會形成如圖2的螞蟻亂轉(Ant Mill)的循環圓圈,最終導致螞蟻因為體能耗盡而集體死亡。這是與群體優勢相背的群體錯覺。再比如小魚的魚群現象,有些捕食者就會故意利用這個習性。如殺人鯨(Killer Whale,也稱虎鯨)為了提高吃小魚的效率,會有意識地分散開將小魚們圍起來,驅使小魚被動在包圍圈內形成密集的魚群,然后虎鯨便會輪流沖入圈中飽餐一頓。這是不同智慧級別的群體智能的對決結果。
圖2 左:螞蟻亂轉;右:虎鯨在學習捕食魚群技巧
不僅非人智能體存在值得研究的群體行為,微觀層面中也有。
二、微觀和非生命體的群體算法
在布朗運動的基礎上,科學家提出了模擬退火(Simulated Annealing)的智能算法。它模擬了金屬退火中的加溫過程、等溫過程和冷卻過程,通過增強和減弱隨機游走的分子的布朗運動強度(如圖3),使其最終形成有序的全局平衡或最優解 [4]。
除了分子的群體行為外,科學家們也看好基因。因為在算法層面上,進行群體的“基因編輯”都是相當安全且無倫理問題的。進化論告訴我們,基因的演化有三種模式:復制(reproduce)、交叉(crossover)和變異(mutation)。那么,如果要“編輯”出一個最優的“基因”,我們完全可以讓成千上組“基因”通過這三種方式來實現優勝劣汰,最終收斂到期望的解。不過需要注意的是,在演化過程中,復制是根本,變異只能偶爾為之。這種基于基因群體行為的方法被稱為遺傳算法(genetic algorithm)[5]。
不僅微粒和基因有群體行為,甚至毫無生命特征的鈔票,也有人觀察到了有趣的群體流通行為。2002年德國物理學家Dirk Brockmann發現,盡管在絕大多數時間里,鈔票只在一個較小的區域里交換,但是仍有一小部分鈔票會流通到較遠的地方,如圖3所示。他將這種流通模式被稱為列維飛行模式(Levy flight pattern),并認為其流通性質表明小概率的事件有時會產生較大的影響[6]。
圖3:布朗運動中的隨機游走與列維飛行模式
不論采用的是哪種方法,從本質上都有一個隱含假設在其中。既認為個體的活動具有隨機性,但納入群體后,最終這種局部或個體的隨機性可以收斂到全局平衡有序的環境。基于這一假設,以上提及的非人智能群體智能、微觀群體算法和遺傳算法常被用于目標的尋優,目的是為了幫助需要迭代求解或梯度尋優的算法獲得最優解。需要注意的是,由于這類算法或多或少都帶有比較強的啟發式,因此不太容易找到好的理論性證明,如數學家們偏好的存在性、收斂性和唯一性等以及統計學家偏好的泛化界。即使有一些理論性的證明,也只是在給了較多假設條件后的有限結論。盡管如此,這類方法在工程上仍然形成了不少好的應用成果。
三、多樣性與集體學習
要發揮群體的優勢,關鍵是多樣性必不可少,因為差異大的時候更容易形成互補性。如蟻群算法中常假定每只螞蟻具有獨特的個性。不僅單個物種內部有互補性,跨物種間也存在互補性,甚至更明顯。比如兩種能獨立生存的生物間的原始協作關系(Protocooperation),可以保證雙方都能獲利。圖4中寄居蟹與附著于寄居蟹匿居的貝殼上的海葵、鮣魚利用吸盤附著在鯊魚體表與鯊魚,都是這類原始協作關系。海葵借助寄居蟹、鮣魚借助于鯊魚擴大了活動范圍和覓食機會,反過來海葵和鯊魚又分別給寄居蟹和鮣魚提供了保護。還有對一方有利,對另一方無關緊要的偏利共生(Commensalism),如常受海葵保護的雙鋸魚。人類與寵物狗的共生也比較有意思。人從寵物狗中得到了情感的慰籍,老年人甚至把它做為已自立門戶的子女的替代品。而寵物狗也不僅僅是得到食物,還從人類這里學習了很多人類的行為規范。值得再次強調的是,機器智能目前還無法替代寵物狗的共生功能。而在人工智能領域,也有不少研究是在學習和利用這種跨物種間的互補性,如利用地面機器人與無人機的互補性來實現對未知環境的快速探路。而2017年出臺的《新一代人工智能發展規劃》中,也強調了要著重研究“多人多機聯結,使之涌現出更強大智能”的群體智能。
圖4: 左:寄居蟹與海葵;右:鮣魚與鯊魚
在通訊中也能見到利用多樣性和互補性的應用。如在信道的誤差糾編中,為了保證信息在傳輸中不發生錯誤,最簡單的操作就是多傳輸幾次。盡管每一次都有可能出錯,但只要出錯的位置不同,總能通過少數服從多數的方式來大幅度降低傳輸犯錯的概率,最大程度地保證信號傳輸的正確性。
機器學習界把利用集體或群體來增強性能的策略叫做集成學習 (Ensemble learning)。要在集成框架下獲得好的性能,基本假設是每個子體學習器要有一定的預測能力,比如至少要比扔硬幣隨機猜的性能好一點,同時分類器之間要有足夠大的多樣性或差異性。在這一思想下,大量的集成學習方法被發展。以分類任務如人臉識別為例,早期端對端的深度學習還未流行時,一般都從三個角度來實現群體的集成。或是改變輸入的特征,形成多樣性;或是變更學習器的多樣性,或是動最終輸出函數的集成方式[7]。雖然基本套路并不復雜,但俗話說得好“三個臭皮匠抵個諸葛亮”。在 2012年深度學習沒有形成大的性能提升前,集成學習模型形成的群體優勢幾乎是打遍了“所有與數據相關的競賽”而無敵手。而2012年后,盡管深度學習成為主流,但仍然能見到集成學習的三板斧,有些是轉化成了深度學習中網絡的結構變化,有些仍是通過把多個深度模型結合來繼續用群體優勢拔得競賽的頭籌。
圖5:三個臭皮匠頂個諸葛亮
如果分析以上這些群體智能學習,不難發現,這些群體算法要么是針對某個目標的優化來考慮的,要么是針對某個目標的預測來實施的。研究非人智能體的群體算法時,科學家們著重觀察的現象似乎主要與其群體的生存密切相關。反觀人類,在成了地球主宰后,早已不再僅僅滿足于生存需求,還衍生了生理、安全、社交、尊重和自我實現共五個層次的需求,被稱為馬斯洛需求層次理論。而這些高層次的需求在人工智能的學習中卻很少被涉及。
圖6:馬斯洛需求層次理論
如果要研究人工智能,必然要考慮人工智能體形成社會和群體、而非個體時的情況。那我們不妨看看,人類智能體在生存需求以上,群體生活時會存在哪些錯覺。如果人工智能體希望模擬人的群體行為,也許就能從這些錯覺中得到一些經驗的借鑒。
四、群體錯覺
一旦有了社會,生存需求就退居二線了。此時的群體不再滿足于以“預測”為終極目標的,對知識的渴求會逐漸占上風,尤其是信息量大的知識。比如“太陽從東邊升起”這種自然規則,按概率來說,就是百分之百能成立的。然而他卻是沒有知識含量的。因為 按信息論之父香農的定義,信息是事件出現概率的倒數的負對數比。簡單來說,百分之百出現的,信息等于0。對習慣快思維的人類來說,這類信息會和路面的細節一樣被直接忽略。如果事件出現的概率很小時,反而蘊含了大的信息量。比如馬路上突然有人打架,于是路人們會一擁而上,觀戰拿手機發朋友圈。這是信息論下“對知識的渴求”表現出來的群體本能反應。
可是假如不是打架,而是刑事事件時,旁觀者愿意主動施救的反而可能變少,尤其是在人來人往的場所。這是因為當在場的人太多時,幫助的責任就被大家平分,平分到連旁觀者都意識不到,以至于給人造成了“集體冷漠”的感覺。這不是信息量在起作用,而是責任分散效應的群體錯覺。我國的“三個和尚”故事中講的“一個和尚挑水喝,兩個和尚抬水喝,三個和尚沒水喝”,就是責任分散效應的體現。
也有人期望通過群體的力量獲得集成學習般的性能提升。然而,“物以類聚、人以群分”,即使現代社會也是如此,如朋友圈中的五花八門的群,常是因某一方面的共性而形成的群體。在這種群體時,執異見的更容易被孤立而非接納。不僅群體有排斥現象,甚至有時還會有智商、情商的拉低效應。比如如果參加傳銷團體,人會不由自主失去自我意識,導致本應正常的智商無法表現,變成智力水平低下的生物。這些現象是群體的拉平錯覺[1]。
群體智能在少數服從多數問題上也存在誤區。因為群體經常表現的是普通品質,并不能勝任需要很高智力才能完成的工作[1],但卻可能因這一規則而扼殺智慧。比如在早期科學還處在啟蒙階段時,哥白尼因堅持日心說而被教會燒死,而伽利略為了保全性命不得不犧牲掉自己對這一觀點堅持。這些都表明多數投票策略可能存在的風險,因為真理并一定都掌握在多數人手里的。這是統計中在缺乏先驗信息時,采用群體平均權重引發的錯覺。
這也反映了另一個現象,在群體社會中,成群并非對所有人都是最優的,因為“牛羊才會成群,獅虎只會獨行”。 畢淑敏說過“孤獨是一種獸性”。它反映了獨來獨往的自信和勇猛。適當享受個體的孤獨,還能更有效的管理時間和自由的探索。
群體錯覺還有不少,它間接或直接地導致了社會的多樣性和層次性。這些是我們在研究人工智能群體行為時需要注意的,也是人工智能體未來形成人工智能社會時需要考慮的。
到此為止,我已經從諸多層面介紹了人類的錯覺。我們不禁要問,人類如此愛犯錯,為什么還能主宰世界呢?機器智能會替代人類成為主宰嗎?
參考文獻:
1、古斯塔夫·勒龐 著,馮克利 譯. 烏合之眾:大眾心理研究. 中央編譯出版社,2005.
2、Kennedy, J., Eberhart, R. Particle swarm optimization. In: Proceedings of the IEEE International Conference on Neural Networks. 4: 1942–1948, 1995.
3、Dorigo, M., Maniezzo, V., Colorni A. Ant system: optimization by a colony of cooperating agents. IEEE Transactions on Systems, Man, and Cybernetics, Part B (Cybernetics), 6(1), pp: 29-41, 1996.
4、Kirkpatrick, S., Gelatt Jr, C. D., Vecchi, M. P. Optimization by Simulated Annealing. Science. 220 (4598): 671–680, 1983.
5、https://en.wikipedia.org/wiki/Genetic_algorithm
6、Brockmann, D., Sokolov, IM. Lévy flights in external force fields: from models to equations. Chemical Physics 284 (1-2), 409-421, 2002.
7、Zhou Z.-H. Ensemble Methods: Foundations and Algorithms. CRC Press. Jun 6, 2012.
張軍平
2018年12月7日
文章來源:張軍平