來源:小康視界
作者:楊小康
校對:葉龔兵
編輯:胡蝶
本文長度為6418字,建議閱讀13分鐘 智能時代正在到來,本文為大家解讀未來人工智能。 作者按:2016年,人工智能60周年。 1956年夏,麥卡錫、明斯基等正式確立了人工智能(ArtificialIntelligence)這一術語,標志著人工智能學科的誕生。 60年后,AlphaGo戰勝李世石,確立了人工智能新的里程碑。智能時代正在到來,站在人工智能的歷史性關口,斯蒂芬·霍金、雷·庫茲韋爾、尤瓦爾·赫拉利等一大批國際學者對人工智能的未來做過大膽預測。人工智能已上升為國家戰略,國家“科技創新2030 重大項目”將新增“人工智能2.0”。最近,我國一批院士以及專家學者對未來人工智能和人工智能2.0進行了深刻闡述。 近年來,本人承擔了人工智能相關的課程和項目,也一直在苦苦思考。本文根據本人在中國計算機學會計算機視覺分會“CCF-CV走進高校系列報告會(第二十九期)”中的報告整理而成,分享對未來人工智能的若干初淺思考。若有不當之處,敬請指正和諒解。
一、從AlphaGo看人工智能現狀
1、AlphaGo是誰?
根據世界圍棋排行榜,AlphaGo的工作單位是Google DeepMind,性別:無,國籍:英國。它的戰績為,2016年一月份勝了歐洲冠軍,兩個月后勝了世界冠軍,當時,有同學問我,如果AlphaGo和柯杰下,誰贏?當時,我說,我猜AlphaGo贏,因為AlphaGo是在科學原理上贏了李世石。很不幸,我猜中了。2017年1月份對決柯潔等,60勝1和,聶衛平隨后在微博上贊嘆:“它是圍棋上帝派來給人類引路的”。
*來源:www.goratings.org,2016.7.1
2、AlphaGo為什么能贏?
圍棋是棋類游戲的皇冠上的明珠,最復雜的棋類游戲,最能體現人類智慧。在這么一個19*19的棋譜上,它的搜索復雜度高達250^150。
這有多復雜?
這是宇宙級別的復雜度,根據天體物理,整個宇宙粒子數量在10^80級別。由此可見,圍棋有多復雜,這也是AlphaGo震撼人類的原因。我們知道人類高手下圍棋主要靠宏觀的直覺,加上局部的計算。AlphaGo能夠贏在于利用最新的深度學習技術,模仿高手,并通過自我學習超越高手。
AlphaGo的第一招:模仿高手,學習高手的棋形。
要模仿高手棋形,AlphaGo需要一個分類器來判斷棋形象不象高手的棋形。圍棋盤可以看成是19*19的圖像,雖然這個圖像很小很小,但是有250^150種變化,要對這些變化分成高手棋形、非高手棋形,是一個挺難的機器學習問題。難就難在高手棋形的特征不好定義、不好提取。在人臉識別、車牌識別中,我們可以定義顏色、邊緣、關鍵點等特征,顯然圍棋棋形的特征不能這樣定義。深度學習是一種最新的特征學習方法,能夠自動學出好的特征。
AlphaGo用了最新的圖像分類器,叫深度卷積神經網絡(DCNN)。不同于傳統的人工神經網絡,他層數特別多,學習和分類的能力特別強。神經網絡1943年就提出來了,50年代末和80年代中興起過兩波研究熱潮,以前的人工神經網絡層數很淺,一般只能訓練兩個隱層,只能解決一些簡單識別問題。2000年左右,G. Hinton等提出了一套預訓練后向傳播的方法,當時就能訓練10幾層,現在的深度學習能夠學習100多層。DCNN是專門針對圖像識別的深度學習方法,對局部圖像進行卷積計算,效率很高。
*來源:圖片來自于互聯網
Nature上有一篇介紹深度學習的綜述,G. Hinton、Y. Lecan、Y. Bengio等深度學習三巨頭是共同作者[1]。Hinton、Lecun相繼去了Google、Facebook,而Bengio繼續留在學術界。這是一個非常有意思的現象。一方面,深度學習跟以前的學術熱點不太一樣,之前,學術界曾經有過很多的熱點,但工業界很少跟進,更談不上花巨資去學術界挖著名科學家。Hinton、Lecun到工業界兼職,說明深度學習是真正有用的,有可能改變產業格局。另一方面,深度學習的成功更多是在應用層面的,很多理論問題還不清楚。兩人去工業界,一人留在學術界,是一種很健康的現象。
深度學習能夠發揮巨大威力的前提是,要有大量的數據用來訓練深度結構,深度學習會涉及到到上百萬、甚至上億的參數,如果數據不夠,很容易過擬合、降低性能。而要進行這樣大規模的訓練,就要有超強的計算能力。其實DCNN 1998年就提出來了,當時只能解決NIST符號識別問題,現在能夠解決ImageNet問題,其使用的深度學習結構基本沒變,主要是用了更強的CPU和以前沒有的GPU,并且用了千萬倍的訓練圖像。據說,AlphaGo存有15萬職業棋手、百萬業余高手的棋譜,訓練的時候會用到1202個CPU,176個GPU。現在GPU服務器在深度學習研究中已經是基本配置。
*來源:Fei-Fei LI,ICME2016大會報告
AlphaGo的第二招:自我學習,自我進化。
模仿高手還不足以超越高手,要超越頂尖高手,AlphaGo用了一個自我學習的方法,就像金庸小說《射雕英雄傳》中的老頑童周伯通,左右互博,自己跟自己學。AlphaGo可以開出兩個程序,自己跟自己下。高手也會自己跟自己擺棋譜,高手擺棋譜擺得慢,需要吃飯、休息。而阿爾法狗只要有電,就一直可以左右互博下去,這就使得阿爾法狗有可能超越高手。
為了達到左右互博的效果,AlphaGo用了一個叫深度強化學習的技術,Google 2014年收購DeepMind后, 申請了深度強化學習的專利。強化學習很符合智能體的學習規律,小孩在不斷跌倒中學會走路,猴子在胡蘿卜加大棒下學會做馬戲。強化學習的特點,一方面是Agent通過環境交互中學習,另一方是,訓練標注稀少,獎賞在現實世界中,通常是不輕易使用的,并且通常是有一定延時的。比如,孩子考試考得好,我們會給點獎勵,但是考試不是經常考,考完要有一段時間才能知道結果。
強化學習主要包括感知、行動、獎賞三個環節,構成一個狀態轉移空間。學習過程可以用馬爾科夫決策過程來表示。以前的強化學習的算法訓練只能解決很小的狀態轉移空間。AlphaGo面臨的是一個超大轉移空間的問題,同時還是一個帶有超長延時訓練標注的問題,一開始的棋,不太好量化好壞,直到很后面才能夠數出各自大概的目數,判斷輸贏,這就可以歸結成為一個深度強化學習問題。這個問題恰恰可以用深度的遞歸神經網絡(DRNN)解決。DRNN的訓練和前面的卷積神經網絡沒有太多的區別。
在左右互博中,AlphaGo 局部會采用一種叫蒙特卡洛搜索樹的隨機策略進行搜索,先用前面提到的CNN的簡化版本,快速定位比較好的落子方案,同時通過隨機策略,給了其他位置一定的概率。隨機策略使得整個系統能夠自我進化,簡化的CNN兼顧了速度和效率。
把兩招合在一起就是:深度卷積網絡,模仿高手,尋找好的落點;深度強化學習,形成左右互博,自我進化。深度強化學習另外一個副產品就是產生了海量的對局,用來充實深度卷積網絡的訓練數據,兩招完美結合在一起。
3、再論AlphaGo是誰?
AlphaGo是最新深度學習方法、棋譜大數據以及最新超算體系的總和,它還以現代科學技術指數發展原理繼續進化,并且沒有任何情緒波動。既然AlphaGo是這樣的一個人工智能系統,是不是它已經在科學原理上已經戰勝了人類棋手?在此我想說,作為人類個體的李世石、柯潔們,雖然告負,但對人類整體來說,這無疑是人類自我挑戰的新的里程碑!
二、未來人工智能和AI2.0國家戰略
1、漫談未來人工智能
關于未來,盡管以AlphaGo為代表的現在人工智能已具備了很高的水平,但還有很多的局限性。中科院院士譚鐵牛在2016年中國人工智能學會年會《關于人工智能發展的思考》報告中,曾經總結過四句非常有意思的話。我是這么理解的,我的理解不一定對。
第一句是“有智能沒有智慧”。智能就是“能干”,現在AI能做好非常具體的事,比如掃地、下棋,但是不具備靈性,不能創造。
第二句是“有智商沒有情商”。如果讓阿爾法狗訓練一下智商測試的題目,估計智商可能會爆表,科大訊飛的人工智能要參加2020年高考,據說要爭取考上大學本科,但估計情商還是很低。
第三句話是“會計算不會算計”。現在人工智只有“解空間”層面的局部策咯,沒有“問題空間”層面的宏觀戰略,不會挖坑、下套這樣的高級博弈。
第四句話是“會專才不會通才”。主要說現在人工智能舉一反三的能力差。
基于此,未來人工智能應該做“四有新人”,也就是有智慧、有情感、有算計、有通才的新一代人工智能。當然,要實現這樣的強人工智能,人類還有很長的路要走。
2、AI2.0國家戰略
我國正在大力發展AI,“人工智能,中國之崛起”,對此,我們可以大有信心。AlphaGo的例子我們知道,AI由三部分構成,機器學習是AI的大腦,超算是AI的軀體,大數據是AI成長的養分,據統計43%機器學習相關論文是中國人寫的,我國已經有眾多的AI人才,這形成了AI垂直產業應用的人才基礎。超算方面我們的太湖之光、天河二號排名世界前二,我國發展人工智能具有很強的硬件基礎。大數據方面,相對歐美日等國家,我國不僅擁有更多的“冷數據”(包括人口、地理等靜態數據),而且用用更多樣的“熱數據”(比如交易、診療等動態數據),大數據優勢將促使我國形成特色,在人工智能時代彎道超車。
人工智能已經上升為國家戰略,國家“科技創新2030 重大項目”將新增“人工智能2.0”[2]。潘云鶴院士于2016年12月在中國工程院院刊Engineering(主刊)發表了論文“Heading towardartificial intelligence 2.0”,提出了人工智能2.0的核心理念“基于重大變化的信息新環境和發展新目標的新一代人工智能”[3]。2017年1~2月,中國工程院院刊信息與電子工程學部分刊Frontiers of Information Technology & Electronic Engineering出版了“Artificial Intelligence 2.0”專題[4],該專題分為六大方向,潘云鶴、李未、高文、鄭南寧、吳澄、李伯虎、陳純等多位院士以及專家學者對人工智能2.0中所涉及的大數據智能、群體智能、跨媒體智能、混合增強智能和自主智能等進行了深刻闡述。
三、未來人工智能視覺感知的思考
1、未來人工智能:類人服務、超人感知
根據國內外專家,未來人工智能有很多、很高遠的愿景。我個人理解,至少其中一個愿景是“類人服務、超人感知”,也就是,以類人的方式服務人類自身,以超人的方式感知外部世界。在智能時代,人類智能與人工智能相互增強,相互對偶,類人服務要求具備類人智能:從人類的視角看,未來人工智能應該在感官和思維上像人;從機器的視角看,未來人工智能應該能夠理解人的行為和情緒。
在傳統社會是一個二元空間,人類社會和物理空間形成互訓關系。在信息社會,人、機、物三者相互融合,形成一個三元空間,未來人工智能能夠進行人、機、物信息的整合,以超越人類的精度和時空尺度,感知三元空間的信息關聯性。多學科的研究,特別是腦計劃的研究,將進一步夯實機器學習的理論基礎,三元空間的大數據和超算能力將進一步提高機器學習的工程能力。機器學習、大數據、超算三者共同推動未來人工智能超人感知、類人服務的愿景。下面就這個愿景,稍微做點技術上的展開思考。
2、類人智能
類人智能就是要將類人知覺和類腦思維整合在一起,如果機器人具備逼近人類的人機交互能力,那么現在擊敗人類的阿爾法狗就有可能進化到陪伴人類下圍棋的BeltaGo(或稱之為“陪Ta狗”?)。
*來源:圖片來源于互聯網
在知覺層面,隨著低成本、低功耗傳感器的發展,未來人工智能要在視、聽、味、觸等不同的模態上實現對現實世界的感知和認知。具體到視覺感知,深度學習三巨頭在2015 Nature上的綜述論文,介紹了用CNN+RNN實現看圖說話。反過來,語言能不能驅動機器視覺?我們說一句話,能不能把對應的物體定位出來?更難地,能不能自動造出來一張與這段話對應的圖像?最近,生成式對抗網絡(GAN)在圖像自動生成方面取得重大進展[5]。如果圖像和語言能夠雙向翻譯,這將使得人工智能的視覺知覺達到一個全新的高度。
在思維層面,未來人工智能要實現類腦計算。2014年IBM 發布了類腦芯片TrueNorth,集成了100萬個“脈沖神經元”,能力相當于一臺超級計算機,功耗卻只有65毫瓦,主要是因為它采用Spike NN結構,用類腦的異步脈沖來驅動電路,而非傳統電路的同步時鐘。但它還沒辦法高效模擬另一個重要大腦機理,也就是觸突的可塑性,因此,性能離大規模商業應用還有一段距離。
從長遠來看,研究類腦計算是通往強人工智能的有效方法[6]。傳統的計算機相當于左腦,擅長邏輯思維,處理數字;神經元芯片相當于右腦,擅長形象思維,處理圖像。IBM正想辦法將兩者整合在一起實現全腦的類腦計算。
*來源:圖片來自于互聯網
3、三元空間感知:人機物協同感知
超人的三元空間感知,在側重物理空間的感知層面,科學家正在研究人機物協同感知。突破肉眼感知的局限性是人工智能的傳統強項,目前太赫茲技術得到很大的進步,上海交通大學跟相關公司合作,在研究太赫茲圖像識別,有可能在5-10米外就能夠識別藏在人身上的刀槍甚至毒品。2017年3月,上海交通大學還跟聯影公司成立了醫學影像先進技術研究院,合作研究成像裝備和大數據診療。可見光譜、紅外光譜、太赫茲、核磁共振等一起實現全譜感知,相當于賦予了人類以天眼、慧眼。
人機物協同感知的一個重大應用就是無人車。在美國加州,全功能的無人車已經允許上路。MIT Technology Review將自動駕駛卡車評為2017年10大突破技術。百度成立了無人車事業部,也在硅谷設立了專門的研究院。
4、三元空間感知:群體智能
超人的三元空間感知,在人類社會層面,正在涌現出群體智能新技術和社會計算新學科,利用互聯網、社交網絡、通信網絡、監控網絡等不同網絡的大數據,克服傳統社會學調查方法數據稀少的問題,更好、更快地分析人群、組織和社會的行為。上海交通大學較早開展了這方面的探索,2009年承擔了973項目“混合網絡下社會集群行為感知與規律研究”,聯合了信息學、管理學、社會心理學等不同領域的專家開展交叉研究,一些成果為國家提供了決策。我本人承擔了其中“大尺度跨媒體社會集群行為感知”課題,結合網絡媒體和視頻監控,為世博會、亞信峰會等大型活動管理提供了技術支持。
在973課題基礎上,我們最近承擔了國家重點研發專項課題,開展大規模人群透徹感知研究,針對反恐維穩、智慧城市、交通控制等需求。利用大數據和深度學習的優勢,進行多尺度、跨相機、跨平臺分析,有望實現群體感知從簡單、低密度、小范圍場景到復雜、高密度、大范圍場景的跨越。
5、三元空間感知:互聯網超級智能
超人的三元空間感知,在側重信息空間的層面,未來學家認為互聯網正在向超級智能的方向不斷進化,形成互聯網、人工智能和人類大腦的聯合智商,互聯網與人類大腦高度相似,它將具備自己的視覺、聽覺、觸覺、運動神經系統,也會擁有自己的記憶神經系統、中樞神經系統。2011年谷歌提出了“谷歌大腦”計劃,以大腦功能區,重新定義Google的業務群。最近,我國也推出了中國腦計劃。
*來源:圖片來自于互聯網
四、關于未來人工智能的
社會經濟影響的思考
未來,強人工智能將深刻改變人類生活,也給人類帶來巨大挑戰。霍金稱人工智能或威脅人類,馬斯克認為人工智能是在“召喚魔鬼”。盡管我們可以相信人類能夠和人工智能包容發展,至少我們要注意兩方面的挑戰。
一、改變就業結構。不僅大量的流水線工人正在被替代,大量的白領工作崗位也將消失。十幾年前IBM深藍打敗了卡斯帕羅夫,今天我們還是不能小看IBM,AlphaGo還在打名氣,IBM的讀片機器人已經開始上崗。華爾街的量化交易機器人正在替代金融交易員,“今日頭條”的推薦機器人正在替代初級的內容編輯。
二、強人工智能將沖擊倫理關系。機器人保姆帶大的小孩,還會不會跟親媽親?如果美女機器人擁有非凡魅力,人口數量和結構會帶來怎么變化?植入了智能器官甚至機器大腦的人,還算不算人?
進一步,我們假設有一天“阿爾法狗”遇上“薛定諤的貓”的時候,也就是當強人工智能運行在量子計算機上的時候,我們的未來會怎樣?
未來,機器人會是怎么樣?未來學家們可能正在研究,機器人會不會做夢(意識)?機器人會不會結婚(性別)?機器人會不會用錢(信用)?機器人會不會統治人類(政治)?
未來,人類自身會怎么樣?從歷史觀看,尤瓦爾·赫拉利不僅寫了《人類簡史》,還寫好了《未來簡史》,認為人類會從智人演化到智神。
未來,人類自身會怎么樣?從生物觀看,人類的密碼在基因,基因分析是典型的計算密集型問題,這種單一任務的工作恰恰可能是人工智能的傳統強項。有了基于量子計算的強人工智能后,人類是不是最終會全面破解基因?很久很久以前,亞當和夏娃遇上了那條蛇,偷吃了智慧之果,被逐出伊甸園。億萬年后,他們的后代遇上了一只“狗”和一只“貓”,打開了強人工智能的魔盒后,會不會摘下傳說中生命樹上的長生之果?這一切,人性中的欲望和貪婪,是否冥冥中早已注定?
*來源:圖片來源于互聯網