來源:人工智能學家(AItists),作者:Jesse Dunietz
圖片來源:RedCube Inc
研發可以使用光而不是電來驅動計算機的這種想法可以追溯到半個多世紀以前。長期以來,“光學計算機”一直宣揚的是能耗在比傳統電子計算機的基礎上,有一個更快的運行速度。然而,由于科學家們一直努力在現在的計算機外部加上光學組件,實用型光學計算機的前景已經失去了活力。盡管有這些挫折,但是對于光學計算機來說,現在可能是一個新的開始 - 研究人員正在測試一種新型的光子計算機芯片,這種芯片將可以為人工智能設備打下良好基礎,能變得像無人駕駛車一樣聰明,并且小到可以放入一個口袋。
常規計算機依賴于像精細的舞步一樣切換電子電路的開關來響應相關的計算,比如兩個數字的乘法。光學計算也遵循類似的原理,但是并不是通過電子流,它的計算是由彼此相互作用的光子束和像透鏡或者分束器這樣的的引導組件執行的。與電阻不同,這些可以抵抗潮汐阻力的光子束必須流經電路,光子沒有質量,一旦以光速行進,就不會產生額外的電力。
馬薩諸塞理工學院的研究人員在《自然-光子學》一文中寫道,最近提出的光學計算對于加強深度學習是很有幫助的,這是一種基于人工智能最新進展的技術。深度學習需要進行大量的計算:它需要將龐大的數據集放入一個模擬的人造的“神經元”網絡中,這個“神經元”網絡松散地依賴于人腦的神經結構。每個人工神經元都會接收一組數字,然后對這些數字進行簡單的計算,并將結果發送到下一層神經元。通過調整每個神經元的演算,人造神經網絡可以學習如何去執行任務,如:識別貓和駕駛汽車。
深度學習已經成為人工智能的核心,包括谷歌和高性能芯片制造商Nvidia在內的一些公司已經為開發此類的專用芯片投入了數百萬。
這些芯片利用多數人工神經網絡會將時間花費在“矩陣乘法”上的現狀——這指的是每個神經元會對被分配到的不同的值進行求和的操作。例如,在面部識別神經網絡中,一些神經元可能正在尋找鼻子的標記。那些神經元將會對相對小的黑暗區域(可能是鼻孔)的輸入賦予更大的價值,給光斑(可能是皮膚)賦予稍微較低的值,甚至是熒光綠(極不可能裝飾某人的鼻子)。專門的深度學習芯片將通過把這些神經元種植到芯片的數百個小型獨立處理器中,來同時執行這些加權和,然后實現大幅度的提速。
這種類型的工作負載要求有相當于迷你超級計算機的處理能力。奧迪和其他的研發無人駕駛汽車的公司都奢侈的在后備箱內裝滿整機的計算機,希望他們在這種嘗試——讓人工智能無人機或手機能適應這種處理能力的不斷努力中有好的運氣。即使神經網絡可以在大型服務器場上運行,如同谷歌翻譯或Facebook的面部識別系統可以在上面運行一樣,這種重型計算機會消耗數百萬美元的電費。
2015年,麻省理工學院的博士后研究員Yichen Shen和《newpaper》雜志的主要作者正在尋求一種新穎的深度學習方法來解決這些能量消耗和計算機尺寸的問題。他偶然發現了合作作者Nicholas Harris的工作,他是麻省理工學院電氣工程與計算機科學的博士研究生,他們研制出了一種新型的光學計算芯片。雖然以前的大多數光學計算機都以失敗告終,但Shen認為,光學芯片可以與傳統的計算機進行結合,開辟新的深度學習階段。
很多研究人員早就放棄了光學計算。從1960年代起,BellLabs和其他人在設計光學計算機元件上花費了大量的資金,但最終,他們的努力并沒有得到什么好的結果。UpperAlsace大學的光學計算學教授PierreAmbs表示:“電子晶體管的光學等效性還未被開發出來,光束無法執行基本的邏輯運算。”
不同于大多數之前的光學計算機,Harris的新型芯片并不會去試圖取代傳統的CPU(中央處理器)。它被設計成為專門執行量子計算的模式,它利用亞原子粒子的量子態來進行比常規計算機更快的計算。當Shen參加Harris的關于新型芯片的演講時,他注意到量子計算與支撐深度學習的矩陣乘法相同。他意識到深度學習可能是這幾十年來阻礙光學計算發展的殺手級應用程序。受到Harris的啟發,麻省理工學院的團隊將會把Harris的光子芯片連接到普通計算機上,允許深度學習的程序能夠把它們的矩陣乘法程序卸載到光學硬盤上。
當他們的計算機需要一個矩陣乘法時——即一堆數字的加權和,它首先要將數字轉換為光信號,其中較大的數字表示為較亮的波束。然后,光學芯片將完全乘法問題分解成許多較小的乘法,每個乘法由芯片的單個“單元”處理。要了解一個“單元”的運行情況,你要想象有兩股流入其中的水流(輸入光束)和兩股流出的水流。每個單元會像閘門和泵的格子一樣起到作用,將流分解,再對它們進行加速或減速,最后將它們混合在一起。通過控制泵的速度,電池可以將不同量的水引導到每個輸出流中。
泵的光學等效物是硅的加熱通道。加熱時, Harris 解釋說:“[硅]原子會擴散一點,這會導致光線以不同的速度行進,”從而導致光波像聲波一樣相互增強或抑制。(對后者進行抑制就是降噪耳機如何進行工作的原理)。計算機設置加熱器,是為了使每個單元輸出通道的流出光量是輸入的加權和,加熱器決定權重。
Shen 和 Harris 通過訓練一個簡單的神經網絡來識別不同的元音聲,并以此來測試他們的芯片。結果是很平常的,但Shen認為這是因為改變了一個本就不完全適合的設備的用途。例如,不斷將數位轉換為光學信號并將光學信號轉換為數位的組件只是一個概念的粗略證明,如果僅僅是因為它們易于連接到 Harris 的量子計算芯片就選擇那些設備,這是不明智的。《Nature Photonics》上的論文表示,他們專門為深度學習而制造的更好的計算機版本可以提供和最佳常規芯片一樣的精度,同時將能將能耗降低幾個數量級,并且提供100倍的速度。這樣的話,即便是將人工智能內置到手持的設備中都是行的通的,而無需在將其再外包給其他的大型服務器,否則這將是不可能的。
當然,光學計算起起落落的發展歷史給我們留下了很大的懷疑空間。Ambs警告說,“我們不要太興奮。” Shen和Harris的團隊還沒有展示出一個完整的體系,并且Ambs的經驗表明,有時候“能顯著的完善一個還未成熟的系統是非常困難的。”
盡管如此,Ambs也同意這項工作“與90年代的[光學]處理器相比,取得了巨大的進步。”Shen和Harris也很樂觀。他們正在創立一個能將他們的技術商業化的初創企業,他們相信更大的深度學習芯片將會起到明顯作用。Harris 認為,導致他們目前芯片的錯誤的所有因素都有了解決的方案,所以“這只是獲得真正的人才并在實際中構建事情的一項工程挑戰”。