
問:在你看來,今年人工智能領域最重要的進步有哪些?

來源:微軟亞洲研究院
如今,從為軟件開發人員生成代碼到為圖形設計師繪制草圖,由大型語言模型驅動的人工智能系統正在改變人們的工作和創作方式。微軟執行副總裁兼首席技術官 Kevin Scott 認為,未來,無論是幫助應對氣候變化及兒童教育等全球挑戰,還是徹底變革醫療健康、法律、材料科學甚至科幻小說等領域,這些人工智能系統的復雜度和規模都將繼續增長。
近期,Kevin Scott 就人工智能對知識工作者的影響以及人工智能下一步發展等話題分享了他的看法,核心觀點包括:
人工智能大模型和生成式人工智能的發展將繼續提高人們的生產力、創造力和滿意度。
人工智能將助力實現科學突破,并幫助世界解決一些重大挑戰。
隨著人工智能模型的平臺化,以及微軟繼續以負責任的方式為客戶推動人工智能的進步,云、基礎設施投資和以極其負責任的方式發展人工智能變得至關重要。
下面就讓我們一起來看一看 Kevin Scott 對人工智能未來之路的展望吧!
問:在你看來,今年人工智能領域最重要的進步有哪些?
Kevin Scott:當我們進入2022年時,我想人工智能領域的幾乎每個人都期待在接下來的12個月左右的時間里能發生引人矚目的大事。現在,這一年馬上就要結束了,即使當初的期望頗高,回顧我們在人工智能領域各個方面取得的創新規模依舊令人興奮??蒲腥藛T和其他同行們為推進前沿技術所取得的成果,僅在幾年前都幾乎是無法想象的。而幾乎所有這些都是人工智能大模型飛速發展的結果。
今年有三項成果讓我印象最為深刻。首先是 GitHub Copilot 的發布,這是一個基于大型語言模型的系統,它能將自然語言提示詞轉化為代碼,給開發人員的工作效率帶來了非常積極的影響。未來的發展將在很大程度上取決于我們編寫軟件的能力,因此 GitHub Copilot 史無前例地讓更廣泛的人群可以擁有編碼技能,這一點非常了不起。
第二個是 DALL?E 2 等生成式圖像模型廣受歡迎且變得更易使用。素描、繪畫以及掌握所有的平面設計、插圖和藝術工具都需要相當高超的技能。像 DALL?E 2 這樣的人工智能系統盡管不能把普通人變成專業的藝術家,但它給了很多人視覺表達的能力,一種他們從未想過自己會擁有的全新超能力。
我們還看到,人工智能模型變得越來越強大,并為其所要解決的問題帶來了更多實質性的收益??v觀今年整個科技行業,我認為蛋白質折疊方面的研究非常出色,包括微軟與華盛頓大學蛋白質設計研究所大衛·貝克實驗室利用 RoseTTAFold 所做的項目,以及利用一系列先進的人工智能技術幫助其開展變革性的工作。任何能對科學和醫學有增效作用的事情對世界都是有益的,因為我們面臨的最大、最棘手的問題就在這些領域中。
2022年是一個令人印象深刻的科技大年。我認為明年會更好。
問:你認為接下來幾年,人工智能技術在哪些方面會產生最大的影響?
Kevin Scott:我可以很有把握地說,2023年將會是人工智能領域有史以來最激動人心的一年。之前我也曾真心實意地相信2022年是有史以來最令人激動的一年。創新的步伐一直在快速向前。
前面我已經談到了 GitHub Copilot,但這也只是人工智能大模型潛在能力的冰山一角,如果把同樣的理念外推到各種不同的場景中,那么我們就可以幫助到編程以外的其他腦力勞動。整個知識經濟將會見證人工智能如何幫助人們解決工作中的重復性問題,并讓工作更愉快、更有成就感。這將適用于幾乎所有的工作,比如設計新分子來創造藥物、根據 3D 模型設計制造“配方”,或者是單純的寫作和編輯。
例如,我一直在使用一個我基于 GPT-3 為自己構建的實驗系統,來幫助我完成一件從十幾歲起就想做的事情——寫一本科幻小說。我的筆記本上寫滿了我為設想中的書編寫的概要,描述了書中的大致內容和這些故事將發生在什么樣的宇宙中。如果我用傳統方式寫書,一天能寫2000個字,我就會覺得自己很不錯了。但有了這個工具,我就可以打破僵局,我經??梢砸惶鞂懗?000個字,這對我來說已經很多了。與之前相比,這是一個更加充滿活力的過程。
這就是“一切皆有副駕駛(copilot for everything)”的夢想——當你做任何類型的認知工作時,都會有一個“副駕駛”坐在你身邊,它不僅可以幫助你完成更多的工作,而且還能以新穎有趣的方式增強你的創造力。
問:這種生產力的提高顯然也會提升滿意度。為什么這些工具能給工作帶來更多樂趣?
Kevin Scott:我們所有人都需要使用工具來完成工作。其中一些人非常樂意獲得、掌握這些工具,并且弄清如何以超級有效的方式用它們來做事。在很多情況下,人們已經有了全新、有趣且從根本上比以前更有效的工具。我們做過一項研究,發現使用無代碼或低代碼工具對用戶的工作滿意度、總體工作量和員工士氣產生了80%以上的積極影響,特別是對那些處于相對早期階段的工具,這是一個巨大的好處。
對于一些員工來說,這實際上是在強化工作的核心流程,它會讓你加速。就像穿著一雙更好的跑鞋去跑步或參加馬拉松。我們發現這正是開發人員使用 Copilot 時的體驗,據他們反饋,Copilot 可以幫助他們保持心流狀態,并且在面對曾經看起來枯燥重復的任務時依然頭腦清醒。當人工智能工具可以幫助人們消除工作中的苦差事,也就是那些重復的或令人討厭的或妨礙他們做真正喜歡的事情的工作,毫無疑問這會提高滿意度。
就我個人而言,這些工具讓我可以比以前更長久地處于心流狀態。創意流的天敵是分心和思維停滯。例如,當我不太清楚該如何解決下一個問題,或者下一問題是“我得去查一下這個問題,我不得不從正在做的工作中切換出來,去解決一個從屬性問題?!边@些工具越來越多地為我解決了這些從屬性問題,我則可以一直保持在心流狀態中。
問:除了 GitHub Copilot 和 DALL?E 2 之外,人工智能還以其他方式出現在了微軟的產品和服務中。那么下一代人工智能如何改進 Teams 和 Word 等現有產品?
Kevin Scott:這是一個人工智能不為人知的故事。迄今為止,人工智能帶來的大部分益處都分散在1000種不同的地方,你甚至可能都沒有意識到你獲得的產品體驗中有多少來自機器學習系統。例如,在 Teams 視頻通話功能的系統中,所有這些參數都是通過機器學習算法學習的;音頻系統有抖動緩沖器使溝通順暢;屏幕上顯示的模糊的背景效果也是機器學習算法在起作用。有十幾個機器學習系統協同工作,才讓我們的交流體驗變得更加愉快。而整個微軟公司的產品和服務都是如此。
我們已經將機器學習的應用從幾個地方擴展到遍布不同產品的上千個場景,從 Outlook 電子郵件客戶端的運作、Word 中的文本預測、必應(Bing)搜索的體驗,到用戶在 Xbox Cloud Gaming 和 LinkedIn 中看到的信息流是什么樣的,無處不在的人工智能正在讓這些產品變得更好。
過去兩年發生了很大變化的一件事是,曾經我們需要為所有產品針對每項任務專門定制一個模型,現在一個模型可以用在很多地方,因為它們擁有了很強的泛化性。能夠投資于這些隨著規模擴展而變得更強大的模型,然后讓所有構建在模型之上的東西同步受益于你所做的改進,這是十分了不起的。
問:微軟通過 AI4Science 和 AI for Good 等倡議持續推進人工智能的研發。人工智能領域最讓你興奮的是什么?
Kevin Scott:我們的社會現在面臨的最具挑戰性的問題都在科學領域。如何治療那些難以治愈的復雜疾???如何為下一場大流行病做好準備?如何為逐漸老齡化的人口提供負擔得起的高質量醫療?如何幫助更多的孩子接受他們未來所需的技能教育?如何通過開發技術來抵消碳排放產生的一些負面影響?我們正在探索如何將人工智能中一些令人興奮的發展成果用于解決這些問題。
這些基礎科學應用中的模型具有與大型語言模型相同的規模擴展特性。當你建立一個模型,讓它進入某種自監督模式,它就可以從模擬中學習,或者通過自身觀察特定領域的能力來學習,然后得到的模型可以讓你顯著改變所應用領域的表現,無論你是在做計算流體力學模擬,還是藥物設計的分子動力學研究。
這其中蘊含著巨大的機遇。這意味著我們能找到更好的藥物,意味著也許我們可以找到解決碳排放問題的新催化劑,意味著全面加快科學家和其他有著遠大想法的人們努力解決全社會最嚴峻挑戰的速度。
問:計算技術和硬件的突破如何促進人工智能的進步?
Kevin Scott:我們在人工智能領域看到的幾乎所有最新進展背后的根源,是我們驗證了模型規模的重要性。事實證明,基于更多數據和更多計算能力訓練出來的模型具有更豐富和更通用的能力。如果想繼續推動這一進步——需要明確的是,目前我們還沒有看到擴大規模所帶來的好處的邊界,我們要做的是盡可能優化和擴展計算能力。
兩年前,微軟推出了第一臺 Azure AI 超級計算機,在今年的 Build 開發者大會上,我曾說我們現在擁有多個超級計算系統,而且我們非常確信這些系統是當今全球規模最大、功能最強的 AI 超級計算機。我們和 OpenAI 使用這些基礎設施來訓練我們幾乎所有最先進的大模型,其中包括微軟的圖靈(Turing)、Z-code 和 Florence 模型,以及 OpenAI 的 GPT、DALL?E 和 Codex 模型。最近,我們還宣布與英偉達(NVIDIA)的合作,打造一臺結合了 Azure 基礎設施和英偉達 GPU 的超級計算機。
這其中的一些進展就是通過使用越來越大的 GPU 集群實現大規模強力計算而取得的。然而,更大的突破或許在于軟件層,它優化了模型和數據在這些巨型系統中的分布方式,既可以訓練模型,又可以讓這些模型為客戶提供服務。如果我們希望將這些大模型作為人們可以用來創作的平臺,那么它們就不能只被世界上極少數擁有足夠資源來建造巨型超級計算機的科技公司所使用。
因此,微軟對一些軟件進行了大量的投入,例如用 DeepSpeed 來提高訓練效率,用 ONNX Runtime 來加速推理。這些軟件針對成本和延遲進行了優化,可以幫助我們讓這些人工智能大模型更容易為人們所用,也更有價值。我為我們的這些技術團隊感到自豪,因為微軟在這一領域確實處于行業領先地位,而且我們對所有這些成果都進行了開源,以便其他人也能夠不斷提升。
問:與這些進步相伴的是人們對“人工智能將影響就業”的擔憂。你如何看待人工智能和就業的問題?
Kevin Scott:我們生活在一個異常復雜和宏觀經濟歷史性變革的時代,展望未來5到10年,我們需要全新的生產力形式,讓所有人都能夠繼續享受進步。我們希望將這些人工智能工具打造成平臺,人們可以使用這些平臺來構建業務和解決問題。我們相信,這些平臺可以讓更多的人使用人工智能。而有了這些平臺,我們就能解決更多的問題,就會有背景更加多元的人們參與到技術的創造中來。
此前,人們需要大量的專業知識才開始人工智能的實例化。但現在你可以調用微軟 Azure 認知服務和微軟 Azure OpenAI 服務,并在這些服務的基礎上構建復雜的產品,而你不必是 AI 方面的專家,也不需要從零開始訓練自己的大模型。
隨著所有這些巨型人工智能系統的不斷增長和演進,我想我們可以預期,這些進步將從根本上改變工作的性質,每個領域被影響的程度會有所不同,在某些情況下甚至還會創造出大量以前沒有的新工作崗位?;仡欉^去可以看到,歷史上重大的技術范式轉變都伴隨著相同的情況:電話、汽車、互聯網。我認為就像這些例子一樣,我們需要用新的方式思考工作和技能,并專注于確保我們有足夠的人才且接受過培訓,能夠承擔起真正關鍵的工作。
問:與人工智能技術相關的另一個擔憂是技術被濫用和誤用的可能性。微軟正在采取哪些具體措施來確保其人工智能工具和服務是以負責任的方式開發和使用的?
Kevin Scott:我們一直非常嚴肅地對待這個問題。微軟的人工智能系統必須通過“負責任的人工智能(responsible AI)”流程,而且我們還在繼續改進這個流程。我們會與一個由多學科專家組成的團隊一起仔細審查正在進行的工作,確保我們充分了解可能發生的所有潛在危害,并盡可能降低它們的負面影響。例如,改進用于訓練模型的數據集、部署限制有害內容生成的過濾器、集成攔截敏感主題查詢的技術幫助防止不良行為者的濫用,或者應用可以返回更有用和更多樣化響應和結果的技術。我們為人工智能系統制定的計劃還包括在發布后盡快發現并減輕任何我們沒有預料到的危害。
另一個非常重要的保護措施是有意識的迭代部署。我們所做的大部分工作都是針對具有廣泛能力的模型。我們將這些模型托管在我們的云中,并通過 API 或我們的產品提供給公眾。任何開發者都可以訪問 API,但他們必須遵守服務條款才能使用,如果他們違反了服務條款,那么他們的訪問權限將被取消。對于其他產品,我們可能會先向一些有明確用例設想的客戶提供有限的預覽版。與這些早期客戶的合作將幫助我們確保負責任的人工智能保障措施能夠在實踐中發揮作用,以便我們能夠在更大的范圍內推廣應用。我們堅信安全和責任是重要的,希望我們能為整個行業提供一些激勵。為此,微軟將通過我們的“負責任的人工智能標準與原則(Responsible AI Standard and Principles)”,與業界共享在開發某些解決方案時應用的全部資源和專業知識。