我從事人工智能相關(guān)的工作,有時候親朋好友就問我,你那個人工智能到底是什么玩意?我一般不做解釋,因?yàn)楹茈y說清楚。
后來,我碰到一個做演講的朋友,他了解了我的困惑之后,他給我布置了一個任務(wù):用十五分鐘講完人工智能,只有一個要求,必須讓你的受眾可以聽懂,哪怕只講一個1+1=2!
于是,我就試著列了一個提綱,如果大家不懂的話,請給我反饋。
人工智能,英文是Artificial Intelligence,縮寫是AI。我們經(jīng)常聽到穿西裝的人說AI、AI的,有時候指的是這個人工智能。如果,是穿嘻哈風(fēng)的年輕人說AI,他們可能是說Adobe Illustrator。這是Adobe公司出的一款軟件,用于圖形設(shè)計,是PS(Adobe Photoshop)的兄弟產(chǎn)品,主要用于設(shè)計卡通形象,它的縮寫也叫AI。
因此,當(dāng)有高端精英趾高氣揚(yáng)地給你說AI的時候,你可以問他,你說的是Artificial Intelligence還是Adobe Illustrator。后面,他或許會老實(shí)一些。
今天,咱們說的是人工智能這個AI。人工智能是由美國人麥卡錫在1956年提出的。人工智能的本質(zhì)是讓機(jī)器能像人一樣思考和行動。它主要通過模擬、延伸和擴(kuò)展人的智能,從而形成一定的理論、方法、技術(shù)及應(yīng)用的新技術(shù)科學(xué)。
概念就說這么多,下面看看它能做什么。
人工智能的應(yīng)用領(lǐng)域很廣,比如代替人眼的圖像領(lǐng)域、代替人嘴的語言領(lǐng)域。從它的應(yīng)用來看,確實(shí)是要代替人類的。
首先來看一個圖像分類,它能認(rèn)識一個圖像是什么。比如,認(rèn)識下面這個圖是香蕉。
再看一個,這個叫目標(biāo)檢測。相比于分類,它又更進(jìn)了一步,它可以找出哪個位置有什么物體。比如,紅框是蘋果,藍(lán)框是香蕉。
還可以更細(xì)致,下面這個叫語義分割。它可以判斷出,哪一個像素屬于什么物體。
這有什么用呢?炫技嗎?自動駕駛用它呀。路上的落葉、石頭、塑料袋,甚至是一個圖釘,都是需要識別出來,以便于分析能不能通過。
其實(shí),我們生活中最為常見的還是目標(biāo)檢測。
比如下面這張圖,工地入口處,檢測工人是否佩戴安全帽。
前兩天,我作為某大賽評委,看到了一個大學(xué)生做的一個作品,很有意思。
它可以檢測桃子是否成熟,是否有病蟲害,還可以驅(qū)趕鳥類。這個正好用于振興農(nóng)業(yè)發(fā)展。
還有更常見的一個應(yīng)用,那就是OCR識別。
下面這個可以把你的動作或者表情遷移到其他人身上(比如動漫人物)。
還有一個,我們也經(jīng)常見,叫超分辨率。它可以用于舊圖修復(fù),能讓模糊的圖變清晰。
可以說,圖像領(lǐng)域是人工智能應(yīng)用范圍最廣的領(lǐng)域(我就不說之一)。
我們看到,人工智能確實(shí)起到了替代人工的作用。我們不妨把時間拉長,不知道大家還能不能回憶起來,原來每個停車場(包含路邊)里,都有一個大爺,負(fù)責(zé)指揮停車,貼條計時,收費(fèi)放行。現(xiàn)在,都被機(jī)器給取代了。
除了圖像領(lǐng)域,在自然語言領(lǐng)域,人工智能的應(yīng)用也比較廣泛。
自然語言處理(Natural Language Processing 簡稱NLP),翻譯成通俗的詞語就是:人話。它想讓機(jī)器可以聽懂人話,看懂人話,而且還能任意表達(dá)人話,不限于哪國話。總之,就是讓機(jī)器人看書、寫字、閑聊天,還能有所總結(jié)和感悟,就和我們?nèi)祟愐粯印?/p>
看下面這個圖。
這是機(jī)器人在自然語言處理方面的成果,這個叫問答系統(tǒng)。
找來一篇文章,比如上面的例子,原文是:
TensorFlow是一個免費(fèi)的開源軟件庫,用于跨一系列任務(wù)的數(shù)據(jù)流和可微分編程。它是一個符號數(shù)學(xué)庫,也用于機(jī)器學(xué)習(xí)應(yīng)用程序,如神經(jīng)網(wǎng)絡(luò)。谷歌將其用于研究和生產(chǎn)。TensorFlow由谷歌大腦團(tuán)隊開發(fā),供谷歌內(nèi)部使用。它于2015年11月9日在Apache License 2.0下發(fā)布。
那么,當(dāng)機(jī)器學(xué)完了這段話之后。你就可以向他提問了。
你問它:TensorFlow是什么、什么是TensorFlow?
因?yàn)樗鼘W(xué)過。它就會回答:TensorFlow是一個免費(fèi)的開源軟件庫……
除此之外,你問它誰發(fā)明的TensorFlow?這個它也學(xué)過,原文中有。它會回答說,是谷歌大腦開發(fā)的。
如果你問它,ITF男孩長得帥不帥?它就智障了。因?yàn)闆]學(xué)過。
你遇到的很多客服系統(tǒng),不是AI技術(shù)不行,主要是沒有那么多對話數(shù)據(jù)去學(xué)習(xí)。
除此之外,還有很多的應(yīng)用。
分類 | 簡介 | 應(yīng)用場景 |
---|---|---|
文本分類 | 通過訓(xùn)練對一段文本的進(jìn)行分類 | 情感分類、輿論監(jiān)控、文學(xué)體裁分類等 |
智能回復(fù) | 基于大量聊天消息訓(xùn)練,依據(jù)上下文的相關(guān)內(nèi)容生成回復(fù)建議 | 智能客服、聊天機(jī)器人、問答系統(tǒng) |
語言翻譯 | 將一種語言的文本轉(zhuǎn)換為另一種語言,同時保持含義完整 | 英漢翻譯、中日翻譯、古文現(xiàn)代文翻譯 |
文本生成 | 基于大量文本訓(xùn)練,輸出當(dāng)前詞語之后最大概率出現(xiàn)的文本 | 輸入法聯(lián)想、文本自動補(bǔ)全、智能對聯(lián)、自動寫原創(chuàng)文章 |
信息提取 | 獲取明文公告,通過算法提取關(guān)鍵信息,輔助決策 | 金融風(fēng)控 |
更多領(lǐng)域
人工智能的應(yīng)用領(lǐng)域很多。
各項技術(shù)可以相互結(jié)合,比如谷歌Imagen搞了一個語言加圖像的應(yīng)用,叫文本圖像合成。說白了就是:我說你畫。
我說:一個騎自行車的土狗,一個游泳的泰迪熊。然后,人工智能就能畫出對應(yīng)的圖。
這是小意思,可以再發(fā)揮點(diǎn)兒想象力,比如我說:一個火龍果在大雪天,成為了跆拳道黑帶!
你以為這只是科研階段嗎?不是的。我寫自媒體,我是看在眼里的。包括百度、頭條等平臺,已經(jīng)上線了文章轉(zhuǎn)視頻的功能。只要有文字,就可以生成音頻,可以生成視頻,而且我就在使用。
但是,不管怎么結(jié)合,萬變不離其宗,人工智能是由一些基礎(chǔ)技術(shù)支撐的。
其他AI相關(guān)技術(shù),都是通過使用這些基礎(chǔ)技術(shù)發(fā)展起來的。這幾個基礎(chǔ)技術(shù)如下:
機(jī)器學(xué)習(xí):人工智能的核心,研究計算機(jī)怎樣模擬或?qū)崿F(xiàn)人類的學(xué)習(xí)行為,以獲取新的知識或技能,重新組織已有的知識結(jié)構(gòu)使之不斷改善自身的性能。
知識圖譜:用圖模型來描述知識和建模世界萬物之間關(guān)聯(lián)關(guān)系的技術(shù)方法。這是先決條件,只有建立了行業(yè)知識圖譜,才能給出行業(yè)AI方案。現(xiàn)在各家都在搞知識圖譜,但是很少有真正實(shí)用的。
自然語言:能實(shí)現(xiàn)人與計算機(jī)之間用自然語言進(jìn)行有效通信的各種理論和方法。主要應(yīng)用于機(jī)器翻譯、輿情監(jiān)測、自動摘要、觀點(diǎn)提取、文本分類等。
人機(jī)交互:為完成確定任務(wù)的人與計算機(jī)之間的信息交換過程。例如:眼睛虹膜、眼動、掌紋、筆跡、步態(tài)、語音、唇讀、人臉、DNA等。
語音識別:是利用機(jī)器將語音信號轉(zhuǎn)換成文本信息。
圖像視覺:用攝影機(jī)和電腦代替人眼對目標(biāo)進(jìn)行識別、跟蹤和測量等機(jī)器視覺,并進(jìn)一步做圖形處理。
人工智能有三個發(fā)展階段:弱人工智能、強(qiáng)人工智能、超人工智能。
當(dāng)前的話,人工智能還處于弱人工智能階段。并且,這一階段將維持較長的時間。
那位說了,這孩子說話,老賣關(guān)子。你倒是說啥樣是強(qiáng),啥樣是弱啊。
這是我們目前所處的階段,你看到的人工智能,都是弱人工智能。
它只會計算和推斷,只能解決某個具體問題。比如智能推薦購物、機(jī)器人客服、識別哈士奇與狼、自動作畫、甚至戰(zhàn)勝柯潔的AlphaGo等。
當(dāng)走向強(qiáng)人工智能時,機(jī)器人就擁有了意識,擁有和人類一樣的智能水平。換句話說,你和它一起生活,你發(fā)覺不出它是個機(jī)器人。
到了超人工智能,它就會像人類一樣自己去學(xué)習(xí)。而且學(xué)習(xí)速度極快,幾秒鐘運(yùn)算上億次,幾分鐘可以超過人類幾百年的積累,智能水平會遠(yuǎn)超過我們?nèi)祟悺?/p>
到時候,就不是我在這里編文章了。我比它差多了。我腦子里只有100本書,AI腦子里有全人類的知識。
現(xiàn)在大廠的AI平臺太多了,還有必要自己做人工智能嗎?個人還有機(jī)會嗎?
有機(jī)會呀。大廠平臺解決的是1000萬人市場規(guī)模中70%的問題。自研人工智能可以解決垂直領(lǐng)域10萬人市場95%的問題。大與小的辯證一直都存在。海洋里有大魚存在,不代表蝦米就會滅絕。
你在某一個極小的點(diǎn)上,做出超過大廠的效果,這在業(yè)內(nèi),真的一點(diǎn)也不奇怪。
人工智能很難嗎?
寫到這個標(biāo)題,估計有人預(yù)測我要賣課了,看著挺像,但并非如此。
做學(xué)術(shù)研究門檻確實(shí)高,但是做應(yīng)用解決問題真的非常簡單。
人工智能框架非常多,如果僅僅是做應(yīng)用,了解了基本概念之后,幾行代碼就可以解決很多問題。國家也有計劃在小學(xué)生中普及AI編程,可見它并不是很難。
弱人工智能還要持續(xù)很長時間,限制人工智能發(fā)展的因素是什么?
業(yè)內(nèi)普遍認(rèn)為主要有3項:算力、算法和數(shù)據(jù)。
算力主要指計算機(jī)硬件設(shè)備。算法主要指人工智能的軟件支持。
數(shù)據(jù)指提供人工智能分析和學(xué)習(xí)的素材。目前在信息化很發(fā)達(dá)的今天,數(shù)據(jù)依然不足以支撐人工智能實(shí)現(xiàn)質(zhì)的飛越。主要原因是數(shù)據(jù)碎片化嚴(yán)重,各場景下的采集和歸納成本極高。
小數(shù)據(jù)僅僅能支撐小場景。比如自動駕駛,你搞一個你房間里的自動駕駛其實(shí)很簡單,路線和物品基本都是固定的。你訓(xùn)練好了模型,在你屋里它可以自由走動,可以去次臥拿了物品放到主臥去。但是,你放到你們小區(qū)里,就不行了。放到全國、全球,就更智障了。雖然說,人工智能不是窮舉所有場景,但是代表性的樣本都來幾條不過分吧。僅僅這個數(shù)量級,現(xiàn)在也是無法收集到的。
以上就是我講的人工智能。
大家好,我是ITF男孩,一個IT男。帶你從IT角度看世界。