“你可以說它是一款智能音箱,但是了解得越多,你越會發(fā)現(xiàn),這絕不僅僅是一個智能音箱。”阿里人工智能實驗室(A.I. Labs)負責人淺雪在7月5日“天貓精靈X1”發(fā)布現(xiàn)場,著重強調(diào)了這一句。
當天正式發(fā)布的天貓精靈X1,在一周前就已經(jīng)被嗅覺靈敏的外媒曝光,文章中還著重強調(diào)了這是一款中文語音交互系統(tǒng),并暗示這是阿里巴巴在智能家庭入口迎擊Ehco的一道武器。
而外媒曝光的同一天,馬云正好出息天津“世界智能大會”,盡管當天滿臉疲憊,但是當馬云說到“現(xiàn)在對人工智能這個詞一聽就生氣”時,聲音卻明顯大了很多。他所謂的生氣,是對智能前面冠以人工一詞“感到可笑”,并描述了自己對AI內(nèi)涵的看法。
“人類生命質(zhì)量會因為智能時代的到來,具有更高的水平。以前的工業(yè)革命,是讓人變得更像是機器;而未來的數(shù)據(jù)化和智能化,會讓機器越來越像機器,而讓人活得越來越像人。”馬云同時強調(diào),面對智能化時代,現(xiàn)在一切都像是萬米長跑才剛剛開始。“我們不要剛跑幾十米就去找身邊的競爭對手是誰?你要跑了3000米以后,再去看看自己的對手是誰?要看看前面更遠的谷歌、IBM跑到哪里了。”
不僅僅是跟隨
盡管馬云當天沒有提到過一句關(guān)于阿里巴巴未來在智能家庭場景下的戰(zhàn)略和構(gòu)想,但是他為幾天后阿里首款智能語音終端發(fā)布留下了潛臺詞:讓人活得更像人;真正的對手是已經(jīng)領(lǐng)跑的谷歌和亞馬遜。
很顯然,當7月5日淺雪如數(shù)家珍般悉數(shù)天貓精靈X1強大有趣的功能時,潛臺詞同樣是用戶體驗和完備的生態(tài)體系:“語言應該是人與另外一種智能進行交流的主要方式。”未來這種智能交互將會讓使用者的體驗更自然、方便、簡單和愉悅;而通過云端一體化的AliGenie引擎的打磨,先將電商應用融入到使用者的購物場景中,未來再與其他生態(tài)伙伴共同打造更廣泛的應用場景。
有輿論曾經(jīng)在天貓精靈X1發(fā)布后提出,阿里巴巴在支付、電商、云平臺和大數(shù)據(jù)方面已經(jīng)對標亞馬遜、谷歌這樣的企業(yè),沒必要再去做一個類似的智能音箱,亦步亦趨跟在別人身后。
實際上,從馬云在世界智能大會上的發(fā)言,再到淺雪在發(fā)布會上對于這款產(chǎn)品的描述,我們能夠看到,如果只是把它當做一款硬件產(chǎn)品,那似乎是在效仿別人;但是如果把它放到阿里“NASA”計劃中來分析,它確實已經(jīng)不是簡單的一個硬件產(chǎn)品,而是阿里希望將技術(shù)運用到整個生態(tài)體系中的戰(zhàn)術(shù),即通過良好的AI技術(shù)、開放的平臺以及生態(tài)協(xié)同優(yōu)勢,讓大多數(shù)人能夠愉悅、實惠地去使用。
如果說智能語音交互是現(xiàn)階段人與AI最好的交流方式,沒有人會質(zhì)疑。而國際市場已經(jīng)有亞馬遜Echo、谷歌Home和蘋果HomePod等強者面世,國內(nèi)騰訊云“小微”、百度“小魚在家”以及京東“叮咚”也都先后亮相,那么阿里的AliGenie+天貓精靈的機會在哪里?
從聲紋和語義切入
回到阿里“NASA”的核心,一切還是以掌握核心技術(shù)為核心。馬云曾強調(diào),“nasa計劃將是面向機器學習、芯片、IoT、操作系統(tǒng)、生物識別等核心技術(shù),要組建全新團隊、建立嶄新機制,全力以赴。要為解決10年、20年后的困難去儲備核心科技。”
在阿里三大智能事業(yè)部中,淺雪負責的A.I. Labs肩負著讓NASA的AI應用在To C市場普及的責任。目前國內(nèi)外同行都在推動相關(guān)的產(chǎn)品,天貓精靈能否成功,關(guān)鍵是如何給使用者最佳的使用體驗。
語言作為智慧生物最為主要的交流方式,其方便性和易用性成為目前智能家庭終端的“標配”。既然整個市場都已經(jīng)邁入了智能語音交互時代,那么邁出第一步的AliGenie+天貓精靈,必須要有讓使用者在交互方面獲得獨特的感受。
淺雪表示,AliGenie目前對用戶的聲紋識別,能夠做到專人專用和千人千面。她在和自媒體達人王自如的遠程互動中,展示了天貓精靈對于聲紋的識別能力,比如能夠?qū)ν踝匀绲穆曇暨M行識別和確認,并且根據(jù)識別后的結(jié)果向其進行了個性化內(nèi)容(歌曲、電影等)的設定和推薦。
更重要的是:另外當王自如發(fā)出語音購物的要求后,還通過聲紋鑒別真?zhèn)危WC購物時的安全性和私密性。淺雪介紹,這種通過聲紋購物的功能是首個實現(xiàn)商用化的聲紋購物系統(tǒng),而通過聲紋購功能,用戶未來還可以應用到更多的支付場景中。
除了聲紋識別,淺雪也指出,中文語音交互的難點更在于語義理解。她以提問“西藏天氣如何”,得到關(guān)于拉薩的實時氣象預報這個例子,強調(diào)目前語義理解引擎對于天氣預報已經(jīng)能夠明白超過780種的中文提問方式。“這個系統(tǒng)兼容了20個領(lǐng)域的自然語義理解。而且我們的引擎針對于用戶常用的天氣、定時、休閑、娛樂、家點控制,生活助手等很多方面都進行了專門的優(yōu)化。”
個體進化和生態(tài)進化
通過深度機器學習以及不斷地訓練,AliGenie+天貓精靈作為一個消費級產(chǎn)品,在軟硬一體結(jié)合程度,語音語義的能力和交互易用性等方面都在進行突破。
淺雪最后強調(diào),阿里更為看重語音助手高度可擴展性的特點,作為一個具備進化能力的智能化設備,隨著開發(fā)者的入駐,天貓精靈X1能夠?qū)崿F(xiàn)的功能還將不斷地增加。
實際上,業(yè)界對于真正意義上AI都有共識,即語義交互加上學習理解能力。簡單的語音識別功能,勢必在將來AI入口的爭奪中失去意義。淺雪總結(jié)天貓精靈X1的三大AI能力,分別是理解、執(zhí)行和進化。我們也認為,對于阿里的NASA來說,未來不斷進化中的“智慧終端群體”,才是最具有威力的“導彈”。
這樣說的原因是,這個“進化”未來不僅僅是來自于產(chǎn)品本身經(jīng)過大數(shù)據(jù)和AI技術(shù)的訓練、實踐、進化。它還包括了每個終端產(chǎn)品+云端智能引擎與阿里周邊生態(tài)的共同進化。從當天發(fā)布的阿里精靈開放平臺來看,其將領(lǐng)先的技術(shù)與商業(yè)形態(tài)、生態(tài)合作伙伴緊密結(jié)合,直接面向商用落地的戰(zhàn)術(shù)已經(jīng)十分明顯。
將AI融入阿里 DT 大商業(yè)體系中,配合云計算、大數(shù)據(jù)強化阿里的電商物流甚至物聯(lián)網(wǎng)體系如果被視為“登月”,那么這個迷你的天貓精靈,則是很有意義的“一小步”。
懂懂筆記
懂懂工作室,成立于2016年。
冷眼旁觀,麻辣點評,深入分析,幫助你用新的視角了解快速變化的產(chǎn)業(yè)。
創(chuàng)始人懂懂于2014年、2015年分別參與了《微信思維》、《微信力量》兩本暢銷書的撰寫。于2016-2017年獨立撰寫《小米生態(tài)鏈戰(zhàn)地筆記》。
【懂懂筆記】是全平臺自媒體,團隊原創(chuàng)內(nèi)容發(fā)布在微信公號、百家號、新浪創(chuàng)世紀、網(wǎng)易、雪球、企鵝號、界面、今日頭條、一點資訊、藍鯨、UC頭條、北京時間、虎嗅、鈦媒體等十幾個科技類主流平臺。
END