中國福建網(wǎng)

當(dāng)前位置:中國福建網(wǎng) > 數(shù)碼 > 正文

傅盛:AI讓機(jī)器有了人類的感知,全鏈條AI技術(shù)賦能物聯(lián)網(wǎng)

作者: 編輯 來源:互聯(lián)網(wǎng) 發(fā)布時間:2018-11-13

┊文章閱讀:

11月8日,獵豹移動董事長兼 CEO 傅盛出席第五屆世界互聯(lián)網(wǎng)大會“物聯(lián)網(wǎng):連接無處不在”論壇,并發(fā)表題為《真開放·全鏈條AI技術(shù)賦能物聯(lián)網(wǎng)》的主題演講。

傅盛:AI讓機(jī)器有了人類的感知,全鏈條AI技術(shù)賦能物聯(lián)網(wǎng)

(圖為獵豹移動董事長兼CEO傅盛)


傅盛表示,即便是在今天的生產(chǎn)線上,也很難解決設(shè)備智能化的問題,而AI讓機(jī)器第一次擁有了人類的感知能力,也讓物聯(lián)網(wǎng)終端更聰明。這是一個巨大的分水嶺,使得AIoT的概念開始出現(xiàn)。在行業(yè)和自身的變革背景下,獵豹移動攜旗下人工智能公司獵戶星空,研發(fā)了包括語音識別、視覺識別、室內(nèi)導(dǎo)航平臺等在內(nèi)的行業(yè)唯一全鏈條AI技術(shù)。

他說到,“我們未來不會單做一款硬件,我們致力于打造AI賦能的云端操作系統(tǒng),跟開發(fā)者一起做更多的物聯(lián)網(wǎng)設(shè)備?!?/strong>

以下是演講全文:

首先,我花一點(diǎn)時間介紹一下獵豹移動。獵豹移動是一家經(jīng)歷過三次跨越的公司,2010年由我自己創(chuàng)辦的可牛影像和金山安全合并而成。

當(dāng)時我們經(jīng)歷的第一波是PC殺毒軟件免費(fèi)化,實現(xiàn)了第一次的增長。

第二波在移動互聯(lián)網(wǎng)的時候,我們碰到了強(qiáng)大的對手,決定出海。我們是第一家大規(guī)模的把用戶做到海外的中國公司。今天,獵豹移動大概有5億多的月度活躍用戶,其中80%來自于海外,完全走出了一條不一樣的曲線,我們內(nèi)部叫做“天外飛仙”。所以我們現(xiàn)在依然是Google工具排行榜的第一,我們游戲的下載次數(shù)在全球接近20億次。

第三波是在2014年上市以后。我當(dāng)時就意識到,整個移動互聯(lián)網(wǎng)的風(fēng)口將盡,我們需要尋找下一個機(jī)會。我們在硅谷、以色列都投資了基金,由此看到了人工智能的機(jī)會。

AI讓機(jī)器擁有感知能力 全力以赴打造全鏈條AI技術(shù)

我對人工智能有一些自己的理解和思考,我們講了很久的物聯(lián)網(wǎng)、智能硬件,其實在AI或者人工智能出現(xiàn)之前,所有的智能硬件都是偽智能硬件。那個時候的智能硬件本質(zhì)上是聯(lián)網(wǎng)硬件,你要掏出手機(jī)進(jìn)行操作。大概在三五年前,各種智能硬件的行業(yè)都起來了,但是很快這個行業(yè)又衰落了。

我甚至想要把機(jī)器人行業(yè)劃分成兩個分水嶺。在AI出現(xiàn)之前的機(jī)器人本質(zhì)上都是自動化機(jī)器,沒有人的屬性。我們看產(chǎn)線上那么多漂亮的機(jī)械手,其實都是通過非常原始的編程和自動化的設(shè)備進(jìn)行生產(chǎn)的。即便今天在生產(chǎn)線上,也很難解決智能化的問題。

傅盛:AI讓機(jī)器有了人類的感知,全鏈條AI技術(shù)賦能物聯(lián)網(wǎng)

但AI出現(xiàn)以后,第一次讓機(jī)器有了人類的感知能力,我們以前的攝像頭看到的都是0101等一串?dāng)?shù)字,但今天攝像頭看到的是人臉;以前看到的語音是波形,我們現(xiàn)在看到的語音是文字。

機(jī)器開始有了人類的感知能力,使得AIoT的概念開始出現(xiàn),看到這個機(jī)會以后,我們就去做了行業(yè)唯一的全鏈條AI技術(shù)。包括語音識別、視覺識別、導(dǎo)航、機(jī)械臂、麥克風(fēng)陣列等,為什么要做呢?

這是從內(nèi)外兩個方面思考的。

第一個,獵豹移動在以前做的太快了。我們就做一個小工具,居然就上市了。后來等到Google發(fā)政策不讓我們做工具,手機(jī)廠商都開始自己做工具的時候,我們的日子就變得很艱難。所以我當(dāng)時就想,擁有自己的底層技術(shù)很關(guān)鍵。

第二個,因為AI行業(yè)還處于早期。很多技術(shù)都不完善,或者沒有形成產(chǎn)業(yè)分工。但很多開發(fā)者,拿一塊板子,拿一個所謂的開放平臺,就想實現(xiàn)很好的語音識別效果,其實是非常難的。以智能音箱為例,換一個外殼罩上去,算法就得調(diào)整,因為混響不一樣。就像,在你的耳朵上加一個耳塞,聽力就可能大幅度下降,和你的大腦聰不聰明沒關(guān)系。所以整個人工智能產(chǎn)業(yè)的鏈條都非常新,又沒有足夠的分工。

第三個,我意識到,AI其實并不算是一個不可逾越的黑科技。很多人都說,BAT才能做AI,或者人家的積累更好一點(diǎn)。但是今天看來,開源代碼會遠(yuǎn)遠(yuǎn)豐富于任何一個時代。很多大洋彼岸的論文出現(xiàn)之后,中國的工程師就很快把它實現(xiàn)了。所以,好處就在于,AI大大降低了技術(shù)壁壘。而且AI使得以前很多公司的積累變得無效,大家處在同一起跑線上。我們認(rèn)為,這是一個彎道超車的好機(jī)會。

所以,我們當(dāng)時就下定決心,把所以技術(shù)全都干了一遍,全力以赴打造全鏈條 AI 技術(shù)。全干一遍的好處就是,我們能夠自主調(diào)整很多細(xì)節(jié)。

語音交互實現(xiàn)了命令的自然化 可能顛覆手機(jī)的中心地位

我認(rèn)為真正有智能的第一個硬件品類,應(yīng)該是智能音箱,我一直在想,語音識別是什么東西?今天有人談“語義理解能力超過人”。只要看到這種標(biāo)題,基本上都是騙子。

為什么這么說?在語義的理解上,AI離人有巨大的差距。因為語言是人類超級牛的發(fā)明,你能夠把你對世界的理解,壓縮成一串很短的文字輸入給對方,對方聽完以后,能把這個圖像、事件還原出來,這是個相當(dāng)牛的能力,人類之間的交流是帶有巨大的信息壓縮和背景知識的。

所以,今天機(jī)器完全做不到。AI想在閱讀理解上超過人類,那是在一個很有限的短文章里,沒有實際意義。

真正的語音操作是什么?我認(rèn)為它的本質(zhì)是實現(xiàn)了命令的自然化。喬布斯有一句話說,每一次交互操作的演進(jìn)都是一次革命。蘋果有幸抓住了兩次革命,第一個是抓住了鍵盤和鼠標(biāo),第二個是抓住了觸摸屏。

今天的手機(jī)不是因為它有多么智能,而是因為它有強(qiáng)大的處理能力,你可以非常方便地touch。所以手機(jī)立刻取代了以前的PC、電視,成為了你的中心位置。

但語音使得手機(jī)的中心位置有可能被顛覆掉,你想象一下,語音是什么?比如,你想看《延禧攻略》,以往你需要從口袋里掏一個東西,解鎖、搜索,未來可以用語音就直接喚醒:我想看《延禧攻略》。

我甚至認(rèn)為,雖然手機(jī)還是個非常關(guān)鍵性的設(shè)備,但下一代設(shè)備都可以變得去手機(jī)化。

兩年前,我們是業(yè)內(nèi)第二款做智能音箱的廠商。我們(聯(lián)合喜馬拉雅)做了一款小雅音箱,當(dāng)時很多人就問我,智能音箱有多智能呢?我回答:你不要考慮它有多智能,你只要考慮它是個搖控器,能夠非常簡單地點(diǎn)歌、了解天氣,設(shè)置鬧鐘。我們買來了對手的產(chǎn)品,我們發(fā)現(xiàn)點(diǎn)歌根本點(diǎn)不準(zhǔn),只有50%的準(zhǔn)確率。為什么?不是語音識別的問題,而是內(nèi)容上的問題。比如說今天抖音出了個神曲叫《我們一起學(xué)貓叫》,你的曲庫里得有這首歌。有的時候用戶說叫“學(xué)貓叫”,有的說喵喵喵,有多種的說法。這不是一個智能的活兒,這是個產(chǎn)品的活兒。

所以我們就把音樂的點(diǎn)播率和內(nèi)容的點(diǎn)播率,這一件事兒做好了。當(dāng)時,我覺得智能音箱的核心不是它有多智能,而是一種新的交互模式。這種新的交互模式本質(zhì)上就是一個搖控器,它把極其復(fù)雜難用的搖控器給改掉了,這個進(jìn)步是非常巨大的。

iPhone剛出來的時候,大家說這個沒有全鍵盤、沒有硬鍵盤怎么用,輸入內(nèi)容太慢了。但就是因為它方便,你可以容忍它非常多不夠快速的地方。

我們賦能了很多物聯(lián)網(wǎng)的中樞,我堅定的認(rèn)為,語音是下一代操作系統(tǒng)的界面,它一定可以使得物聯(lián)網(wǎng)的很多設(shè)備變得智能。可以跟你直接交互,不需要通過手機(jī)APP的方式,它自己就被賦能了。我們跟很多廠商合作了很多款音箱,因為我們覺得打音箱上的戰(zhàn)役可能打不過,但是合作是有機(jī)會的。

人工智能不會顛覆人 只要一點(diǎn)突破就會帶來變革

我們還做了一款能移動的售賣機(jī)——零售機(jī)器人豹小販,它會主動問你是否需要商品,用戶掃描二維碼就可以購買??吹饺硕嗟牡胤剿蜁^去,因為它有人臉識別技術(shù)。以前,售賣機(jī)只能放在一個地方,如今,自動售賣機(jī)的售賣效率,大概是傳統(tǒng)的三到五倍,用互聯(lián)網(wǎng)的定律看,當(dāng)多一個鏈接,互聯(lián)網(wǎng)就損失了50%以上的流量。而在線下零售端,當(dāng)你從原有的位置走出來,讓用戶看到有一點(diǎn)點(diǎn)改進(jìn),效率的改變是巨大的。

在機(jī)械臂方面,我專門去發(fā)那科看過他們的生產(chǎn)線。我個人覺得,在精密制造上和日本、德國企業(yè)去比拼,是沒有機(jī)會的。因為他們是三十年的積累,可以用機(jī)械臂生產(chǎn)機(jī)械臂。但是他們面臨一個問題:整個產(chǎn)線投產(chǎn)周期非常長,他要改變一個產(chǎn)品的時候,整條產(chǎn)線都要變,成本非常高。

我一直在想,AI 出現(xiàn)之后,可能不需要精密的機(jī)械臂,來做生產(chǎn)。我想到我奶奶的手,哆哆嗦嗦的,但她仍然能夠織毛衣,還可以穿針引線。核心不是因為她的肌肉能夠多么精確地控制,而是因為她能用眼睛做最后一點(diǎn)點(diǎn)調(diào)整。

受此啟發(fā),我們在機(jī)械臂上加上了攝像頭,使得它去抓杯子的時候,杯子怎么樣放都可以抓得到,這樣可以降低對機(jī)械臂精度的要求。

做機(jī)械臂的機(jī)床,如果從日本買,大概需要 2000 萬的投資,六個月之后拿貨,我們現(xiàn)在正在嘗試用韓國產(chǎn)的機(jī)床為我們做諧波減速器,未來可能用國產(chǎn)的機(jī)床。雖然精度降低了一點(diǎn)點(diǎn),由于由于有視覺技術(shù),所以它最后肯定能完成動作。

因為機(jī)械臂最大的成本就來自于諧波減速器,我們正在做的機(jī)械臂,未來可以降到市場價格的三分之一。當(dāng)機(jī)械臂的價格降低,可能會產(chǎn)生新的、比工業(yè)市場大十倍的市場,市場增大十倍之后,成本又會進(jìn)一步降低。在 AI 賦能之后,機(jī)械臂是有可能實現(xiàn)跨越式增長的。

在接待服務(wù)方面,如果大家有興趣的話,可以去獵豹移動參觀一下。我們的前臺已經(jīng)是機(jī)器人接待了,我們是一家沒有前臺的公司,只有機(jī)器人。你來的時候,我在OA上提一個申請,然后你會收到一條數(shù)字碼,機(jī)器人就會過來。你跟它說“我來面試”或者開會,把數(shù)字碼輸上,它給你拍張照,在我們的閘機(jī)上刷一下臉,你就可以進(jìn)入公司,它也會帶你去會議室。

今天講人工智能,很多人太強(qiáng)調(diào)所謂顛覆人的智能,這條路我還沒有看到顛覆人的地方。但核心是有可能實現(xiàn)一點(diǎn)點(diǎn)突破,比如說它能夠把原來的0101這種信號,對應(yīng)成真正的人臉和語音的字節(jié)的時候,其實我覺得這個機(jī)會就已經(jīng)非常非常巨大了。它會讓很多設(shè)備具備人的感知能力,在一個非常垂直的領(lǐng)域,完成一點(diǎn)點(diǎn)工作。這一點(diǎn)點(diǎn)工作,可能會帶來巨大的變革。

我們最近剛跟一個酒店簽約,我們的音箱進(jìn)酒店了。以后你到房間以后,你就直接可以說,開燈。你可以跟音箱說:“給我來支牙刷”,酒店系統(tǒng)就會收到,服務(wù)員很快就會把牙刷送過來。這樣的話,通過人工智能技術(shù)可以讓物聯(lián)網(wǎng)的設(shè)備變得更聰明,而且真正可以使得照明、空調(diào)等設(shè)備變得互聯(lián)互通,非常好用。

我希望機(jī)器人也好,音箱也好,都能跟各行各業(yè)合作,我們的本質(zhì)不是想做一個硬件,我們的本質(zhì)還是想做一個AI賦能的云端操作系統(tǒng),跟開發(fā)者一起做更多的物聯(lián)網(wǎng)設(shè)備。謝謝大家!