中國福建網(wǎng)

當前位置:中國福建網(wǎng) > 國內(nèi) > 正文

為爭取到更多手機廠商,AI公司曠視科技正朝人臉識別方向努力

作者: 編輯 來源:互聯(lián)網(wǎng) 發(fā)布時間:2018-08-14

┊文章閱讀:

圖片來源:視覺中國

毫無疑問,人臉識別已經(jīng)成為手機廠商日益重視的功能模塊。

不論是vivo今年發(fā)布的旗艦機X21,還是OPPO的主打款 Find X,更不用提 iPhone X 在2017年問世時基于3D視覺感知的 Face ID ,與人臉識別相關(guān)的應(yīng)用模塊已明顯成為趨勢。

從具體的應(yīng)用來說,諸如屏幕解鎖、人臉支付、人像捕捉、美顏修圖等功能背后,均由 3D 的視覺方案來支撐。

什么是 3D 的視覺方案?

如鈦媒體作者 Kiwi_s在介紹 OPPO的3D 視覺方案中談到的:如果我們把手機比喻為眼睛,那么在傳統(tǒng)識別技術(shù)中,手機這雙“眼睛”看到的都是一個平面的世界,而3D視覺技術(shù),則讓手機從平面視覺升級為立體視覺,從而對人臉識別的速度、精度實現(xiàn)質(zhì)的提升。

目前行業(yè)中三種主流的3D視覺方案為:雙目立體視覺方案、3D結(jié)構(gòu)光方案、TOF方案。

在三種不同的3D視覺方案中,它們各自都有鮮明的優(yōu)缺點和不同的使用場景。其中,雙目方案屬于被動采集,而3D結(jié)構(gòu)光和TOF技術(shù)則為主動采集方案,滿足了3D視覺上拍攝距離不同的應(yīng)用場景細分。

被稱為國內(nèi)“視覺識別 AI 四小龍”之一的曠視科技,就是為這些手機廠商提供人臉識別方案的幕后關(guān)鍵角色。

今年6月,曠視率先為OPPO、vivo提供基于安卓系統(tǒng)的3D視覺感知技術(shù)支持,并于近期發(fā)布業(yè)內(nèi)首個“軟硬一體”的移動端3D感知全棧解決方案。

根據(jù)曠視的官方披露,所謂全棧方案,就是從算法創(chuàng)新、應(yīng)用開發(fā)、設(shè)備制造到解決方案,形成完整的產(chǎn)業(yè)閉環(huán),具體來說,在曠視發(fā)布的軟硬一體移動端智能3D產(chǎn)品解決方案中,最上面一層是3D應(yīng)用層,往下依次至AI算法、解決方案,最后到攝像、傳感等硬件設(shè)備制造上。

“手機3D視覺領(lǐng)域雖然已有多種類型的應(yīng)用案例出來,但該領(lǐng)域包含算法和模組的軟硬一體整體解決方案仍是缺位的,曠視科技正在嘗試一種從上往下的整合方案。”曠視科技云事業(yè)部高級副總裁吳文昊介紹稱。

曠視科技云事業(yè)部高級副總裁吳文昊

把一個全新的生態(tài)通過整合形成更具效率的角色分配,這件事并不容易,不過,曠視之所以成為這條產(chǎn)業(yè)鏈的“攢局者”,當中的深層原因一方面來自手機 AI 落地本身的難度;另一方面是來自行業(yè)客戶的需求。

從行業(yè)總體來說,在手機人臉識別背后的視覺感知技術(shù)方案,目前仍屬于起步階段。

蘋果就曾在人臉識別方案的落地遭遇過巨大挑戰(zhàn),蘋果原本計劃在2016年便推出Face ID技術(shù),并在當時已量產(chǎn)了4萬臺 iPhone X 用以驗證方案。但鮮為人知的是,由于蘋果并不是一家做算法的公司,相關(guān)的底層技術(shù)、算法并不完善,出于對用戶體驗的考量,蘋果不得不推遲一年用以測試,到2017年才發(fā)布搭載Face ID的新一代iPhone。

產(chǎn)業(yè)鏈角色的分散,是手機端 AI 方案落地面臨的第一個難點。吳文昊談到了曠視與手機客戶討論項目的場景:開會時有十多家廠商參與,他們既來自世界各地,又分屬產(chǎn)業(yè)內(nèi)傳感器、模組、光電等不同環(huán)節(jié),每一家都如同一個孤立的零部件,整個產(chǎn)業(yè)無法得到串聯(lián)。

“大家相互分散,很多做硬件的不懂軟件,做軟件的對硬件把控也不足,而最后的落地又需要應(yīng)用去驅(qū)動。”吳文昊對鈦媒體說,他以刷臉支付舉例,當中識別人臉的精度、支付安全標準、對活體工攻擊的能力防范,這些問題都需要應(yīng)用場景來反推驗證,并由產(chǎn)業(yè)鏈上的各個角色配合完成。

按照人臉識別在手機落地需要的 AI 方案,曠視也聯(lián)合多家合作伙伴,搭建了軟硬一體的移動端產(chǎn)品矩陣,具體為:

  • 3D 應(yīng)用:曠視研發(fā)的3D人臉識別解鎖和3D人像光效應(yīng)用已經(jīng)實現(xiàn)了規(guī)?;瑫r在安全支付、3D 美顏、3D 整形等領(lǐng)域均有所涉獵,根據(jù)曠視透露,下一步將投入到AR游戲、虛擬試穿等應(yīng)用。
  • 3D 算法:在AI+3D的底層算法研發(fā)方面,曠視專注于識別和重建兩個大類。識別即機器感知、理解世界的能力;重建即把識別出的物體進行三維重建,是開發(fā)針對人、針對物的3D視覺應(yīng)用核心所在,曠視目前已與Bellus 3D、Altizure等3D視覺企業(yè)開展了聯(lián)合研發(fā)合作。
  • 解決方案:曠視根據(jù)不同應(yīng)用場景中對深度計算、深度修復(fù)、深度優(yōu)化、標定、畸變校正等能力的需求,整合結(jié)構(gòu)光、TOF、雙目等不同的攝像、傳感系統(tǒng)架構(gòu),設(shè)計出基于雙攝、三攝、深攝的解決方案。
  • 硬件模組:移動端3D產(chǎn)業(yè)鏈最下面一層是硬件制造,包含攝像頭、傳感器、芯片等硬件模組的研發(fā)。結(jié)構(gòu)光、TOF和雙目方案涉及到高清攝像頭、IR投射器、IR接收器、激光發(fā)光器等設(shè)備的搭配組合,曠視目前已經(jīng)與艾邁斯半導體等3D硬件模組廠商展開合作。

曠視最新推出的3D 視覺全棧方案,即從算法創(chuàng)新、應(yīng)用開發(fā)、設(shè)備制造到解決方案,形成完整產(chǎn)業(yè)閉環(huán)。

可以看出,曠視在全棧方案的四層中主要涉及3D 應(yīng)用層與算法,而在曠視不太擅長的硬件及解決方案中,則采取了與三維技術(shù)集成商珠科創(chuàng)新、光場應(yīng)用服務(wù)商疊鏡數(shù)字、傳感器服務(wù)商艾邁斯半導體等合作伙伴共同開發(fā)的方式;此外,曠視還宣布將聯(lián)合主要芯片廠商合作研發(fā)算法適配性更強的芯片,進一步優(yōu)化手機3D應(yīng)用能力。

隨著手機廠商對 3D 視覺識別技術(shù)的青睞,曠視在產(chǎn)業(yè)鏈上明顯的抱團動作,實則也是用“生態(tài)”形成壁壘的一種方式。而在AI 服務(wù)手機場景的戰(zhàn)場上,曠視的另一位競爭對手商湯科技也同樣動作頻頻。

今年5月,商湯實現(xiàn)了從2D人臉識別向3D結(jié)構(gòu)光人臉識別的升級,這一技術(shù)已搭載于最新發(fā)布的小米8透明探索版,商湯科技聯(lián)合創(chuàng)始人、研究院院長王曉剛在接受界面新聞采訪時,也談到了對生態(tài)鏈的看法。

“蘋果、三星這樣的廠商是軟硬一體,可以提供整體的方案;國內(nèi)的手機公司和技術(shù)提供方是分開的,這就需要兩邊更好地結(jié)合,才能和外國廠商抗衡?!?/p>

而在具體的合作方面,商湯科技的做法是,在頭部廠商落地方案之后,再把相關(guān)的技術(shù)標準化,形成類似SDK的整合,然后提供給更加長尾的客戶。之后,商湯科技還會逐漸形成一個平臺,來提供更加綜合性的服務(wù)。

這樣來看,商湯主打技術(shù)產(chǎn)品化形成的“平臺”,曠視則專注于搭建“生態(tài)”后成為軟硬一體的服務(wù)商。對于如何構(gòu)建自己的門檻,曠視科技云事業(yè)部高級副總裁吳文昊表示:“沒有哪一種策略是不能通過時間與金錢完成的。但重要的是,首先愿不愿意做改變,這是一個定位的問題;其次才是改變的決心和能力?!?strong>(本文首發(fā)鈦媒體,作者/蘇建勛)

  • 新浪新聞
  • 百度搜索
  • 搜狗搜索
  • 京東商城
  • 企業(yè)慧聰
  • 新浪科技
  • 科技訊
  • 鵪鶉蛋價格
  • 唯美圖片