中國福建網(wǎng)

當(dāng)前位置:中國福建網(wǎng) > 數(shù)碼 > 正文

從安兔兔AI測試看兩大勢力角逐:手機(jī)人工智能發(fā)展也不清凈

作者: 編輯 來源:互聯(lián)網(wǎng) 發(fā)布時間:2019-02-07

┊文章閱讀:

剛跨過安兔兔跑分的坎,又跌入安兔兔AI評測的坑。評價君這么形容麒麟980其實并沒有什么不恰當(dāng)?shù)牡胤?。不久前安兔兔官方發(fā)布了一款A(yù)I測試工具,然而跑分之后有些小伙伴不淡定了,這分?jǐn)?shù)究竟是咋跑出來的?不怪各位有這樣的疑惑,今天評價君就稍微解讀一下AI測試背后的一些東西,看完也許就知道該如何理解跑分。

廢話不說,先來看看被質(zhì)疑的成績是怎么回事。從評價君截取的三張圖可以看到,小米Note3、紅米Note7兩款手機(jī)獲得了超過72000分的成績,而榮耀Magic2的成績是62964分。前面兩款使用的是驍龍660芯片,因此從這三張圖能輕易得出他們勝過麒麟980的結(jié)論,焦點自然也就在這了。

評價君順便挖個坑:各位說驍龍660和驍龍660 AIE是同一款芯片么?這個問題在本文中不討論。

對于這種現(xiàn)象,安兔兔官方的人自然也是強(qiáng)勢回?fù)?。大概總結(jié)起來就是三點。第一這個成績和測試標(biāo)準(zhǔn)被海思認(rèn)可。第二,AI不代表整體性能。第三,NPU沒底層支持所以成績差。評價君對這個回應(yīng)不發(fā)表評論,只順勢說一下不怎么清凈甚至暗流涌動的AI競爭。

在很早之前,評價君就多次在介紹AI的文章中引用了另一款軟件AI Benchmark的榜單。這是一個相對權(quán)威的榜單,測試成績也都是公開的,各位可以到網(wǎng)上查詢??闯煽冎啵恢烙袥]有人注意到很多成績的右上角都有備注信息?這個備注往往被忽略,但其實相當(dāng)關(guān)鍵。

評價君隨便解釋幾個對本文可能有用的吧:

1——代表支持浮點AI模型,也就是依賴FP16運(yùn)算能力,典型的就是華為芯片內(nèi)置的NPU。

2——代表支持量化AI模型,依賴的是INT8運(yùn)算能力,典型代表就是高通的Hexagon DSP。

3——代表對前面兩者通吃。多說一句,即便通吃,實際使用中也只能二選一。

6——代表使用了Android的NNAPI驅(qū)動,AI性能會有30%到50%提升,但系統(tǒng)最低要求是Android 8.1。還敢說升級系統(tǒng)沒用?

7——代表使用華為EMUI8.1系統(tǒng),該系統(tǒng)的BUG會導(dǎo)致長時間待機(jī)之后AI性能下降30%,重啟之后恢復(fù)。(╯‵□′)╯︵┴─┴

所以先解釋了三星芯片為什么得分低:Exynos 9810不支持任何AI運(yùn)算模型,全靠CPU運(yùn)算,這一點AI Benchmark和安兔兔結(jié)論一致。那么接下來問題來了,從上面可以知道AI運(yùn)算模型有INT8和FP16兩種,在方案上就是高通DSP和華為NPU競爭。安兔兔員工說NPU無法被調(diào)用所以測不出成績,AI也無法發(fā)揮作用。那真就不能讓兩大方案一比高低了嗎?

答案當(dāng)然不是。同樣作為測試軟件的AI Benchmark非常清楚的給出了麒麟980基于FP16模型的AI成績,并不存在無法調(diào)用NPU的問題。同時也能看到,支持NPU和不支持NPU成績差距相當(dāng)明顯,測試中運(yùn)算速度會被加快3倍左右。所以同樣測試AI性能,安兔兔做不到的項目,AI Benchmark做到了,不愧是愛因斯坦母校的作品。

其實從網(wǎng)友分享的成績來看,安兔兔對INT8評分的測試還是相當(dāng)精準(zhǔn)的,測試做的相當(dāng)有技術(shù)水平。比如下圖中的vivo X23完全可以把前面的驍龍660手機(jī)摁在地上摩擦,實際上它可能只是一個驍龍670芯片的機(jī)型。

安兔兔AI測試這成績很好的解釋了兩者的硬件差異——雖然其他方面比較相近,驍龍670使用了驍龍845同款的Hexagon 685,AI性能向旗艦看齊。同理,也可以看到小米6的AI成績遠(yuǎn)不如小米8,也反映了小米6和小米8使用不同DSP產(chǎn)生的性能差距。所以至少在高通系芯片上,安兔兔AI測試相當(dāng)有參考價值。

AI運(yùn)算到底是基于INT8還是基于FP16,不光是高通和華為之間的矛盾,也是人工智能模型繼續(xù)向前推進(jìn)和發(fā)展必須面對的問題,兩種方案都有各自的支持者投入大量研發(fā)力量促進(jìn)其進(jìn)化,以確保獲得競爭中的優(yōu)勢。以目前情況看,直接競爭也就不可避免了,測試軟件則在其中起到了導(dǎo)向作用。

所以不客氣的說,任何評測軟件都會有自己對發(fā)展趨勢的理解和預(yù)判。盡管可能讓用戶覺得軟件有傾向性,但只有這樣才能發(fā)揮出自己最大的價值,這一點放之四海皆準(zhǔn)。對于用戶來說,也就意味著不能只看一個測試軟件的結(jié)果,要綜合評估。其實跑分除了驗證某些猜想之外,跑分對于絕大多數(shù)用戶而言意義也并不大,看看就好,不要太認(rèn)真。

  • 牙齒美容
  • 好愛卡
  • pe管
  • 石家莊小吃培訓(xùn)
  • 裝修平臺
  • 南京小吃培訓(xùn)
  • 植物提取物網(wǎng)
  • 源碼論壇
  • 激光打標(biāo)機(jī)
  • 丹泊儀器
  • 礦山生態(tài)修復(fù)
  • 青島月子會所
  • 南京刑事律師