┊文章閱讀:次
前言:從 Symbian 時(shí)代到如今的 iOS 和 Android,在手機(jī)上,我們已經(jīng)經(jīng)歷了一次從物理鍵盤(pán)到虛擬鍵盤(pán)的輪回。鍵盤(pán)從屏外到屏內(nèi),但手機(jī)輸入法依然還是那個(gè)輸入法,只是它已經(jīng)從單純的文字輸入工具,進(jìn)化成了以文字輸入為核心賣(mài)點(diǎn)的「百寶箱」式的 APP。
?
? ? 它不只是能幫你打字,還能幫你搜索、幫你斗圖,甚至幫你翻譯。
?
? ? 有人會(huì)嫌棄說(shuō)「手機(jī)輸入法變得越來(lái)越臃腫了」,但實(shí)際上手機(jī)輸入法的功能變得越來(lái)越強(qiáng)大和全面,也是不爭(zhēng)的事實(shí)。輸入法之所以會(huì)向功能全面化進(jìn)化,顯然是離不開(kāi)中文輸入法這個(gè)大環(huán)境下的激烈競(jìng)爭(zhēng)。
?
? ? 尤其是搜索巨頭的進(jìn)場(chǎng),搜狗輸入法、塞班末期借殼點(diǎn)訊的百度輸入法和收購(gòu) A4 完成布局的 QQ 輸入法,為了「搜索截流」這個(gè)目標(biāo)布局手機(jī)輸入法市場(chǎng)的搜索巨頭,直接推動(dòng)了輸入法的功能進(jìn)化。
?
? ? 搜索巨頭之所以看中輸入法,是因?yàn)椤篙斎搿故怯脩?hù)表達(dá)自我的基礎(chǔ)需求——你可以不使用任何一個(gè)手機(jī) APP,但鍵盤(pán)任何人都必不可少——布局輸入法既能為用戶(hù)精準(zhǔn)畫(huà)像,也能從用戶(hù)點(diǎn)擊輸入框的第一時(shí)間,就截取用戶(hù)的搜索流量。把輸入法用作一個(gè)可以無(wú)視時(shí)間和空間的 Launcher,做搜索引擎的百度、搜狗、騰訊瞄準(zhǔn)輸入法是這個(gè)思路,做 AI 的訊飛瞄準(zhǔn)輸入法,同樣也是這個(gè)思路。只是百度在打字之余位用戶(hù)提供了搜索入口,而訊飛為用戶(hù)提供了AI。
?
AI,正是訊飛的拿手好戲
?
? ? 2010 年發(fā)布時(shí),訊飛輸入法更像是專(zhuān)長(zhǎng)智能語(yǔ)音和人工智能技術(shù)的科大訊飛的 to C 先行者,拿出最新的技術(shù)在市場(chǎng)上試錯(cuò)。而在逐漸迭代的過(guò)程中,訊飛成長(zhǎng)成國(guó)內(nèi)用戶(hù)增長(zhǎng)第一、市場(chǎng)份額次席的手機(jī)輸入法,靠的正是科大訊飛在智能語(yǔ)音和人工智能領(lǐng)域的 20 年沉淀。如果跟熟悉手機(jī)輸入法的手機(jī)用戶(hù)提起訊飛,他們的第一印象一定是:語(yǔ)音無(wú)敵。
?
? ? 科大訊飛的「智能語(yǔ)音」和「人工智能」,落地在訊飛手機(jī)輸入法上,理所當(dāng)然會(huì)是語(yǔ)音輸入。在聯(lián)網(wǎng)狀態(tài)下,訊飛輸入法目前可以支持除了普通話之外的粵語(yǔ)、閩南語(yǔ)、四川話等 23 種方言,以及英語(yǔ)、日語(yǔ)、韓語(yǔ)、和俄語(yǔ)等外文,甚至中英混輸也能無(wú)壓力識(shí)別。
?
? ? 這中間涉及到的一系列復(fù)雜的機(jī)器翻譯、自然語(yǔ)言理解、機(jī)器推理、知識(shí)發(fā)現(xiàn),而且?guī)缀趺恳环N方言 / 語(yǔ)言基本上都是一套獨(dú)立的語(yǔ)言系統(tǒng),都既需要長(zhǎng)時(shí)間的大量機(jī)器學(xué)習(xí)積累,也需要技術(shù)積累。而這恰好是背靠科大訊飛的訊飛輸入法的優(yōu)勢(shì)所在。一方面,其背靠有 20 多年智能語(yǔ)音技術(shù)沉淀的科大訊飛,擁有超過(guò) 20 萬(wàn)小時(shí)訓(xùn)練數(shù)據(jù)積累;另一方面,科大訊飛有太多的國(guó)際賽事頂尖榮譽(yù),比如2018年的國(guó)際權(quán)威英文語(yǔ)音識(shí)別大賽“CHiME-6”中,科大訊飛包攬了兩項(xiàng)第一名;2019 年在 ICDAR2019 舉辦的場(chǎng)景文本視覺(jué)問(wèn)答挑戰(zhàn)賽 ST-VQA 中,科大訊飛包攬了三項(xiàng)冠軍。
?
? ? ?在 2018 年訊飛輸入法就已實(shí)現(xiàn) 1 分鐘 400 字的高速輸入,而且能夠?qū)⒆R(shí)別率保持在 98% 以上。98% 的識(shí)別率意味著識(shí)別出錯(cuò)的概率會(huì)非常小,而即便是因?yàn)橹饔^或者客觀原因識(shí)別出錯(cuò),也可以簡(jiǎn)單手輸修改幾個(gè)字詞調(diào)整,易用性相當(dāng)可觀。
?
? ? 要知道,在保證輸入準(zhǔn)確的前提下,我們普通人在手機(jī)上手輸文字的速度大概在每分鐘 60 字以?xún)?nèi),所以訊飛的語(yǔ)音輸入速度,基本上是手動(dòng)輸入的 6 倍左右——這種輸入速度上的碾壓,往往能顯著地提高效率,尤其是在那些需要大量輸入文字的場(chǎng)景里面,比如商務(wù)對(duì)接工作。
?
? ? 而且,在手機(jī)大屏化趨勢(shì)導(dǎo)致手機(jī)的握持手感和輸入體驗(yàn)都不夠理想的背景下,語(yǔ)音輸入不只是更高效,而且體驗(yàn)也會(huì)更加自然,畢竟,同樣是輸出文字,按住空格鍵「說(shuō)話」毫無(wú)疑問(wèn)要比抱著手機(jī)「打字」更加自然。
?
? ? 在更開(kāi)放的 Android 上,訊飛能直接調(diào)起鍵盤(pán)錄入語(yǔ)音實(shí)時(shí)轉(zhuǎn)換文字,而不需要在當(dāng)前 APP 和訊飛輸入法的 APP 之間跳轉(zhuǎn),體驗(yàn)非常流暢,邏輯清晰、使用也簡(jiǎn)單。而且不管你是習(xí)慣用什么方言,訊飛都能精準(zhǔn)識(shí)別,這就非常符合國(guó)人的方言眾多、習(xí)慣不一的現(xiàn)實(shí)了。主流的方言,包括粵語(yǔ)、四川話、閩南語(yǔ)、上海話、武漢話等超過(guò) 23 種方言,延伸出的藏語(yǔ)、維語(yǔ) 2 種民族語(yǔ)言,都能直接在訊飛里面語(yǔ)音輸入,而不需要從日常的語(yǔ)言氛圍里面切換到普通話之后再語(yǔ)音輸入,消除了體驗(yàn)痛點(diǎn)。
?
? ? 當(dāng)前的語(yǔ)音輸入不可能不出錯(cuò),距離100%準(zhǔn)確最后“一公里”,訊飛輸入法也拿出了解決方案——智能糾錯(cuò)的語(yǔ)音候選詞。實(shí)際體驗(yàn)可以感知,在語(yǔ)音輸入過(guò)程中自動(dòng)糾錯(cuò),AI提供了中、英候選建議,大大節(jié)省修改和重輸?shù)臅r(shí)間。
?
? ? 但在訊飛輸入法上,落地科大訊飛智能語(yǔ)音和人工智能技術(shù)的并不只有語(yǔ)音輸入這個(gè)功能,而是鋪開(kāi)為更廣義的語(yǔ)音轉(zhuǎn)文字、文字識(shí)別在內(nèi)的一些列工具性質(zhì)的功能,比如文字掃描、語(yǔ)音便簽、實(shí)時(shí)翻譯。
?
OCR拍照取字有奇效?
? ? 在訊飛的工具箱中啟用之后,我們可以直接在 APP 內(nèi)工具欄上直接啟動(dòng)訊飛的 OCR應(yīng)用——也就是文字掃描功能。
?
? ? OCR 主要涉及到為計(jì)算機(jī)視覺(jué)技術(shù)(包括了圖像識(shí)別和圖像理解),也是屬于人工智能的主要技術(shù)之一,基于語(yǔ)義分割的文字檢測(cè)方案,訊飛輸入法通過(guò)在特征圖上對(duì)每個(gè)像素進(jìn)行前景和背景的分類(lèi),可以實(shí)現(xiàn)任意方向、任意形狀的文本行檢測(cè)。得益于此,訊飛輸入法的 OCR 拍照取字的速度和成功率也非??捎^,基本上可以做到立拍即取,而且取字之后還支持后續(xù)的翻譯操作,所以用作出國(guó)旅行的實(shí)時(shí)翻譯工具也有奇效。
?
? ? 語(yǔ)音便簽功能實(shí)際上是訊飛輸入法語(yǔ)音輸入的翻版,核心功能仍然是語(yǔ)音轉(zhuǎn)文字,但它不是用作文字輸入而是用作備忘,可以直接把臨時(shí)產(chǎn)生的思考直接轉(zhuǎn)換為文字存儲(chǔ)起來(lái)。
?
? ? 實(shí)時(shí)翻譯對(duì)大眾而言為剛需中的剛需。輸入法如何讓翻譯更普及,著實(shí)做了有用功。譬如,訊飛輸入法搭載了快捷翻譯(文本翻譯文本)、隨聲譯(語(yǔ)音翻譯文本)以及面對(duì)面翻譯(線下場(chǎng)景的語(yǔ)音翻譯文本并支持語(yǔ)音播報(bào))。和線上的「翻譯器」一樣,隨聲譯是通過(guò)語(yǔ)音識(shí)別 - 翻譯轉(zhuǎn)換實(shí)現(xiàn)實(shí)時(shí)的雙語(yǔ)互譯,目前訊飛輸入法內(nèi)支持的互譯語(yǔ)言包括英、日、韓、俄等多種語(yǔ)言與中文互譯。也就是,說(shuō)中文譯外文,說(shuō)外文譯中文,說(shuō)是語(yǔ)音輸入的加強(qiáng)版也不為過(guò)。
?
?輸入,訊飛同樣可圈可點(diǎn)
?
? ? 這些基于智能語(yǔ)音和人工智能的功能,是訊飛輸入法相比其他競(jìng)品的相對(duì)優(yōu)勢(shì),不過(guò)作為目前市占率第二的中文輸入法,訊飛的基礎(chǔ)功能——也就是文字輸入,也非常強(qiáng)大。
?
? ? 影響中文輸入法按鍵出字效率的,包括這幾種因素:
? ? 1.輸入方式
? ? 2.詞庫(kù)(包括候選詞)
? ? 3.選詞效率
? ? 4.輸入輔助?
? ? 如果分開(kāi)各項(xiàng)來(lái)看,訊飛在分項(xiàng)中即便不是在所有輸入法中沒(méi)有做到最好,也至少是處于主流水準(zhǔn),并以肉眼可見(jiàn)的速度提升。
?
輸入方式,豐富趁手
?
? ? 輸入方式上,以國(guó)內(nèi)用戶(hù)典型的中文輸入為例,訊飛支持既支持主流鍵位比如 9 宮格拼音、全鍵盤(pán)拼音、筆畫(huà)、手寫(xiě)和語(yǔ)音,而且它還可以支持拼音雙鍵這種小眾的鍵位;支持點(diǎn)劃、經(jīng)典布局,或者 iOS 系統(tǒng)布局;支持全拼或者 7 種雙拼、繁簡(jiǎn)輸入……
?
詞庫(kù),助力輸入效率
?
? ? 而至于詞庫(kù),訊飛這種頭部的輸入法都有大量的分類(lèi)詞庫(kù)、同時(shí)支持云輸入,所以專(zhuān)用詞匯以及熱點(diǎn)詞匯的輸入效率都非常高,基本上不會(huì)出現(xiàn)自帶輸入法非常用詞需自造的情況。
?
選詞效率,智能調(diào)頻
? ? 訊飛在候選詞上仍然使用了自己拿手的機(jī)器學(xué)習(xí),在海量數(shù)據(jù)訓(xùn)練優(yōu)化之后,訊飛能智能預(yù)測(cè)用戶(hù)的輸入習(xí)慣,結(jié)合字頻詞頻和上文語(yǔ)義,智能調(diào)整候選詞。
?
輸入輔助,戲也很多
?
? ? 在偏娛樂(lè)化的社交場(chǎng)景中,訊飛輸入法還支持輔助輸入一些流行等的表達(dá)方式,比如火星文、刷屏模式、咆哮模式,專(zhuān)門(mén)的「BiuBiu 工具」,來(lái)收納所有包括 emoji 聊天在內(nèi)的趣味聊天方式,無(wú)論你是不是這些聊天方式的受眾,偶爾嘗試一下也會(huì)非常有趣。
? ? ?所有這些輸入功能,讓訊飛輸入法具備有高效輸入工具的能力,再加上公認(rèn)的強(qiáng)大的語(yǔ)音輸入能力,訊飛至少在中文相關(guān)的輸入場(chǎng)景下,稱(chēng)得上是輸入效率最高的中文輸入法之一。
?
? ? 當(dāng)然,因?yàn)橛锌拼笥嶏w的智能語(yǔ)音和人工智能技術(shù)的加持,訊飛手機(jī)輸入法不只是一款做得不錯(cuò)的「中文輸入法」,而是一個(gè)以智能語(yǔ)音功能為核心的、加入了大量輸入輔助功能的Launcher,它所能提供的,已經(jīng)遠(yuǎn)超過(guò)中文輸入而已。
?
? ? 這款輸入法,遠(yuǎn)不止輸入法。
Copyright @ 2013-2020 中國(guó)福建網(wǎng) 版權(quán)所有
聯(lián)系我們
免責(zé)聲明:本站為非營(yíng)利性網(wǎng)站,部分圖片或文章來(lái)源于互聯(lián)網(wǎng)如果無(wú)意中對(duì)您的權(quán)益構(gòu)成了侵犯,我們深表歉意,請(qǐng)您聯(lián)系,我們立即刪除。