┊文章閱讀:次
5月4日,科大訊飛再傳捷報(bào),在國(guó)際多通道語(yǔ)音分離和識(shí)別大賽(CHiME)比賽最新一屆CHiME-6中,科大訊飛聯(lián)合中科大語(yǔ)音及語(yǔ)言信息處理國(guó)家工程實(shí)驗(yàn)室(USTC-NELSLIP)創(chuàng)下三連冠的好成績(jī),其中語(yǔ)音識(shí)別錯(cuò)誤率從CHiME-5的46.1%降至30.5%,刷新了該項(xiàng)目最好紀(jì)錄。
科大訊飛奪得CHiME-6冠軍 (Track1:Ranking A)
科大訊飛奪得CHiME-6冠軍 (Track1:Ranking B)
聚焦實(shí)用性,科大訊飛將賦能進(jìn)行到底
由法國(guó)計(jì)算機(jī)科學(xué)與自動(dòng)化研究所、英國(guó)謝菲爾德大學(xué)、美國(guó)三菱電子研究實(shí)驗(yàn)室等知名研究機(jī)構(gòu)于2011年所發(fā)起的CHiME(Computational Hearing in Multisource Environments),至今已成功舉辦六屆,比賽的目的是希望學(xué)術(shù)界和工業(yè)界針對(duì)高噪聲、高混響、自由討論場(chǎng)景提出全新的語(yǔ)音識(shí)別解決方案,從而進(jìn)一步提升語(yǔ)音識(shí)別的實(shí)用性和普適性。
技術(shù)的突破是是應(yīng)用落地的底氣。在2018年的CHiME-5比賽中,最優(yōu)的參賽系統(tǒng)語(yǔ)音識(shí)別錯(cuò)誤率仍高達(dá)46.1%,距離實(shí)用仍有較大差距。所以,今年USTC-NELSLIP聯(lián)合團(tuán)隊(duì)在早前的技術(shù)基礎(chǔ)上,進(jìn)一步探索復(fù)雜場(chǎng)景語(yǔ)音識(shí)別實(shí)用化的可能性。通過(guò)團(tuán)隊(duì)的技術(shù)攻關(guān),將該任務(wù)上的語(yǔ)音識(shí)別錯(cuò)誤率從原來(lái)的46.1%降至30.5%。這一研究成果無(wú)疑將進(jìn)一步拓展語(yǔ)音識(shí)別的應(yīng)用空間,以遠(yuǎn)距離會(huì)議場(chǎng)景為例,相比于CHiME-6的比賽任務(wù),其說(shuō)話風(fēng)格隨意性減少、聲音疊加現(xiàn)象減少、訓(xùn)練數(shù)據(jù)大幅增加,錯(cuò)誤率勢(shì)必大幅下降??上攵?,本次比賽的技術(shù)成果無(wú)疑將進(jìn)一步增促進(jìn)會(huì)議場(chǎng)景語(yǔ)音識(shí)別的實(shí)用化。
人工智能下半場(chǎng),科大訊飛實(shí)現(xiàn)多應(yīng)用落地
隨著技術(shù)的發(fā)展,人工智能進(jìn)入應(yīng)用落地的下半場(chǎng),如何讓技術(shù)服務(wù)于理念,落地于現(xiàn)實(shí),是科大訊飛“以人工智能建設(shè)美好生活”的愿景。用行動(dòng)踐行“技術(shù)頂天,產(chǎn)品立地”發(fā)展戰(zhàn)略的科大訊飛,正在逐步將領(lǐng)先行業(yè)的語(yǔ)音識(shí)別技術(shù)落地C端。
2019年聯(lián)合國(guó)教科文組織(UNESCO)在法國(guó)舉辦的“人工智能促進(jìn)可持續(xù)發(fā)展”會(huì)議、在瑞士舉辦的2019信息社會(huì)世界高峰會(huì)議(WSIS)論壇、2019年全國(guó)兩會(huì)等重大國(guó)際及國(guó)內(nèi)會(huì)議現(xiàn)場(chǎng)均使用了訊飛聽(tīng)見(jiàn)智能會(huì)議系統(tǒng)提供的英文及中文轉(zhuǎn)寫(xiě)服務(wù),而這背后,就是科大訊飛積累多年的語(yǔ)音識(shí)別核心源頭人工智能技術(shù)?;诤诵脑搭^技術(shù)優(yōu)勢(shì),去年9月份,科大訊飛正式成為北京2022年冬奧會(huì)和冬殘奧會(huì)官方自動(dòng)語(yǔ)音轉(zhuǎn)換與翻譯獨(dú)家供應(yīng)商,為奧運(yùn)會(huì)提供自動(dòng)語(yǔ)音轉(zhuǎn)換與翻譯技術(shù)和服務(wù)。如今,訊飛聽(tīng)見(jiàn)智能會(huì)議系統(tǒng)已成為國(guó)內(nèi)外大型會(huì)議的得力助手,僅2019年就服務(wù)了國(guó)內(nèi)外2000多場(chǎng)高規(guī)格大會(huì)。
除了訊飛聽(tīng)見(jiàn)智能會(huì)議系統(tǒng),在實(shí)際的應(yīng)用場(chǎng)景中,科大訊飛的語(yǔ)音識(shí)別和多麥克風(fēng)陣列信號(hào)處理技術(shù)還廣泛應(yīng)用在不同的C端產(chǎn)品和服務(wù)中,比如搭載八麥克風(fēng)陣列的訊飛智能錄音筆、能完整記錄會(huì)議內(nèi)容的訊飛智能辦公本、月活1.4億且能免切換識(shí)別中英文及23種方言的訊飛輸入法等,這些辦公和生活應(yīng)用已觸手可達(dá),為廣大用戶解決不同場(chǎng)景下的語(yǔ)音識(shí)別需求。
目前,科大訊飛正在大力拓展多語(yǔ)種語(yǔ)音識(shí)別方面的技術(shù)研究,通過(guò)長(zhǎng)期的智能語(yǔ)音技術(shù)積累及研發(fā)攻關(guān),已為華為新發(fā)布的旗艦手機(jī)P40提供多語(yǔ)種語(yǔ)音技術(shù)。隨著本次技術(shù)難題的再突破,科大訊飛還將帶來(lái)怎樣的驚喜應(yīng)用,我們拭目以待。
Copyright @ 2013-2020 中國(guó)福建網(wǎng) 版權(quán)所有
聯(lián)系我們
免責(zé)聲明:本站為非營(yíng)利性網(wǎng)站,部分圖片或文章來(lái)源于互聯(lián)網(wǎng)如果無(wú)意中對(duì)您的權(quán)益構(gòu)成了侵犯,我們深表歉意,請(qǐng)您聯(lián)系,我們立即刪除。