┊文章閱讀:次
10月16日至10月18日,由中國自動化學(xué)會 (CAA)、中國圖象圖形學(xué)學(xué)會(CSIG)、中國人工智能學(xué)會(CAAI)和中國計算機學(xué)會(CCF)聯(lián)合主辦的第三屆中國模式識別與計算機視覺大會(PRCV 2020)在南京完美落幕。作為PRCV 2020特邀企業(yè)之一,騰訊優(yōu)圖實驗室高級研究員在大會特邀企業(yè)論壇上發(fā)表了以《騰訊優(yōu)圖實驗室近期人臉分析領(lǐng)域的研究與應(yīng)用》主題的演講,與參會專家、學(xué)者和業(yè)界代表就優(yōu)圖在人臉分析方向的研究與落地成果進行了交流、分享。
深耕視覺AI領(lǐng)域,多項研究取得突破
人臉分析是人工智能的重要研究領(lǐng)域,也是騰訊優(yōu)圖的核心技術(shù)之一。在今年的ECCV中, 騰訊優(yōu)圖共有8篇論文被收錄,涵蓋目標跟蹤、行人重識別、人臉識別、人體姿態(tài)估計、動作識別、物體檢測等熱門及前沿領(lǐng)域,再次展示了騰訊在計算機視覺領(lǐng)域的科研及創(chuàng)新實力。此次PRCV上,優(yōu)圖研究員邰穎對其中五篇論文研究成果進行了重點分享。
騰訊優(yōu)圖實驗室高級研究員邰穎 現(xiàn)場演講
一是鏈式跟蹤器,是基于目標對回歸的端到端聯(lián)合檢測跟蹤算法。其算法屬于業(yè)內(nèi)首創(chuàng)兩幀輸入模式,可將目標檢測、特征提取、目標關(guān)聯(lián)這三個模塊集成至單個網(wǎng)絡(luò)中,實現(xiàn)端到端聯(lián)合檢測跟蹤,是第一個將跟蹤算法中的目標關(guān)聯(lián)問題轉(zhuǎn)化為兩幀檢測框?qū)Γ˙ox pair)回歸問題的算法。。
二是通過分布蒸餾損失改善人臉識別中的困難樣本。目前基于深度學(xué)習(xí)的人臉識別算法已經(jīng)可以較好的處理簡單樣本,但對于困難樣本(低分辨率、大姿態(tài)等)仍表現(xiàn)不佳。為了提升人臉識別模型在困難樣本上的性能,優(yōu)圖提出了一種基于分布蒸餾的損失函數(shù)。通過分布蒸餾損失函數(shù)使Student分布靠近Teacher分布,從而減小Student分布中的同人樣本和非同人樣本的相似度重合區(qū)域,提高困難樣本的識別性能。
三是基于特征解耦的人臉活體檢測。邰穎指出,活體檢測技術(shù)用于在身份驗證場景中確定對象是否為真人,以防御照片、面具、屏幕翻拍等多種方式的攻擊,保證人臉識別安全。騰訊優(yōu)圖提出了解耦學(xué)習(xí)框架,將活體特征和內(nèi)容特征通過合適的約束和監(jiān)督解耦,同時可視化了LBP紋理特征圖,進一步促進活體特征的解耦。
四是基于風(fēng)格跳躍連接的人臉屬性編輯,通過修改通道層面的全局信息風(fēng)格特征來解決忽略全局的人臉統(tǒng)計信息的問題。該方法可以得到在屬性生成準確率和圖像質(zhì)量上都更好的結(jié)果。實驗結(jié)果表明優(yōu)圖的算法和現(xiàn)有的所有方法相比都有優(yōu)越性。
五是基于對抗語義數(shù)據(jù)增強的人體姿態(tài)估計,他認為,目前的SOTA方法在嚴重遮擋、旁人干擾、對稱相似三種困難場景中表現(xiàn)仍有待提升。而優(yōu)圖提出的一種Adversarial Semantic Data Augmentation(對抗語義數(shù)據(jù)增強方法),則是針對這些人體部件在不同的細粒度上進行重組,從而去模擬出嚴重遮擋、旁人干擾、對稱相似三種困難場景。而人體姿態(tài)估計網(wǎng)絡(luò)從這個對抗過程中也不斷提升了自己對困難場景的預(yù)測準確性。
聚焦AI技術(shù)場景落地,不斷探索應(yīng)用新領(lǐng)域
日趨成熟的AI產(chǎn)業(yè),正在逐漸成為新一輪科技革命的核心驅(qū)動力,讓新產(chǎn)品新技術(shù)進步有了更大更豐富的想象空間。邰穎表示,騰訊優(yōu)圖實驗室在研究AI技術(shù)之初,就專注于技術(shù)落地,讓技術(shù)與場景不斷結(jié)合碰撞。同時,邰穎在現(xiàn)場分享了騰訊優(yōu)圖在人臉編輯生成方向的幾大創(chuàng)新實踐案例。
在人像分割和虛擬背景方面,優(yōu)圖通過二分類高精度分割能力,可將不同人種、手勢、復(fù)雜光線等不同場景進行高精度分割。該技術(shù)在騰訊會議產(chǎn)品中進行了應(yīng)用,以極小的性能消耗,保障了穩(wěn)定、精確的視頻分割效果,為聯(lián)合國大會、VALSE2020等重要會議活動提供了支持。
在人像融合方面,優(yōu)圖依托自研的DittoGAN生成框架,在融合中更好地保持用戶的ID信息和模版屬性信息。同時還支持多樣化的模版風(fēng)格,包括真人、動漫、游戲等。騰訊云在畢業(yè)季推出的云畢業(yè)照,以及深圳40周年的“深”份證活動等,背后都有優(yōu)圖人像融合能力的技術(shù)支持。
在年齡演化方面,騰訊優(yōu)圖與手機QQ、騰訊微視合作推出的六一兒童節(jié)特效濾鏡,將“變童年”特效拓展至全年齡生成,并支持連續(xù)年齡演化,讓你一鍵“萌萌噠”。更有人像動漫化能力通過騰訊云對外開放,實現(xiàn)跨領(lǐng)域等多種變化的人像轉(zhuǎn)換,為大眾帶來更有趣豐富的娛樂體驗。
作為騰訊公司旗下人工智能實驗室,騰訊優(yōu)圖實驗室聚焦計算機視覺,專注人臉識別、圖像識別、OCR等領(lǐng)域開展技術(shù)研發(fā)和行業(yè)落地,在推動產(chǎn)業(yè)數(shù)字化升級過程中,優(yōu)圖始終專注基礎(chǔ)研究、產(chǎn)業(yè)落地兩條腿走路的發(fā)展戰(zhàn)略,與騰訊云與智慧產(chǎn)業(yè)深度融合,挖掘客戶痛點,切實為行業(yè)降本增效。在未來,騰訊優(yōu)圖也將繼續(xù)深耕于AI技術(shù),并將找到更多的應(yīng)用場景和應(yīng)用空間,讓更多的用戶享受到科技帶來的紅利。
Copyright @ 2013-2020 中國福建網(wǎng) 版權(quán)所有
聯(lián)系我們
免責(zé)聲明:本站為非營利性網(wǎng)站,部分圖片或文章來源于互聯(lián)網(wǎng)如果無意中對您的權(quán)益構(gòu)成了侵犯,我們深表歉意,請您聯(lián)系,我們立即刪除。