一本久道综合久久精品,青青青青手机在线观看,久久国产香蕉一区精品蜜桃免费,国产精品久久久久久,九九艳阳天电影免费观看,中文成人久久久久影院免费观看,天天操天天干

中國(guó)西藏網(wǎng) > 即時(shí)新聞 > 國(guó)內(nèi)

比唇語專家更懂唇語讀唇語軟件識(shí)別準(zhǔn)確率遠(yuǎn)超人類

發(fā)布時(shí)間：2023-03-01 11:12:00來源：科技日?qǐng)?bào)

　　讀唇語軟件識(shí)別準(zhǔn)確率遠(yuǎn)超人類

　　“動(dòng)動(dòng)嘴皮子”，AI就能知道你在說啥

　　可以想見，由于公益、公共安全、國(guó)家安全等領(lǐng)域巨大的潛在需求的牽引，以及AI技術(shù)飛速發(fā)展的強(qiáng)力推動(dòng)作用，在不久的將來，AI讀唇語有望實(shí)現(xiàn)快速推廣與深度普及，產(chǎn)業(yè)前景十分可期。

　　——閆懷志北京理工大學(xué)計(jì)算機(jī)學(xué)院副教授、網(wǎng)絡(luò)與安全研究所所長(zhǎng)

　　◎本報(bào)記者翟冬冬

　　雖然電視劇《狂飆》已經(jīng)迎來了大結(jié)局，但熱度仍然沒有絲毫減弱，有的網(wǎng)友利用劇中人物創(chuàng)作娛樂視頻，也有的網(wǎng)友剪輯其中精彩片段。不過，還有一些“較真”的網(wǎng)友，發(fā)現(xiàn)《狂飆》中的一些人物對(duì)話，配音和嘴型對(duì)不上，于是便想通過人工智能進(jìn)行唇語識(shí)別，還原最初的劇本情節(jié)。

　　然而，AI讀唇語并非只能被用于破譯“隱藏劇情”。據(jù)統(tǒng)計(jì)，我國(guó)聽力殘障人口超過2054萬，除了主要的手語交流外，讀唇語也是他們重要的溝通方式。但人工解讀唇語容易受到個(gè)人經(jīng)驗(yàn)、視覺感受能力、語言理解能力等因素影響，在正確率方面差強(qiáng)人意，于是人們開始嘗試?yán)肁I技術(shù)來解讀唇語。

　　比唇語專家更懂唇語

　　“所謂AI讀唇語，即人工智能唇語識(shí)別，其核心技術(shù)框架為視覺識(shí)別和自然語言處理。”北京理工大學(xué)計(jì)算機(jī)學(xué)院副教授、網(wǎng)絡(luò)與安全研究所所長(zhǎng)閆懷志介紹道，具體而言，就是利用機(jī)器視覺技術(shù)，將人臉從圖像中連續(xù)識(shí)別出來，并提取其中連續(xù)的口型變化特征，輸入至唇語識(shí)別模型，辨識(shí)出該人物口型對(duì)應(yīng)的發(fā)音，進(jìn)而輸出可能性最大的表達(dá)語句。

　　“視覺識(shí)別和自然語言處理分別有著龐大的技術(shù)體系和不同的技術(shù)路線，但究其本質(zhì)，都是通過大量的唇語數(shù)據(jù)來訓(xùn)練AI模型，力求文本輸出的準(zhǔn)確性?！遍Z懷志補(bǔ)充道。

　　近幾年，不斷有AI巨頭開始在唇語識(shí)別賽道上作出嘗試。谷歌旗下Deep Mind公司就與英國(guó)牛津大學(xué)合作，研發(fā)出了一款A(yù)I讀唇語軟件，通過讓AI讀唇語軟件“收看”數(shù)千小時(shí)的電視節(jié)目來訓(xùn)練其唇語識(shí)別能力。有意思的是，在隨機(jī)抽取200個(gè)視頻片段的讀唇語測(cè)試中，AI讀唇語軟件的準(zhǔn)確率達(dá)到了46.8%，而經(jīng)過專業(yè)訓(xùn)練的人類讀唇語專家，準(zhǔn)確率僅為12.4%。

　　為何AI讀唇語能夠悄然興起？閆懷志給出了自己的分析：一是強(qiáng)烈的需求牽引，二是巨大的技術(shù)推動(dòng)。從需求牽引來說，唇語識(shí)別不僅可為部分殘障人士提供方便，更可以在公共安防等諸多領(lǐng)域發(fā)揮巨大作用；從技術(shù)推動(dòng)來說，由于AI算法、算力以及數(shù)據(jù)瓶頸被不斷突破，使得AI技術(shù)在唇語識(shí)別領(lǐng)域取得較大成功成為現(xiàn)實(shí)。

　　眾多難題有待突破

　　不過，閆懷志也表示，目前我國(guó)人工智能唇語識(shí)別技術(shù)尚處于起步階段，若想利用人工智能準(zhǔn)確地識(shí)別唇語，還有很長(zhǎng)的路要走。

　　從語言本身來看，人類語言具有較高的復(fù)雜性，在人類話語所涉及的所有音標(biāo)中，僅有30%左右是直接由人類嘴唇來控制的，70%是難以通過肉眼，甚至是機(jī)器視覺區(qū)分的齒音、舌音以及喉音。而且，不同人說話的語氣、方言、連詞、口音，乃至胡須遮蓋等因素，都會(huì)導(dǎo)致嘴型的細(xì)微變化，而恰恰是這種細(xì)微變化，會(huì)嚴(yán)重影響人工智能對(duì)于唇語的識(shí)別和判斷。

　　從技術(shù)層面來看，人工智能采集唇語的環(huán)境通常較為復(fù)雜，若想精準(zhǔn)識(shí)別難度很高。以目前的人工智能技術(shù)而言，對(duì)于長(zhǎng)句、復(fù)雜句式等的識(shí)別水平不盡如人意，更不用說還存在著多場(chǎng)景識(shí)別、多人像唇語識(shí)別等問題。

　　閆懷志表示，只有解決了上述問題，AI讀唇語才能得到突破性提升，邁向成熟發(fā)展階段。

　　人類不同語種之間千差萬別，AI能讀懂每個(gè)語種的唇語嗎？

　　閆懷志介紹，此前較為成功的AI讀唇語系統(tǒng)大多僅限于英語模型，這是因?yàn)槎鄶?shù)AI模型都是基于英語數(shù)據(jù)訓(xùn)練而得。但是，從技術(shù)框架上來說，不同語種的訓(xùn)練模型是基本一致的，或者說可以依賴于同一類技術(shù)手段來實(shí)現(xiàn)。

　　當(dāng)然，為了適應(yīng)不同語種的唇語識(shí)別，也需要作一些適應(yīng)性調(diào)整：一方面要選擇對(duì)應(yīng)語種的數(shù)據(jù)進(jìn)行有針對(duì)性的訓(xùn)練；另一方面，還需要對(duì)AI模型進(jìn)行調(diào)整，比如納入時(shí)間屏蔽、優(yōu)化語言模型以及改進(jìn)超參數(shù)等。

　　此外，同一語種也會(huì)有不同口型，即便口型類似，也可能代表著完全不同的意思。因此，成熟的AI讀唇語系統(tǒng)需要大量的唇語特征樣本數(shù)據(jù)，并盡可能地覆蓋多種應(yīng)用場(chǎng)景、多類型的說話人群，借此來提升訓(xùn)練后的唇語識(shí)別模型的泛化能力，提高AI讀唇語對(duì)于不同口型和不同表意語言的識(shí)別準(zhǔn)確率。

　　亟須監(jiān)管的技術(shù)雙刃劍

　　盡管存在種種難題，但仍有越來越多的AI企業(yè)開始涉足并計(jì)劃深耕人工智能唇語識(shí)別賽道。目前來看，各大AI巨頭的選擇不盡相同，具體可分為唇語數(shù)據(jù)、唇語視頻識(shí)別、唇語理解等。

　　閆懷志也表示，目前許多人工智能唇語識(shí)別技術(shù)領(lǐng)域已實(shí)現(xiàn)初步突破，全鏈條集成前景可期，產(chǎn)業(yè)集群正在逐步形成。

　　從應(yīng)用場(chǎng)景來看，AI讀唇語在社會(huì)公益、公共安全等領(lǐng)域都已開始嶄露頭角。從目前各大巨頭的布局以及相關(guān)技術(shù)的發(fā)展趨勢(shì)來看，AI讀唇語預(yù)期可在身份識(shí)別、國(guó)家安全、智慧系統(tǒng)等方面具有廣闊的應(yīng)用前景?！翱梢韵胍?，由于公益、公共安全、國(guó)家安全等領(lǐng)域巨大的潛在需求的牽引，以及AI技術(shù)飛速發(fā)展的強(qiáng)力推動(dòng)作用，在不久的將來，AI讀唇語有望實(shí)現(xiàn)快速推廣與深度普及，產(chǎn)業(yè)前景十分可期。”閆懷志說。

　　例如，在安防安監(jiān)領(lǐng)域，很多安監(jiān)場(chǎng)景噪音較大或僅有視頻信號(hào)，無法準(zhǔn)確捕捉聲音，人工智能唇語識(shí)別技術(shù)就能派上用場(chǎng)；在身份識(shí)別領(lǐng)域，可以利用AI讀唇語來實(shí)現(xiàn)口型支付密碼輸入，“動(dòng)動(dòng)嘴唇”就能實(shí)現(xiàn)身份識(shí)別和支付交易；在公共安全領(lǐng)域，利用AI讀唇語，可以在各類視頻中分析案件當(dāng)事人的唇語信息，輔助案件偵查工作；在智慧系統(tǒng)領(lǐng)域，可利用AI讀唇語來實(shí)現(xiàn)“無聲勝有聲”——只依靠口型來控制智能設(shè)備，比如智能家電等。

　　當(dāng)然，技術(shù)應(yīng)用是把雙刃劍。很多人擔(dān)心，AI讀唇語會(huì)使人們對(duì)話中的隱私內(nèi)容遭到泄露，無論當(dāng)事人是公開發(fā)言、竊竊私語或是自言自語。“張張嘴”就被別人竊取聊天內(nèi)容，仔細(xì)想來確實(shí)可怕。

　　閆懷志表示，這種擔(dān)心并非杞人憂天。AI讀唇語導(dǎo)致的隱私泄露，一方面可能是有人惡意進(jìn)行唇語獲取識(shí)別，另一方面也可能是正常使用的AI讀唇語系統(tǒng)，但其中的存儲(chǔ)、使用等環(huán)節(jié)保護(hù)不當(dāng)，導(dǎo)致相關(guān)數(shù)據(jù)被竊取或?yàn)E用，進(jìn)而對(duì)個(gè)人權(quán)益造成損害。而且，由于涉及到當(dāng)事人的對(duì)話內(nèi)容，具有明顯的方向性，這種隱私泄露的危害性可能要比普通的個(gè)人信息泄露更為嚴(yán)重。

　　因此，閆懷志建議，應(yīng)從隱私安全保護(hù)的角度，在管理層面加強(qiáng)相關(guān)法律法規(guī)的制定，嚴(yán)格規(guī)范和約束AI讀唇語的應(yīng)用場(chǎng)景、范圍和目的，加大對(duì)技術(shù)惡意利用的監(jiān)管和懲戒力度。此外，還要在技術(shù)層面加強(qiáng)AI讀唇語系統(tǒng)的安全保護(hù)體系建設(shè)，以技術(shù)手段提高系統(tǒng)的識(shí)別精準(zhǔn)度，避免技術(shù)濫用，切實(shí)保障用戶對(duì)話的內(nèi)容安全。（科技日?qǐng)?bào)）

（責(zé)編：陳濛濛）

版權(quán)聲明：凡注明“來源：中國(guó)西藏網(wǎng)”或“中國(guó)西藏網(wǎng)文”的所有作品，版權(quán)歸高原（北京）文化傳播有限公司。任何媒體轉(zhuǎn)載、摘編、引用，須注明來源中國(guó)西藏網(wǎng)和署著作者名，否則將追究相關(guān)法律責(zé)任。

相關(guān)閱讀

專題推薦

傲游截圖20180202095714.jpg

微觀

觀當(dāng)下

班禪額爾德尼·確吉杰布新年祝福超美！換上新藏裝，迎接藏歷新年！我在拉薩過藏歷新年歡慶日喀則農(nóng)事新年

賞閱

西藏拉薩雪后風(fēng)光秀麗

“西藏江南”林芝：冬日景色壯美冬日然烏湖半冰半水美如畫青海：雪后黃河干流宛如翡翠山南的“仙女之淚”——普姆雍措

資料云

QQ截圖20200831163244.jpg

中央第七次西藏工作座談會(huì)

流淌的吉曲河——學(xué)歷史講拉薩雪域長(zhǎng)歌新時(shí)代?邊疆行——西藏篇一江清水向東流

即時(shí)新聞

關(guān)于我們|信息聲明|糾錯(cuò)熱線|中國(guó)西藏網(wǎng)舉報(bào)受理和處置管理辦法

中國(guó)西藏網(wǎng)版權(quán)所有，未經(jīng)書面授權(quán)禁止使用

中國(guó)西藏信息中心主辦版權(quán)所有：高原(北京)文化傳播有限公司 Copyright ? 2000-2017 by www.7baotech.com All Rights Reserved

E-mail: xizangzongbianshi@163.com 違法和不良信息舉報(bào)電話：010-58336000 互聯(lián)網(wǎng)宗教信息服務(wù)許可證：京（2022）0000001

廣播電視節(jié)目制作經(jīng)營(yíng)許可證（京）字第04446號(hào) 京ICP備 17049894號(hào)-2 京公網(wǎng)安備110102001709-1

安阳县| 镶黄旗| 梧州市| 永和县| 隆化县| 常宁市| 威信县| 兴海县| 乐昌市| 富裕县| 和田县| 县级市| 依兰县| 巴林左旗| 宁安市| 周宁县| 樟树市| 丹棱县| 蒙自县| 桐柏县| 呼伦贝尔市| 邛崃市| 灌云县| 方正县| 屏南县| 新津县| 苍溪县| 凤城市| 都兰县| 志丹县| 沂源县| 宜都市| 张家界市| 广州市| 阜平县| 江口县| 贵定县| 柳州市| 中宁县| 秭归县| 饶阳县|