焦作网 WWW.JZRB.COM

二維碼

掃一掃加入微信公眾號

Top
網站首頁 新聞 國內 國際 河南 焦作
時政要聞 專題 直播 網視 網談 網評
今日頭條 汽車 旅游 經濟 美食
焦作關注 房產 娛樂 體育 市場
 焦作日報 手機報 經典微視頻
 焦作晚報 “焦作+”客戶端
 經典山陽 小記者 焦作論壇
 網上投稿 記 協 訂報服務
  您現在的位置: 焦作網 > 辟謠平臺 > 權威發布 > 正文

辟謠平臺

“動動嘴皮子”AI就能知道你在說啥,當心隱私泄露!
更新時間:2023-3-6 9:14:06    來源:科技日報

 可以想見,由于公益、公共安全、國家安全等領域巨大的潛在需求的牽引,以及AI技術飛速發展的強力推動作用,在不久的將來,AI讀唇語有望實現快速推廣與深度普及,產業前景十分可期。——閆懷志 北京理工大學計算機學院副教授、網絡與安全研究所所長

  雖然電視劇《狂飆》已經迎來了大結局,但熱度仍然沒有絲毫減弱,有的網友利用劇中人物創作娛樂視頻,也有的網友剪輯其中精彩片段。不過,還有一些“較真”的網友,發現《狂飆》中的一些人物對話,配音和嘴型對不上,于是便想通過人工智能進行唇語識別,還原最初的劇本情節。

  然而,AI讀唇語并非只能被用于破譯“隱藏劇情”。據統計,我國聽力殘障人口超過2054萬,除了主要的手語交流外,讀唇語也是他們重要的溝通方式。但人工解讀唇語容易受到個人經驗、視覺感受能力、語言理解能力等因素影響,在正確率方面差強人意,于是人們開始嘗試利用AI技術來解讀唇語。

  比唇語專家更懂唇語

  “所謂AI讀唇語,即人工智能唇語識別,其核心技術框架為視覺識別和自然語言處理。”北京理工大學計算機學院副教授、網絡與安全研究所所長閆懷志介紹道,具體而言,就是利用機器視覺技術,將人臉從圖像中連續識別出來,并提取其中連續的口型變化特征,輸入至唇語識別模型,辨識出該人物口型對應的發音,進而輸出可能性最大的表達語句。

  “視覺識別和自然語言處理分別有著龐大的技術體系和不同的技術路線,但究其本質,都是通過大量的唇語數據來訓練AI模型,力求文本輸出的準確性。”閆懷志補充道。

  近幾年,不斷有AI巨頭開始在唇語識別賽道上作出嘗試。谷歌旗下Deep Mind公司就與英國牛津大學合作,研發出了一款AI讀唇語軟件,通過讓AI讀唇語軟件“收看”數千小時的電視節目來訓練其唇語識別能力。有意思的是,在隨機抽取200個視頻片段的讀唇語測試中,AI讀唇語軟件的準確率達到了46.8%,而經過專業訓練的人類讀唇語專家,準確率僅為12.4%。

  為何AI讀唇語能夠悄然興起?閆懷志給出了自己的分析:一是強烈的需求牽引,二是巨大的技術推動。從需求牽引來說,唇語識別不僅可為部分殘障人士提供方便,更可以在公共安防等諸多領域發揮巨大作用;從技術推動來說,由于AI算法、算力以及數據瓶頸被不斷突破,使得AI技術在唇語識別領域取得較大成功成為現實。

  眾多難題有待突破

  不過,閆懷志也表示,目前我國人工智能唇語識別技術尚處于起步階段,若想利用人工智能準確地識別唇語,還有很長的路要走。

  從語言本身來看,人類語言具有較高的復雜性,在人類話語所涉及的所有音標中,僅有30%左右是直接由人類嘴唇來控制的,70%是難以通過肉眼,甚至是機器視覺區分的齒音、舌音以及喉音。而且,不同人說話的語氣、方言、連詞、口音,乃至胡須遮蓋等因素,都會導致嘴型的細微變化,而恰恰是這種細微變化,會嚴重影響人工智能對于唇語的識別和判斷。

  從技術層面來看,人工智能采集唇語的環境通常較為復雜,若想精準識別難度很高。以目前的人工智能技術而言,對于長句、復雜句式等的識別水平不盡如人意,更不用說還存在著多場景識別、多人像唇語識別等問題。

  閆懷志表示,只有解決了上述問題,AI讀唇語才能得到突破性提升,邁向成熟發展階段。

  人類不同語種之間千差萬別,AI能讀懂每個語種的唇語嗎?

  閆懷志介紹,此前較為成功的AI讀唇語系統大多僅限于英語模型,這是因為多數AI模型都是基于英語數據訓練而得。但是,從技術框架上來說,不同語種的訓練模型是基本一致的,或者說可以依賴于同一類技術手段來實現。

  當然,為了適應不同語種的唇語識別,也需要作一些適應性調整:一方面要選擇對應語種的數據進行有針對性的訓練;另一方面,還需要對AI模型進行調整,比如納入時間屏蔽、優化語言模型以及改進超參數等。

  此外,同一語種也會有不同口型,即便口型類似,也可能代表著完全不同的意思。因此,成熟的AI讀唇語系統需要大量的唇語特征樣本數據,并盡可能地覆蓋多種應用場景、多類型的說話人群,借此來提升訓練后的唇語識別模型的泛化能力,提高AI讀唇語對于不同口型和不同表意語言的識別準確率。

  亟須監管的技術雙刃劍

  盡管存在種種難題,但仍有越來越多的AI企業開始涉足并計劃深耕人工智能唇語識別賽道。目前來看,各大AI巨頭的選擇不盡相同,具體可分為唇語數據、唇語視頻識別、唇語理解等。

  閆懷志也表示,目前許多人工智能唇語識別技術領域已實現初步突破,全鏈條集成前景可期,產業集群正在逐步形成。

  從應用場景來看,AI讀唇語在社會公益、公共安全等領域都已開始嶄露頭角。從目前各大巨頭的布局以及相關技術的發展趨勢來看,AI讀唇語預期可在身份識別、國家安全、智慧系統等方面具有廣闊的應用前景。“可以想見,由于公益、公共安全、國家安全等領域巨大的潛在需求的牽引,以及AI技術飛速發展的強力推動作用,在不久的將來,AI讀唇語有望實現快速推廣與深度普及,產業前景十分可期。”閆懷志說。

  例如,在安防安監領域,很多安監場景噪音較大或僅有視頻信號,無法準確捕捉聲音,人工智能唇語識別技術就能派上用場;在身份識別領域,可以利用AI讀唇語來實現口型支付密碼輸入,“動動嘴唇”就能實現身份識別和支付交易;在公共安全領域,利用AI讀唇語,可以在各類視頻中分析案件當事人的唇語信息,輔助案件偵查工作;在智慧系統領域,可利用AI讀唇語來實現“無聲勝有聲”——只依靠口型來控制智能設備,比如智能家電等。

  當然,技術應用是把雙刃劍。很多人擔心,AI讀唇語會使人們對話中的隱私內容遭到泄露,無論當事人是公開發言、竊竊私語或是自言自語。“張張嘴”就被別人竊取聊天內容,仔細想來確實可怕。

  閆懷志表示,這種擔心并非杞人憂天。AI讀唇語導致的隱私泄露,一方面可能是有人惡意進行唇語獲取識別,另一方面也可能是正常使用的AI讀唇語系統,但其中的存儲、使用等環節保護不當,導致相關數據被竊取或濫用,進而對個人權益造成損害。而且,由于涉及到當事人的對話內容,具有明顯的方向性,這種隱私泄露的危害性可能要比普通的個人信息泄露更為嚴重。

  因此,閆懷志建議,應從隱私安全保護的角度,在管理層面加強相關法律法規的制定,嚴格規范和約束AI讀唇語的應用場景、范圍和目的,加大對技術惡意利用的監管和懲戒力度。此外,還要在技術層面加強AI讀唇語系統的安全保護體系建設,以技術手段提高系統的識別精準度,避免技術濫用,切實保障用戶對話的內容安全。

文章編輯:楊銘 
  • 上一篇文章:
  • 下一篇文章: 沒有了
  • 焦作網免責聲明:

    本網所有稿件,未經許可不得轉載。
    轉載稿件不代表本網觀點,如有異議請聯系我們即可處理。
    刊發、轉載的稿件,作者可聯系本網申領稿酬。


    “動動嘴皮子”AI就能知道你在說啥,當心隱私泄露!
    2023-3-6 9:14:06    來源:科技日報

     可以想見,由于公益、公共安全、國家安全等領域巨大的潛在需求的牽引,以及AI技術飛速發展的強力推動作用,在不久的將來,AI讀唇語有望實現快速推廣與深度普及,產業前景十分可期。——閆懷志 北京理工大學計算機學院副教授、網絡與安全研究所所長

      雖然電視劇《狂飆》已經迎來了大結局,但熱度仍然沒有絲毫減弱,有的網友利用劇中人物創作娛樂視頻,也有的網友剪輯其中精彩片段。不過,還有一些“較真”的網友,發現《狂飆》中的一些人物對話,配音和嘴型對不上,于是便想通過人工智能進行唇語識別,還原最初的劇本情節。

      然而,AI讀唇語并非只能被用于破譯“隱藏劇情”。據統計,我國聽力殘障人口超過2054萬,除了主要的手語交流外,讀唇語也是他們重要的溝通方式。但人工解讀唇語容易受到個人經驗、視覺感受能力、語言理解能力等因素影響,在正確率方面差強人意,于是人們開始嘗試利用AI技術來解讀唇語。

      比唇語專家更懂唇語

      “所謂AI讀唇語,即人工智能唇語識別,其核心技術框架為視覺識別和自然語言處理。”北京理工大學計算機學院副教授、網絡與安全研究所所長閆懷志介紹道,具體而言,就是利用機器視覺技術,將人臉從圖像中連續識別出來,并提取其中連續的口型變化特征,輸入至唇語識別模型,辨識出該人物口型對應的發音,進而輸出可能性最大的表達語句。

      “視覺識別和自然語言處理分別有著龐大的技術體系和不同的技術路線,但究其本質,都是通過大量的唇語數據來訓練AI模型,力求文本輸出的準確性。”閆懷志補充道。

      近幾年,不斷有AI巨頭開始在唇語識別賽道上作出嘗試。谷歌旗下Deep Mind公司就與英國牛津大學合作,研發出了一款AI讀唇語軟件,通過讓AI讀唇語軟件“收看”數千小時的電視節目來訓練其唇語識別能力。有意思的是,在隨機抽取200個視頻片段的讀唇語測試中,AI讀唇語軟件的準確率達到了46.8%,而經過專業訓練的人類讀唇語專家,準確率僅為12.4%。

      為何AI讀唇語能夠悄然興起?閆懷志給出了自己的分析:一是強烈的需求牽引,二是巨大的技術推動。從需求牽引來說,唇語識別不僅可為部分殘障人士提供方便,更可以在公共安防等諸多領域發揮巨大作用;從技術推動來說,由于AI算法、算力以及數據瓶頸被不斷突破,使得AI技術在唇語識別領域取得較大成功成為現實。

      眾多難題有待突破

      不過,閆懷志也表示,目前我國人工智能唇語識別技術尚處于起步階段,若想利用人工智能準確地識別唇語,還有很長的路要走。

      從語言本身來看,人類語言具有較高的復雜性,在人類話語所涉及的所有音標中,僅有30%左右是直接由人類嘴唇來控制的,70%是難以通過肉眼,甚至是機器視覺區分的齒音、舌音以及喉音。而且,不同人說話的語氣、方言、連詞、口音,乃至胡須遮蓋等因素,都會導致嘴型的細微變化,而恰恰是這種細微變化,會嚴重影響人工智能對于唇語的識別和判斷。

      從技術層面來看,人工智能采集唇語的環境通常較為復雜,若想精準識別難度很高。以目前的人工智能技術而言,對于長句、復雜句式等的識別水平不盡如人意,更不用說還存在著多場景識別、多人像唇語識別等問題。

      閆懷志表示,只有解決了上述問題,AI讀唇語才能得到突破性提升,邁向成熟發展階段。

      人類不同語種之間千差萬別,AI能讀懂每個語種的唇語嗎?

      閆懷志介紹,此前較為成功的AI讀唇語系統大多僅限于英語模型,這是因為多數AI模型都是基于英語數據訓練而得。但是,從技術框架上來說,不同語種的訓練模型是基本一致的,或者說可以依賴于同一類技術手段來實現。

      當然,為了適應不同語種的唇語識別,也需要作一些適應性調整:一方面要選擇對應語種的數據進行有針對性的訓練;另一方面,還需要對AI模型進行調整,比如納入時間屏蔽、優化語言模型以及改進超參數等。

      此外,同一語種也會有不同口型,即便口型類似,也可能代表著完全不同的意思。因此,成熟的AI讀唇語系統需要大量的唇語特征樣本數據,并盡可能地覆蓋多種應用場景、多類型的說話人群,借此來提升訓練后的唇語識別模型的泛化能力,提高AI讀唇語對于不同口型和不同表意語言的識別準確率。

      亟須監管的技術雙刃劍

      盡管存在種種難題,但仍有越來越多的AI企業開始涉足并計劃深耕人工智能唇語識別賽道。目前來看,各大AI巨頭的選擇不盡相同,具體可分為唇語數據、唇語視頻識別、唇語理解等。

      閆懷志也表示,目前許多人工智能唇語識別技術領域已實現初步突破,全鏈條集成前景可期,產業集群正在逐步形成。

      從應用場景來看,AI讀唇語在社會公益、公共安全等領域都已開始嶄露頭角。從目前各大巨頭的布局以及相關技術的發展趨勢來看,AI讀唇語預期可在身份識別、國家安全、智慧系統等方面具有廣闊的應用前景。“可以想見,由于公益、公共安全、國家安全等領域巨大的潛在需求的牽引,以及AI技術飛速發展的強力推動作用,在不久的將來,AI讀唇語有望實現快速推廣與深度普及,產業前景十分可期。”閆懷志說。

      例如,在安防安監領域,很多安監場景噪音較大或僅有視頻信號,無法準確捕捉聲音,人工智能唇語識別技術就能派上用場;在身份識別領域,可以利用AI讀唇語來實現口型支付密碼輸入,“動動嘴唇”就能實現身份識別和支付交易;在公共安全領域,利用AI讀唇語,可以在各類視頻中分析案件當事人的唇語信息,輔助案件偵查工作;在智慧系統領域,可利用AI讀唇語來實現“無聲勝有聲”——只依靠口型來控制智能設備,比如智能家電等。

      當然,技術應用是把雙刃劍。很多人擔心,AI讀唇語會使人們對話中的隱私內容遭到泄露,無論當事人是公開發言、竊竊私語或是自言自語。“張張嘴”就被別人竊取聊天內容,仔細想來確實可怕。

      閆懷志表示,這種擔心并非杞人憂天。AI讀唇語導致的隱私泄露,一方面可能是有人惡意進行唇語獲取識別,另一方面也可能是正常使用的AI讀唇語系統,但其中的存儲、使用等環節保護不當,導致相關數據被竊取或濫用,進而對個人權益造成損害。而且,由于涉及到當事人的對話內容,具有明顯的方向性,這種隱私泄露的危害性可能要比普通的個人信息泄露更為嚴重。

      因此,閆懷志建議,應從隱私安全保護的角度,在管理層面加強相關法律法規的制定,嚴格規范和約束AI讀唇語的應用場景、范圍和目的,加大對技術惡意利用的監管和懲戒力度。此外,還要在技術層面加強AI讀唇語系統的安全保護體系建設,以技術手段提高系統的識別精準度,避免技術濫用,切實保障用戶對話的內容安全。

    文章編輯:楊銘 
     

    版權聲明 | 焦作日報社簡介 | 焦作網簡介 | 網上訂報 | 聯系我們
    版權所有:河南省焦作日報社 未經授權,請勿轉載或建立鏡像。
    《焦作日報》遺失聲明熱線:(0391)8797096 郵編:454002
    本網違法和不良信息舉報電話:(0391)8797000 舉報郵箱:jzrbcn@163.com
    河南省“網絡敲詐和有償刪帖”專項整治工作熱線:0371-65598032 舉報網站:www.henanjubao.com
    公安部網絡違法犯罪舉報網 河南省互聯網違法和不良信息舉報中心 豫ICP備14012713號-1
    焦公網安備4108000005 豫公網安備41080202000004號 互聯網新聞信息服務許可證號:41120180013
    信息網絡傳播視聽節目許可證號:11642120  地址:焦作市人民路1159號 報業·國貿大廈 


    掃一掃在手機打開當前頁

    版權所有:河南省焦作日報社 未經授權,請勿轉載或建立鏡像。
    互聯網新聞信息服務許可證:41120180013 電話:(0391)8797000
    主站蜘蛛池模板: China plate rolling machine manufacturer,cone rolling machine-Saint Fighter | 防爆暖风机_防爆电暖器_防爆电暖风机_防爆电热油汀_南阳市中通智能科技集团有限公司 | 济南品牌设计-济南品牌策划-即合品牌策划设计-山东即合官网 | 北京森语科技有限公司-模型制作专家-展览展示-沙盘模型设计制作-多媒体模型软硬件开发-三维地理信息交互沙盘 | 信阳网站建设专家-信阳时代网联-【信阳网站建设百度推广优质服务提供商】信阳网站建设|信阳网络公司|信阳网络营销推广 | 合肥防火门窗/隔断_合肥防火卷帘门厂家_安徽耐火窗_良万消防设备有限公司 | 强效碱性清洗剂-实验室中性清洗剂-食品级高纯氮气发生器-上海润榕科学器材有限公司 | 称重传感器,测力传感器,拉压力传感器,压力变送器,扭矩传感器,南京凯基特电气有限公司 | 冷藏车厂家|冷藏车价格|小型冷藏车|散装饲料车厂家|程力专用汽车股份有限公司销售十二分公司 | 手板_手板模型制作_cnc手板加工厂-东莞天泓 | 酶联免疫分析仪-多管旋涡混合仪|混合器-莱普特科学仪器(北京)有限公司 | 嘉兴恒升声级计-湖南衡仪声级计-杭州爱华多功能声级计-上海邦沃仪器设备有限公司 | 单螺旋速冻机-双螺旋-流态化-隧道式-食品速冻机厂家-广州冰泉制冷 | MTK核心板|MTK开发板|MTK模块|4G核心板|4G模块|5G核心板|5G模块|安卓核心板|安卓模块|高通核心板-深圳市新移科技有限公司 | pos机办理,智能/扫码/二维码/微信支付宝pos机-北京万汇通宝商贸有限公司 | 天津力值检测-天津管道检测-天津天诚工程检测技术有限公司 | 网络推广公司_网络营销方案策划_企业网络推广外包平台-上海澜推网络 | 山东led显示屏,山东led全彩显示屏,山东LED小间距屏,临沂全彩电子屏-山东亚泰视讯传媒有限公司 | 菏泽知彼网络科技有限公司| 台式恒温摇床价格_大容量恒温摇床厂家-上海量壹科学仪器有限公司 | (中山|佛山|江门)环氧地坪漆,停车场地板漆,车库地板漆,聚氨酯地板漆-中山永旺地坪漆厂家 | EDLC超级法拉电容器_LIC锂离子超级电容_超级电容模组_软包单体电容电池_轴向薄膜电力电容器_深圳佳名兴电容有限公司_JMX专注中高端品牌电容生产厂家 | 菏泽知彼网络科技有限公司 | 交流伺服电机|直流伺服|伺服驱动器|伺服电机-深圳市华科星电气有限公司 | 氧化铝球_高铝球_氧化铝研磨球-淄博誉洁陶瓷新材料有限公司 | 流程管理|流程管理软件|企业流程管理|微宏科技-AlphaFlow_流程管理系统软件服务商 | 皮带机_移动皮带机_大倾角皮带机_皮带机厂家 - 新乡市国盛机械设备有限公司 | 洗地机_全自动洗地机_手推式洗地机【上海滢皓环保】 | 破碎机_上海破碎机_破碎机设备_破碎机厂家-上海山卓重工机械有限公司 | 耐酸泵,耐酸泵厂家-淄博华舜耐腐蚀真空泵 | 博博会2021_中国博物馆及相关产品与技术博览会【博博会】 | 熔体泵|换网器|熔体齿轮泵|熔体计量泵厂家-郑州巴特熔体泵有限公司 | 杭州标识标牌|文化墙|展厅|导视|户内外广告|发光字|灯箱|铭阳制作公司 - 杭州标识标牌|文化墙|展厅|导视|户内外广告|发光字|灯箱|铭阳制作公司 | 超声波清洗机-超声波清洗设备定制生产厂家 - 深圳市冠博科技实业有限公司 | 桨叶搅拌机_螺旋挤压/方盒旋切造粒机厂家-无锡市鸿诚输送机械有限公司 | 防爆正压柜厂家_防爆配电箱_防爆控制箱_防爆空调_-盛通防爆 | 涿州网站建设_网站设计_网站制作_做网站_固安良言多米网络公司 | 行星搅拌机,双行星搅拌机,动力混合机,无锡米克斯行星搅拌机生产厂家 | 旅游规划_旅游策划_乡村旅游规划_景区规划设计_旅游规划设计公司-北京绿道联合旅游规划设计有限公司 | 卸料器-卸灰阀-卸料阀-瑞安市天蓝环保设备有限公司 | RFID电子标签厂家-上海尼太普电子有限公司 |