近日,百度輸入法發布V7.4版,并推出“輕聲識別”等新功能,讓用戶在語音錄入私密話題,或公共場合下能夠使用“耳語”進行語音輸入,讓手機也能聽懂“悄悄話”。

語音輸入功能方便快捷,為何用戶還會首選文字而非語音進行輸入呢?據調查數據顯示,絕大多數用戶在表達內容涉及隱私,或當時的場合不適宜大聲說話時會選擇手動鍵入內容來代替語音輸入。不少用戶都表示,如果手機可以識別“小聲說話”的內容,便可解決大多數安靜情況下語音輸入的痛點。
百度輸入法的“輕聲識別”功能可升級輸入法“聽力”,用戶的“悄悄話”也能聽懂。據了解,耳語語音較之正常語音有兩大不同點,一是耳語語音音量比正常音量要低很多,二是人們在輕聲說話的時候,由于不經過聲帶振動,因此不存在基頻,也不會產生相應的各次諧波,導致耳語的頻譜特性與正常語音完全不同,極大增加技術研發難度。
針對耳語語音的特殊性,百度輸入法依托人工智能技術,采取主動學習的方式,通過基音檢測和諧波分析技術,挑選出符合耳語特性的數據,作為百度輸入法“輕聲識別”的訓練集和開發集。挑選出的耳語數據經過標注后,作為訓練數據放在聲學模型上進行適配,使得已有聲學模型能夠快速適配耳語語音特性。
隨著語音識別技術的不斷發展,百度在語音輸入方面頻頻發力。在此前發布的V7.3版本中,百度輸入法創新性的推出了長文本語音輸入等語音輸入新功能。2017年初,百度推出的網頁應用SwiftScribe可以將音頻文件轉為文本,時長1分鐘的音頻文件可以在30秒內轉換完成,轉化效率較人工速記快 1.67倍,極大提升速記行業轉錄效率。
業內人士指出,百度輸入法的“輕聲識別”功能具有聲音低、識別準、速度快的特點,將拓展用戶語音輸入的使用場景,并培養用戶的語音使用習慣,“輕聲識別”功能的上線為語音輸入法市場帶來一抹亮色,通過人工智能技術對輸入法產品的加持,提升用戶的輸入體驗,同時也將在輸入法行業掀起人工智能浪潮。
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。
海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。
IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。