99热免费,女高潮大叫喷水流白浆,精品老肥婆88AV,美女后入视频,日韩h

首頁> IT業(yè)界 > > 正文

頂級語音識別專家Daniel Povey:新一代Kaldi可大幅降低收聽語音詞錯誤率 年底或將應用于所有小米AIoT產品

2021-08-31 21:45:17 來源:互聯網

中國網科技8月31日訊 小米集團語音首席科學家、“Kaldi之父”Daniel Povey(丹尼爾·波維)今日接受媒體采訪時稱,新一代Kaldi目標不僅僅是趕上或者稍微領先這些語音識別庫,而是要根本地改變語音識別的實現方式。

Daniel Povey對中國網科技透露,目前小米AIoT產品中還用的是第一代Kaldi,接下來小米將逐步把新一代Kaldi能力融入到小米產品中,預計在今年年底或明年初,開始將新一代Kaldi能力應用于小米產品,但現在仍在測試之中。

談及為何選擇在小米開發(fā)新一代Kaldi,Daniel Povey對記者直言:“事實上有很多大型互聯網公司都想把我招致麾下,但小米是一家公司戰(zhàn)略規(guī)劃相對穩(wěn)定的公司,加上表現出對開源項目的承諾與重視,因此在我需要做開源項目這一硬性標準看來,小米是最佳去處?!?/p>

據悉,現有端到端語音識別模型的流行和準確率的逐步提升,以及PyTorch、TensorFlow等深度學習工具包的普及,是開發(fā)新一代Kaldi主要動力。相較初代而言,新一代Kaldi是一個全新代碼庫,需要完全重新打造,由C++以及CUDA完成,并可以在Python調用。新一代Kaldi由3個獨立的項目組成,分別稱為 k2、Lhotse和Icefall。

其中,最新算法Icefall是這次新一代Kaldi重要部分,基于實現“雙向建?!焙投鄬幽P偷膬?yōu)勢,擁有新一代Kaldi能力的AIoT產品可以大大提高語音識別能力,從而降低收到語音指令的詞錯誤率。小米集團方面稱,目前已經在LibriSpeech數據集上取得了2.57%的詞錯誤率,而且還在持續(xù)的進一步優(yōu)化。

小米集團語音首席科學家、“Kaldi之父”Daniel Povey

Daniel Povey表示:“新一代Kaldi與PyTorch兼容,并且代碼更容易修改,比初代Kaldi代碼庫更靈活得多,允許用戶更輕松地嘗試新想法。并且止于目前,依托于Kaldi而發(fā)展起來的很多中小型企業(yè)有很多,Kaldi將一直堅持做項目開源?!?/p>

公開信息顯示,Daniel Povey是語音識別開源工具Kaldi的主要開發(fā)者和維護者,因此被稱為“Kaldi之父”。而Kaldi工具簡而言之的講,目前國內三大語音助手小愛同學、小度、天貓精靈使用的底層框架都是Kaldi,Kaldi等于是能讓智能物聯通過語音交互方式呈現的基礎,是目前被業(yè)界公認的語音識別框架基石。

標簽: 語音 頂級 AIoT 小米