99热免费,女高潮大叫喷水流白浆,精品老肥婆88AV,美女后入视频,日韩h

頂級(jí)語(yǔ)音識(shí)別專家Daniel Povey:新一代Kaldi可大幅降低收聽語(yǔ)音詞錯(cuò)誤率 年底或?qū)?yīng)用于所有小米AIoT產(chǎn)品

2021-08-31 21:45:17 來源:互聯(lián)網(wǎng)

中國(guó)網(wǎng)科技8月31日訊 小米集團(tuán)語(yǔ)音首席科學(xué)家、“Kaldi之父”Daniel Povey(丹尼爾·波維)今日接受媒體采訪時(shí)稱,新一代Kaldi目標(biāo)不僅僅是趕上或者稍微領(lǐng)先這些語(yǔ)音識(shí)別庫(kù),而是要根本地改變語(yǔ)音識(shí)別的實(shí)現(xiàn)方式。

Daniel Povey對(duì)中國(guó)網(wǎng)科技透露,目前小米AIoT產(chǎn)品中還用的是第一代Kaldi,接下來小米將逐步把新一代Kaldi能力融入到小米產(chǎn)品中,預(yù)計(jì)在今年年底或明年初,開始將新一代Kaldi能力應(yīng)用于小米產(chǎn)品,但現(xiàn)在仍在測(cè)試之中。

談及為何選擇在小米開發(fā)新一代Kaldi,Daniel Povey對(duì)記者直言:“事實(shí)上有很多大型互聯(lián)網(wǎng)公司都想把我招致麾下,但小米是一家公司戰(zhàn)略規(guī)劃相對(duì)穩(wěn)定的公司,加上表現(xiàn)出對(duì)開源項(xiàng)目的承諾與重視,因此在我需要做開源項(xiàng)目這一硬性標(biāo)準(zhǔn)看來,小米是最佳去處?!?/p>

據(jù)悉,現(xiàn)有端到端語(yǔ)音識(shí)別模型的流行和準(zhǔn)確率的逐步提升,以及PyTorch、TensorFlow等深度學(xué)習(xí)工具包的普及,是開發(fā)新一代Kaldi主要?jiǎng)恿?。相較初代而言,新一代Kaldi是一個(gè)全新代碼庫(kù),需要完全重新打造,由C++以及CUDA完成,并可以在Python調(diào)用。新一代Kaldi由3個(gè)獨(dú)立的項(xiàng)目組成,分別稱為 k2、Lhotse和Icefall。

其中,最新算法Icefall是這次新一代Kaldi重要部分,基于實(shí)現(xiàn)“雙向建?!焙投鄬幽P偷膬?yōu)勢(shì),擁有新一代Kaldi能力的AIoT產(chǎn)品可以大大提高語(yǔ)音識(shí)別能力,從而降低收到語(yǔ)音指令的詞錯(cuò)誤率。小米集團(tuán)方面稱,目前已經(jīng)在LibriSpeech數(shù)據(jù)集上取得了2.57%的詞錯(cuò)誤率,而且還在持續(xù)的進(jìn)一步優(yōu)化。

小米集團(tuán)語(yǔ)音首席科學(xué)家、“Kaldi之父”Daniel Povey

Daniel Povey表示:“新一代Kaldi與PyTorch兼容,并且代碼更容易修改,比初代Kaldi代碼庫(kù)更靈活得多,允許用戶更輕松地嘗試新想法。并且止于目前,依托于Kaldi而發(fā)展起來的很多中小型企業(yè)有很多,Kaldi將一直堅(jiān)持做項(xiàng)目開源。”

公開信息顯示,Daniel Povey是語(yǔ)音識(shí)別開源工具Kaldi的主要開發(fā)者和維護(hù)者,因此被稱為“Kaldi之父”。而Kaldi工具簡(jiǎn)而言之的講,目前國(guó)內(nèi)三大語(yǔ)音助手小愛同學(xué)、小度、天貓精靈使用的底層框架都是Kaldi,Kaldi等于是能讓智能物聯(lián)通過語(yǔ)音交互方式呈現(xiàn)的基礎(chǔ),是目前被業(yè)界公認(rèn)的語(yǔ)音識(shí)別框架基石。

標(biāo)簽: 語(yǔ)音 頂級(jí) AIoT 小米