11月16, 2020

新一代Kaldi技术细节揭秘:K2是核心部分

2020年11月15日,由北京希尔贝壳科技有限公司、中国计算机学会语音对话与听觉专业组、AISHELL基金会主办,小米科技、昆山杜克大学、西北工业大学音频语音与语言处理研究组、中国科学技术大学共同协办的第五届Kaldi技术交流会在北京举办。

受疫情影响,本次技术交流会采用全天线上直播&下午(北京·小米科技园)线下技术交流会的形式。值得注意的是,本次线下交流活动,Kaldi之父Daniel Povey博士首次亲临现场,与来自北京各大互联网公司、知名高校的开发者们深入交流下一代Kaldi社区未来的发展。

加入小米一年,Daniel Povey设计并开发出了新一代Kaldi。新一代Kaldi分成三个部分,包括核心算法部分,训练数据准备部分、示例脚本集合部分。

其中,Lhotse(训练数据准备部分)将替代以前Kaldi中所有数据准备相关的工作,操作各种音频和文本的元数据。Lhotse除了Kaldi本身,也适用于其他应用。而且Lhotse纯Python代码,方便易用。

点击查看原文>

本文链接:https://blog.jnliok.com/post/13IWjKNlo1r7a7IVhwFg.html

-- EOF --

Comments