CMU Sphinx
作者:毫末科技
邮箱:hxg@haomo-studio.com
微信二维码:
1 概述
1.1 技术描述
包含如下模块:
- Acoustic and Language Models:语音和语料模型,支持多种语言.
- Sphinxbase:核心库
- Sphinxtrain:生成用户自己语音语料模型的工具
- Pocketsphinx: PocketSphinx是一个计算量和体积都很小的嵌入式语音识别引擎。在Sphinx-2的基础上针对嵌入式系统的需求修改、优化而来,是第一个开源面向嵌入式的中等词汇量连续语音识别项目。识别精度和Sphinx-2差不多。
- Sphinx-2: 采用半连续隐含马尔可夫模型(SCHMM)建模,采用的技术相对落后,使得识别精度要低于其它的译码器。
- Sphinx-3: CMU高水平的大词汇量语音识别系统,采用连续隐含马尔可夫模型CHMM建模。支持多种模式操作,高精度模式扁平译码器,由Sphinx3的最初版本优化而来;快速搜索模式树译码器。目前将这两种译码器融合在一起使用。
- Sphinx-4: 是由Java语言编写的大词汇量语音识别系统,采用连续的隐含马尔可夫模型建模,和以前的版本相比,它在模块化、灵活性和算法方面做了改进,采用新的搜索策略,支持各种不同的语法和语言模型、听觉模型和特征流,创新的算法允许多种信息源合并成一种更符合实际语义的优雅的知识规则。由于完全采用JAVA语言开发,具有高度的可移植性,允许多线程技术和高度灵活的多线程接口。
作者:HappyHorizon 链接:https://www.jianshu.com/p/26032e16752f 來源:简书 著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。