阿里云文档 2024-08-26

如何使用POPAPI在客户端自行操作训练自学习模型

本文为您介绍如何使用POP API,在客户端自行操作训练自学习模型,不需要依赖管控台的设置。

阿里云文档 2024-01-29

管理定制模型

对于已创建的定制模型,您可以对其进行自动化测试、重新训练及删除操作。

阿里云文档 2024-01-29

如何在控制台创建定制模型并应用模型_智能语音交互(ISI)

本文为您介绍如何在控制台创建定制模型并应用模型。

阿里云文档 2024-01-16

如何在SDK中使用POP API设置自学习模型

本文为您介绍如何在SDK中使用POP API设置自学习模型。

文章 2022-06-13 来自:开发者社区

语音识别(ASR)系列之四:基于Attention的模型

语音识别系列前三篇分别介绍了基本原理、混合模型、端到端模型中的CTC模型和Transducer模型。此篇是系列最后一篇,讲讲基于Attention机制(注意力机制)的端到端模型。\复习AttentionAttention机制毫不夸张地说是近几年机器学习中的大热门,热门的原因确实是因为它在各种场景中能提高模型的准确率。Attention本身的机制和结构不是本篇文章的重点,网上介绍的文章很多,我公众....

语音识别(ASR)系列之四:基于Attention的模型
文章 2022-06-13 来自:开发者社区

语音识别(ASR)系列之三:CTC、RNN-T模型

上一篇系列之二介绍了早期的混合模型,底层使用GMM或者DNN计算帧对应的音素概率,上层使用HMM寻找最优的音素序列,得到最终的文字序列。该模型的缺点:需要对帧级别打标签、建模,这对语音数据来说工作量巨大,并且标签不一定准确,特别是两个音的边界部分;两个或者多个模型混合增加了模型复杂度,使用不太方便。\\于是后来新的模型思路转向从语音直接预测文字,即端到端模型。今天我们来看看具有里程碑意义的CTC....

语音识别(ASR)系列之三:CTC、RNN-T模型
文章 2022-06-13 来自:开发者社区

语音识别(ASR)系列之二:混合模型

上篇系列之一从总体上讲了ASR的原理、评估方法、模型发展,这一篇开始介绍称霸ASR三十年的混合模型(Hybrid Model),特别是GMM/HMM模型。由于GMM和HMM模型本身已经是很大的一块内容,我假设读者已经了解其基本原理。网络异常,图片无法展示|基本概念在讲具体模型之前,先介绍一些需要了解的基本概念。对语音进行处理,一般会先进行分帧和特征提取,例如MFCC、FBank,然后把这些特征转....

语音识别(ASR)系列之二:混合模型

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐