阿里云文档 2024-08-26

如何使用POPAPI在客户端自行操作训练自学习模型

本文为您介绍如何使用POP API,在客户端自行操作训练自学习模型,不需要依赖管控台的设置。

问答 2024-06-24 来自:开发者社区

在端到端语音识别模型中,时间戳预测面临的主要挑战是什么?

在端到端语音识别模型中,时间戳预测面临的主要挑战是什么?

阿里云文档 2024-01-29

管理定制模型

对于已创建的定制模型,您可以对其进行自动化测试、重新训练及删除操作。

阿里云文档 2024-01-29

如何在控制台创建定制模型并应用模型_智能语音交互(ISI)

本文为您介绍如何在控制台创建定制模型并应用模型。

阿里云文档 2024-01-16

如何在SDK中使用POP API设置自学习模型

本文为您介绍如何在SDK中使用POP API设置自学习模型。

文章 2023-05-13 来自:开发者社区

开源|业界首个应用落地的非自回归端到端语音识别模型,推理效率可提升10倍

近期,阿里巴巴达摩院发布新一代语音识别模型Paraformer,这是业界首个应用落地的非自回归端到端语音识别模型,在推理效率上最高可较传统模型提升10倍,且识别准确率在多个权威数据集上名列第一。目前,该模型于魔搭社区面向全社会开源,适用语音输入法、智能客服、车载导航、会议纪要等众多场景。01下一代语音识别模型:从自回归到非自回归的探索语音作为最自然的交流途径, 一直是人机交互重要研究领域。当前语....

开源|业界首个应用落地的非自回归端到端语音识别模型,推理效率可提升10倍
文章 2023-05-13 来自:开发者社区

INTERSPEECH 2022论文解读|Paraformer: 高识别率、高计算效率的单轮非自回归端到端语音识别模型

INTERSPEECH 是由国际语音通讯协会(International Speech Communication Association, ISCA)创办的语音信号处理领域顶级旗舰国际会议。历届 INTERSPEECH 会议都备受全球各地语音语言领域人士的广泛关注。本文介绍一种具有高识别率与计算效率的单轮非自回归模型 Paraformer。该论文已被 INTERSPEECH 2022 接收。近....

INTERSPEECH 2022论文解读|Paraformer: 高识别率、高计算效率的单轮非自回归端到端语音识别模型
文章 2022-07-29 来自:开发者社区

INTERSPEECH 2022论文解读|Paraformer: 高识别率、高计算效率的单轮非自回归端到端语音识别模型

针对 Transoformer 模型自回归生成文字的低计算效率的缺陷,学术界提出了非自回归模型来并行地输出目标文字(如图1所示)。根据生成目标文字时的迭代轮数,非自回归模型分为:多轮迭代式与单轮非自回归模型。迭代式非自回归模型,主要为 Mask-Predict 模式[2],训练时,将输入文字随机掩码,通过周边信息预测当前文字。解码时,采用多轮迭代的方式逐步生成目标文字;计算复杂度与迭代轮数有关(....

INTERSPEECH 2022论文解读|Paraformer: 高识别率、高计算效率的单轮非自回归端到端语音识别模型

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐