阿里云文档 2025-06-07

Paraformer实时语音识别WebSocket API

本文介绍如何通过WebSocket连接访问实时语音识别服务。DashScope SDK目前仅支持Java和Python。若想使用其他编程语言开发Paraformer实时语音识别应用程序,可以通过WebSocket连接与服务进行通信。WebSocket是一种支持全双工通信的网络协议。客户端和服务器通过...

阿里云文档 2025-05-15

Gummy实时语音识别、翻译WebSocket API

本文介绍如何通过WebSocket连接访问Gummy实时语音识别、翻译服务。DashScope SDK目前仅支持Java和Python。若想使用其他编程语言开发Gummy实时语音识别、翻译应用程序,可以通过WebSocket连接与服务进行通信。WebSocket是一种支持全双工通信的网络协议。客户端...

阿里云文档 2025-05-12

实时语音识别

实时语音识别可以将音频流实时转换为文本,实现“边说边出文字”的效果。它适用于对麦克风语音进行实时识别,以及对本地音频文件进行实时转录。

阿里云文档 2025-03-28

高并发场景下实时语音识别的性能优化

本文介绍在高并发场景下,如何通过DashScope Java SDK,高效调用Paraformer实时语音识别服务。

文章 2025-02-10 来自:开发者社区

FireRedASR:精准识别普通话、方言和歌曲歌词!小红书开源工业级自动语音识别模型

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发感兴趣,我会每日分享大模型与 AI 领域的开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术! 微信公众号|搜一搜:蚝油菜花 大家好,我是蚝油菜花,今天跟大家分享一下 FireRedASR 这个小红书开源的工业级自动语音识别模型。 快速阅读 FireRedASR 是小红书开源的工业级自动语音识别模型,支持普通话、中文方...

FireRedASR:精准识别普通话、方言和歌曲歌词!小红书开源工业级自动语音识别模型
阿里云文档 2024-01-16

如何在SDK中使用POP API设置自学习模型

本文为您介绍如何在SDK中使用POP API设置自学习模型。

文章 2023-06-17 来自:开发者社区

直接开源!达摩院公布下一代工业级语音识别模型

今天,阿里巴巴达摩院发布新一代语音识别模型Paraformer,这是业界首个应用落地的非自回归端到端语音识别模型,在推理效率上最高可较传统模型提升10倍,且识别准确率在多个权威数据集上名列第一。目前,该模型于魔搭社区面向全社会开源,适用语音输入法、智能客服、车载导航、会议纪要等众多场景。01 下一代语音识别模型:从自回归到非自回归的探索语音作为最自然的交流途径, 一直是人机交互重要研究领域。当前....

直接开源!达摩院公布下一代工业级语音识别模型

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等

登录插画

登录以查看您的控制台资源

管理云资源
状态一览
快捷访问