语音识别API-阿里云

阿里云文档 2025-04-11

Gummy实时语音识别、翻译WebSocket API

本文介绍如何通过WebSocket连接访问Gummy实时语音识别、翻译服务。DashScope SDK目前仅支持Java和Python。若想使用其他编程语言开发Gummy实时语音识别、翻译应用程序，可以通过WebSocket连接与服务进行通信。WebSocket是一种支持全双工通信的网络协议。客户端...

阿里云文档 2025-04-10

Paraformer实时语音识别WebSocket API

本文介绍如何通过WebSocket连接访问实时语音识别服务。DashScope SDK目前仅支持Java和Python。若想使用其他编程语言开发Paraformer实时语音识别应用程序，可以通过WebSocket连接与服务进行通信。WebSocket是一种支持全双工通信的网络协议。客户端和服务器通过...

阿里云文档 2025-03-28

高并发场景下实时语音识别的性能优化

本文介绍在高并发场景下，如何通过DashScope Java SDK，高效调用Paraformer实时语音识别服务。

问答 2025-01-26 来自：开发者社区

通义千问语音识别大模型API 本地上传报错 InvalidParameter问题如何解决？

在使用通义千问ASR时，是否支持直接上传本地音频文件？如果支持，是否必须使用官方DashScope SDK，或者可以通过 Base64 编码等方式上传？当前尝试通过 multipart/form-data 和 Base64 编码上传本地文件，但遇到 InvalidParameter 错误。但是使用公网 URL响应正常。请问正确的本地上传方式是什么？是否需要特定的字段名或编码格式？附错误信息：re....

问答 2024-08-14 来自：开发者社区