阿里云文档 2025-04-11

Gummy实时语音识别、翻译WebSocket API

本文介绍如何通过WebSocket连接访问Gummy实时语音识别、翻译服务。DashScope SDK目前仅支持Java和Python。若想使用其他编程语言开发Gummy实时语音识别、翻译应用程序,可以通过WebSocket连接与服务进行通信。WebSocket是一种支持全双工通信的网络协议。客户端...

阿里云文档 2025-04-10

Paraformer实时语音识别WebSocket API

本文介绍如何通过WebSocket连接访问实时语音识别服务。DashScope SDK目前仅支持Java和Python。若想使用其他编程语言开发Paraformer实时语音识别应用程序,可以通过WebSocket连接与服务进行通信。WebSocket是一种支持全双工通信的网络协议。客户端和服务器通过...

阿里云文档 2025-03-28

高并发场景下实时语音识别的性能优化

本文介绍在高并发场景下,如何通过DashScope Java SDK,高效调用Paraformer实时语音识别服务。

问答 2025-01-26 来自:开发者社区

通义千问语音识别大模型API 本地上传报错 InvalidParameter问题如何解决?

在使用通义千问ASR时,是否支持直接上传本地音频文件?如果支持,是否必须使用官方DashScope SDK,或者可以通过 Base64 编码等方式上传?当前尝试通过 multipart/form-data 和 Base64 编码上传本地文件,但遇到 InvalidParameter 错误。但是使用公网 URL响应正常。请问正确的本地上传方式是什么?是否需要特定的字段名或编码格式?附错误信息:re....

问答 2024-08-14 来自:开发者社区

阿里语音AI实时语音识别 sdm 有个产品功能诉求:目前了解到没有API可以查询到即时占用的chan

阿里语音AI实时语音识别 sdm 有个产品功能诉求:目前了解到没有API可以查询到即时占用的channel 数,只有满载了才能通过日志中Error信息中知悉到服务满载了。是否可提供API查询即时占用的channel 数,以便于业务侧做监测和业务流量控制?

问答 2024-08-05 来自:开发者社区

如何使用Python调用阿里云的实时语音识别API?

如何使用Python调用阿里云的实时语音识别API?

问答 2024-08-05 来自:开发者社区

Paraformer 语音识别,API 识别出结果,从哪里知道用户说的是什么语言?

Paraformer 语音识别,API 识别出结果,从哪里知道用户说的是什么语言?

问答 2024-07-24 来自:开发者社区

modelscope-funasr的http方式的语音识别api 怎么调用?

modelscope-funasr的http方式的语音识别api 怎么调用?

问答 2024-05-29 来自:开发者社区

modelscope-funasr的实时语音识别API详情,过程的结果非常不准,这是什么原因呢?

modelscope-funasr的实时语音识别API详情,过程的结果非常不准,这是什么原因呢?

问答 2024-04-22 来自:开发者社区

阿里云语音AI 语音识别 restful api接口 uniapp h5配置跨域报400,为什么?

阿里云语音AI 语音识别 restful api接口 uniapp h5配置跨域报400,为什么?

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐