阿里云文档 2025-03-28

高并发场景下实时语音识别的性能优化

本文介绍在高并发场景下,如何通过DashScope Java SDK,高效调用Paraformer实时语音识别服务。

阿里云文档 2025-03-17

Paraformer实时语音识别WebSocket API

本文介绍如何通过WebSocket连接访问实时语音识别服务。DashScope SDK目前仅支持Java和Python。若想使用其他编程语言开发Paraformer实时语音识别应用程序,可以通过WebSocket连接与服务进行通信。WebSocket是一种支持全双工通信的网络协议。客户端和服务器通过...

阿里云文档 2025-03-03

Gummy实时语音识别、翻译WebSocket API

本文介绍如何通过WebSocket连接访问Gummy实时语音识别、翻译服务。DashScope SDK目前仅支持Java和Python。若想使用其他编程语言开发Gummy实时语音识别、翻译应用程序,可以通过WebSocket连接与服务进行通信。WebSocket是一种支持全双工通信的网络协议。客户端...

阿里云文档 2024-08-26

如何使用POPAPI在客户端自行操作训练自学习模型

本文为您介绍如何使用POP API,在客户端自行操作训练自学习模型,不需要依赖管控台的设置。

问答 2024-06-24 来自:开发者社区

在端到端语音识别模型中,时间戳预测面临的主要挑战是什么?

在端到端语音识别模型中,时间戳预测面临的主要挑战是什么?

阿里云文档 2024-01-16

如何在SDK中使用POP API设置自学习模型

本文为您介绍如何在SDK中使用POP API设置自学习模型。

问答 2023-01-30 来自:开发者社区

Paraformer语音识别-长音频版”ModelScope模型识别文本和时间戳为什么长文本返回?

Paraformer语音识别-中文-通用-16k-离线-large-长音频版”这个ModelScope模型的识别文本和时间戳为什么是拼接成长文本返回的?

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐