智能语音交互、语音AI中我在使用阿里实时语音识别时,用麦克风录音时,ASR效果就不是很好了,这个是?
智能语音交互、语音AI中我在使用阿里实时语音识别时,用麦克风录音时,MediaRecorder.AudioSource.DEFAULT的ASR效果还行,但是改成MediaRecorder.AudioSource.VOICE_COMMUNICATION,ASR效果就不是很好了,这个是怎么回事呀?
请问智能语音交互、语音AI中录音识别服务到底能不能返回每个字的时间戳?词信息里面是这个词的开始时间和
问题1:请问智能语音交互、语音AI中录音识别服务到底能不能返回每个字的时间戳?词信息里面是这个词的开始时间和结束时间吧,就是说是没办法精确到字的吧,没有啊,我昨天试过不是的,比如一段录音里面有个词,很多很多,确认下我们这边录音分析返回的时间戳是否可以精确到字,之前您同事说是去words里面取,words里面最多两个字,但是我测试的不是最多两个字,我的例子里面有四个字的,eg:“很多很多” 问题2....
智能语音交互、语音AI中帮忙查一下这个taskid,我听录音是静音的,但是却返回了识别结果af58b
智能语音交互、语音AI中帮忙查一下这个taskid,我听录音是静音的,但是却返回了识别结果af58b2f7cad14c8aabd901568433b6ff
本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。
产品推荐
人工智能平台PAI
人工智能平台 PAI(Platform for AI,原机器学习平台PAI)是面向开发者和企业的机器学习/深度学习工程平台,提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务,内置140+种优化算法,具备丰富的行业场景插件,为用户提供低门槛、高性能的云原生AI工程化能力。
+关注