文章 2024-08-29 来自:开发者社区

语音识别教程:Whisper

语音识别教程:Whisper 一、前言 最近看国外教学视频的需求,有些不是很适应,找了找AI字幕效果也不是很好,遂打算基于Whisper和GPT做一个AI字幕给自己。 二、具体步骤 1、安装FFmpeg Windows: 进入 https://github.com/BtbN/FFmpeg-Builds/releases,点击 windows版本的FFMPEG对应的图标,进入下载界...

语音识别教程:Whisper
文章 2024-07-04 来自:开发者社区

语音识别-免费开源的语音转文本软件Whisper的本地搭建详细教程,python版本是3.805,ffmpeg是专门处理音视频的,ffmpeg的下载链接,现在要求安装python和ffmpeg

视频资料链接: 免费开源的语音转文本软件Whisper的本地搭建详细教程_哔哩哔哩_bilibili 博主的博客地址: https://blog.lukeewin.top github中的Whisper链接地址: ...

语音识别-免费开源的语音转文本软件Whisper的本地搭建详细教程,python版本是3.805,ffmpeg是专门处理音视频的,ffmpeg的下载链接,现在要求安装python和ffmpeg
文章 2023-12-25 来自:开发者社区

(保姆教程及高级玩法-自定义数据处理)微信同声传译插件-语音识别

一、博主博客(保姆教程及高级玩法)微信同声传译插件-语音识别__揽的博客-CSDN博客(保姆教程及高级玩法)微信同声传译插件-语音识别__揽的博客-CSDN博客二、数据处理代案例(一定要看,不难理解,思路很重要)以上是我发布总结的教程,下面将展示如何使用正则进行数据处理请仔细查看,你会发现这个方法很吊,但是先体会一下案例,才能详细理解//name名字 id学生的id fenshu 学生的分数 .....

(保姆教程及高级玩法-自定义数据处理)微信同声传译插件-语音识别
文章 2023-12-25 来自:开发者社区

(保姆教程及高级玩法及坑)微信同声传译插件-语音识别

目录一、背景二、效果 编辑三、保姆级教程3.1 小程序后台添加插件:微信同声传译3.1.1 设置 -> 第三方设置 -> 添加插件 3.1.2 搜索插件 3.1.3 成功添加后,点击详情 3.1.4 复制它的AppID和最新版本号(后序有用) 3.2 配置项目3.2.1 微信原生小程序 3.2.2 uniapp配置3.3 页面展示3.3.1 wxml代码3.3.2 js代码3.3.3....

(保姆教程及高级玩法及坑)微信同声传译插件-语音识别
问答 2023-08-14 来自:开发者社区

ModelScope按照教程跑的MFCCA模型,最后的输出为什么没有说话人呢,只有语音识别的文字?

ModelScope按照教程跑的MFCCA模型,最后的输出为什么没有说话人呢,只有语音识别的文字?

文章 2023-05-27 来自:开发者社区

《阿里云AI产品必知必会系列电子书》——智能语音交互—— 一句话识别QuickStart使用教程(1)

产品概述智能语音交互(Intelligent1Speech1Interaction)是基于语音识别、语音合成、自然语言理解等技术,为企业在多种实际应用场景下,赋予产品“能听、会说、懂你”式的智能人机交互功能。适用于智能问答、智能质检、法庭庭审实时记录、实时演讲字幕、访谈录音转写等场景,在金融、司法、电商等多个领域均有应用。目前最常见的服务就是一句话识别和语音合成,下面分别针对两个功能通过SDK调....

《阿里云AI产品必知必会系列电子书》——智能语音交互—— 一句话识别QuickStart使用教程(1)
文章 2023-05-27 来自:开发者社区

《阿里云AI产品必知必会系列电子书》——智能语音交互—— 一句话识别QuickStart使用教程(2)

《阿里云AI产品必知必会系列电子书》——智能语音交互—— 一句话识别QuickStart使用教程(1) https://developer.aliyun.com/article/1232532?groupCode=supportservice二、Step By Step•v2.1 前往控制台创建项目•2.2 获取创建好项目的appkey•2.3 获取阿里云账户对应的Access ID 和Acce....

《阿里云AI产品必知必会系列电子书》——智能语音交互—— 一句话识别QuickStart使用教程(2)
文章 2023-05-27 来自:开发者社区

《阿里云AI产品必知必会系列电子书》——智能语音交互—— 一句话识别QuickStart使用教程(3)

《阿里云AI产品必知必会系列电子书》——智能语音交互—— 一句话识别QuickStart使用教程(2) https://developer.aliyun.com/article/1232530?groupCode=supportservice三、通过SDK调用一句话识别服务注:由于模型的采样率在配置时使用16K,所有测试的音频文件采样率也需要是16K(常见音频采样率:8000Hz/16000Hz....

文章 2023-05-27 来自:开发者社区

《阿里云AI产品必知必会系列电子书》——智能语音交互——语音合成QuickStart使用教程

语音合成Quick Start使用教程一、服务开通以及项目创建请参考:一句话识别Quick Start使用教程二、通过SDK调用一句话识别服务1.添加maven依赖<dependency> <groupId>com.aliyun</groupId> <artifactId>aliyun-java-sdk-core</artifactId&...

《阿里云AI产品必知必会系列电子书》——智能语音交互——语音合成QuickStart使用教程
问答 2023-05-23 来自:开发者社区

手机怎么开通阿里语音AI语音交互?发个手机教程。

手机怎么开通阿里语音AI语音交互?发个手机教程。

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐