文章 2025-04-04 来自:开发者社区

Dolphin:40语种+22方言!清华联合海天瑞声推出的语音识别大模型,识别精度超Whisper两代

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发感兴趣,我会每日分享大模型与 AI 领域的开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术! AI 在线答疑 -> 智能检索历史文章和开源项目 -> 丰富的 AI 工具库 -> 每日更新 -> 尽在微信公众号 -> 搜一搜:蚝油菜花 ️ "方言识别天花板!清华团队开源语音大模型,40种语言...

Dolphin:40语种+22方言!清华联合海天瑞声推出的语音识别大模型,识别精度超Whisper两代
文章 2024-08-29 来自:开发者社区

语音识别教程:Whisper

语音识别教程:Whisper 一、前言 最近看国外教学视频的需求,有些不是很适应,找了找AI字幕效果也不是很好,遂打算基于Whisper和GPT做一个AI字幕给自己。 二、具体步骤 1、安装FFmpeg Windows: 进入 https://github.com/BtbN/FFmpeg-Builds/releases,点击 windows版本的FFMPEG对应的图标,进入下载界...

语音识别教程:Whisper
文章 2024-07-04 来自:开发者社区

语音识别-免费开源的语音转文本软件Whisper的本地搭建详细教程,python版本是3.805,ffmpeg是专门处理音视频的,ffmpeg的下载链接,现在要求安装python和ffmpeg

视频资料链接: 免费开源的语音转文本软件Whisper的本地搭建详细教程_哔哩哔哩_bilibili 博主的博客地址: https://blog.lukeewin.top github中的Whisper链接地址: ...

语音识别-免费开源的语音转文本软件Whisper的本地搭建详细教程,python版本是3.805,ffmpeg是专门处理音视频的,ffmpeg的下载链接,现在要求安装python和ffmpeg
文章 2024-04-28 来自:开发者社区

【专栏】Linux 中的机器学习:Whisper适用于语音助手、翻译等领域,随着技术发展,其应用前景广阔

一、引言 在当今的科技领域,机器学习和自然语言处理技术正蓬勃发展。Linux 作为一个强大的操作系统,为机器学习提供了广阔的发展空间。 Whisper 是一种先进的自动语音识别(ASR)系统,它在 Linux 环境中展现出了卓越的性能。本文将深入探讨 Whisper 在 Linux 中的应用,以及如何利用它来实现...

问答 2024-02-01 来自:开发者社区

modelscope-funasr的Qwen-Audio是把Whisper作为语音识别,然后处理吗?

modelscope-funasr的Qwen-Audio 这个项目是把 Whisper 作为语音识别,然后用通义千问处理识别结果吗?

文章 2024-01-25 来自:开发者社区

Whisper对于中文语音识别与转写中文文本优化的实践(Python3.10)

阿里的FunAsr对Whisper中文领域的转写能力造成了一定的挑战,但实际上,Whisper的使用者完全可以针对中文的语音做一些优化的措施,换句话说,Whisper的“默认”形态可能在中文领域斗不过FunAsr,但是经过中文特殊优化的Whisper就未必了。 中文文本标注优化 Whisper经常被人诟病的一点是对中文语音转写后标点符号的支持不够完备。首先安装whisper: pip ...

Whisper对于中文语音识别与转写中文文本优化的实践(Python3.10)
文章 2024-01-10 来自:开发者社区

中文语音识别转文字的王者,阿里达摩院FunAsr足可与Whisper相颉顽

君不言语音识别技术则已,言则必称Whisper,没错,OpenAi开源的Whisper确实是世界主流语音识别技术的魁首,但在中文领域,有一个足以和Whisper相颉顽的项目,那就是阿里达摩院自研的FunAsr。 FunAsr主要依托达摩院发布的Paraformer非自回归端到端语音识别模型,它具有高精度、高效率、便捷部署的优点,支持快速构建语音识别服务,最重要的是,FunASR支持标点符号识...

中文语音识别转文字的王者,阿里达摩院FunAsr足可与Whisper相颉顽
问答 2023-12-27 来自:开发者社区

modelscope-funasr中文语音识别性能相对whisper怎么样,有性能数据吗?

modelscope-funasr中文语音识别性能相对whisper怎么样,有性能数据吗?

文章 2023-03-14 来自:开发者社区

Linux 中的机器学习:Whisper——自动语音识别系统

Whisper 是一种自动语音识别 (ASR) 系统,使用从网络收集的 680000 小时多语言和多任务数据进行训练,Whisper 由深度学习和神经网络提供支持,是一种基于 PyTorch 构建的自然语言处理系统,这是免费的开源软件。安装Whisper我们用 Ubuntu 22.04 LTS 测试了 Whisper,为避免污染您的系统,我们建议使用 Anaconda 或 Miniconda 安....

Linux 中的机器学习:Whisper——自动语音识别系统
文章 2023-02-23 来自:开发者社区

闻其声而知雅意,M1 Mac基于PyTorch(mps/cpu/cuda)的人工智能AI本地语音识别库Whisper(Python3.10)

前文回溯,之前一篇:含辞未吐,声若幽兰,史上最强免费人工智能AI语音合成TTS服务微软Azure(Python3.10接入),利用AI技术将文本合成语音,现在反过来,利用开源库Whisper再将语音转回文字,所谓闻其声而知雅意。Whisper 是一个开源的语音识别库,它是由Facebook AI Research (FAIR)开发的,支持多种语言的语音识别。它使用了双向循环神经网络(bi-dir....

闻其声而知雅意,M1 Mac基于PyTorch(mps/cpu/cuda)的人工智能AI本地语音识别库Whisper(Python3.10)

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

X
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等