文章 2025-03-23 来自:开发者社区

1.6K star!这个开源文本提取神器,5分钟搞定PDF/图片/Office文档!

嗨,大家好,我是小华同学,关注我们获得“最新、最全、最优质”开源项目和高效工作学习方法 Kreuzberg 是一个基于 Python 的文本提取库,支持从 PDF、图像、Office 文档等 20+ 格式中提取文本内容。采用 MIT 开源协议,具备本地处理、异步架构、智...

1.6K star!这个开源文本提取神器,5分钟搞定PDF/图片/Office文档!
文章 2025-02-06 来自:开发者社区

OCRmyPDF:16.5K Star!快速将 PDF 文件转换为可搜索、可复制的文档的命令行工具

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发非常感兴趣,我会每日分享大模型与 AI 领域的最新开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术,欢迎关注我哦! 微信公众号|搜一搜:蚝油菜花 快速阅读 功能强大:OCRmyPDF 支持生成可搜索的 PDF/A 文件,保持原始图像分辨率,同时优化图像质量。 多语言支持:支持超过 100 种语言,确保不同语言的...

OCRmyPDF:16.5K Star!快速将 PDF 文件转换为可搜索、可复制的文档的命令行工具
阿里云文档 2024-02-26

与PDF文档AnnoAPI有哪些相关API

本文介绍与PDF文档AnnoAPI相关的API。

阿里云文档 2024-01-02

与PDF文档ActivePDF相关的API有哪些

本文介绍与PDF文档ActivePDF相关的API。

阿里云文档 2023-09-13

与PDF文档Sub有哪些相关API_智能媒体管理(IMM)

本文介绍与PDF文档Sub相关的API。

阿里云文档 2023-01-09

PDF文档的API枚举

本文介绍PDF文档的API枚举。

阿里云文档 2023-01-09

PDF文档如何获取和设置滚动条,设置播放

本文介绍PDF文档如何获取和设置滚动条、设置播放。

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

开发与运维

集结各类场景实战经验,助你开发运维畅行无忧

+关注