文章 2025-03-20 来自:开发者社区

SmolDocling:256M多模态小模型秒转文档!开源OCR效率提升10倍

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发感兴趣,我会每日分享大模型与 AI 领域的开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术! AI 在线答疑 -> 智能检索历史文章和开源项目 -> 丰富的 AI 工具库 -> 每日更新 -> 尽在微信公众号 -> 搜一搜:蚝油菜花 "学术狗集体泪目!这个AI把论文截图秒变Markdow...

SmolDocling:256M多模态小模型秒转文档!开源OCR效率提升10倍
文章 2024-08-19 来自:开发者社区

MiniCPM-V 系列模型在多模态文档 RAG 中的应用(无需OCR的多模态文档检索+生成)

转载自:https://github.com/RhapsodyAILab/Awesome-MiniCPMV-Projects/tree/main/visrag 作者:https://github.com/bokesyo 在相当长一段时间内,检索增强生成(RAG)需要使用 OCR 技术把文档中的文本抽取出来,接着使用文本嵌入模型获得语义向量,利用语义向量构建知识库进行检索...

MiniCPM-V 系列模型在多模态文档 RAG 中的应用(无需OCR的多模态文档检索+生成)
阿里云文档 2023-12-05

单据票证信息抽取产品功能文档

功能简介单据票证信息抽取(固定版式)是基于深度学习的信息抽取自学习模型任务,可对版式相对固定的单据、证件、凭证等类型数据有较好的效果,支持用户自定义抽取字段,通过平台可视化引导,完成数据标注和模型训练。在图像质量较好情况下,通过100+训练样本标注,调优后模型识别准确率可超95%+。同时工具箱中还提...

阿里云文档 2023-08-28

长文档信息抽取产品功能说明

功能简介长文档信息抽取是基于深度学习的信息抽取自学习模型任务,支持用户自定义抽取字段,通过平台可视化引导,完成数据标注和模型训练,实现对非结构化、多版式的文档的高精度抽取。在图像质量较好情况下,通过100+训练样本标注,调优后模型识别准确率可超85%+。功能优势高精度,基于阿里云强大的预训练模型,经...

阿里云文档 2023-02-15

OCR文档学习工具箱

工具箱是OCR文档自学习所提供的用于模型、模板路由分类及提升识别准确率的小工具集合,当前主要提供了分类器与字段类型两大类工具。

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐