阿里云文档 2025-06-12

文字识别模型qwen-vl-ocr如何使用

通义千问OCR是文字提取专有模型,专注于文档、表格、试题、手写体文字等类型图像的文字提取能力。它能够识别多种文字,目前支持的语言有:汉语、英语、阿拉伯语、法语、德语、意大利语、日语、韩语、葡萄牙语、俄语、西班牙语、越南语。

问答 2024-07-17 来自:开发者社区

文字识别OCR模型ID:24711训练报错,怎么解决?

文字识别OCR模型ID:24711训练报错,怎么解决?这个列在标注的时候有很多份都无法正确识别内容

阿里云文档 2024-05-28

调用CreateModelAsyncPredict模型异步预测API

文档自学习创建异步预测任务接口。

阿里云文档 2024-05-28

调用GetModelAsyncPredict获取模型异步预测结果API

模型预测分为三种类型:长文档信息抽取、单票据信息抽取、表格信息抽取。

问答 2024-01-02 来自:开发者社区

ModelScope读光ocr手写体模型问题中,不知道如何训练?

ModelScope读光ocr手写体模型问题中,我将灰度化的动作拆解到三通道 现在的识别模型只能识别灰度 无法识别颜色 如有多种颜色的背景横线干扰无法区分 我解开成三通道参数 但是不知道如何训练?

问答 2023-06-05 来自:开发者社区

OCR模型,如何使用本地LMDB文件进行训练?

如何使用本地LMDB文件进行训练?一定需要用MsDataset吗?如果无法联网是不是就没办法? 尝试使用Demo的方式,传入local_lmdb但是报错: TypeError: init() got an unexpected keyword argument 'local_lmdb'

问答 2023-04-10 来自:开发者社区

请问这个ocr模型的输入可以在不重新训练的情况下改成其他数值吗?

请问这个ocr模型的输入可以在不重新训练的情况下改成其他数值吗?我尝试在到处onnx的时候修改do_chunking和img_width无法成功。

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐