文章 2024-10-11 来自:开发者社区

LangChain-20 Document Loader 文件加载 加载MD DOCX EXCEL PPT PDF HTML JSON 等多种文件格式 后续可通过FAISS向量化 增强检索

背景描述 LangChain 提供了多种文档加载器,包括但不限于以下几种: TextLoader:用于从各种来源加载文本数据。 CSVLoader:用于加载 CSV 文件并将其转换为 LangChain 可以处理的文档格式。 UnstructuredFileLoader:能够自动检测并处理不同格式的文件。 DirectoryLoader:用于加载...

LangChain-20 Document Loader 文件加载 加载MD DOCX EXCEL PPT PDF HTML JSON 等多种文件格式 后续可通过FAISS向量化 增强检索
文章 2024-02-26 来自:开发者社区

Java【代码 16】将word、excel文件转换为pdf格式和将pdf文档转换为image格式工具类分享(Gitee源码)aspose转换中文乱码问题处理

1.感谢 感谢小伙伴儿的分享:● 不羁● 郭中天整合调整后的工具类Gitee地址:https://gitee.com/yuanzhengme/java_application_aspose_demo 2.包含的工具类 ● WordToPdfUtil用于将word文档转换为pdf格式的工具类● ExcelToPdfUtil用于将excel文档转换为pdf格式的工具类● ...

阿里云文档 2023-09-03

如何通过组件实现Word导出为pdf格式_机器人流程自动化

本文档主要介绍阿里云RPA可视化编辑模式下,Word类组件的操作示例。

文章 2017-11-12 来自:开发者社区

C#对word、excel、pdf等格式文件的操作总结

一、word 这是我以前工作时写过的一个业务逻辑处理类,里面有不少文件操作的方法,这里主要关注一下C#对word的操作。里面的方法可以直接拿出来用,主要是通过word的dot模版来进行创建word、替换word等操作。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 3...

文章 2013-05-27 来自:开发者社区

C#对word、excel、pdf等格式文件的操作总结

一、word 这是我以前工作时写过的一个业务逻辑处理类,里面有不少文件操作的方法,这里主要关注一下C#对word的操作。里面的方法可以直接拿出来用,主要是通过word的dot模版来进行创建word、替换word等操作。 namespace Excel2Word { public class BLL { private Microsoft.Office.Inter...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

开发与运维

集结各类场景实战经验,助你开发运维畅行无忧

+关注