工具介绍
一款一站式、开源、高质量的数据提取工具,主要包含以下功能:
•Magic-PDF PDF文档提取
•Magic-Doc网页与电子书提取
Magic-PDF 是一款将 PDF 转化为 markdown 格式的工具。支持转换本地文档或者位于支持S3协议对象存储上的文件。
Magic-Doc 是一款支持将网页或多格式电子书转换为 markdown 格式的工具。
工具地址
GitHub:https://github.com/opendatalab/MinerU
一款一站式、开源、高质量的数据提取工具,主要包含以下功能:
•Magic-PDF PDF文档提取
•Magic-Doc网页与电子书提取
Magic-PDF 是一款将 PDF 转化为 markdown 格式的工具。支持转换本地文档或者位于支持S3协议对象存储上的文件。
Magic-Doc 是一款支持将网页或多格式电子书转换为 markdown 格式的工具。
GitHub:https://github.com/opendatalab/MinerU
扫码打开当前页
进群添加哦
之前