工具介绍
一款一站式、开源、高质量的数据提取工具,主要包含以下功能:
•Magic-PDF PDF文档提取
•Magic-Doc网页与电子书提取
Magic-PDF 是一款将 PDF 转化为 markdown 格式的工具。支持转换本地文档或者位于支持S3协议对象存储上的文件。
Magic-Doc 是一款支持将网页或多格式电子书转换为 markdown 格式的工具。
工具地址
GitHub:https://github.com/opendatalab/MinerU
【Applnn】温馨提醒:
1.本站发布的文章及附件仅限用于学习和研究,不得用于商业或非法用途,否则后果请用户自负!
2.本站信息来自网络收集整理,版权争议与本站无关,仅供学习研究,如有侵权请联系客服删除!
3.如果您喜欢该程序和内容,请支持正版,购买注册,得到更好的正版服务。
4.如果您喜欢我们,多多分享给你们朋友吧!