0 资料来源
MarkItDown试用: https://www.html.zone/markitdown/
github:https://github.com/microsoft/markitdown
下面的测试是:微软MarkitDown 不加载大模型情况下的测试
测试用的: https://www.html.zone/markitdown/
1 word
原始word
Markdow
预览
2 pdf
原始pdf
Markdow
预览
3 excel
原始excel
直接卡在加载中
4 图片
原始图片
Markdow
预览
总结
- word效果较好
- pdf可能乱码多
- excel无法加载
- 图片无法识别