——比没有发现问题更可怕的还能是什么,是没有答案
关键词:AI LLM vary ocr docker
上周末接到一个需求,提取pdf中的采购数据,整合一起进行比较。想用LLM来解决,似乎可以但是感觉又有问题。
于是问了下度娘,发现vary 这个似乎可以试试。这样找到了一个paper ,demo效果还是很nice的。但是搞算法和大模型的两位伙伴一个休假一个,忙的不可开交。我则临时抱佛脚,因为用户那边等个确定的意见。这我就开始捣鼓起来。
git 下代码,conda 虚拟环境,nvidia cuda toolkit 这也见到过不那么熟悉的东西以一个个上场。(因为一时没有环境得自己搭)
前面都还勉强过关,没想到这windows 搞环境还不是那么顺利。果然过不去了。反复了几次,不行。最终因为缺少库deepspeed 装不上,windows 啊,总不至于再搞ubuntu 然后nvidia cuda 头大了。于是乎最后一点希望,docker 这个不行那就去Ubuntu
找了个nvidia的docker 好家伙22G 。凌晨四点的网络还是很给力的。下载顺利,导入成功,docker启动,部署代码,安装运行环境
等待—— 等待——
终于成了。但是呢,由于没有model ,网上那些文章里的那一行代码是不能出结果的。下一步
训练模型。朋友们祝我好运吧!
(待续)