- 博客(16)
- 收藏
- 关注
原创 【TextIn—智能文档解析与DocFlow票据AI自动化处理:赋能企业文档数字化管理与数据治理的双重利器】
在数据驱动的时代,企业面临的挑战不仅在于海量数据的整理和响应速度的提高,更在于如何有效管理和利用这些日益增长的海量信息。尤其是在信息日趋多样化的背景下,企业如何管理结构化与非结构化数据、实现自动化处理,已成为数字化转型的关键议题。TextIn凭借其领先的通用文档解析与票据自动化处理技术,为企业应对此类问题提供了切实有效的解决方案,全面提升企业的数据管理和运营的效率。
2025-01-02 10:14:27
8747
转载 直播预告 | 揭秘文档解析技术细节,一起锁定12月5日直播
立即扫码即可报名,还能免费领取100次使用权限,与行业专家面对面交流,共同探讨文档解析技术的无限可能。不要错过这个提升自己技术实力的绝佳机会!在数字化浪潮中,文档解析技术正成为大模型发展的关键力量。为了帮助大家深入了解这一技术,并探索其在大模型训练与应用中的重要作用。,全方位展示其在大模型训练与应用中的核心价值。,详细拆解这项技术在不同场景下的使用。在这次路演上,常扬老师将。
2024-11-28 11:58:43
54
2
原创 【TextIn:开源免费的AI智能文字识别产品(通用文档智能解析识别、OCR识别、文档格式转换、篡改检测、证件识别等)】
TextInAPI文档。致力于为企业、开发者及个人用户提供一站式智能文字识别服务。TextIn智能文字识别引擎可以从图像和PDF文档中提取印刷、手写、印章、公式、表格、图片等富文本信息,支持50+多语言识别,众多文档类型,包括商业文件、发票、账单、收据、名片和海报。在财务共享系统中可以从混贴的发票中切分、分类、提取字段信息,支持发票中错行、倾斜、重叠、遮挡、形变、光照不均等复杂场景;在证件识别系统中支持13类国家证件识别,覆盖个人和企业所需的200+种证件识别
2024-11-01 15:50:44
8071
28
原创 LMDeploy量化部署进阶实践
这节是主要还是Internlm2.5和InternVL2的部署与量化实现的内容,操作简单,主要是我们可以使用lmde工具来量化模型,使其模型推理只需要较低的显存占用,保证在低配置下也能运行推理。感兴趣的同学可以自己深入了解下我们的LMDeploy量化参数以及相关代码的核心逻辑。
2024-08-29 09:44:56
936
原创 MindSearch 快速部署
继 OpenAI 发布 SearchGPT 之后,国内也涌现出一批优秀的AI搜索引擎,其中,由中科大和上海人工智能实验室联合研发的 MindSearch(思·索)尤为引人注目
2024-08-14 09:26:14
1621
原创 【大模型微调数据构造】
本节内容可参照XTuner 微调个人小助手认知,这里简单介绍下流程:首先进入之前创建的开发机并激活之前创建的虚拟环境建立文件夹ruozhiba复制internlm2-chat-1.8B模型上面的数据构造可以去指定地址下载数据集,我这里是直接去下载的,详细命令在开源数据网站上可以看到。
2024-06-18 16:49:00
1151
原创 OpenCompass 大模型评测实战
上海人工智能实验室科学家团队正式发布了大模型开源开放评测体系 “司南” (OpenCompass2.0),用于为大语言模型、多模态模型等提供一站式评测服务。开源可复现:提供公平、公开、可复现的大模型评测方案全面的能力维度:五大维度设计,提供 70+ 个数据集约 40 万题的的模型评测方案,全面评估模型能力丰富的模型支持:已支持 20+ HuggingFace 及 API 模型分布式高效评测:一行命令实现任务分割和分布式评测,数小时即可完成千亿模型全量评测。
2024-06-18 16:40:57
924
原创 Lagent & AgentLego 智能体应用搭建
在本节中,我们将基于 Lagent 自定义一个工具。Lagent 中关于工具部分的介绍文档位于 https://lagent.readthedocs.io/zh-cn/latest/tutorials/action.html。继承 BaseAction 类实现简单工具的 run 方法;或者实现工具包内每个子工具的功能简单工具的 run 方法可选被 tool_api 装饰;工具包内每个子工具的功能都需要被 tool_api 装饰下面我们将实现一个调用和风天气 API 的工具以完成实时天气查询的功能。
2024-06-18 16:35:50
1117
原创 LMDeploy 量化部署 LLM 实践
支持多模态模型:这一节内容其实比较简单,需要理解的知识点都是LMdeploy部署有关,更多的是希望同学们能够感受到LMdeploy部署的操作便捷性和输出的性能。
2024-06-18 16:19:49
858
原创 XTuner 微调 LLM:1.8B、多模态、Agent
是不是感觉其实微调也不过如此!事实上确实是这样的!其实在微调的时候最重要的还是要自己准备一份高质量的数据集,这个才是你能否真微调出效果最核心的利器。微调也经常被戏称为是炼丹,就是说你炼丹的时候你得思考好用什么样的材料、用多大的火候、烤多久的时间以及用什么丹炉去烧。这里的丹炉其实我们可以想象为 XTuner ,只要丹炉的质量过得去,炼丹的时候不会炸,一般都是没问题的。但是假如炼丹的材料(就是数据集)本来就是垃圾,那无论怎么炼(微调参数的调整),炼多久(训练的轮数),炼出来的东西还只能且只会是垃圾。
2024-06-13 16:47:37
1124
原创 IntenLM2-三-《“茴香豆“:零代码搭建你的 RAG 智能助理》
茴香豆的工作流分为三个部分:预处理(Preprocess),拒答工作流(Rejection Pipeline),应答工作流(Response Pipeline),使用拒答工作流是为了方便更复杂的应用场景。
2024-06-11 17:40:29
958
原创 InternLM2实战营第二期-笔记
部署 InternLM2-Chat-1.8B 模型进行智能对话,部署实战营优秀作品 八戒-Chat-1.8B 模型,通过 InternLM2-Chat-7B 运行 Lagent 智能体 Demo,实践部署 浦语·灵笔2 模型
2024-06-11 10:02:02
1294
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人