- 博客(283)
- 收藏
- 关注
原创 启信宝《2025全国采购地图》:藏在县城的“隐形冠军”,撑起你的购物车
今年"双十一"凸显县域产业带正从幕后走向台前。启信宝《2025全国采购地图》显示,湖南平江辣条、河南柘城培育钻石、山东曹县汉服等县域产业集群正成为中国制造新引擎。其中,平江已形成完整辣条产业链,柘城培育钻石产能占全球70%,曹县汉服通过知识产权创新应对山寨挑战。这些县域产业带正从单纯成本优势向供应链、技术、品牌等综合优势转型,威海渔具、许昌假发等更多"隐形冠军"正在浮现,共同支撑起中国经济的产业深度和发展韧性。
2025-11-20 14:45:57
466
1
原创 论文解读-对话中的多模态情感识别综述
本调查对MERC领域进行了结构化的回顾,比较了代表性方法,并突出了关键的开放研究问题。作者希望它能作为实用参考,支持未来开发稳健且包容的情感识别系统。
2025-11-19 10:00:00
1279
11
原创 论文解读 - 大型多模态模型中现实世界个性化基准测试
本文中,论文提出了MDI基准测试,这是一种评估大型多模态模型(LMMs)在多维度场景中解决实际人类需求能力的工具。该基准测试包含超过500张图像和1200个相关需求,涵盖了人类生活的六大方面。此外,论文引入了年龄分层和基于老年人、中年人及年轻人需求的抽样问题,以确保评估的全面性。
2025-11-12 10:00:00
1553
17
原创 让大模型一键“读懂”全球文档,合合信息携手火山引擎打造AI智能体新范式
摘要:中国信通院数据显示国内已发布大模型超1500个,推动技术落地成为行业关键。合合信息与火山引擎合作推出升级版"大模型加速器",通过高效文档解析技术解决企业非结构化数据处理难题,支持99.99%的复杂文档解析。平台提供分层服务方案:HiAgent面向企业定制化需求,Coze降低开发者门槛。支持多种部署方式,推动AI在医疗、金融等领域的应用落地,加速大模型从实验室走向实际生产。
2025-11-11 14:22:30
329
原创 启信宝获得法博会“行业洞见奖”,相关服务即将登陆“深律通”
2025深圳法律服务博览会成功举办,聚焦"法律创新护航科技与产业创新"主题。合合信息旗下启信宝凭借法律科技创新应用,获深圳市律师协会颁发的"行业洞见奖"。该产品将通过"深律通"APP向全市律师开放,提供企业多维数据查询及智能风险分析服务,助力法律行业数字化转型。启信宝整合商业大数据,开发股权穿透、关联图谱等功能,显著提升律师尽调、风险评估效率,并探索AI技术在法律场景的深度应用。
2025-11-05 16:47:17
189
原创 合合信息与上海交通大学开展课题合作研究,共探智能文档图像处理前沿技术
计算机视觉领域迎来新突破,合合信息与上海交通大学联合举办的首届VQualA视觉质量评估研讨会及文档图像质量评估竞赛在ICCV2025期间举行。会议聚焦智能文档图像处理技术标准化评估,吸引了全球上百名选手参与。竞赛中,DeQA-Doc团队的多模态大模型方案表现优异,成功将图像质量评估技术延伸至文档图像领域。面对数字化时代文档图像质量评估的挑战,此次活动旨在推动AI技术与产业应用的深度融合。
2025-10-27 15:01:33
390
原创 多模态文本智能大模型前沿技术与应用论坛在上海召开,合合信息推出多模态文本智能技术方案
第八届中国模式识别与计算机视觉学术会议(PRCV2025)聚焦多模态文本智能大模型发展,探讨前沿技术与应用。专家提出"多模态思维链"技术提升跨模态推理能力,OCR幻觉缓解方案优化文本感知。合合信息推出"多模态文本智能技术"方案,通过空间位置理解实现多模态信息立体化处理,已在金融、医药等领域应用。该技术突破传统文档处理局限,构建"感知-认知-决策"新范式,推动AI从工具向业务伙伴进化。小红书、甲骨文研究等案例展示了技术在实际场景中的创新应用价值。
2025-10-21 17:46:59
561
原创 启信宝电影行业洞察:广东蝉联“双冠王”,票房与企业数量全国第一
2024年中国电影市场呈现两极分化:观影人次下滑23.1%,但电影企业数量五年翻三番。行业正从规模扩张转向结构升级,资源加速向头部企业和核心区域聚集。动画电影头部效应显著,彩条屋等三家头部公司占据80%市场份额。广东成为最大票仓和产业聚集地,影院数量占全国17%。AI技术快速渗透电影产业,相关企业六年增长4.3倍,应用覆盖制作全流程。行业正经历深度调整,向工业化、智能化方向发展。
2025-10-20 15:26:11
438
原创 合合信息获首批“个人信息保护合规审计自审计能力评价”最高等级认证
在国家施行《个人信息保护合规审计管理办法》背景下,合合信息凭借完善的数据安全管理体系,荣获首批"个人信息保护合规审计自审计能力(规范级)"评价证书,这是评审活动中的最高等级认证。
2025-09-25 14:04:45
281
原创 合合信息获2025年中国网络安全创新创业大赛奖项,打造多模态AI鉴伪方案
合合信息自研产品“基于多模态一致性检验的图像智能鉴伪系统FidOK”从上百家参赛企业中脱颖而出,荣获大赛奖项,为AI时代下的图像安全保驾护航。
2025-09-17 14:07:23
282
原创 扫描全能王“翻页自动拍”功能上线,AI扫描提升教师教学材料电子化效率
扫描全能王推出"翻页自动拍"功能,助力教师节教学资料电子化。该功能通过AI技术自动捕捉翻页动作,准确率达97%,较传统扫描方式节省20%时间,可智能去除手指、阴影等干扰因素,实现连续拍摄并生成高清电子文档。该功能适用于教育、法律、医学等多领域,配合教师认证权益计划,帮助教师从繁琐的文档处理中解放,专注教学工作。
2025-09-10 14:27:27
407
原创 合合信息参编《数据产业图谱(2025)》,助力绘制中国数字经济发展新蓝图
合合信息作为核心参编单位,凭借启信产业大脑的产业链数据库(覆盖32个行业、5500万企业主体)提供重要支撑。图谱揭示数据应用领域企业占比最高(24%),并指出数据资源企业加速增长、产业集中度提升等趋势。合合信息新推出的智能产业研究分析功能,通过自动化产业图谱构建和洞察分析,为政企机构提供更强大的决策支持,助力数字经济发展。
2025-09-02 14:59:51
380
原创 RAGFlow+TextIn:RAG实战教程!1分钟实现解析性能提升
针对原生解析器在复杂文档处理中的不足(如表格识别错误、阅读顺序错乱等问题),提出采用商业化解析工具TextInxParse的解决方案。文章详细对比了开源与商业化解析工具的优劣,并提供了两种集成方案:通过API直接上传解析结果,或修改RAGFlow源码实现深度集成。重点展示了如何通过代码修改替换原生解析模块,实现表格精准识别、多栏文档顺序还原等能力提升。实际测试表明,该方法显著提高了知识库构建质量,为后续检索和生成环节奠定了更好的基础。文末还探讨了切片策略等进一步优化RAG系统性能的可能性。
2025-08-25 11:34:22
1272
10
原创 启信宝宠物行业报告:6年增10倍!超400万家企业抢滩千亿“毛孩子经济”
2025年亚洲宠物展揭示千亿级"毛孩子经济"新趋势。数据显示,中国宠物市场规模2024年达3880亿元,预计2025年突破4500亿,相关企业6年增长10倍至409.9万家。宠物医疗获53%融资占比,成为资本新宠。区域布局呈现特色:海南领跑新兴消费,山东稳坐"宠物粮仓"。新型服务快速崛起,宠物摄影和运输企业分别增长14倍和25倍。
2025-08-20 14:47:44
543
原创 合合信息智能审核白皮书上线,AI破解审核业务“数据孤岛”难题
合合信息发布智能审核白皮书,针对金融、财务、供应链等场景推出AI智能审核解决方案。传统人工审核面临效率低、成本高、错误率高等问题,尤其在跨境金融等复杂场景中,多系统数据孤岛和复杂版式文档处理困难。合合信息的AI系统支持多版式文档解析、跨系统数据比对,在财务场景实现全流程自动化,账单识别准确率达98%以上。其标准化产品TextInDocFlow提供一站式智能文档处理,支持API等多种集成方式。
2025-08-08 11:00:00
650
原创 告别碎片化输入:TextIn xParse如何为RAG打造「零损耗」知识管道
TextInxParse智能文档解析引擎是提升RAG系统效能的关键工具。它通过深度结构化解析,精准还原PDF、Word等文档的标题层级、表格数据、跨页内容等复杂元素,输出标准化的Markdown/JSON格式。相比传统OCR,该工具能显著提升检索效率30%以上,确保答案准确性,并完整保留关键信息。其核心优势包括:行业领先的表格识别能力(支持合并单元格、跨页表格等)、多语言支持、图像处理功能,以及开发者友好的API集成。典型应用场景涵盖金融报表解析、学术内容重建、医疗数据处理等领域。通过提供结构化数据输入,T
2025-08-06 10:00:00
1148
7
原创 参会邀请!2025世界人工智能大会&合合信息技术交流日报名启动!
2025世界人工智能大会即将开幕,合合信息邀请您一起参与KOL深度技术交流活动。本次活动不仅可以带您逛展2025世界人工智能大会,在合合信息展台体验AI黑科技,还可以与行业顶尖技术专家面对面交流,共同探讨当下热门AI安全话题。即可报名,报名成功后我们会有专人联系。不仅可以收获WAIC单日门票一张,还可以get合合信息精美伴手礼哦,期待现场与你相见!详细活动安排请戳下图,点击。
2025-07-18 16:44:41
460
3
原创 文档抽取进入「说人话」时代:用Prompt就能提取发票、合同、简历的关键信息
根据《福布斯》技术委员会的研究,企业仍封存于非结构化文档中,全球企业每年都要因手动处理发票、合同、报告产生代价高昂的效率损耗。在此情况下,成为一项极其重要的基础能力,它将PDF扫描件、医疗影像报告、物流单据等“不可用数据”实时转化为可计算、可分析的燃料,重构数据价值链:例如,:改变人工核验方式,自动从身份证、收入证明、银行流水、税单中提取关键信息(姓名、ID、收入、支出、账户信息),加速审批流程。
2025-07-09 10:00:00
2059
7
原创 扫描全能王联合上海电影博物馆发起特色探馆活动,AI助力存档百年光影
本次探馆活动设置了多个打卡点,参与者可以用扫描全能王扫描《上海电影制片厂生产手册》、电影海报、宣传单等众多见证中国电影历史发展的珍贵文档,不仅可以了解电影背后的时代精神和民族文化,助力电影文化传承,还可以用AI扫描技术构建起关于电影的私人记忆库,在日常生活中随时搜索扫描文档中的关键内容,真正把电影知识“带回家”。与最新的科技手段结合,激发创意火花,探索电影博物的无限可能,是上海电影博物馆开馆12年来一直坚持的事情,本次借助扫描技术的创意观展路线,让电影的精神走进观众的日常生活,传播真善美的力量。
2025-07-02 15:48:48
388
原创 搭建Coze扣子文档智能问答Bot工作流,保姆级教程来了!
在信息爆炸的今天,我们常常被淹没在各种文档之中——产品手册、技术白皮书、合同条款、内部报告……快速精准地从文档中提取所需信息,是提升日常工作效率的关键。这时,可靠的就能成为我们的得力助手。文档智能问答机器人能够将静态文档转化为动态知识库,比起原先埋头文档中靠自己阅读记忆,现在我们只需向Bot提问,它就能快速定位并输出文档中相关的精确答案或关键段落。: 面对冗长的合同,直接询问“付款周期是多久?”或“违约责任条款有哪些?”,Bot能迅速给出答案,省去逐页查找的麻烦。
2025-07-02 10:44:28
1664
5
原创 文档解析工具API表格提取完全指南:从坐标迷雾到精准裁剪
在数字化办公的过程中,我们经常遇到这样的需求:例如,财务报表系统要从PDF财务报告中提取表格,生成独立的图片文件,需要精准地提取表格区域,保持原始格式。再如,企业需要批量处理合同、发票中的表格信息,输入文档归档系统,因而要求无损提取表格图片,确保信息完整性。前端工作中,系统或页面要实现移动端适配也遵循相似的逻辑,由于原始表格在小屏幕上显示效果差,需要将复杂表格转换为高清图片,便于在手机上查看。
2025-06-30 11:17:00
687
5
原创 启信宝联合六大数交所共同编制,《企业数据治理实践白皮书》发布
近期,第三届粤港澳大湾区国际数据交易周在深圳举办。本届活动由深圳数据交易所主办,以“数聚湾区,智启新程”为主题,聚焦数据要素市场化配置改革、数据跨境流通及数据资产化等前沿议题。会上,合合信息旗下启信宝正式发布了《企业数据治理实践白皮书》(下文称“白皮书”)。
2025-06-24 14:44:59
842
原创 合合信息发布业内首个AI Agent跨平台云资源智能管理终端
在当今以数据驱动和云原生为核心的技术浪潮中,数据库、服务器等云资源如同“数字时代的电力”,成为企业开发应用、存储数据等业务的基石。随着云计算产业规模不断扩大,如何高效有序管理云资源成为了难题。近期,2025亚马逊云科技中国峰会在上海顺利召开,深度聚焦云计算与生成式AI的技术融合趋势。大会上,上海合合信息科技股份有限公司(以下简称“合合信息”)发布了业内首个AI Agent跨平台云资源智能管理终端Chaterm,通过打造“对话式终端管理工具”,帮助云计算从业人士实现云资源的智能化和规模化管理。
2025-06-20 10:00:00
1325
原创 中高考季,盘点AI文档工具有哪些实用的创新?
中高考甫落帷幕,今年的考生终于松一口气,而学校、老师们仍在紧锣密鼓地研究试题、评估考分。在人工智能的浪潮下,AI 押题、AI 判卷等应用纷纷各显神通,AI 文档工具成为一项学习利器,其中哪些创新具有实用、好用的特点呢?今天,我们将介绍智能文档处理工具 TextIn 在学习领域的新功能,来看看:哪一项是你需要的?
2025-06-18 10:00:00
1679
8
原创 真实场景文档理解:字节发布的WildDoc基准数据集向OCR提出了什么挑战?
本文讨论了字节跳动团队联合华中科技大学发布的 WildDoc 基准数据集对 OCR 能力的再衡量,分析了现有模型在真实场景文档理解中的性能瓶颈,探讨了自然场景文档解析的重要性及文档解析产品的应对方法。
2025-06-11 10:00:00
1017
3
原创 从OCR到Document Parsing,AI时代的非结构化数据处理发生了什么改变?
本文讨论了在AI时代,非结构化数据处理从OCR到Document Parsing的改变,介绍了文档解析技术的概念、作用、典型应用等内容。
2025-06-09 10:00:00
2462
7
原创 TextIn OCR Frontend前端开源组件库发布!
PDF 文件源配置url?data?: Object;: boolean;password?: string;length?: boolean;
2025-06-03 10:00:00
1435
1
原创 合合信息首批通过中国信通院文档图像篡改检测平台能力完备性测评
据合合信息技术团队人员介绍,合合信息自研的篡改检测系统融合先进的图像处理技术与深度学习算法,能够高效、准确地识别各类凭证图像中的篡改行为,包括身份证、行驶证、驾驶证、银行卡、护照、中国港澳台通行证、商场小票等,并精确定位篡改区域。据悉,本次“护证计划”开展的文档图像篡改检测平台能力测评,旨在规范市场上的图像检测技术,提升行业整体的风险防范能力。AI技术发展日新月异,面对大模型等前沿技术带来的安全挑战,合合信息将持续优化图像篡改检测技术在多场景的应用,推动技术能力向规范化、普适化延伸。
2025-05-30 11:40:04
526
原创 论文解读 - 统一的多模态理解和生成模型综述(下)
大规模、高质量且多样化的训练数据是构建强大的统一多模态理解和生成模型的基础。这些模型通常需要在大量图像-文本对上进行预训练,以学习跨模态的相关性和表示。需要注意的是,在大规模多模态数据上进行训练之前,这些模型往往使用从大型自然语言语料库中训练得到的参数初始化,例如Common Crawl 1、RedPajama、WebText等。由于本综述主要关注多模态模型,因此本节讨论将不包括纯文本数据。
2025-05-30 10:00:00
1251
5
原创 论文解读 - 统一的多模态理解和生成模型综述(上)
近年来,多模态理解模型和图像生成模型都取得了显著的进步。尽管各自取得了成功,这两个领域却独立发展,形成了独特的架构范式:基于自回归的架构主导了多模态理解,而基于扩散的模型则成为图像生成的基石。最近,人们越来越关注开发能够整合这些任务的统一框架。GPT-4的新能力正是这一趋势的体现,突显了统一的可 能性。然而,两个领域的架构差异带来了重大挑战。为了清晰地概述当前的统一努力,论文提供了一份全面的综述,旨在指导未来的研 究。首先,论文介绍多模态理解和文本到图像生成模型的基础概念和最新进展。接下来,论文回顾现有的统
2025-05-29 10:00:00
1676
10
原创 Coze扣子文档解析 VS. 专业OCR工具,RAG知识库性能评测!
Coze 平台解析和TextIn 文档解析,一款专业的 PDF 与图像解析产品。Coze 解析TextIn 文档解析数据集以企业年报与招股书文件为主体。原始数据集包括:年报 6 份,招股书 82 份。由于 Coze 不支持 500 页以上的 PDF 文件解析,数据集调整为:年报 6 份,招股书 67 份。测试集包含共322 项 QA 单问题,所有信息均来自年报与招股书文件。
2025-05-21 10:00:00
1547
7
原创 轻松get热播剧同款“数字名片”!合合信息名片全能王助力保险拓客
对于科技公司及创业者而言,名片全能王更是展示公司实力、拓展人脉的得力工具,通过多场景一键转发、全员名片统一管理等功能,帮助创业者大幅提升客户名片管理效率,降低客源流失风险。名片全能王能够帮助用户第一时间将自己的核心信息传递给对方,不仅提升了沟通效率,迅速建立客户信任,其强大的管理功能还可以高效整理客户信息,推动合作深入发展。同时,名片全能王还打破了多平台壁垒,支持微信、企业微信、钉钉、腾讯会议等多个即时通讯平台收发名片,实现数字名片无缝流转,大幅提升商务交流效率与便捷性。图说:名片全能王小程序功能示意图。
2025-05-20 15:01:58
366
原创 合合信息亮相2025中国图象图形大会,聚焦大模型时代的伪造图像检测
未来,合合信息也会持续关注和参与业界交流,秉持创新精神,深入钻研图像篡改检测技术,与行业伙伴携手共进,为构建安全、可信的数字世界贡献力量。自2006年创立以来,合合信息深耕图像安全领域,致力于推动行业规范化发展,牵头编制了《文本图像篡改检测系统技术要求》,围绕伪造图像鉴别、生成式图像判别等议题为行业提供有效指引,入选中国信通院“护证计划”首批技术支撑单位,助力金融、医疗等行业构建可信证照防伪体系。伪造图像检测面临数据获取与标注成本高、检测技术泛化能力有限、无痕篡改检测能力有限和伪造手段多样化等主要挑战,
2025-05-15 14:04:19
800
原创 LLM“力大砖飞”的时代,OCR专有模型还有意义吗?
本文讨论了在大模型(LLM)盛行的背景下,探讨OCR专有模型是否仍有意义,分析了大模型和小模型的区别、OCR专有模型存在的必要性、大小模型是否会相互替代以及它们的协同方式等内容。
2025-05-14 10:00:00
1435
6
原创 合合信息上线智能文档处理领域首批MCP服务,助力企业快速搭建Agent
据合合信息技术团队成员介绍,TextIn MCP Server系“大模型加速器”产品中,专为大模型下游任务设计的通用文档解析服务,能够识别并提取上千种文档中的跨页表格、合并单元格、密集表格、手写字符及公式,包括金融文档、国家标准、学术论文、财务发票等,解析稳定率达99.99%,单页处理耗时较行业可比产品降低超30%。基于领先的智能文档处理技术,旗下自研产品“大模型加速器”在复杂版面理解、表格及图表处理、内容溯源等能力上实现新突破,从数据源头降低大模型“幻觉”风险,让大模型在与人类的沟通中“更靠谱”。
2025-05-13 14:31:54
1414
原创 TextIn ParseX重磅功能更新:支持切换公式输出形式、表格解析优化、新增电子档PDF去印章
本文讨论了TextIn ParseX为适配多场景需求进行的功能更新与版本优化,介绍了新功能及优化内容,还给出使用途径和交流方式。
2025-05-12 10:00:00
1349
11
原创 TextIn MCP Server正式发布,无代码搭建智能文档处理Agent!
本文讨论了为实现智能文档处理任务与LLM更好交互,提高开发者接入效率与体验,TextIn MCP Server近日正式上线的相关事宜,介绍了其功能、接入方式及使用案例等。
2025-04-30 10:00:00
2583
13
原创 OCR技术难点解读:数学公式检测与识别
本文讨论了文档解析中数学表达式检测与识别(MEDR)这一自然语言处理和计算机视觉交叉领域的重要技术,介绍其技术难点、应用场景、发展历程及相关模型等。
2025-04-23 10:00:00
1531
15
原创 合合信息发布智能文档处理行业白皮书,破解文档处理效率与安全问题
白皮书》提到,AI“狂飙”的时代,图像造假的门槛变得越来越低,加强反制技术研究愈发迫在眉睫,合合信息的图像篡改检测技术为图像安全的守护发挥了重要作用。在数字化转型浪潮席卷全球的当下,企业面临着海量文档处理的难题,传统文档处理方式效率低、成本高、易出错,已无法满足企业发展的需求。在金融领域,智能文档处理技术通过对上市公司或银行发布的公告、年报等进行解析和处理,解决传统 PDF 解析工具存在的文本及阅读顺序、乱码、表格解析等痛点,抽取关键信息,为企业提供决策支持,助力金融信息化企业建设数据底座。
2025-04-17 10:31:21
538
2
原创 TextIn ParseX文档解析参数使用指南(第一期)
本文讨论了TextIn ParseX通用文档解析这款适配多样化场景的PDF解析工具,介绍了其常用参数的作用及使用方法。关键要点包括解析页码参数、分辨率参数、加密文档参数、标题目录参数、获取JSON结果参数、页面元素参数及表格输出参数。
2025-04-16 10:00:00
1447
15
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅