大模型的第二个杀手级应用场景出来了

部署运行你感兴趣的模型镜像

前言

我24年3月份投入到AI辅助编程,创建了 auto-coder 系列项目,就是笃定 AI 辅助编程会是大模型第一个落地的场景. 然后我在24年9月9号发了一篇文章:大模型的第一个杀手级应用场景出来了

这个是我当时的判断逻辑:

但是现在,我的判断逻辑更加清晰,就是这次AI变革是生产力变革,面向的是生产力而不是娱乐消费,和互联网有本质的区别。而能落地的场景,必须是用户高频的“工作agent”。 toC 的用户千千万,每个用户的职业都应该被特定的应用深入的帮助,而且有成瘾性,一旦离开了这个工作agent,自己就不会工作了。就像 AI 辅助编程,用户日常每周需要使用他超过40个小时,并且有海量的token消费,用户一旦离开这种工具,就不会写代码了。

沿着这套逻辑线,我推导出了第二个杀手级应用场景:数据分析。

为什么之前不行,为什么他不是第一个杀手级应用

诶,这个不是很早就有很多人做了么?和RAG知识库一样,之前的人的都做的稀烂,因为他们还是把AI的东西往老的东西上不断的叠加,也不知道如何从AI原生角度出发去设计和思考产品,此外,就是之前的企业做的太早了。AI辅助编程是第一个杀手级应用,而数据分析是第二个,他们两者是先后关系,必须有AI辅助编程先出现,才能再出现数据分析。数据分析需要AI辅助编程探索出来的很多技术,才能最后落地。说白了,在此之前,数据分析领域,无论应用技术和大模型以及思考深度能力,都无法支持其落地。但是现在,随着AI辅助编程技术的发展,数据分析也终于可以落地了。

NLP2SQL 只是简单的根据自然语言生成SQL么

很遗憾,几乎所有的用户一开始使用大模型做数据分析时,都聚焦的是NLP2SQL。但他们很快遇到了几乎不可解决的问题:

1. 数据分析包含大量业务术语和背景,大模型很难理解用户的需求。

2. 企业有很多数据表,office 文档表,还有数仓,召回需求所需要的表的准确率低到可怕

3.企业有很多数据表,office 文档表,还有数仓,无法对这些数据做统一的分析。

4. 就最简单的生成SQL做法也是针对不同数据源生成不同类型的SQL,而大模型往往会错乱,比如把msyql的function当成hive的function去使用,而SQL自身的复杂度也导致计算大模型能准确的理解需求,能准确的找到合适的表,但是生成复杂SQL的成功率也极低。

所以你还认为 NLP2SQL 只是简单的根据自然语言生成SQL么? 为了完成 NLP2SQL,你需要修炼好内功:

1. 有准确率极高的业务知识库/Schema 知识库,从而让大模型可以理解用户需求,同时找到合适的表。而当前业界几乎所有主流的RAG 都无法满足这个需求。

2. 有强大的引擎,可以跨数据源对各种数据进行连接和分析。

3. 有对大模型更加友好的统一的SQL方言,能让大模型极大的提升生成正确的SQL成果率。

这意味着,你至少要打造三把宝剑,

1. 满足要求的RAG技术 

2. 多数据源联合分析的分布式计算引擎 

3. 对大模型友好的 SQL方言。

数据分析不仅仅是NLP2SQL

然而,NLP2SQL 只是走出了数据分析的第一步,或者说带来的价值连10% 都不到。数据分析不仅仅是 NLP2SQL,AI 大模型赋予人类的能力也仅仅是 NLP2SQL, 而是:

1.  人类第一次可以用智能去“处理”自己的数据。

2. 人类第一次,可以对全模态的数据做处理。

还记得以前,如果你想知道一个产品的用户好评情况,可能只有两种选择:

1.产品上给个五分打分制。花钱鼓励用户去打分,大于3分就算好评

2. 找NLP的同学写一个情感分析程序,对用户的comment 做分类,正向,负向。

我们希望通过SQL透明来完成comment(对产品评论的)分析,用户无需感知。这才是真正意义上的智能分析。

而全模态的数据分析,我们举一个例子,比如你可能还希望分析出A图片里的用户在哪些新闻稿里出现。

来,一起见证划时代的Agentic 数据分析产品: InfiniSynapse

InfiniSynapse 通过自研的第二代LLM-Native RAG实现了企业业务的理解,精准的Schema召回保证数据的准确性。提供专门为大模型优化的InfiniSQL语言,从而可以更加准确的生成复杂的查询语句,通过 InfiniSQL 引擎让人类第一次对全模态(数据库结构化,文档,语音,视频),进行多数据源 进行联合智能分析,并且支持海量规模。


我们通过Agentic 范式搭配超强的RAG+大模型友好的 InfiniSQL, InfiniSynapse 实现了当前智能分析领域的SOTA。

回顾下:

1. 满足要求的RAG技术 (我们自研的第二代 LLM-Native RAG)

2. 多数据源联合分析的分布式计算引擎  (Infini SQL 引擎)

3. 对大模型友好的 SQL方言。 (Infini SQL)

4. 人类第一次可以用智能去“处理”自己的数据。(Infini SQL)

5. 人类第一次,可以对全模态的数据做处理。(Infini SQL)

如何更好的对用户的需求做理解?在分析过程中, InfiniSynapse 会自主决策查询核实的知识库,来帮助理解用户的需求:

会自主到数据库里验证相应的库表和字段是否真实匹配:

会自动对对文本类的数据使用大模型做处理(还自动给你写prompt):

对结果还能支持可视化加总结:

如果是plan模式,他啥事都会和你商量:

如果讨论清楚了,则自动提醒转入执行模式:

InfiniSynapse 系统文档链接(内涵诸多实际分析案例)

https://uelng8wukz.feishu.cn/wiki/RbHGwPpR7imM7kkzthxcS8HunCb?fromScene=spaceOverview

后话

数据分析领域是一个集大成的领域,对数据分析,人类第一次拥有了完全自主分析能力的Agent, 并且融合了知识库,Agentic 等成熟技术,直接对多类型数据源的多重模态的数据进行联合分析,拓展了人类对数据的分析能力和种类。我们通过对底层引擎进行 AI Native 化改造,真正意义上的实现了交互,执行全智能化。

让每个数据从业人员,每周使用 InfiniSynapse 40 小时以上。

 如果大家想体验这个强大的系统,可私信联系我们。

您可能感兴趣的与本文相关的镜像

Llama Factory

Llama Factory

模型微调
LLama-Factory

LLaMA Factory 是一个简单易用且高效的大型语言模型(Large Language Model)训练与微调平台。通过 LLaMA Factory,可以在无需编写任何代码的前提下,在本地完成上百种预训练模型的微调

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值