用实例驳斥李彦宏开源模型会越来越落后

百度创始人李彦宏认为开源模型会落后,Meta发布Llama3参数模型后,通过与百度文心一言的实例对比,MetaAI在语言处理上表现出色。作者通过数学和编程测试发现Llama3在某些场景下超越文心一言,暗示开源模型有可能追赶闭源模型。
部署运行你感兴趣的模型镜像

近日百度创始人、董事长兼首席执行官李彦宏先生在Create
2024百度AI开发者大会上发表了这么一个观点:开源模型会越来越落后。

话音刚落,美国 Meta 就发布了 Llama3,包含了8B 和 70B 参数两个版本。Meta
表示, 最大的 Llama 3 参数超过
400B,虽然400B+模型仍在训练中,但在接下来的几个月中也将陆续发布,新功能包括多模态、多语言对话能力、更长的上下文窗口以及更强的整体能力

李彦宏的判断正确吗?话不多说,我们用实例来测试下。那就用Meta AI
和百度的文心一言3.5进行比较。因为上周我刚好写了一篇关于镜像变换的文章《用矩阵实现镜像变换》,这个例子正好涉及到数学和编程,非常考验大模型的能力!

先来看 Meta AI 的表现! Meta AI 第一问

非常不错,代码是正确的,只不过无法正常显示图片,因为在x的负区域,因此要做下
width 平移,才能正常显示。

Meta AI 第二问 (注:是在同一个上下文)

理论介绍的非常好!即使对初学者都非常友好!如果不考虑平移显示的问题,可以给满分!

再来看百度文心一言3.5的表现! 文心一言 第一问

给出的水平镜像变换矩阵和垂直镜像变换矩阵都是错的!正确的变换矩阵请参考我的上一篇文章《用矩阵实现镜像变换》。

文心一言 第二问 (注:是在同一个上下文)

这一问,文心一言的回答非常多错误!我列出几点:

1. 这一句
“水平镜像是将矩阵按照水平中轴线进行翻转,而垂直镜像则是将矩阵按照垂直中轴线进行翻转。”
说反了!

2.
这一句"对于二维空间中的图像,镜像变换矩阵M是一个2x2的矩阵,其反对角元素为1,其它元素为0。"
有误,不一定是2x2矩阵,和矩阵的宽、高以及是水平还是垂直镜像变换有关系。具体请参考我的上一篇文章《用矩阵实现镜像变换》。

3.
这一句"通过对图像进行镜像变换,可以实现图像的翻转、旋转、缩放等效果。"
又是错的!把镜像变换怎么能实现旋转、缩放!

4.
这一句"此外,结合镜像变换和旋转变换,还可以实现图像的任意角度旋转。同时,通过镜像变换和裁剪操作的结合,也可以实现图像的缩放效果。"
和上面第3点类似,旋转和缩放和镜像变换无关!

从这2个例子来看 Meta AI
是完胜百度的文心一言3.5的!当然这样的比较比较片面!

1. 首先我没有使用百度的文心大模型4.0,因为我没有购买。

2.
我也做了其它测试,偏向于数学证明和算法,我不想在文章中展开太多。总的来说,Meta
AI 和 文心一言3.5在我的其它测试用例中表现基本打平。

3. Meta AI 有时用中文提问,它会用英文回答,因此它会提示你:I am still
improving my command of non-English languages, and I may make errors
while attempting them. I will be most useful to you if I can assist you
in English.

4.
这里没有黑百度文心一言的意思!相反,文心一言是我用的最多的国内大模型。我发现文心3.5模型也一直在进步!同一个问题,之前乱回答的,现在回答得相当好了!我基本都会同时扔给ChatGPT-3.5和文心3.5进行比较测试,我的结论是文心3.5基本能达到ChatGPT-3.5的水平!

最后我的结论,从 Meta AI 的表现来看,Llama
3在语言方面已经达到甚至超过了文心3.5的水平,更不用说Llama
3还支持多模态!只要有Meta这样的大公司在背后持续开源,那么开源模型必定能追上闭源模型!如果Meta等大公司不再开源,那么开源模型靠个人或学术组织将非常困难,因为缺少数据、算力!

原文链接
用实例驳斥李彦宏开源模型会越来越落后

欢迎关注我的微信公众号[数学345]:长按"识别图中二维码";或打开微信扫一扫。

您可能感兴趣的与本文相关的镜像

Llama Factory

Llama Factory

模型微调
LLama-Factory

LLaMA Factory 是一个简单易用且高效的大型语言模型(Large Language Model)训练与微调平台。通过 LLaMA Factory,可以在无需编写任何代码的前提下,在本地完成上百种预训练模型的微调

内容概要:文章以“智能网页数据标注工具”为例,深入探讨了谷歌浏览器扩展在毕业设计中的实战应用。通过开发具备实体识别、情感分类等功能的浏览器扩展,学生能够融合前端开发、自然语言处理(NLP)、本地存储与模型推理等技术,实现高效的网页数据标注系统。文中详细解析了扩展的技术架构,涵盖Manifest V3配置、内容脚本与Service Worker协作、TensorFlow.js模型在浏览器端的轻量化部署与推理流程,并提供了核心代码实现,包括文本选择、标注工具栏动态生成、高亮显示及模型预测功能。同时展望了多模态标注、主动学习与边缘计算协同等未来发展方向。; 适合人群:具备前端开发基础、熟悉JavaScript和浏览器机制,有一定AI模型应用经验的计算机相关专业本科生或研究生,尤其适合将浏览器扩展与人工智能结合进行毕业设计的学生。; 使用场景及目标:①掌握浏览器扩展开发全流程,理解内容脚本、Service Worker与弹出页的通信机制;②实现在浏览器端运行轻量级AI模型(如NER、情感分析)的技术方案;③构建可用于真实场景的数据标注工具,提升标注效率并探索主动学习、协同标注等智能化功能。; 阅读建议:建议结合代码实例搭建开发环境,逐步实现标注功能并集成本地模型推理。重点关注模型轻量化、内存管理与DOM操作的稳定性,在实践中理解浏览器扩展的安全机制与性能优化策略。
基于Gin+GORM+Casbin+Vue.js的权限管理系统是一个采用前后端分离架构的企业级权限管理解决方案,专为软件工程和计算机科学专业的毕业设计项目开发。该系统基于Go语言构建后端服务,结合Vue.js前端框架,实现了完整的权限控制和管理功能,适用于各类需要精细化权限管理的应用场景。 系统后端采用Gin作为Web框架,提供高性能的HTTP服务;使用GORM作为ORM框架,简化数据库操作;集成Casbin实现灵活的权限控制模型。前端基于vue-element-admin模板开发,提供现代化的用户界面和交互体验。系统采用分层架构和模块化设计,确保代码的可维护性和可扩展性。 主要功能包括用户管理、角色管理、权限管理、菜单管理、操作日志等核心模块。用户管理模块支持用户信息的增删改查和状态管理;角色管理模块允许定义不同角色并分配相应权限;权限管理模块基于Casbin实现细粒度的访问控制;菜单管理模块动态生成前端导航菜单;操作日志模块记录系统关键操作,便于审计和追踪。 技术栈方面,后端使用Go语言开发,结合Gin、GORM、Casbin等成熟框架;前端使用Vue.js、Element UI等现代前端技术;数据库支持MySQL、PostgreSQL等主流关系型数据库;采用RESTful API设计规范,确保前后端通信的标准化。系统还应用了单例模式、工厂模式、依赖注入等设计模式,提升代码质量和可测试性。 该权限管理系统适用于企业管理系统、内部办公平台、多租户SaaS应用等需要复杂权限控制的场景。作为毕业设计项目,它提供了完整的源码和论文文档,帮助学生深入理解前后端分离架构、权限控制原理、现代Web开发技术等关键知识点。系统设计规范,代码结构清晰,注释完整,非常适合作为计算机相关专业的毕业设计参考或实际项目开发的基础框架。 资源包含完整的系统源码、数据库设计文档、部署说明和毕
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值