- 博客(16)
- 收藏
- 关注
原创 Sizing Tool -- 大模型所需GPU计算资源
此外,大模型训练的算力需求可以通过公式 6∗N∗D来计算,其中 N是模型的参数量, D是你要用的训练token的数量。HGX 是 NVIDIA 出的高性能服务器,通常一台机器包含 8 个或 4 个 GPU,搭配 Intel 或 AMD CPU,并且使用 NVLink 和 NVSwitch 实现全互联(8 个 GPU 通常也是除 NVL 和 SuperPod 之外的 NVLink 全互联的上限),而且一般会采用风冷散热。在系统的介绍GPU资源使用情况前,我们有必要先了解一下GPU的算力具体是怎么衡量的。
2024-05-23 18:22:25
5744
1
原创 评测:使用开源框架FastGPT快速构建智能助手应用
FastGPT 是一个基于 LLM 大语言模型的知识库问答系统,提供开箱即用的数据处理、模型调用等能力。同时可以通过工作流可视化进行应用编排,从而实现复杂的问答场景和更好的模型体验。更赞的是,FastGPT 项目在 Apache License 2.0 许可下开源,是由环节云计算公司提供支持,具体情况可参考git官方说明。
2024-05-05 21:39:35
5544
3
原创 评测:使用百度千帆AppBuilder构建RAG知识问答应用
之前几篇文章我们聊过大模型再RAG领域的落地情况,本篇文章就先以百度的平台为例,进行一次详细的测评,详细介绍大模型知识问答助手的应用创建情况。这里我上传了一个3.5M大小的pdf文档《郑州银行2022年年度报告》,可以看到文档需要解析需要很长一段时间,这里可以选择用标点符号或者固定长度来切分文档,猜测可能用到了百度相关的切分文档的方法,最终呈现的文档效果片当很不错。在下面的个性化领域知识里面,千帆提供了两种方式,一种是通过百度搜索,即联网的方式查询相关支持,将其作为相关文档传给大模型;
2024-04-02 14:13:58
2308
1
原创 2023银行业大模型落地汇总
银行类别银行名称主要合作方主要大模型应用国有大行中国工商银行清华、鹏城实验室、华为等信贷业务全流程助手、员工助手、智能客服、智能知识库、金融研报生成、智能研发中国农业银行无ChatABC大模型:办公助手、研发助手中国银行无客服助手中国建设银行建信金科低代码开发平台、智能优惠券配置、金融培训活动海报生成中国交通银行华为、科大讯飞客服助手、办公助手中国邮政储蓄银行百度、中国电子智能问答系统“灵犀”、投行交易机器人股份
2024-03-26 14:51:54
502
原创 简述企业落地RAG技术时遇到的困境
大模型如火如荼,企业在去年的喧嚣过后今年开始进入正经的落地阶段。落地的第一步就是选择场景。这本身就是一个非常困难的工作,因为选好场景,对大模型最终提供的服务质量影响太大了。选场景这个事可以另开一篇文章来讲,从目前接触的客户来看,使用RAG技术落地大模型还是比较普遍的一个选择,但各家也都遇到了许多的困难。本文就目前遇到的客户问题,进行一些整理和归纳,后续对我们深入研究大模型的应用有所指导。
2024-03-08 11:49:22
1574
1
原创 如何搭建基于大模型的智能知识库
基于RAG与LLM的知识库作为目前最有潜力的企业端大模型应用之一,从技术角度可以看到,建设方案已经完备;从业务角度,最终的应用效果和业务价值还需要观察,并通过业务侧的反馈不断地促进建设方案的进一步优化,比如增加对多模态知识的处理能力等。让我们共同期待这类应用普及那一天的到来。
2024-01-25 14:52:33
15787
原创 以AutoGPT为例浅谈智能体Agent
AutoGPT是一个AI agent(智能体),也是开源的应用程序,结合了GPT-4和GPT-3.5技术,给定自然语言的目标,它将尝试将其分解成子任务,并在自动循环中使用搜索引擎和其他工具来实现这一目标,它由GPT-4驱动,自主地开发和管理业务。官网对GPT的优势描述如下:🌐 用于搜索和信息收集的互联网接入 / Internet access for searches and information gathering。
2024-01-16 22:24:34
1689
1
原创 面试基础问题
1. 自我介绍重点:了解表达能力,在团队中的角色,是否独立承担过大的模块2. java基础&计算机基础--我的经验是挑10道题面试时长正好2.1 设计模式了解多少,继承、封装、多态概念2.2 深拷贝和浅拷贝区别2.3 IOC&AOP, Spring中,类的循环引用问题,如何发生的?怎么解决?2.4 springboot启动流程2.5 JVM内存结构 volitail关键字 syncronize关键字2.6 简单的解释一下垃圾回收机制 :分代,回收算法,如何判断
2022-04-18 11:35:24
912
原创 面试基础问题
#面试基础问题自我介绍重点:了解表达能力,在团队中的角色,是否独立承担过大的模块java基础2.1 设计模式了解多少2.2 深拷贝和浅拷贝了解多少浅拷贝:被复制对象的所有变量都含有与原来的对象相同的值,而所有的对其他对象的引用仍然指向原来的对象.换言之,浅拷贝仅仅复制所考虑的对象,而不复制它所引用的对象.深拷贝:被复制对象的所有变量都含有与原来的对象相同的值.而那些引用其他对象的变量将指向被复制过的新对象.而不再是原有的那些被引用的对象.换言之.深拷贝把要复制的对象所引用的对象都复制了
2022-02-18 17:43:55
698
转载 纯干货,Spring-data-jpa详解,全方位介绍
JPA入门详细介绍:原文链接:http://www.cnblogs.com/dreamroute/p/5173896.html神一样的存在--【原创】纯干货,Spring-data-jpa详解,全方位介绍。本篇进行Spring-data-jpa的介绍,几乎涵盖该框架的所有方面,在日常的开发当中,基本上能满足所有需求。这里不讲解JPA和Spring-data-jpa单独使用,所有的内容都...
2019-01-22 15:16:04
128
转载 (转)学习MySQL优化原理,这一篇就够了!
(转)学习MySQL优化原理,这一篇就够了!原文:https://mp.weixin.qq.com/s__biz=MzI4NTA1MDEwNg==&mid=2650763421&idx=1&sn=2515421f09c150d31e8d1b8b59243bd5&chksm=f3f9c508c48e4c1ea64b00b25c226efa2b9e32910f832...
2019-01-17 21:36:45
95
转载 JPA与Mybatis选型
【转】如何对 JPA 或者 MyBatis 进行技术选型 在我们平时的项目中,大家都知道可以使用 JPA 或者 Mybatis 作为 ORM 层。对 JPA 和 Mybatis 如何进行技术选型?下面看看大精华总结如下:最佳回答首先表达个人观点,JPA必然是首选的。个人认为仅仅讨论两者使用起来有何区别,何者更加方便,不足以真正的比较这两个框架。要评判出更加优秀的方案,我...
2019-01-17 11:29:21
724
转载 JPA使用笔记
JPA的多表映射 一对多关系映射(默认一方放弃外键维护,默认延迟加载):@OneToMany:作用:建立一对多的关系映射属性:targetEntityClass:指定多的多方的类的字节码。 mappedBy:指定从表实体类中引用主表的对象的名称。 cascade:指定要使用的级联操作 fetch:指定是否采用延迟加载 orphanRemov...
2018-11-19 15:22:56
478
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人