- 博客(240)
- 收藏
- 关注
原创 【大模型开源实战】10 分钟,教你如何用 LLama-Factory 训练和微调大模型
在这个AI快速发展的时代,我们很高兴为大家带来LlamaFactory - 一个为AI开发者和爱好者量身打造的实用工具平台。作为非计算机专业出身的开发者,我们深深受益于计算机世界的开放共享精神。今天,我们希望通过LlamaFactory为这个社区贡献我们的一份力量。
2024-11-06 16:12:02
1501
原创 GraphRAG如何构建知识图谱Knowledge Graph
GraphRAG工作的第一步,是将输入的文档集合,按一定的策略拆分成一个一个chunks,然后解析每个chunks,将chunk中所关注的实体(entity)和关系(relation)解析出来,以此构建知识图谱。
2024-11-05 11:08:05
1191
原创 GraphRAG原理及部署实战
RAG在大模型时代,被寄予了厚望,但在近一年多各大小公司的实施过程中,其效果远没有抖音中宣传的那么振奋人心,其原因是多方面的。
2024-11-05 11:05:30
1731
1
原创 构建本地知识库(下):使用RAG构建知识库
在上一篇文章中,我们已经尝试在本地部署了大模型以及利用langchain框架来构建起基于大模型的应用程序。在本章中,我们将更近一步,在现有的应用程序上尝试利用RAG来继续强化应用。
2024-11-04 11:40:21
1248
原创 构建本地RAG知识库(上): langchain+ollama构建本地大模型应用
本章主要阐述了本地构建基于大模型的应用程序的过程。从资源准备分析到实际搭建,一步步的指导应该如何在本地搭建一个基于大模型的应用程序。感兴趣的小伙伴可以自己动手试一下。
2024-11-04 11:38:31
865
原创 【AI大模型】Ollama 大模型的本地私有化部署
在localhost部署并运行开源大模型,可以试试Ollama。本文使用Ollama部署,并通过API的方式调用大模型。
2024-10-31 15:31:13
836
原创 【大模型部署】如何在本地部署大语言模型:工具与指南
在快速发展的人工智能领域,大语言模型(LLMs)正成为各类应用的核心。无论是在智能客服、内容生成,还是在教育与医疗等领域,这些模型的应用潜力巨大。
2024-10-31 15:28:51
2079
原创 【AI大模型】能不手动调试吗?自动提示语工程!
调试提示语的过程:调整第一版,然后用一些案例测试一下,然后再调试,再测试。。 如果把这个过程自动化,就可以构建一个自动提示语工程了。
2024-10-29 20:14:40
905
原创 RAG系统架构介绍
让我们直奔主题: 检索增强一代Retrieval-Augmented Generation(RAG)系统正在重塑我们处理人工智能驱动的信息的方式。作为架构师,我们需要了解这些系统的基本原理,才能有效利用它们的潜力。
2024-10-29 20:11:35
742
原创 【AI大模型】使用谷歌 Gemini API 构建自己的 ChatGPT(二)
【AI大模型】使用谷歌 Gemini API 构建自己的 ChatGPT(二)🚀
2024-10-28 15:33:24
969
原创 【AI大模型】使用谷歌 Gemini API 构建自己的 ChatGPT(一)
这篇文章不仅是关于聊天机器人教程,还探讨了Gemini内置视觉与多模态方法如何使其能够根据视觉输入解释图像并生成文本。
2024-10-28 15:31:47
2377
原创 运行开源大语言模型的新选择:Ollama 的本地化解决方案
在现代人工智能的发展中,大语言模型(LLM)如 LLaMA2 的应用越来越广泛。然而,运行这些模型通常需要复杂的配置和强大的硬件支持。
2024-10-25 11:35:06
647
原创 只想简单跑个 AI 大模型,却发现并不简单
跑 AI 模型最好有 GPU。好吧,我没有 GPU。那怎么办?没关系!云环境来救场!Google Colab、Kaggle Notebooks 都挺香的,毕竟谁不喜欢“白嫖”呢?我果断选择了 Colab,心想资源丰富又强大。
2024-10-25 11:32:49
723
原创 【AI大模型】本地部署 Code Llama 大模型
在本地部署 Code Llama 大模型并结合 Text Generation Web UI 实现远程运行 LLM 需要以下步骤:准备环境、下载和配置模型、部署和配置 Web UI、进行远程访问和测试、以及优化和安全设置。这些步骤可以帮助你构建一个高效且安全的本地 LLM 服务。
2024-10-21 15:08:30
1402
原创 AI大模型应用开发:手把手教你部署并使用清华智谱GLM大模型
部署一个自己的大模型,没事的时候玩两下,这可能是很多技术同学想做但又迟迟没下手的事情,没下手的原因很可能是成本太高,近万元的RTX3090显卡,想想都肉疼,又或者官方的部署说明过于简单,安装的时候总是遇到各种奇奇怪怪的问题,难以解决。本文就来分享下我的安装部署经验,包括本地和租用云服务器的方式,以及如何通过API调用大模型开发自己的AI应用,希望能解决一些下不去手的问题。
2024-10-21 15:01:38
1364
原创 11.9K Star!强大的 Web 爬虫工具 FireCrawl:为 AI 训练与数据提取提供全面支持
是一款开源、优秀、尖端的 AI 爬虫工具,专门从事 Web 数据提取,并将其转换为 Markdown 格式或者其他结构化数据。
2024-10-18 12:00:57
1089
原创 LLM大模型入门教程:看完这份教程文档,你会发现没有难学的大模型
今天给大家推荐这个大模型入门学习项目,实在是太香了太香了,目前该项目已经超过1100星,具体的文章分类如下所示。
2024-10-18 11:51:51
803
原创 GPT-4与Google Gemini 终极对比:谁是大模型的霸主
谷歌最近推出了他们的最新科技产品——Gemini Pro,这一产品的发布引起了广泛关注。紧随其后,他们还计划推出性能更强的 Gemini Ultra。
2024-10-16 15:10:17
2466
原创 GPT不是唯一选择:Hugging Face五款优秀的开源LLM
Hugging Face不仅是一个平台,它更像是一个资源库,汇集了超过12万个模型、2万个数据集以及5万个演示应用(Spaces),这些资源都是开源的,对公众开放。
2024-10-16 15:08:55
970
原创 为AI开发者而生,Agent开发专用的IDE
今天我们分享的开源项目,是由LangChain-ai推出的首个专门为智能体开发设计的IDE,让智能体开发变得更简单,它就是:LangGraph Studio
2024-10-15 16:46:10
832
原创 Git 3K star!LLM读不懂?那用可视化的方式来学吧
今天我们分享的开源项目,让你通过可视化的方式来了解大模型,更直观的搞懂它到底是怎么回事,它就是:llm-viz
2024-10-15 16:42:45
602
原创 CogView3-Plus,开源了!
CogView-3-Plus 在 CogView3(ECCV'24) 的基础上引入了最新的 DiT 框架,以实现整体性能的进一步提升。
2024-10-14 15:01:21
1066
原创 【无标题】基于情境依赖因果影响的多智能体协作强化学习
文章还提到,某些经过微调的LLMs在处理需要常识知识的任务时表现出色,并且预训练模型可以通过所谓的“情境学习”来执行新任务,这表明它们可能已经吸收了一些超出纯粹语言模式匹配的知识元素。
2024-10-14 14:49:14
896
原创 【LLM模型微调】LLMs-微调经验-LLaMA微调指南v7.0
预训练是使用数万亿个数据标记从头开始训练LLM的过程。该模型使用自监督算法进行训练。
2024-10-12 14:41:48
769
原创 吴恩达:恭喜AI获得诺贝尔奖
在去年十月Geoff的退休派对上(上图所示),我满怀深情和感激地谈到了他为推动人工智能发展所做的所有工作。即使我们为人工智能的新诺贝尔奖得主欢呼,让我们继续思考我们人工智能领域如何能更多地庆祝下一代创新者。
2024-10-12 13:46:06
726
原创 Git上爆火《开源大模型食用指南》self-llm(附文档)已发布,速通大模型!
Git上爆火《开源大模型食用指南》self-llm(附文档)已发布,速通大模型!
2024-10-11 16:46:31
854
原创 【LLM大模型】RAG早已经过时,RAG-Fusion正当时
RAG,即检索增强生成,是一种人工智能框架,通过将 LLM 生成的响应与外部知识来源结合,从而提高响应的质量和准确性,这也是其名称的由来。
2024-10-11 16:39:36
997
原创 产品经理想转行做大模型AI产品经理,建议看看这篇文章!(文末福利)
如果你想转行做大模型,作为一名AI产品经理,你可以怎么做呢?或许,你可以先进行自我检测,看看自己是否真的适合转行做大模型。这篇文章里,作者便给想转行做大模型的AI产品经理们提出了一些建议,不妨来看看吧。
2024-10-10 15:01:02
1167
原创 LangChain: AI大语言模型的新篇章
本文介绍了LangChain框架,它能够将大型语言模型与其他计算或知识来源相结合,从而实现功能更加强大的应用。接着,对LangChain的关键概念进行了详细说明,并基于该框架进行了一些案例尝试,旨在帮助读者更轻松地理解LangChain的工作原理。
2024-10-10 14:54:02
1031
原创 LLM大语言模型书籍教程推荐:《大模型时代》+《开源大模型食用指南》!附文档
LLM大语言模型书籍教程推荐:《大模型时代》+《开源大模型食用指南》!附文档
2024-10-08 15:16:11
1111
原创 使用Ollama部署本地LLM:构建AI REST API的简易指南
利用Ollama本地LLM(大语言模型)搭建AI的REST API服务是一个实用的方法。下面是一个简单的工作流程。
2024-10-08 15:06:05
1183
原创 对于LLM大模型,到底微调还是不微调?
在 LLM 出现之前,微调通常用于小规模模型(100M – 300M 参数)。当时,最先进的领域应用通过监督微调(SFT)构建,即使用标注数据对预训练模型进行进一步训练,以适应自己的领域和下游任务。
2024-10-07 15:24:43
1230
原创 【新书】深度学习与机器学习:推动大数据分析与管理的发展
本书探讨了人工智能 (AI)、机器学习 (ML) 和深度学习 (DL) 在推动大数据分析与管理进步中的作用。书中着重简化深度学习背后的复杂数学概念,通过直观的可视化和实际案例研究,帮助读者理解神经网络及卷积神经网络 (CNN) 等技术的工作原理。
2024-10-06 10:06:23
889
原创 不可错过!CMU最新《生成式人工智能大模型》课程:从文本、图像到多模态大模型
从生成图像和文本到生成音乐和艺术,生成模型一直是人工智能的关键挑战之一。本课程将探讨推动生成模型和基础模型(Foundation Models)最近进展的机器学习和人工智能技术。
2024-10-06 10:04:50
1201
原创 大模型如何领域适配?最新《领域特定基础模型概述:关键技术、应用与挑战》
ChatGPT等基于基础模型的产品在人类语言理解方面的出色表现,促使学术界和工业界探索如何将这些模型定制化应用于特定行业和应用场景。此过程被称为领域特定基础模型的定制化,旨在解决通用模型的局限性,因为通用模型可能无法完全捕捉领域特定数据的独特模式和需求。
2024-10-05 08:15:00
997
原创 《大模型驱动的数字员工3.0建设应用白皮书》
在银行业数字化、智能化发展的过程中,数字员工成为发展数字金融的重要应用载体,正在重塑银行业的服务模式和创新能力。
2024-10-04 09:15:00
932
原创 大语言模型的知识冲突:成因、根源与展望
大语言模型在实际应用场景中经常面临知识冲突的问题,主要包括上下文 - 记忆知识冲突、多源上下文知识冲突和记忆内知识冲突。
2024-10-03 07:15:00
894
原创 如何在Spring Boot中无缝集成LangChain4j,玩转AI大模型!
如何在Spring Boot中无缝集成LangChain4j,玩转AI大模型!
2024-10-02 08:15:00
2457
原创 LangChain4j炸裂!Java开发者打造AI应用从未如此简单
LangChain4j 的目标是简化将大语言模型(LLM)集成到 Java 应用程序中的过程。
2024-10-01 07:45:00
1720
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人