- 博客(22)
- 收藏
- 关注
原创 Datawhale动手学AI Agent学习笔记
需要新建工作流模式的应用这里和创建其他应用一致,点击新建应用就可以创建一个工作流。选好题目后还需要请大家想想,你需要怎么把问题送给agent让他帮你解决,解决完你需要什么形式的答案?明确好输入输出,我们就可以试试去设计一个工作流了。
2025-01-02 22:38:53
712
原创 茴香豆:企业级知识库问答工具
是由书生·浦语团队开发的一款开源、专门针对国内企业级使用场景设计并优化的知识问答工具。在基础 RAG 课程中我们了解到,RAG 可以有效的帮助提高 LLM 知识检索的相关性、实时性,同时避免 LLM 训练带来的巨大成本。在实际的生产和生活环境需求,对 RAG 系统的开发、部署和调优的挑战更大,如需要解决群应答、能够无关问题拒答、多渠道应答、更高的安全性挑战。因此,根据大量国内用户的实际需求,总结出了的茴香豆知识问答助手架构,帮助企业级用户可以快速上手安装部署。
2024-08-30 20:33:58
999
原创 InternVL 多模态模型部署微调实践
InternVL 是一种用于多模态任务的深度学习模型,旨在处理和理解多种类型的数据输入,如图像和文本。它结合了视觉和语言模型,能够执行复杂的跨模态任务,比如图文匹配、图像描述生成等。通过整合视觉特征和语言信息,InternVL 可以在多模态领域取得更好的表现。
2024-08-30 16:18:21
978
原创 MindSearch 部署的到 Hugging Face Space
和相比区别是把internstudio换成了github codespace。随着硅基流动提供了免费的 InternLM2.5-7B-Chat 服务(免费的 InternLM2.5-7B-Chat 真的很香),MindSearch 的部署与使用也就迎来了纯 CPU 版本,进一步降低了部署门槛。那就让我们来一起看看如何使用硅基流动的 API 来部署 MindSearch 吧。
2024-08-23 22:04:00
849
原创 Datawhale X 李宏毅苹果书 AI夏令营task1-3笔记
首先简单介绍一下机器学习(Machine Learning,ML)和深度学习(Deep Learning,DL)的基本概念。机器学习,顾名思义,机器具备有学习的能力。具体来讲,机器学习就是让机器具备找一个函数的能力。机器具备找函数的能力以后,它可以做很多事。比如语音识别,机器听一段声音,产生这段声音对应的文字。我们需要的是一个函数,该函数的输入是声音信号,输出是这段声音信号的内容。这个函数显然非常复杂,人类难以把它写出来,因此想通过机器的力量把这个函数自动找出来。
2024-08-23 17:42:07
971
原创 LMDeploy 量化部署进阶实践
打开,进入如下界面并按箭头指示顺序点击。点选开发机,自拟一个开发机名称,选择镜像。我们要运行参数量为7B的InternLM2.5,由查询InternLM2.5-7b-chat的config.json文件可知,bfloat16所以我们需要大于14GB的显存,选择(24GB显存容量),后选择,等状态栏变成运行中,点击,我们即可开始部署。在终端中,让我们输入以下指令,来创建一个名为lmdeploy的conda环境,python版本为3.10,创建成功后激活环境并安装0.5.3版本的lmdeploy及相关包。
2024-08-23 15:38:49
1015
原创 探索 InternLM 模型能力边界
在中选择双模型对话,与InternLM2.5及另外任意其他模型对话,收集InternLM2.5 输出结果不如其他模型的对话案例。
2024-08-16 18:45:17
1036
原创 Datawhale X 魔搭 AI夏令营第四期AIGC方向笔记task3
LoRA (Low-Rank Adaptation) 微调是一种用于在预训练模型上进行高效微调的技术。它可以通过高效且灵活的方式实现模型的个性化调整,使其能够适应特定的任务或领域,同时保持良好的泛化能力和较低的资源消耗。这对于推动大规模预训练模型的实际应用至关重要。
2024-08-16 15:25:56
2019
原创 Lagent 自定义你的 Agent 智能体
Lagent 是一个轻量级开源智能体框架,旨在让用户可以高效地构建基于大语言模型的智能体。同时它也提供了一些典型工具以增强大语言模型的能力。Arxiv 搜索Bing 地图Google 学术搜索Google 搜索交互式 IPython 解释器IPython 解释器PPTPython 解释器在本节中,我们将带大家基于 Lagent 自定义自己的智能体。Lagent 中关于工具部分的介绍文档位于动作 — Lagent。继承BaseAction类实现简单工具的run方法;
2024-08-12 14:20:54
559
原创 Datawhale X 魔搭 AI夏令营第四期AIGC方向笔记task2
首先,我们来看下它的自我介绍。通义千问是具有信息查询、语言理解、文本创作等多能力的AI助手。我们可以看到,编程与技术支持能力是它的强项之一。(P1:通义千问自我介绍)接下来我们把场景聚焦到编程与技术支持这个方向,让他详细介绍下自己可以如何帮助大家编程。(P2:编程能力介绍)。定义一个类继承自。创建一个 DataLoader 实例来批量加载数据,并通过 CLIP 模型计算每个批次的图像与文本之间的相似度。话剧场景结合AI内容,自己在AI结果上做一些调整,最终整理出来场景表格图片编号场景描述。
2024-08-12 12:33:09
411
原创 OpenCompass 评测 InternLM-1.8B 实践
上海人工智能实验室科学家团队正式发布了大模型开源开放评测体系 “司南” (OpenCompass2.0),用于为大语言模型、多模态模型等提供一站式评测服务。开源可复现:提供公平、公开、可复现的大模型评测方案全面的能力维度:五大维度设计,提供 70+ 个数据集约 40 万题的的模型评测方案,全面评估模型能力丰富的模型支持:已支持 20+ HuggingFace 及 API 模型分布式高效评测:一行命令实现任务分割和分布式评测,数小时即可完成千亿模型全量评测。
2024-08-11 09:36:51
1112
原创 Datawhale X 魔搭 AI夏令营第四期AIGC方向笔记task1
文生图主要以SD系列基础模型为主,以及在其基础上微调的lora模型和人物基础模型等。接下来,我们简单了解下提示词、lora、ComfyUI和参考图控制这些知识点。
2024-08-08 17:17:47
922
原创 Datawhale AI 夏令营第四期大模型应用开发笔记
当前环节可让你在内,从一个完全小白的选手,搭建开通免费试用在进行授权链接:新用户需要先注册 & 绑定阿里云账号新用户还需要完成阿里云账号的实名认证,直接完成即可。
2024-08-08 16:08:24
1054
原创 LangGPT结构化提示词编写实践
Prompt是一种用于指导以大语言模型为代表的生成式人工智能生成内容(文本、图像、视频等)的输入方式。它通常是一个简短的文本或问题,用于描述任务和要求。Prompt可以包含一些特定的关键词或短语,用于引导模型生成符合特定主题或风格的内容。例如,如果我们要生成一篇关于“人工智能”的文章,我们可以使用“人工智能”作为Prompt,让模型生成一篇关于人工智能的介绍、应用、发展等方面的文章。Prompt还可以包含一些特定的指令或要求,用于控制生成文本的语气、风格、长度等方面。
2024-08-04 16:36:27
2243
原创 XTuner微调个人小助手认知
本节主要重点是带领大家实现个人小助手微调,如果想了解微调相关的基本概念,可以访问XTuner微调前置基础。环境安装:我们想要用简单易上手的微调工具包 XTuner 来对模型进行微调的话,第一步是安装 XTuner !安装基础的工具是一切的前提,只有安装了 XTuner 我们才能够去执行后续的操作。前期准备:在完成 XTuner 的安装后,我们下一步就需要去明确我们自己的微调目标了。我们想要利用微调做一些什么事情呢,然后为了实现这个目标,我们需要准备相关的硬件资源和数据。启动微调:在确定了自己的微调目标后,我
2024-08-04 15:25:38
897
原创 InternLM + LlamaIndex RAG 实践
给模型注入新知识的方式,可以简单分为两种方式,一种是内部的,即更新模型的权重,另一个就是外部的方式,给模型注入格外的上下文或者说外部信息,不改变它的的权重。第一种方式,改变了模型的权重即进行模型训练,这是一件代价比较大的事情,大语言模型具体的训练过程,可以参考。第二种方式,并不改变模型的权重,只是给模型引入格外的信息。类比人类编程的过程,第一种方式相当于你记住了某个函数的用法,第二种方式相当于你阅读函数文档然后短暂的记住了某个函数的用法。进行任何增训的情况下,通过 RAG 技术实现的新增知识问答。
2024-08-04 11:25:42
1050
原创 ”AI+物质科学“学习笔记
从零入门AI for Science(AI+化学)是 Datawhale 2024 年 AI 夏令营第三期的学习活动,基于天池平台第二届世界科学智能大赛 物质科学赛道:催化反应产率预测开展的实践学习。教程提供的Baseline涉及机器学习(随机森林)深度学习RNN的方案,教程会一一介绍这些方案的构建思路并给出代码实现示例。
2024-08-04 00:11:21
2732
原创 轻松玩转书生·浦语大模型趣味 Demo
是利用《西游记》剧本中所有关于猪八戒的台词和语句以及 LLM API 生成的相关数据结果,进行全量微调得到的猪八戒聊天模型。(Windows 即开始菜单键)打开指令界面,并输入命令,按下回车键。能够以较低的训练成本达到不错的角色模仿能力,同时低部署条件能够为后续工作降低算力门槛。输入以下命令,完成环境包的安装:(时间较长,请耐心等待)界面,点击 创建开发机 配置开发机系统。待程序运行的同时,对端口环境配置本地。镜像,然后在资源配置中,使用。的选项,然后立即创建开发机器。配置完成后,进入到新创建的。
2024-07-29 20:51:23
949
原创 LMDeploy量化部署LLM&VLM实践
打开InternStudio平台,创建开发机。填写开发机名称;选择镜像;选择10% A100*1GPU;点击“立即创建”。排队等待一小段时间,点击“进入开发机”。点击左上角图标,切换为终端(Terminal)模式。
2024-07-25 15:57:09
1172
原创 关于书生·浦语大模型全链路开源体系的笔记
从当下图标中我们可以看出大模型的发展趋势。当前,大模型已经成为发展通用人工智能的重要途经,它也逐渐从专业模型转变成通用模型。下面是书生·浦语大模型的发展历程。
2024-07-21 12:35:39
507
原创 关于InternStudio开发机中SSH连接与端口映射
在InternStudio控制台创建好开发机后进入SSH连接界面之后打开电脑的powerShell终端,即:使用快捷键打开运行框,输入powerShell,打开powerShell终端。将SSH连接的登录命令复制到终端,回车,在复制密码进行粘贴,回车后显示如下界面通过配置SSH密钥可以进行SSH远程连接支持RSA和DSA两种认证密钥这里我们使用的是RSA算法生成密钥,命令为:输入命令后就可以了,这里的密钥默认情况下是生成在~/.ssh/目录下的,表示的是家目录。
2024-07-16 00:51:14
692
原创 Python实现wordcount函数并调试
通过debug代码,可以逐步了解代码循环的整个过程,变量与堆栈的变化,进而逐步找到代码隐藏的bug。# 统计每个单词出现的次数。# 分割字符串为单词列表。# 调用函数并打印结果。
2024-07-15 23:16:22
356
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人