- 博客(18)
- 收藏
- 关注
原创 茴香豆:企业级知识问答工具实践闯关任务
茴香豆是由书生·浦语团队开发的一款开源、专门针对国内企业级使用场景设计并优化的知识问答工具。在基础 RAG 课程中我们了解到,RAG 可以有效的帮助提高 LLM 知识检索的相关性、实时性,同时避免 LLM 训练带来的巨大成本。在实际的生产和生活环境需求,对 RAG 系统的开发、部署和调优的挑战更大,如需要解决群应答、能够无关问题拒答、多渠道应答、更高的安全性挑战。因此,根据大量国内用户的实际需求,总结出了三阶段Pipeline的茴香豆知识问答助手架构,帮助企业级用户可以快速上手安装部署。茴香豆特点。
2024-08-25 16:28:06
716
原创 MindSearch CPU-only 版部署
任务要求: 因为要使用硅基流动的 API Key,所以接下来便是注册并获取 API Key 了。首先,我们打开 硅基流动统一登录 来注册硅基流动的账号(如果注册过,则直接登录即可)。在完成注册后,打开 硅基流动统一登录 来准备 API Key。首先创建新 API 密钥,然后点击密钥进行复制,以备后续使用。 由于硅基流动 API 的相关配置已经集成在了 MindSearch 中,所以我们可以直接执行下面的代码来启动 MindSearch 的后端。 在后端启动完成后,我们打开新终端运行如下命令来
2024-08-25 12:55:40
474
原创 InternVL 微调实践闯关任务
InternVL 是一种用于多模态任务的深度学习模型,旨在处理和理解多种类型的数据输入,如图像和文本。它结合了视觉和语言模型,能够执行复杂的跨模态任务,比如图文匹配、图像描述生成等。通过整合视觉特征和语言信息,InternVL 可以在多模态领域取得更好的表现。对于InternVL这个模型来说,它vision模块就是一个微调过的ViT,llm模块是一个InternLM的模型。对于视觉模块来说,它的特殊之处在Dynamic High Resolution。
2024-08-20 22:26:15
1629
原创 LMDeploy 量化部署实践闯关任务
准确说,模型量化是一种优化技术,旨在减少机器学习模型的大小并提高其推理速度。模型在运行时,占用的显存可大致分为三部分:模型参数本身占用的显存、kv cache占用的显存,以及中间运算结果占用的显存。随着模型变得越来越大,我们需要一些大模型压缩技术来降低模型部署的成本,并提升模型的推理性能。让我们回到LMDeploy,在最新的版本中,LMDeploy使用的是AWQ算法,能够实现模型的4bit权重量化。输入以下指令,让我们同时启用量化后的模型、设定kv cache占用和kv cache int4量化。
2024-08-16 20:39:15
715
原创 Lagent 自定义你的 Agent 智能体
Lagent 是一个轻量级开源智能体框架,旨在让用户可以高效地构建基于大语言模型的智能体。同时它也提供了一些典型工具以增强大语言模型的能力。Arxiv 搜索Bing 地图Google 学术搜索Google 搜索交互式 IPython 解释器IPython 解释器PPTPython 解释器在本节中,我们将带大家基于 Lagent 自定义自己的智能体。Lagent 中关于工具部分的介绍文档位于动作 — Lagent。继承BaseAction类实现简单工具的run方法;
2024-08-12 23:07:21
383
原创 OpenCompass 评测 InternLM-1.8B 实践
任务要求:在 OpenCompass 中评估一个模型通常包括以下几个阶段:配置 -> 推理 -> 评估 -> 可视化。
2024-08-10 13:35:39
444
原创 XTuner 微调个人小助手认知任务
下面我们将根据项目的需求一步步的进行修改和调整吧!在 PART 1 的部分,由于我们不再需要在 HuggingFace 上自动下载模型,因此我们先要更换模型的路径以及数据集的路径为我们本地的路径。为了训练过程中能够实时观察到模型的变化情况,XTuner 贴心的推出了一个。
2024-08-10 12:45:50
869
原创 Llamaindex RAG实践
正式介绍检索增强生成(Retrieval Augmented Generation,RAG)技术以前,大家不妨想想为什么会出现这样一个技术。给模型注入新知识的方式,可以简单分为两种方式,一种是内部的,即更新模型的权重,另一个就是外部的方式,给模型注入格外的上下文或者说外部信息,不改变它的的权重。第一种方式,改变了模型的权重即进行模型训练,这是一件代价比较大的事情,大语言模型具体的训练过程,可以参考InternLM2技术报告。第二种方式,并不改变模型的权重,只是给模型引入格外的信息。
2024-08-09 22:42:46
1305
原创 LangGPT结构化提示词编写实践
的简称,中文名为结构化提示词。LangGPT 是一个帮助你编写高质量提示词的工具,理论基础是我们提出的一套模块化、标准化的提示词编写方法论——结构化提示词。例如,如果我们要生成一篇关于“人工智能”的文章,我们可以使用“人工智能”作为Prompt,让模型生成一篇关于人工智能的介绍、应用、发展等方面的文章。例如,我们可以使用“请用幽默的语气描述人工智能的发展历程”作为Prompt,让模型生成一篇幽默风趣的文章。总之,Prompt是一种灵活、多样化的输入方式,可以用于指导大语言模型生成各种类型的内容。
2024-08-07 23:01:02
725
原创 8G显存玩转书生大模型 Demo
然后,我们执行如下代码来启动一个 Streamlit 服务。的 PowerShell 中输入以下命令,将端口映射到本地。
2024-08-05 22:35:50
320
原创 书生大模型全链路开源开放体系
与相近规模的Llama-33B、Llama2-13B以及国内主流的7B、13B开源模型相比,InterLM-20B在不足三分之一的参数量下,却达到了Llama2-70B的水平。书生·浦语大模型的发展历程彰显了这一变革的重要性。它从轻量级的7B社区模型,逐步升级到中量级的20B商业模型,再到重量级的123B全场景模型。提供了全链路部署的解决方案,包括模型轻量化、推理和服务,使得大模型在GPU上的部署更加高效,性能领先。工具,全方位评测模型性能,保证了评测结果的复现性,成为全球领先的大模型开源评测体系。
2024-08-04 22:19:49
703
原创 Datawhale AI夏令营 AI+逻辑推理——Task2
安装需要的库导入需要的环境,包括日志处理、多线程、api请求等相关库引入。import osimport relogger.remove() # 移除默认的控制台输出。
2024-07-30 22:29:45
845
原创 书生大模型训练营(第三期)——入门岛
SSH全称Secure Shell,中文翻译为安全外壳,它是一种网络安全协议,通过加密和认证机制实现安全的访问和文件传输等业务。SSH 协议通过对网络数据进行加密和验证,在不安全的网络环境中提供了安全的网络服务。SSH 是(C/S架构)由服务器和客户端组成,为建立安全的 SSH 通道,双方需要先建立 TCP 连接,然后协商使用的版本号和各类算法,并生成相同的会话密钥用于后续的对称加密。在完成用户认证后,双方即可建立会话进行数据交互。那在后面的实践中我们会配置SSH密钥。
2024-07-20 23:37:53
810
原创 Datawhale AI 夏令营 Task3——使用深度学习方案
时间序列预测是一个不断发展的领域,随着技术的进步,我们可以期待更多的优化方法和模型的出现。深度学习模型,特别是LSTM和其变体,已经在许多时间序列预测任务中显示出了优越的性能。更复杂的模型结构:如引入注意力机制的LSTM模型,以更好地捕捉时间序列中的长期依赖关系。多模态数据融合:结合时间序列数据和其他类型的数据,如文本或图像,以提供更全面的分析。模型解释性:提高模型的可解释性,以便更好地理解预测结果。自动化特征工程:开发自动化的特征工程工具,以减少手动特征提取的工作量。实时预测。
2024-07-20 13:15:50
577
原创 Datawhale AI 夏令营 Task2——入门lightgbm,开始特征工程
在Task2中,我们的任务是使用进阶的解决本次问题,以达到更好的预测效果。你可以从中学会。特征工程是参与机器学习竞赛的重要环节,可以通过并改善特征或者构建新的。探索性数据分析、数据预处理、提取特征、切分训练集与验证集、训练模型、预测结果。
2024-07-16 22:52:47
1468
原创 第十届NVIDIA Sky Hackathon比赛——货运智驾小助手
随着科技的飞速发展,人工智能和深度学习已经成为我们生活中不可或缺的一部分。而NVIDIA Sky Hackathon,作为一场专注于深度学习技术创新的比赛,每年都吸引着众多开发者、研究者和爱好者前来参与。今天,我想和大家分享一下我参加第十届NVIDIA Sky Hackathon比赛的经历和感受。
2024-07-14 22:13:37
818
原创 Datawhale AI训练营
使用 read_csv() 函数从文件中读取训练集数据,文件名为 'train.csv'# 使用 read_csv() 函数从文件中读取测试集数据,文件名为 'train.csv'# 3. 计算训练数据最近11-20单位时间内对应id的目标均值。# 4. 将target_mean作为测试集结果进行合并。# 导入 numpy 库,用于科学计算和多维数组操作。# 导入 pandas 库,用于数据处理和分析。# 1. 导入需要用到的相关库。# 2. 读取训练集和测试集。# 5. 保存结果文件到本地。
2024-07-11 22:35:36
281
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人