- 博客(28)
- 收藏
- 关注
原创 【茴香豆】茴香豆:企业级知识问答工具实践闯关任务
在 huixiangdou 文件加下创建 repodir 文件夹,用来储存知识库原始文档。再创建一个文件夹 workdir 用来存放原始文档特征提取到的向量知识库。
2024-09-10 23:20:32
321
原创 【MindSearch】MindSearch 部署到Github Codespace 和 Hugging Face Space
https://huggingface.co/spaces/Awaken/huixiang
2024-09-10 23:01:41
211
原创 【书生浦语】LMDeploy 量化部署实践闯关任务
2、kv cache占用4GB:剩余显存24-14=10GB,kv cache修改为占用40%,即10*0.4=4GB。2、kv cache占用8GB:剩余显存24-14=10GB,kv cache默认占用80%,即10*0.8=8GB。输入以下指令,让我们同时启用量化后的模型、设定kv cache占用和kv cache int4量化。是故23GB=权重占用14GB+kv cache占用8GB+其它项1GB。是故19GB=权重占用14GB+kv cache占用4GB+其它项1GB。
2024-09-10 19:15:10
499
原创 【书生浦语】Lagent 自定义你的 Agent 智能体
首先,我们先使用 LMDeploy 部署 InternLM2.5-7B-Chat,并启动一个 API Server。
2024-09-10 14:53:51
143
原创 【训练营】llamaindex+Internlm2 RAG实践
给出了参考文件README_zh-CN.md。执行结果,可以正确引用知识库的内容做出解释。
2024-08-13 21:37:12
328
原创 【训练营】书生·浦语大模型全链路开源开放体系笔记
1.8B:超轻量级,可用于端侧应用或开发者快速学习上手。20B:综合性能强劲,有效支持复杂场景。102B:典型场景表现接近GPT-4。7B:模型轻便但性能不俗。
2024-08-13 15:11:45
182
转载 书生·浦语大模型实战营第二期
内容全面升级零基础搭建 RAG、多模态和智能体应用,深入了解大模型微调、部署、评测全流程[1] A100 免费算力强力助学[2] 助教讲师全程伴学[3] 优秀学员精美证书[4] 杰出项目官方流量支持&更高级别赛事推荐机会。
2024-03-15 13:48:23
111
1
原创 【DataWhale学习】Sora技术原理
Scaling ng Law:模型规模的增大对视频生成质量的提升具有明确意义,从而很好地解决视频一致性、连续性等问题;Data Engngine:数据工程很重要,如何设计视频的输入(e.g. 是否截断、长宽比、像素优化等)、patches 的输入方式、文本描述和文本图像对质量;AI Infrfrara:AI 系统(AI 框架、AI 编译器、AI 芯片、大模型)工程化能力是很大的技术壁垒,决定了 Scaling 的规模。
2024-02-29 22:50:23
379
原创 InternLM作业汇总
第四节课笔记:https://blog.youkuaiyun.com/googteo/article/details/135566121?第二节课笔记:https://juejin.cn/post/7321049431489396773。
2024-01-30 15:25:06
356
1
原创 【作业】XTuner 大模型单卡低成本微调实战
敲一次是换行,敲两次才是输入段落。4bit快一点,空内容会重复。tmux远程微调防止中断。Ctrl+B D 退出。
2024-01-14 14:07:28
652
1
原创 【笔记】XTuner 大模型单卡低成本微调实战
不需要一问一答,只需要回答(陈述句),systerm和user留空,数据放入assistant。
2024-01-13 10:09:09
702
1
原创 【作业】基于 InternLM 和 LangChain 搭建知识库基于 InternLM 和 LangChain 搭建知识库
基于 InternLM 和 LangChain 搭建知识库基于 InternLM 和 LangChain 搭建知识库建立database
2024-01-10 19:25:24
462
原创 【笔记】基于 InternLM 和 LangChain 搭建知识库基于 InternLM 和 LangChain 搭建知识库
RAG:检索增强生成,外挂知识库finetune:在小数据集上微调。
2024-01-10 15:32:58
479
原创 Datawhale深度强化学习task1学习笔记
一次次的决策来实现目标,这个目标通常是以最大化累积的奖励来呈现的,这个过程就是过程,而强化学习就是解决序列决策问题的有效方法之一。分类:基于价值的和基于策略梯度的算法探索策略( exploration strategy ):常用的方法有ϵ−greedy和置信上界( upper confidence bound,UCB )等等。
2023-11-15 14:07:07
107
原创 广播机制的维度问题
这是因为,在 numpy 中,数组的形状是一个元组,元组中的每个元素表示数组在对应维度上的长度。(,3)和(3,2,)都不是有效的数组形状表达方式。在这个例子中,偏置是一个标量,它可以和任何形状的张量相加,相当于把偏置复制成和另一个张量相同的形状,然后再相加。数那几个数字,从右到左,进行匹配)是否相同,相同则可以扩展,无论维度数相差多少都可以扩展,且可扩展的地方就只有维度长度为1的地方。广播机制是 numpy 对不同形状的数组进行数值计算的方式,它可以让形状不同的数组在某些维度上兼容,从而进行运算。
2023-11-12 15:54:48
95
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人