- 博客(494)
- 收藏
- 关注
原创 MindSearch深度解析实践
任务要求:在 官方的MindSearch页面 复制Spaces应用到自己的Spaces下,Space 名称中需要包含 MindSearch 关键词,请在必要的步骤以及成功的对话测试结果当中。
2024-12-11 23:15:57
344
原创 探索书生大模型能力边界
在 LeetCode 使用 InternThinker 刷 5 道算法题:使用 InternThinker 生成答案提交至 100% 通过。
2024-12-02 13:25:39
817
原创 Lagent 自定义Agent 智能体
使用 Lagent 复现文档中 “制作一个属于自己的Agent” 和 “Multi-Agents博客写作系统的搭建”两部分内容,记录复现过程并截图。
2024-11-25 17:42:03
336
原创 MetaGPT实现多动作Agent
智能体 = LLM+观察+思考+行动+记忆多智能体 = 智能体+环境+SOP+评审+路由+订阅+经济多动作的agent的本质是react,这包括了think(考虑接下来该采取啥动作)+act(采取行动)在MetaGPT的examples/write_tutorial.py下有示例代码这个函数是调用TutorialAssistant类,进行runTutorialAssistant类继承了role类,run也是用role类里的。
2024-11-19 22:59:03
831
原创 MetaGPT windows安装
不过在pycharm中用git下载比较难,可以直接在github下载后解压,把MetaGPT-main改名为MetaGPT,在该文件夹下运行pip指令。换成Kimi就好多了,api的cost也能计算出来,推理效果也比较卓越,就是速度慢了些。game.py和main.py都是空的,因为zhipu大模型比较傻。在config里定义自己的API。条目很齐全,就是跑起来会报错。项目经理细化每个文件的需求。程序员开始分别撰写子文件。架构师定义库、文件结构。
2024-11-19 16:36:07
531
原创 LMDeploy 量化部署实践闯关任务
对历史生成的token对QKV的计算结果进行缓存量化技术观点1仅有0.1-1%的权重影响大,对其它权重进行低比特量化基于激活值进行挑选量化,效果会不错观点2,量化时对显著权重缩放实现混合精度的计算阈值的确定就通过每行的绝对值平均值大模型外推通过位置编码角度解决:直接用整数1,2,…,1000作为位置:数值跨度大,对梯度优化不友好如果缩放到[0,1]跨度太小,模型和优化器不易分辨使用向量:1234用[1,2,3,4]
2024-11-19 13:08:20
703
原创 pip install volcengine-python-sdk报错
这是因为由于 Windows 系统有最长路径限制,可能会导致安装失败。这个包的保存路径名字特别长。
2024-11-14 22:34:12
828
原创 玩转书生「多模态对话」与「AI搜索」产品 - 任务
这是开源的 AI 搜索引擎。使用 MindSearch 在以下三个问题中选择一个你感兴趣的进行提问。任务要求:将模型回复截图保存提交到飞书问卷。
2024-11-10 15:05:32
371
原创 LangChain Ollama实战文献检索助手(三)思维链COT、思维树TOT和思维网NOT
大模型的思考方式有时候并不尽人意。我们可以在提示词中引导大模型如何拆分任务,按部就班地思考。
2024-11-07 18:29:07
655
原创 LangChain上使用huggingface的embedding模型(如jina-embeddings-v3)
embedding将文本映射到稠密的向量空间中,方便存储和查询。这里结合自己的应用场景,选择1b以下的embedding模型,综合考量下选择arkohut/jina-embeddings-v3下载使用模型卡片提供的命令,用cmd下载(强烈建议使用SSH命令下载!!!!用http容易报错)需要使用魔法上网才能下载。如果超时的话,也可以选择手动下载。注意下载后的文件名应该和网站上提供的一样。
2024-11-06 21:42:58
1204
原创 LangChain Ollama实战文献检索助手(二)少样本提示FewShotPromptTemplate示例选择器
选择1b以下的embedding模型,综合考量下选择arkohut/jina-embeddings-v3。embedding将文本映射到稠密的向量空间中,方便存储和查询。
2024-11-06 21:42:02
738
原创 ModuleNotFoundError: No module named ‘custom_st‘
用huggingface的jina-embeddings-v3部署在本地作为embedding模型时,会报错。尝试了很多种设置,最后发现其实只要在参数里加一个。
2024-11-06 21:27:13
726
1
原创 LangChain Ollama实战文献检索助手(一)环境配置和输入输出解析
提示模板的基本原则是:1.给予模型清晰明确的指示2.让模型慢慢地思考# 创建原始模板template = """您是一位专业的学者。\n对于 {theme} 研究领域的{year}以来的进展 ,您能提供富有洞见的综述吗?"""# 根据原始模板创建LangChain提示模板。
2024-11-06 13:20:19
611
原创 module ‘torch‘ has no attribute ‘float8_e4m3fnuz‘
这是因为我的torch版本只有2.1,太低导致的。升到2.5版本就能解决。这里还有个问题,直接升的话,可能cuda版本也变了,模型跑不起来。,找到适配当前cuda的高等级torch。运行大模型的时候报错说。
2024-11-05 12:09:08
5003
1
原创 L2G4000 InternVL 部署微调实践闯关任务
开源的多模态大模型:InternVL,Qwen-VL,LLaVA闭源的:GPT-4o研究重点:不同模态特征空间的对齐。
2024-11-04 17:20:03
545
原创 书生大模型全链路开源开放体系
价值对齐:让大模型的能力和行为跟人类的价值、真实意图和伦理原则相一致,确保人类与人工智能协作过程中的安全与信任。价值对齐是AI安全的一个核心议题。人类反馈的强化学习(RLHF)可用于对齐。数据对齐:指在数据处理过程中,将不同的数据源或数据集按照相同的格式和结构进行匹配和匹配的过程。这个过程通常涉及到数据的清洗、转换和整合,以确保数据的一致性和准确性。在数据对齐的过程中,我们需要关注数据的来源、格式、结构、含义和语义等方面,以确保数据的对齐效果。20B的涌现现象更明显,可以对没见过的问题进行合理的回答。
2024-11-04 10:56:49
352
原创 XTuner 微调个人小助手认知任务
步骤 0. 使用 conda 先构建一个 Python-3.10 的虚拟环境。在InternStudio开发机中的已经提供了微调模型,可以直接软链接即可。这是原始的微调数据,是llm的对话语料,定义这个机器人来写代码,讲冷笑话。1536 epoch的权重文件有问题,这里就换成保存1500epoch的。时间需要很久,在等待过程中,可以先进行后面的修改数据工作。可以看到,自我认知修改成功,也能说冷笑话。步骤 1. 修改 Config。步骤 1. 创建修改脚本。步骤 0. 复制模型。步骤 4. 模型合并。
2024-10-30 10:22:44
306
原创 L1G4000 InternLM + Llamaindex RAG 实践
安装llama-index那句命令行执行后,它会卸载pytorch,装上2.5.0版的。会导致和cuda不匹配报错。注意服务器上是没有浏览器的。因此需要在本地ide 用ssh连接服务器后,在本地ide上打开链接。下载Sentence Transformer 模型,遇上下载错误的时候。把百度百科相关的2024诺奖信息输入后,可以正确回答了。装完包后把pytorch卸载重新装2.0.1的就好了。软连接可以避免复制操作,占用存储。运行结果显示,出现我们想要的答案。在无rag下,查询xtuner。
2024-10-29 16:06:47
328
原创 LangGPT结构化提示词编写实践(L1G3000 浦语提示词工程实践)
可以看到,不加提示词的话,题目的主题写成了英文subject,在严肃的商务邮件中加入了不严肃的icon,并且没设定截止日期,也没讲清楚这个发布会里的重要环节。不加提示词的生成结果很生硬,像是直接从英语翻译过来的,“希望这封邮件能在您繁忙的工作生活中给予您正面的感受”。可以看到,无提示的用词不正规、无标题组织、还出现了不明英文,落款处有很多不明词汇。主题是AI研究者获诺奖的可行性分析,最后生成的书也挺靠谱的。不加提示词的开头的主语是“我”,不适用于商务场合。无提示词的没有落款,子标题错标严重。
2024-10-29 14:55:50
985
原创 书生营 L0G4000 玩转HF/魔搭/魔乐社区
新建下载internlm2_5-chat-1_8b的json文件。在codespace上给环境装包,按照教材即可。push的时候需要先认证token。基本上没啥问题,照着教程来就行。建立下载json文件。
2024-10-24 20:06:25
293
原创 书生营L0G3000 Git 基础知识
(github上预览自己的介绍没有换行,多加几个空格就好了)git会报错密码,输入的时候换成token就好了。
2024-10-24 16:31:17
382
原创 书生第四期L0G1000 Linux 基础知识
在root文件夹下建相关文件运行,即可获得进入开发机powershell进行ssh连接基础命令生成密钥。
2024-10-24 00:23:05
193
原创 189. Rotate Array刷题笔记
其实可以用三次颠倒来解决,加上取模和剪枝判断。但是这种方法只能解决互质和恰为倍数的情况。运行报错可能是因为不是原地置换数组。
2022-07-25 21:24:33
546
原创 136. Single Number刷题笔记
reduce是迭代方法,第0和第1元素操作的结果和第2元素继续操作,以此类推。用异或,可以解决这个问题。
2022-07-25 10:21:27
465
原创 Python logging模块学习笔记
logging查看回滚日志](Thecharacterusedbytheoperatingsystemtoseparatepathnamecomponents)os.sep是Thecharacterusedbytheoperatingsystemtoseparatepathnamecomponents。在日志命名的时候,比如父命名core,子命名为main.core,就可以复制父logger的设置。levelno是第x行。利用本地端口监听使用。...
2022-07-24 19:11:44
579
原创 240. Search a 2D Matrix II刷题笔记
如果采用二向搜索可能会更快点。从左下角直接开始搜索,比较简单,加上剪枝判断后速度也还可以。
2022-07-24 10:51:07
1631
原创 Ubuntu18.04屏幕自动旋转解决方法
如果想要旋转,则把normal替换成rotateleft,rotateright即可。Ubuntu屏幕突然自己旋转,大概率是因为开了重力感应,电脑倾角变动后,屏幕跟随旋转。查看连接上的屏幕名称,这里是eDP-1-1,不同电脑不一样。为了防止以后自动旋转,一劳永逸,在终端中输入下列命令,即可。...
2022-07-24 09:21:15
4216
原创 1722. Minimize Hamming Distance After Swap Operations刷题笔记
代码】1722.MinimizeHammingDistanceAfterSwapOperations刷题笔记。
2022-07-21 20:14:52
167
原创 tensorflow 1.3.1 安装及报错解决
按照以下顺序安装,注意这之前要装上cuda,并且tensorflow-gpu要最晚安装。重新安装protobuf,选择版本为3.20.*便可解决该问题。接下来再importTensorFlow,遇到下面问题。给numpy降级即可解决。
2022-07-21 11:19:15
1646
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人