waiting不是违停-优快云博客

原创 MindSearch深度解析实践

任务要求：在官方的MindSearch页面复制Spaces应用到自己的Spaces下，Space 名称中需要包含 MindSearch 关键词，请在必要的步骤以及成功的对话测试结果当中。

2024-12-11 23:15:57 344

原创探索书生大模型能力边界

在 LeetCode 使用 InternThinker 刷 5 道算法题：使用 InternThinker 生成答案提交至 100% 通过。

2024-12-02 13:25:39 817

原创 Lagent 自定义Agent 智能体

使用 Lagent 复现文档中 “制作一个属于自己的Agent” 和 “Multi-Agents博客写作系统的搭建”两部分内容，记录复现过程并截图。

2024-11-25 17:42:03 336

智能体 = LLM+观察+思考+行动+记忆多智能体 = 智能体+环境+SOP+评审+路由+订阅+经济多动作的agent的本质是react，这包括了think（考虑接下来该采取啥动作）+act（采取行动）在MetaGPT的examples/write_tutorial.py下有示例代码这个函数是调用TutorialAssistant类，进行runTutorialAssistant类继承了role类，run也是用role类里的。

2024-11-19 22:59:03 831

原创 MetaGPT windows安装

不过在pycharm中用git下载比较难，可以直接在github下载后解压，把MetaGPT-main改名为MetaGPT，在该文件夹下运行pip指令。换成Kimi就好多了，api的cost也能计算出来，推理效果也比较卓越，就是速度慢了些。game.py和main.py都是空的，因为zhipu大模型比较傻。在config里定义自己的API。条目很齐全，就是跑起来会报错。项目经理细化每个文件的需求。程序员开始分别撰写子文件。架构师定义库、文件结构。

2024-11-19 16:36:07 531

原创 LMDeploy 量化部署实践闯关任务

对历史生成的token对QKV的计算结果进行缓存量化技术观点1仅有0.1-1%的权重影响大，对其它权重进行低比特量化基于激活值进行挑选量化，效果会不错观点2，量化时对显著权重缩放实现混合精度的计算阈值的确定就通过每行的绝对值平均值大模型外推通过位置编码角度解决：直接用整数1,2，…，1000作为位置：数值跨度大，对梯度优化不友好如果缩放到[0,1]跨度太小，模型和优化器不易分辨使用向量：1234用[1,2,3,4]

2024-11-19 13:08:20 703

原创 pip install volcengine-python-sdk报错

这是因为由于 Windows 系统有最长路径限制，可能会导致安装失败。这个包的保存路径名字特别长。

2024-11-14 22:34:12 828

原创玩转书生「多模态对话」与「AI搜索」产品 - 任务

这是开源的 AI 搜索引擎。使用 MindSearch 在以下三个问题中选择一个你感兴趣的进行提问。任务要求：将模型回复截图保存提交到飞书问卷。

2024-11-10 15:05:32 371

原创 LangChain Ollama实战文献检索助手（三）思维链COT、思维树TOT和思维网NOT

大模型的思考方式有时候并不尽人意。我们可以在提示词中引导大模型如何拆分任务，按部就班地思考。

2024-11-07 18:29:07 655

原创 LangChain上使用huggingface的embedding模型（如jina-embeddings-v3）

embedding将文本映射到稠密的向量空间中，方便存储和查询。这里结合自己的应用场景，选择1b以下的embedding模型，综合考量下选择arkohut/jina-embeddings-v3下载使用模型卡片提供的命令，用cmd下载（强烈建议使用SSH命令下载！！！！用http容易报错）需要使用魔法上网才能下载。如果超时的话，也可以选择手动下载。注意下载后的文件名应该和网站上提供的一样。

2024-11-06 21:42:58 1204

原创 LangChain Ollama实战文献检索助手（二）少样本提示FewShotPromptTemplate示例选择器

选择1b以下的embedding模型，综合考量下选择arkohut/jina-embeddings-v3。embedding将文本映射到稠密的向量空间中，方便存储和查询。

2024-11-06 21:42:02 738

原创 ModuleNotFoundError: No module named ‘custom_st‘

用huggingface的jina-embeddings-v3部署在本地作为embedding模型时，会报错。尝试了很多种设置，最后发现其实只要在参数里加一个。

2024-11-06 21:27:13 726 1

原创 LangChain Ollama实战文献检索助手（一）环境配置和输入输出解析

提示模板的基本原则是：1.给予模型清晰明确的指示2.让模型慢慢地思考# 创建原始模板template = """您是一位专业的学者。\n对于 {theme} 研究领域的{year}以来的进展，您能提供富有洞见的综述吗？"""# 根据原始模板创建LangChain提示模板。

2024-11-06 13:20:19 611

原创 L1G6000 评测 InternLM-1.8B 实践

创建环境。

2024-11-06 09:45:32 1005

原创 module ‘torch‘ has no attribute ‘float8_e4m3fnuz‘

这是因为我的torch版本只有2.1，太低导致的。升到2.5版本就能解决。这里还有个问题，直接升的话，可能cuda版本也变了，模型跑不起来。，找到适配当前cuda的高等级torch。运行大模型的时候报错说。

2024-11-05 12:09:08 5003 1

原创 L2G4000 InternVL 部署微调实践闯关任务

开源的多模态大模型：InternVL，Qwen-VL，LLaVA闭源的：GPT-4o研究重点：不同模态特征空间的对齐。

2024-11-04 17:20:03 545

原创书生大模型全链路开源开放体系

价值对齐：让大模型的能力和行为跟人类的价值、真实意图和伦理原则相一致，确保人类与人工智能协作过程中的安全与信任。价值对齐是AI安全的一个核心议题。人类反馈的强化学习（RLHF）可用于对齐。数据对齐：指在数据处理过程中，将不同的数据源或数据集按照相同的格式和结构进行匹配和匹配的过程。这个过程通常涉及到数据的清洗、转换和整合，以确保数据的一致性和准确性。在数据对齐的过程中，我们需要关注数据的来源、格式、结构、含义和语义等方面，以确保数据的对齐效果。20B的涌现现象更明显，可以对没见过的问题进行合理的回答。

2024-11-04 10:56:49 352

原创 XTuner 微调个人小助手认知任务

步骤 0. 使用 conda 先构建一个 Python-3.10 的虚拟环境。在InternStudio开发机中的已经提供了微调模型，可以直接软链接即可。这是原始的微调数据，是llm的对话语料，定义这个机器人来写代码，讲冷笑话。1536 epoch的权重文件有问题，这里就换成保存1500epoch的。时间需要很久，在等待过程中，可以先进行后面的修改数据工作。可以看到，自我认知修改成功，也能说冷笑话。步骤 1. 修改 Config。步骤 1. 创建修改脚本。步骤 0. 复制模型。步骤 4. 模型合并。

2024-10-30 10:22:44 306

原创 L1G4000 InternLM + Llamaindex RAG 实践

安装llama-index那句命令行执行后，它会卸载pytorch，装上2.5.0版的。会导致和cuda不匹配报错。注意服务器上是没有浏览器的。因此需要在本地ide 用ssh连接服务器后，在本地ide上打开链接。下载Sentence Transformer 模型，遇上下载错误的时候。把百度百科相关的2024诺奖信息输入后，可以正确回答了。装完包后把pytorch卸载重新装2.0.1的就好了。软连接可以避免复制操作，占用存储。运行结果显示，出现我们想要的答案。在无rag下，查询xtuner。

2024-10-29 16:06:47 328

原创 LangGPT结构化提示词编写实践（L1G3000 浦语提示词工程实践）

可以看到，不加提示词的话，题目的主题写成了英文subject，在严肃的商务邮件中加入了不严肃的icon，并且没设定截止日期，也没讲清楚这个发布会里的重要环节。不加提示词的生成结果很生硬，像是直接从英语翻译过来的，“希望这封邮件能在您繁忙的工作生活中给予您正面的感受”。可以看到，无提示的用词不正规、无标题组织、还出现了不明英文，落款处有很多不明词汇。主题是AI研究者获诺奖的可行性分析，最后生成的书也挺靠谱的。不加提示词的开头的主语是“我”，不适用于商务场合。无提示词的没有落款，子标题错标严重。

2024-10-29 14:55:50 985

原创书生营 L0G4000 玩转HF/魔搭/魔乐社区

新建下载internlm2_5-chat-1_8b的json文件。在codespace上给环境装包，按照教材即可。push的时候需要先认证token。基本上没啥问题，照着教程来就行。建立下载json文件。

2024-10-24 20:06:25 293

原创书生营L0G3000 Git 基础知识

（github上预览自己的介绍没有换行，多加几个空格就好了）git会报错密码，输入的时候换成token就好了。

2024-10-24 16:31:17 382

原创书生营第四期L0G2000 Python 基础知识

【代码】书生营第四期L0G2000 Python 基础知识。

2024-10-24 11:01:58 272

原创书生第四期L0G1000 Linux 基础知识

在root文件夹下建相关文件运行，即可获得进入开发机powershell进行ssh连接基础命令生成密钥。

2024-10-24 00:23:05 193

原创 189. Rotate Array刷题笔记

其实可以用三次颠倒来解决，加上取模和剪枝判断。但是这种方法只能解决互质和恰为倍数的情况。运行报错可能是因为不是原地置换数组。

2022-07-25 21:24:33 546

原创 136. Single Number刷题笔记

reduce是迭代方法，第0和第1元素操作的结果和第2元素继续操作，以此类推。用异或，可以解决这个问题。

2022-07-25 10:21:27 465

原创 Python logging模块学习笔记

logging查看回滚日志](Thecharacterusedbytheoperatingsystemtoseparatepathnamecomponents)os.sep是Thecharacterusedbytheoperatingsystemtoseparatepathnamecomponents。在日志命名的时候，比如父命名core，子命名为main.core，就可以复制父logger的设置。levelno是第x行。利用本地端口监听使用。...

2022-07-24 19:11:44 579