章章小鱼-优快云博客

原创 OpenAI’s 5 Levels Of ‘Super AI’

在目前的第一级别，即人工智能的当前阶段，计算机能够以对话语言与人们进行互动。比如客户服务支持人员、人工智能教练，以及与你的团队交流并帮助你撰写社交媒体内容的ChatGPT和Claude。被称作“组织”的这一超级人工智能的最终阶段，涉及的人工智能能够完成整个组织的工作。你目前拥有的每一个员工，执行的每一项功能，都由协同工作、不断改进并运行一切所需事务的智能代理来完成，无需人类参与。据称即将在未来不久出现，这一级别被称为“推理者”的系统能够执行与拥有博士学位的人类相当的基本问题解决任务，但无法使用任何工具。

2025-03-21 10:42:34 266

原创从强化学习的角度理解O1【kimi解读】

这些开源o1项目在不同的方面对路线图中的关键组件进行了探索和实现。它们通过不同的方法和策略，尝试复现o1模型的推理能力和性能。这些项目不仅验证了路线图中各个组件的有效性，还提供了具体的实现细节和实验结果，为未来的研究和开发提供了宝贵的参考。通过这些项目的实践，研究者可以更好地理解如何在实际应用中结合策略初始化、奖励设计、搜索和学习，以构建具有强推理能力的大型语言模型。将o1适应到一般领域需要解决的关键挑战包括构建通用奖励模型、处理多模态数据和构建世界模型。

2025-01-10 18:02:39 982

原创 Anthropic Agent构建指南【附中文代码，一键运行】

Agent 的定义因人而异，可以是完全自主的系统，也可以是遵循预定义工作流的系统。将所有变体都归类为“Agentic 系统”，并区分 “工作流 (Workflows)” 和 “Agent”：通过预定义代码路径编排 LLM 和工具的系统。LLM 动态指导自身过程和工具使用的系统，控制任务完成方式。成功并不在于构建最复杂的系统，而在于构建最适合需求的系统。从简单的提示开始。通过全面的评估进行优化。仅在更简单的解决方案不足时才添加多步骤 agentic 系统。保持 Agent 设计的简洁性。

2024-12-29 16:52:20 899

原创 OpenAI审慎对齐范式—Deliberative alignment

核心问题：现有大型语言模型（LLMs）虽然经过广泛的安全训练，但在面对恶意提示时仍会屈服，对良性查询过度拒绝，并容易受到越狱攻击。主要原因：模型需要在没有足够时间推理的情况下立即响应；并且是通过大量的标签示例间接推断期望行为，而不是直接学习自然语言的安全标准。解决方案：引入 “审慎对齐”（Deliberative Alignment），这是一种新的训练范式，直接向 LLM 教授人类撰写的、可解释的安全规范文本，并训练它们在回答之前明确地对这些规范进行推理。

2024-12-29 16:27:35 926

原创 LLM预训练recipe — 摘要版

本文深入探讨了从零开始进行大型语言模型（LLM）预训练（pretrain）的各个环节，侧重方法论和实践细节，旨在普及预训练过程中的关键步骤、常见问题及避坑技巧，而非技术原理的深入分析。作者强调了数据处理的重要性，并强调了自主预训练的价值。

2024-12-27 21:54:47 852

原创【model factory】构建统一的AI模型调用工具：多模型多平台集成

随着AI技术的快速发展，市面上出现了越来越多的大语言模型和多模态模型。为了解决这些问题，我们开发了这个AI模型集成工具包，旨在提供一个统一的接口来调用各种AI模型。

2024-12-08 13:44:41 288

原创【Agent】构建智能教学系统：基于多 Agent 的角色扮演对话实现

在探索大语言模型的教育应用过程中，我们开发了一个基于多 Agent 的智能教学系统。本文将介绍如何通过教师和学生两个专业化的 Agent 协同工作，实现自然的教学对话互动。

2024-12-07 22:32:33 610

原创【Agent】构建智能诗歌创作系统：基于多 Agent 的协同创作实现

在探索大语言模型的创意应用过程中，我们开发了一个基于多 Agent 的智能诗歌创作系统。本文将介绍如何通过多个专业化的 Agent 协同工作，实现根据地点和天气信息自动创作诗歌的功能。

2024-12-07 22:32:07 500

原创【Agent】构建智能客服系统：基于多 Agent 的对话系统实现

智能路由基于工具调用的Agent切换专业化的Agent分工灵活的部门分配状态管理内置的消息历史上下文变量支持完整的会话追踪模块化设计清晰的类层次结构统一的工具接口可扩展的Agent系统系统扩展性易于添加新的Agent灵活的工具注册简单的切换机制。

2024-12-07 22:30:45 505

原创【Agent】Prompt-based Toy Agent: 一个有趣的role-play对话系统

在探索大语言模型应用的过程中，我实现了一个有趣的项目：Prompt-based Toy Agent。这是一个基于提示词工程的多角色对话系统，通过精心设计的 prompt，让 AI 扮演不同的角色与用户对话。

2024-12-07 17:37:40 696

原创【llm_inference】self-refine框架（最小code实现）

初始翻译：完成基础翻译工作翻译反馈：对翻译结果进行专业评估优化翻译：根据反馈改进翻译质量这种设计模拟了专业翻译工作的流程：翻译→审校→修改，通过多轮优化确保翻译质量。自优化翻译系统通过模拟人类翻译和审校的流程，实现了高质量的机器翻译。系统的模块化设计、异步处理机制和完善的日志系统，为实际应用提供了坚实的基础。通过持续的优化和改进，这个系统将为机器翻译领域带来更多可能。

2024-12-06 17:11:37 775

原创【llm_inference】react框架（最小code实现）

ReAct 是一种结合了推理（Reasoning）和行动（Acting）的语言模型推理架构。它允许模型在回答问题时，通过不断的思考、采取行动、观察结果，最终得出答案。这种方式模拟了人类解决问题的过程，使得模型的推理过程更加透明和可控。你是一位洞察研究员。1. 为用户查询寻找详细信息，并尽可能简单地将内容总结为一句话2. 如果用户的问题是关于具体数值的，只返回数值结果，不需要任何额外解释。"""self.description = "用于网络搜索的工具"名称（name）

2024-12-06 17:00:49 1081

原创【llm_inference】plan-and-execute（最小code实现）

规划（Plan）：分析问题并制定详细的执行计划执行（Execute）：按照计划逐步执行具体操作综合（Synthesize）：整合执行结果得出最终答案这种设计模拟了项目经理的工作方式：先规划、后执行、最后总结，确保任务的高效完成。计划执行推理架构通过将复杂问题分解为规划和执行两个阶段，实现了更加系统化和可控的问题解决方式。系统的模块化设计、智能规划能力和灵活的执行机制，为实际应用提供了强大的支持。通过持续的优化和改进，这个架构将在人工智能领域发挥越来越重要的作用。

2024-12-06 16:57:58 616

原创【llm_inference】思维链推理cot（最小code实现）

思维链推理技术通过模拟人类的思维方式，显著提升了大语言模型的推理能力。它不仅能够帮助模型得出更准确的答案，还能提供清晰的推理过程，增强了模型输出的可解释性。通过合理的工程实现和持续的优化改进，思维链推理将在人工智能领域发挥越来越重要的作用。

2024-12-06 16:55:03 969

原创大模型训练和推理阶段的内存消耗估计

本文以Mixtral-8x22B为例来介绍各个阶段的内存消耗以及推理和训练时的内存消耗。

2024-05-05 15:52:00 2224

原创微调llama 3 — PEFT微调和全量微调

高效微调llama3

2024-04-24 12:42:48 10444 2

原创 HiQA: A Hierarchical Contextual Augmentation RAG for Massive Documents QA

Tips:本文章只是简单介绍了一下HiQA的三步走流程，对于具体的如果针对表格、图片做相应的处理，还需要深入原论文。

2024-04-21 13:02:33 1120 1

原创如何优雅的从huggingface中下载模型？

【代码】如何优雅的从huggingface中下载模型？

2023-03-24 23:21:53 1447 1

原创 Linux下软件安装& 非root用户安装软件的一般流程

在linux系统下，软件包安装一般需要root权限，因为都是安装到绝对路径，需要往系统文件夹写文件。但是源码编译就看情况了，适合咱这种没有root权限的孩子……下面是Linux下非root用户安装软件的一般流程：获取源代码，常用wget方式直接从url（一般都有官网，去官网看看啦）下载解压源代码安装包，多为gzip过的tar包，一般使用tar -zxvf xxx.tar.gz即可切换到解压后的目录，运行 ./configure。./configure –help可以列出配置项，非root用户最重要的

2022-05-02 13:12:50 8155

原创 json的三种类型和读取方式

⭐如果数据是这个样子的：{"商家名称": "珍滋味港式粥火锅(工体店)", "评分": 27.0, "人均消费": 174, "评论数量": 2307}{"商家名称": "井格老灶火锅(望京新世界店)", "评分": 26.2, "人均消费": 105, "评论数量": 1387}{"商家名称": "脸谱港式火锅(酒仙桥丽都店)", "评分": 24.5, "人均消费": 218, "评论数量": 39}要用下面这种方式读取：with open("××××.json", "r", "utf-.

2022-05-01 20:36:52 445

原创【spacy.load(‘en‘)】失败【OR Can‘t find model ‘en_core_web_sm‘】

1、spacy.load(‘en‘) 失败的解决方法和安装en_core_web_sm的三步骤pip install spacypip install -i https://pypi.tuna.tsinghua.edu.cn/simple/ en_core_web_sm --trusted-host pypi.tuna.tsinghua.edu.cnconda install -c conda-forge spacy-model-en_core_web_sm关于-c conda-forge，这个其

2022-05-01 20:33:18 1220

原创非root用户，普通用户安装maven

第一步：下载、解压到相应目录wget http://mirrors.hust.edu.cn/apache/maven/maven-3/3.3.9/binaries/apache-maven-3.3.9-bin.tar.gztar -xvf apache-maven-3.3.9-bin.tar.gzmv -f apache-maven-3.3.9 /home/username第二步：编辑 ~/.bashrc 文件，在文件末尾添加如下代码：export MAVEN_HOME=/home/z.

2022-05-01 20:29:12 592

原创 RuntimeError: Expected object of device type cuda but got device type cpu for argument ……

https://blog.youkuaiyun.com/weixin_37913042/article/details/103009733出错误背景：Pytorch 中想使用 CUDA 对程序计算进行加速错误的意思：object 的 device 类型期望得到的是 cuda 类型，但是实际上的类型确实 cpu 类型，在调用二分类交叉熵损失进行前向计算的时候检查下面几点：模型是否放到了CUDA上 model = model.to(device) 或 model = model.cuda(device)输入数

2022-05-01 20:24:27 298

原创两台服务器scp命令实现文件传输

两台服务器之间进行文件传输，一些人会先下载到本地，然后在上传到另一台服务器……太慢了，用scp命令传输超快！# 传输文件scp filedir/test.sh username@目标服务器IP地址:target_dir #把本机文件传送到目标服务器scp username@目标服务器IP地址:target_dir 当前服务器目录 #把目标服务器上的东西搞过来# 例子# 假设当前在10.10.10.54上操作，输入以下命令scp zhangxy@10.10.0.187:/data/zhan

2022-05-01 20:15:08 2026

原创查看自己是不是root用户

这里提供两种方式① 直接输入id，显示信息，具有root权限的uid gid group 都是0，普通用户并不是② roo个用户后面是#号，普通用户后面是$比如我的就是[student01@login ~]$ 普通用户

2022-05-01 20:09:51 2012

原创无sudo权限，普通用户，安装jdk11

找jdk11的免安装版本到指定文件夹进入~/.bashrc（这个文件夹是用户自己配置环境变量的，/etc/profile是系统环境变量）进行配置，配置4行就行了！（只需要把第一行的JAVA_HOME改成自己的jdk路径就行）export JAVA_HOME=自己的路径/java_env/jdk-11.0.2export JRE_HOME=${JAVA_HOME}/jreexport CLASSPATH=.:${JAVA_HOME}/lib:${JRE_HOME}/libexport PATH=${

2022-05-01 20:08:49 1060

原创 linux上下载的jdk没有jre文件夹，如何生成

有一些程序在运行的时候会需要jre，但是linux上直接免安装方式安装好的jdk中并没有jre文件夹，解决方法：先进入到jdk的bin目录下，然后输入jlink --module-path jmods --add-modules java.desktop --output jre最后把生成的jre文件夹移到上一级目录，即和bin目录同一级...

2022-05-01 20:03:54 3768 1

原创 shell脚本第一行怎么写？

标准的写法是#!/usr/bin/env bash通过/usr/bin/env 运行程序，用户不需要去寻找程序在系统中的位置（因为在不同的系统，命令或程序存放的位置可能不同），只要程序在你的$PATH中；通过/usr/bin/env 运行程序另一个好处是，它会根据你的环境寻找并运行默认的版本，提供灵活性...

2022-05-01 17:36:08 1067

原创 conda、pip、packages等问题

1、conda clean -i / -a这条命令可以清除缓存的packages2、pip install -e .pip install -e . 、pip install . 、python setup.py install 都可以理解为执行setup.py文件3、No module named ‘tensorflow.contrib’降低版本后解决问题import tensorflow.contrib.slim as slimModuleNotFoundError: No module

2022-05-01 10:56:26 1724

原创 python的一些杂七杂八的使用

1、assert的用法，assert之后还可以输出信息这里举个例子，我们可以这样写代码：assert os.path.exists(path_tools), "{}不存在，请将common_tools.py文件放到 {}".format(path_tools, os.path.dirname(path_tools))2、a=[]和a=list()a=[]更快一点。参考import timesta=time.time()for i in range(10000000): a=[]pr

2022-04-30 23:34:33 762

原创 python代码报错汇总

下面列出的问题都是自己在实践过程中遇到并解决的，但是只适合解决我当时的问题，放在有些情况下，可能就不适用啦！1、pickle.load()读取文件错误pickle文件比较不稳定，在读取的时候报错 ‘ascii’ codec can’t decode byte 0xb2 in position 2: ordinal not in range(128)。错误来源有很多种，其中一种可能是编码错误，比如下面这种，改变编码方式：import picklewith open("data\\squeeze_net

2022-04-30 22:50:19 16481

原创 Python实现Leetcode 295 数据流的中位数

原理的话就看东哥的文章吧，这只贴Python代码实现。import heapqclass MedianFinder: def __init__(self): self.min_heap = [] # 梯形, min_heap(存大值), 值不小于三角形里面的，维持min_heap元素个数>=max_heap self.max_heap = [] # 三角形, max_heap(存小值)，值不大于梯形里面的 def addNum(self, n

2022-03-28 19:21:56 174

原创 linux普通用户，putty实现免密登录

亲测有效（1）在putty的安装文件夹下找到puttygen.exe，并且双击打开，点击Generate，同时不断的移动鼠标，生成公钥和私钥文件。公钥就是上面的一长串字符，先自己复制下来，自己存起来，并点击Save private key保存密钥.ppk文件。（2）打开putty，在Connection-Data下面的Auto-login username写上登录名，就是在登录服务器的时候的用户名（3）在SSH-Auth下的Private key file for authentication上传

2021-08-14 14:01:29 1599

原创 LSTM输出输出维度及中间变化（Pytorch版）

最近又回来看LSTM了，是因为并不理解LSTM中的输入输出，以及各个维度的变化都是什么，经过资料收集，发现下面四篇文章综合起来看，理解的最透彻，放上链接：①https://zhuanlan.zhihu.com/p/79064602?ivk_sa=1024320u②https://www.zhihu.com/question/41949741?sort=created③https://blog.youkuaiyun.com/qq_41620823/article/details/103352523④https:/

2021-06-23 13:33:49 3765 1

xiaoxiaoyu290的博客