自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(192)
  • 收藏
  • 关注

原创 【个人成长】《代码的艺术》视频分享合集

这个系列是对《代码的艺术》真本书的一个视频分享,主要是希望通过聊天的方式和大家沟通一些关于软件工程能力上的问题,视频没有在优快云,主要在B站上面,这里当做一个目录。

2022-11-23 01:14:21 314

原创 【AI】Vibe Working: AI Coding 的“隐形杠杆”(个人版)

在 AI Coding ,真正拉开开发者效率差距的,往往不是谁用了 Cursor、谁用了 Copilot,而是谁更拥抱和更懂得怎么和 AI “对上频道”。

2025-10-27 07:17:03 927

原创 【AI】Vibe Working:重新思考 AI Coding

AI Coding从个人工具到团队协作的系统性转变。作者基于85%的AI开发实践,指出效能核心在于思维转变(50%)和协作机制(20%),而非单纯技术。团队复盘中暴露的流程问题(如规范对齐、重复任务处理)揭示AI产研的瓶颈在于组织方式,需通过制定AI操作指南、Prompt资产化等"隐形杠杆"重构工作流。未来将探索产品、测试等环节的AI化,推动从"管理AI"到"领导AI"的角色升级,并邀请读者共同探讨人与AI的协作边界。 关键词:

2025-10-27 07:16:03 1045

原创 【AI】AI评测入门(五):Evaluation 跑起来

我们将把这些 dataset, prompt,evaluator 结合起来,通过一次完整的 **Experiment(实验)**,让你能直观地**评估 (Evaluate)** 模型表现,完成从理论到实践的闭环。

2025-10-21 20:48:36 894

原创 【AI】学不完的AI:省成本不只切换模型,还有 Prompt Caching

Prompt caching(提示词缓存)是大语言模型 API 中一项重要的优化功能。当你重复使用相同或相似的提示词时,缓存机制可以显著降低成本和延迟。尤其在考虑成本的时候,不应只看模型的 input 和 output 价格,cache 对成本影响也很大,有的模型可以到第一次成本的 10%。

2025-10-21 20:36:54 714

原创 【AI】学不完的AI:想了下还是得学 Prompt Engineering

Prompt Engineering 的精髓在于“工程化”:把技巧转化为模板、组件,并嵌入 Agent 工作流。通过迭代优化和实际应用,你的输出将越来越可靠、高效。记住,好的 Prompt 不是猜出来的,而是设计出来的——从简单开始,逐步复杂化,提示词的效果终会事半功倍。

2025-10-15 08:45:04 950

原创 AI-Native 能力反思(三):Prompt Engineering 自我提升神器

说实话,刚开始学习 Prompt Engineering 的时候,我以为这只是跟技术有关,不过通过文档字里行间的描述,以及结合平时工作用 AI 的思考。

2025-10-15 08:43:51 583

原创 【AI】专访 Braintrust CEO Ankur Goyal:为什么 AI 评测是产品 prototype 走向生产的唯一桥梁?

今天看了 Founder Mode 频道跟 Braintrust CEO Ankur Goyal 的播客视频,讨论了 AI prototype 投入生产的挑战,以及讨论了 AI 评测在这个过程中的重要性。

2025-10-07 21:37:21 761

原创 【AI超级个体】AI-Native 能力思考(二):从“方案提供者”到“成果交付者”

摘要: 哈佛大学研究指出,AI正引发"偏向资深者的技术变革",初阶岗位需求减少而资深岗位持续增长。在AI能高效生成方案后,资深者的核心价值在于成果交付力:将理想方案转化为实际成果的"最后一公里"。这包括处理架构隐患、协调团队资源、应对突发情况等AI无法完成的任务。AI可以产出"功能",但资深者交付的是稳定可靠的"产品"并承担最终责任。定义问题与交付成果的能力构成AI时代人才的价值闭环,这种"成事"能力将长期稀

2025-10-07 21:36:10 539

原创 【AI】大模型的分析力横评:一次“伪异步”排查后的真实思考

本文通过一个前后端异步调用不匹配的案例,测试了多款大模型的分析能力。问题表现为前端采用异步轮询设计,而后端实际是同步阻塞实现。测试结果显示:GPT-5和Grok-4准确抓住了问题本质,给出了完整解决方案;Claude 3.7虽然简洁但切中要害;而Claude 4.0和Gemini 2.5则因经验套用导致分析偏差。

2025-09-28 23:58:28 924

原创 【AI超级个体】Cursor Meetup 厦门站,不要 vibe coding,而要 vibe working

参加 Cursor Meetup 厦门站,我原以为只是学点 AI 编程技巧,却意外意识到:真正的价值不在“vibe coding”,而在“vibe working”——用规范管理 AI、重构工作流、解决真实问题。无论是教育、开发还是内容创作,AI 都不是替代者,而是协作者。关键不是会不会用 AI 写代码,而是能否扎扎实实落地实践,把 AI 融入自己的工作范式。

2025-09-28 13:40:24 999

原创 【AI超级个体】AI时代先学会问好问题

AI时代最稀缺的不是答案,而是"好问题"。两派观点争论模型是否等于产品,实则揭示了人类在AI时代的独特价值。模型虽能快速吸收复杂性,但定义问题、设计验证路径、外化需求等核心工作仍需人类完成。真正的产品力来自清晰的问题界定、严谨的集成和可量化的验证。AI工程师的关键能力在于将模糊需求转化为可执行的规范,通过持续观察和迭代来优化模型表现。面对技术焦虑,我们应专注提升"提问能力"——学会定义问题、设定标准、搭建流程,这些人类特有的判断力和理解力,才是AI无法替代的核心竞争力

2025-09-22 23:59:38 368

原创 【AI】DeepResearch 与 DeerFlow 的比较分析报告-初探DeepResearch

本文粗浅对比了阿里巴巴的Tongyi DeepResearch和字节跳动的DeerFlow两大深度研究代理框架。

2025-09-22 10:29:40 676

原创 【AI】AI评测入门(四):Evaluator Prompt拆解

对langfuse evaluator 的 prompt 做深度拆解分析,形成对自己自定义 evaluator 的洞察

2025-09-16 22:54:27 876

原创 【AI】AI评测入门(三):有什么评估器(Evaluator)-langfuse版

本文主要描述了langfuse上的评估器,讨论了评估器适合的不同场景,从单一评估器到组合评估器

2025-09-16 22:50:56 1270

原创 【Agent】DeerFlow Researcher:系统架构与执行流程(基于真实 Trace 深度解析)

本文档基于 researcher 阶段 Trace(包括 `continue_to_running_research_team_trace.json`、`research_team_trace.json`、`reporter_trace.json`、`reporter_chatOpenAI_trace.json`),系统分析 DeerFlow 在 research 执行阶段的架构、消息编排、工具链与调度闭环,并结合实际耗时/令牌特征提出优化建议。面向工程实现与运维调优读者。

2025-09-09 23:59:35 1110

原创 【Agent】DeerFlow Planner:执行流程与架构设计(基于真实 Trace 深度解析)

本文档系统阐述 DeerFlow 中 Planner 的职责边界、端到端执行流程、关键节点设计、数据结构、容错与人审机制,以及与研究/编码子代理的协同方式。面向开发与运维读者,帮助快速理解与调优 Planner 相关链路。

2025-09-09 23:57:46 1033

原创 【AI】AI 评测入门(二):Prompt 迭代实战从“能跑通”到“能落地”

摘要:本文分享了Prompt工程从初版到落地的5次迭代过程,强调"Prompt是测出来的,不是写出来的"核心理念。作者以"产品评价打标签"功能为例,展示如何通过测试发现问题、优化Prompt,重点关注可调试性而非完美结构。文章详细记录了v0.0.1版本的生成过程(利用元提示词+标签体系)、关键问题(情绪判断粗糙/标签匹配不全等)及修正方案,并强调数据质量校验的重要性。每个版本改进都基于测试反馈,最终目标是实现可评测、可调试、可工程化的Prompt解决方案。

2025-09-08 15:03:36 966

原创 【AI】AI评测入门(一):先搞懂你的数据集

摘要: 本文探讨了AI评测项目中数据集的关键作用,强调“输入决定输出”的核心逻辑。作者将数据集分为三部分: 知识库(标签体系)——需人工审查确保结构清晰,避免模型幻觉; 自测数据集——用于探索Prompt边界,需覆盖真实场景的多样性; 评测数据集——聚焦发现模型缺陷,需保留基准数据防止“简单错误”。 文章指出,高质量的数据集比Prompt设计更基础,并演示了如何用Langfuse结构化导入数据。最终结论:理解输入是控制输出的前提,为后续Prompt优化和评测奠定基础。 (字数:149)

2025-09-08 14:57:36 614

原创 AI 评测 (AI Evaluation):AI 可靠性的基石

《AI评测:从猜测到工程的必由之路》摘要:硅谷技术领袖指出AI评测正成为核心竞争力,传统软件工程的确定性开发范式已无法适应AI时代的概率性系统。文章对比传统开发与LLM开发的本质差异,提出完整的AI评测体系应由数据集、成功标准和评分机制三要素构成,形成分析-量化-优化的闭环。强调应将评测视为基础设施而非工具,建立"评测派对"等团队文化,通过持续发现失败模式推动进步。作者建议立即采取四步行动,指出真正的护城河在于评测驱动开发(EDD)带来的高效反馈循环。(149字)

2025-08-22 08:40:10 618

原创 【AI】DeepWiki 页面转换成 Markdown 保存 - Chrome 扩展

个人比较喜欢整理项目架构,更多都是保存成 markdown 的格式保存,然后发博客。deepwiki 刚好把 github 仓库代码的架构输出出来了,不过没有办法下载成 markdown 格式,用于记录或者修改。所以为了解决这个问题,我开发了一个 Chrome 扩展,可以自动将 DeepWiki 页面转换为 Markdown 格式。这个插件,可以只转换单页,也可以把整个项目的项目架构文

2025-05-08 20:26:37 1508

原创 【Go】优化文件下载处理:从多级复制到零拷贝流式处理

通过这次优化,我们将文件下载处理从一个简单但效率低下的实现,改进为一个高效的零拷贝流式处理方案。这种模式不仅适用于音频文件下载,也适用于各种网络资源获取场景。使用流式处理避免不必要的内存使用利用已知大小信息进行资源预分配和限制减少IO操作次数,直接从网络流写入文件完善错误处理和资源管理这些优化技巧可以广泛应用于各种需要处理大型网络资源的场景,显著提高系统的性能和可靠性。

2025-05-08 20:23:22 545

原创 【Git】拉取github上某个Pull Request分支的代码

从github上拉取pr分支代码

2025-03-20 15:49:20 1144

原创 【Agent】OpenManus-Flow-PlanningFlow设计分析

openManus Flow 组件的 PlanningFlow详细设计

2025-03-17 23:27:07 1022

原创 【Agent】OpenManus-Flow-BaseFlow详细分析

openManus Flow 组件的 BaseFlow 详细分析

2025-03-17 23:25:33 1279

原创 【Agent】OpenManus-Flow组件详细分析

openManus 中 Flow组件的详细分析

2025-03-16 23:47:38 1296

原创 【Agent】OpenManus-Prompt组件详细分析

openManus Prompt组件的详细分析

2025-03-16 23:45:43 2816

原创 【Agent】OpenManus-Tool 详细分析

openManus Tool 组件的详细分析

2025-03-16 23:44:32 1118

原创 【Agent】OpenManus-Agent-实现具体的智能体

openManus agent 具体实现agent的详细分析

2025-03-16 23:42:19 1112

原创 【Agent】OpenManus-Agent-ToolCallAgent详细分析

openManus agent组件里面 ToolCallAgent 的详细分析

2025-03-16 23:40:51 1886

原创 【Agent】OpenManus-Agent-ReActAgent详细分析

openManus 的 agent 组件的 ReActAgent 设计分析

2025-03-16 23:35:43 782

原创 【Agent】OpenManus-Agent-Memory详细设计

openManus agent组件内 Memory 的详细设计

2025-03-16 23:34:12 1230

原创 【Agent】OpenManus-Agent-BaseAgent详细分析

openManus agent组件 里面 baseAgent的详细分析

2025-03-16 23:32:52 1321

原创 【Agent】OpenManus-Agent架构详细分析

openManus agent 组件的详细分析

2025-03-16 23:27:57 2086

原创 【Agent】OpenManus 项目架构分析

OpenManus 是一个基于大语言模型的智能体框架,旨在提供一个无需邀请码的创意实现平台。项目由 MetaGPT 社区的贡献者开发,采用 Python 语言实现。

2025-03-16 23:25:25 921

原创 【Linux】查询服务器应用内存使用情况占比

linux指令查询服务器内存占用情况

2025-03-13 10:23:55 827

原创 【Agent】windows 复现 owl

windows下复现agent owl的效果

2025-03-11 10:10:43 1415

原创 【python】修改 python pip install 镜像源

pip修改镜像源

2025-03-11 10:06:25 599

原创 【Agent】Windows 和 CentOS 安装 Conda

windows和centos安装conda

2025-03-11 10:05:58 929

原创 【Agent】owl 案例-分析宁德时代的投资价值

owl案例,“分析宁德时代的投资价值”,完整输出

2025-03-11 10:04:18 1283

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除