- 博客(42)
- 资源 (3)
- 收藏
- 关注
原创 大白话带你玩转大模型 Agent:一文带你看懂思维链提示 (Chain of Thought)
你有没有过这样的经历?问 AI 一个稍微复杂点的问题,比如 "小明有 3 个苹果,妈妈又买了两袋,每袋 4 个,现在一共有几个?",它可能会直接甩给你一个 "11 个",但你压根不知道它是怎么算的 —— 万一算错了呢?更头疼的是那种需要逻辑推理的问题,比如 "为什么夏天白天比冬天长?",AI 的回答常常像一团浆糊,让人摸不着头脑。今天咱们就来聊聊怎么让 AI 变得更 "靠谱"—— 没错,就是思维链提示(Chain of Thought,简称 CoT) 这项黑科技。
2025-08-20 09:08:51
583
原创 大白话带你玩转大模型 Agent:一文带你看懂提示工程 (Prompt Engineering)
你说的话,AI 真的懂吗?当你对着 Siri 说 “今天天气怎么样”,对着 ChatGPT 喊 “写篇周末游记” 时,你可能没意识到 —— 你已经在玩 “提示工程” 了!提示工程(Prompt Engineering) 就是教你怎么跟 AI “好好说话” 的学问。别以为这是程序员的专利 —— 根据 Google 2024 年的研究,掌握基础提示技巧能让 AI 输出质量提升 30% 提示工程(Prompt Engineering) 就是教你怎么跟 AI “好好说话” 的学问。别以为这是程序员的专利 ——
2025-08-19 09:21:59
746
原创 大白话带你玩转大模型 Agent:一文带你看懂 Docker
本文介绍了容器技术的起源、原理及Docker的应用。容器技术解决了传统开发中环境重复搭建、资源浪费等问题,通过轻量级隔离实现应用的高效部署。与虚拟机相比,容器共享操作系统内核,启动更快且占用资源更少。Docker作为主流容器实现工具,采用CS架构,通过Dockerfile构建镜像(image)并运行容器(container)。其底层依赖Linux的NameSpace实现资源隔离、Control groups控制资源使用。Docker实现了"一次构建,到处运行",显著提升了应用部署效率。
2025-08-19 09:21:33
1019
原创 大白话带你玩转大模型 Agent:一文带你看懂 ReAct 范式
如果你用过智能助手,可能遇到过这种情况:问它 “今天北京的 PM2.5 是多少,适合户外运动吗?”,它可能瞎编一个数字,或者直接说 “适合”—— 因为它既不会查实时数据,也不会结合数据推理。但如果用了ReAct 范式,AI 就会像个靠谱的助理:先想 “我需要查北京今天的 PM2.5 数据”,然后调用天气 API,拿到数据后再分析 “数值大于 100,不适合户外运动”。今天咱们就用大白话聊聊,这个让 AI 变聪明的 ReAct 范式到底是啥。
2025-08-18 09:52:11
1231
原创 大白话带你玩转大模型 Agent :一文带你看懂预训练
如果有一天,你对着 Siri 说 “给我整碗酸辣粉,多加醋”,它能精准听懂你的方言 + 需求,可别惊讶 —— 这背后藏着大模型 “上学” 的第一步:预训练。就像人类要先学拼音识字才能写文章,AI 要想 “聪明”,也得先经过这场 “基础教育”。今天咱们就用大白话,聊聊预训练到底是怎么回事。
2025-08-18 09:27:47
844
原创 大模型 Agent 小白入门:一文带你看懂 Function Calling
想象一下:你问智能音箱 "今天北京的 PM2.5 是多少",它愣了一下,然后说 "我这就帮你查一下",过了几秒告诉你具体数值。这背后,可能就是 Function Calling 在悄悄工作。如果把大模型比作一个聪明的秘书,那 Function Calling 就像是给秘书配了一部电话 —— 遇到自己不知道的事情,它可以打电话给气象局、查日历、甚至调监控,而不是瞎猜或说 "我不知道"。今天咱们就用大白话,聊聊这个让 AI 从 "纸上谈兵" 变成 "实干家" 的神奇技术 —Function Calling
2025-08-15 09:12:20
873
原创 大模型 Agent 小白入门:一文带你看懂模型微调
你有没有发现,通用大模型有时候像个 "啥都懂但啥都不精" 的万金油?比如你让它分析公司财报,它可能把 "毛利率" 和 "净利率" 搞混;让它写法律文书,它引用的法条可能早就失效了。这就像让一个刚毕业的大学生直接去当心脏外科医生 —— 基础知识是有,但缺了点专业训练。而 "模型微调" 技术,就是给 AI 上的 "专业培训班",让它从 "啥都知道一点" 变成 "某领域专家"。今天咱们就用大白话,聊聊这个能让 AI"深造镀金" 的神奇技术,看完你就知道为什么银行的 AI 能精准识别诈骗合同。
2025-08-15 09:11:48
929
原创 大模型 Agent 小白入门:一文带你看懂 RAG
RAG,全称 "检索增强生成"(Retrieval Augmented Generation),听着挺唬人,其实本质很简单:让 AI 在回答问题前,先去查一查相关的资料,再基于资料作答。就这么一个小改动,能让 AI 的靠谱程度飙升 —— 香港大学的研究显示,在药物禁忌查询任务中,用了 RAG 的 GPT-4 准确率从 49% 暴涨到 94%。
2025-08-14 09:48:04
484
原创 大模型 Agent 小白入门:一文带你看懂大模型背后的功臣 RLHF
你有没有过这样的经历?跟智能音箱说 "放点轻松的音乐",它给你播了死亡重金属;问 ChatGPT"怎么哄女朋友开心",它一本正经地建议 "可以探讨量子物理的浪漫之处"。这时候你肯定会想:这 AI 是聪明,但咋就这么不懂事呢?别急,科学家们早就发现了这个问题,还发明了一套专门 "调教"AI 的方法 ——RLHF。简单说,就是给 AI 请个 "家教",让它不仅聪明,还懂人情世故,知道什么话该说,什么话不该说,什么话得说得漂亮。今天咱们就用大白话,聊聊这个让 AI 从 "理工直男" 变成
2025-08-14 09:36:30
770
原创 AIGC 小白入门:为什么 AI 画不好手?
你有没有发现一个神奇的现象:AI 能画出栩栩如生的星空、以假乱真的人像,甚至能创作出让艺术家都惊叹的超现实画作,但唯独画手时,总会暴露智商 —— 要么多出几根手指变成 "六指琴魔",要么关节扭曲得像外星生物,要么拇指长到能摸到后脑勺。就像某些网友吐槽的:"永远不要问一个女人的年龄,以及 AI 为什么画不好手。"今天咱们就来聊聊:为什么在 AI 眼里,画手比画宇宙还难?这个让 AI"折戟沉沙" 的小难题,背后藏着哪些大秘密?
2025-08-13 13:35:33
550
原创 大模型 Agent 小白入门:一文带你看懂模型蒸馏
模型蒸馏:让AI"瘦身不缩水"的智能瘦身术随着大模型参数突破万亿级,其"重量级"特性带来了高成本、大体积和慢响应等问题。模型蒸馏技术应运而生,它通过知识迁移,将大模型的能力"浓缩"到小模型中。这项技术让AI像"健身教练"指导学员一样,通过软标签(概率分布)而非硬标签传递知识,使蒸馏后的模型既能保留大模型90%以上的性能,又能将内存占用减少90%、推理速度提升6-10倍。
2025-08-13 09:39:31
834
原创 大模型 Agent 小白入门:一文带你看懂 LangChain
LangChain是大模型应用开发的"超级工具箱",能将单一AI转化为多功能助手。它通过六大核心组件实现:1)模型选择自由切换;2)提示模板规范提问;3)记忆功能留存对话历史;4)索引系统整合本地数据;5)任务链自动串联操作步骤;6)代理功能实现自主决策。应用场景包括个性化健康顾问、智能周报生成器和自适应教育助手等。2024年已有超10万个应用基于LangChain开发,其可视化界面让非技术人员也能通过拖拽快速搭建AI工具。
2025-08-13 09:37:28
553
原创 Syzkaller实战教程12: 手把手带你复现顶会SyzVegas
本文将手把手带读者复现Syzvegas并解决复现过程中常见的问题。SyzVegas 是一个基于覆盖引导,能够对内核进行 fuzz 的灰盒测试工具。它提出了一种新的方法,通过引入强化学习技术来提升Syzkaller——一种流行的内核模糊测试工具的有效性。
2025-08-12 18:14:33
1538
原创 大模型 Agent 小白入门:一文带你看懂具身智能
想象一个场景:你加班到深夜,拖着疲惫的身体回家,刚打开门,就看到家里的机器人 "小具" 已经热好了牛奶,还把你乱扔的拖鞋摆得整整齐齐。它看到你皱眉,还会歪着头问:"主人好像很累?需要我给你捶捶背吗?"这不是科幻片里的情节,而是 "具身智能" 想实现的日常。如果把 AI 分成两类:一类是 "纸上谈兵派",比如 ChatGPT,能和你聊天说地但连杯水都递不了;另一类就是 "行动派"—— 具身智能,它们有物理 "身体"(可能是机器人、智能车,甚至是带机械臂的设备),能摸、能看、能动手,把智能从虚拟世界拽进了现。
2025-08-12 15:49:13
1029
原创 Syzkaller实战教程11: strace捕获种子及syzkaller适配演示
Strace是Linux系统中强大的诊断调试工具,可追踪程序系统调用。它能在无源码情况下定位问题,适用于程序运行失败、系统调用过程查看等场景。常用参数包括:-c统计调用信息、-f跟踪子进程、-e指定跟踪类型(如文件、网络等)。实践案例展示了如何通过"strace -e trace=open"命令发现域名解析失败是因libnss_dns.so.2文件缺失所致,通过重装glibc-devel包解决问题。该工具为系统运维提供了有效的故障排查手段。
2025-08-11 10:25:02
1433
原创 大模型Agent小白入门:一文带你看懂Agent开发的核心—— MCP 协议
MCP协议:智能时代的"万能翻译官"MCP协议(ModelContextProtocol)是Anthropic公司推出的智能体通信标准,旨在解决不同智能设备间的"语言不通"问题。该协议采用客户端-服务器架构,通过动态灵活的交互方式,让智能家居、自动驾驶等设备能像联合国代表一样顺畅交流。
2025-08-11 10:18:17
628
原创 Syzkaller实战教程10: MoonShine复现&Trace2syz功能演示
Moonshine是哥伦比亚大学团队开发的Syzkaller改进项目,通过静态分析系统调用依赖关系,提炼出高效测试种子以提升内核模糊测试效率。核心功能包括:1)从280万系统调用中精炼出1.4万个关键调用,保留86%覆盖率;2)使Linux内核覆盖率平均提升13%,发现17个新漏洞;3)采用Go语言开发,依赖Ragel和Goyacc进行数据解析。复现环境需配置Ubuntu 20.04、Go 1.11.13及特定版本Syzkaller,通过strace采集系统调用跟踪后,使用moonshine工具链进行种子蒸
2025-08-07 16:20:48
901
原创 Syzkaller实战教程9: 获取种子的AST-Like格式
本文详细解析了Syzkaller模糊测试工具的核心数据结构AST-Like格式及其转换流程。首先介绍了Syzkaller定义的Prog、Call和Arg三种结构体,它们分别表示程序整体、系统调用和参数。然后阐述了Trace2syz工具将strace日志转换为Syzkaller程序的步骤,包括系统调用转换、参数处理和内存分配等关键环节。重点分析了syz-db工具对corpus.db的解包过程及其输出的五种格式:人类可读的文本格式(txt)、结构化JSON格式、内部表示格式(TXT)、统计信息(target)
2025-08-07 16:06:23
957
原创 Syzkaller实战教程8:25年最新版本Syzkaller核心代码解读
本文分模块解读了syzkaller-25年最新版本代码的功能,对于初学者了解syzkaller的底层实现原理具有重要作用。以下是其核心功能的摘要: 程序表示与执行使用AST-LIKE结构描述系统调用序列(prog.go) 序列化为不可逆二进制格式(encodingexec.go)供executor执行 executor.cc负责实际执行并捕获崩溃和覆盖率 测试程序管理 corpus.go存储程序集合,包含信号和覆盖率信息种子程序管理(seed.go)和数据库操作(corpus.go)等。
2025-08-06 10:20:03
1334
原创 Syzkaller实战教程7:手动采集代码覆盖率并使用
本文详细解析了syzkaller代码覆盖率收集的完整流程,介绍了关键数据结构,并通过实例演示了如何手动收集和使用覆盖率数据。掌握这些知识,有助于开发者和安全研究人员更深入地理解syzkaller的工作原理,读者可以亲自上手依据自己的思路改造syzkaller达成默认框架无法实现的效果,以验证idea的可行性。
2025-08-06 09:18:24
869
原创 Syzkaller实战教程6:[重要]初始种子加载机制剖析第二集
摘要:本文深入分析了新版syzkaller模糊测试工具的多队列任务调度机制。其核心execQueues结构包含四个优先级队列:triageCandidateQueue(高优候选程序分析)、candidateQueue(普通候选程序)、triageQueue(信号分析)和smashQueue(暴力变异)。初始种子通过AddCandidates加载到candidateQueue,执行发现新信号后转入triageCandidateQueue分析确认。
2025-08-01 21:15:12
781
原创 Syzkaller实战教程5: 初始种子加载机制剖析第一集
本文分析了Syzkaller模糊测试工具在不同版本的初始种子加载机制。25年新版本通过corpus.db加载种子后,经过稳定的优先级排序,使短程序优先执行;而旧版本通过workQueue管理候选种子。文章详细解析了manager.go、corpus.go、prio.go和seed.go等核心模块的功能,包括语料库管理、优先级调度和种子加载流程。特别比较了内存工作集和持久化corpus的区别,指出运行时的模糊测试主要基于内存中的验证种子。
2025-08-01 10:30:51
1154
原创 Syzkaller实战教程4:用官方神器Syzbot收集高价值POC
本文介绍了syzbot自动化内核模糊测试系统及其POC生成机制。syzbot是基于Google开发的syzkaller工具,能持续测试Linux内核各分支,自动报告crash并跟踪修复状态。系统通过虚拟机实例运行测试,提供详细的错误报告,包括调用栈、寄存器状态等信息,并生成精简的POC(概念验证)代码。POC在漏洞验证、定位和修复中起关键作用,具有精简性、可复现性和针对性等特点。
2025-07-31 19:57:57
1410
1
原创 Syzkaller实战教程3: [重要]挖掘你的第一个0day漏洞
本文介绍了Syzkaller内核模糊测试工具的使用流程,主要包括三部分内容:1. 测试内核的更新与配置方法,从内核下载、编译配置到常见错误处理;2. crash结果分类流程,指导如何收集和验证潜在0day漏洞;3. crash复现技术,详细说明如何使用syz-repro工具生成复现程序,并通过syz-execprog进行验证。文章提供了完整的配置参数、实用脚本和常见问题解决方案,涵盖了从环境搭建到漏洞验证的全过程,为内核模糊测试工作提供了系统的技术参考。
2025-07-31 19:33:17
957
原创 Syzkaller实战教程2:运行环境配置+实例运行
本文详细介绍了在linux系统上搭建Syzkaller内核模糊测试环境的完整流程。 1.环境配置:通过VMware创建Ubuntu20.04虚拟机A,配置QEMU/KVM虚拟化环境,安装Go语言工具链和Syzkaller;2.内核编译:下载Linux内核源码并配置KCOV等调试选项,编译生成带覆盖率支持的bzImage内核镜像;3.测试环境构建:使用debootstrap创建Debian虚拟机镜像,通过QEMU启动嵌套虚拟机B; 实例测试:4.演示两种测试场景 - 提供完整上手教程
2025-07-30 22:12:56
1164
原创 Syzkaller实战教程1:核心概念及运行机制剖析
本专栏实战教程旨在帮助读者系统性地学习Syzkaller模糊测试框架,从基础概念到实际应用,逐步掌握漏洞挖掘的核心技能。通过本教程的学习,读者将能够深入理解Syzkaller的工作原理,并具备独立开展漏洞挖掘的能力。作为教程的第一篇博客,本文详细介绍了Syzkaller的基础概念及工作机制,并对主要功能源码和许多易混淆的概念进行了具体分析,对于读者理解Syzkaller具有重要意义。
2025-07-30 21:54:38
1583
1
原创 基于seq2seq的机器翻译系统
本文介绍了seq2seq模型的原理,并基于seq2seq构建了一个机器翻译系统,通过代码和注释对seq2seq的实际应用进行了较为详尽的分析,对于transformer和LSTM的学习皆有一定帮助,可供读者参考。
2022-10-02 16:15:13
2285
2
原创 PySimpleGUI库创建python代码的图形窗口
本文介绍了针对python代码创建图形交互窗口的一种常用库PySimpleGUI,通过代码和实例进行了讲解
2022-10-02 16:02:49
2374
原创 Transformer模型入门详解及代码实现
本文对Transformer模型的基本原理做了入门级的介绍,意在为读者描述整体思路,而并非拘泥于细微处的原理剖析,并附上了基于PYTORCH实现的Transformer模型代码及详细讲解。
2022-08-26 12:04:42
17265
2
原创 电影知识图谱和基于模板的问答系统构建
参考目前网络上开源的医疗问答系统等项目,对基于neo4j的知识图谱构建及基于人为指定模板的问答系统构建进行了整理,笔者对代码进行了较为详尽的注释,供读者参考。
2022-07-16 09:50:57
2891
3
原创 conda install 和 pip install的区别
conda和pip一般被认为是几乎相同的,但这两个工具虽然功能存在部分重叠,但其设计的目的是不同的。
2022-07-03 20:47:02
10689
原创 anaconda创建虚拟环境及jupyter使用者的注意事项
网上已经有了许多关于anaconda创建虚拟环境的教程,笔者在整理了相关内容后,增加了jupyter使用者在创建虚拟环境后,无法找到新创建虚拟环境的解决方案。
2022-07-03 20:42:51
1222
1
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅