R1 带来了实用的 Agentic 编程体验

Windsurf 刚推出的时候(24年10-11月份的时候),其 agentic 模式,给人非常惊艳的感觉 ,我当时还写了篇文章:AI辅助编程:Agentic 火,要跟进么?但是考虑到当时的模型真正组合使用工具的能力还不够强(比如windsurf 是通过很多工程努力来完成agentic模式,而不是依赖大模型原生的这个能力的),所以我们当时决定不跟进。

auo-coder.chat 本身提供了 /chat(代码设计,信息获取) /coding(编程) /conf(对软件系统自身的配置) ,项目索引地图以及自动生成命令执行等相关能力,但是这些原子性的能力需要用户自己组合使用的。但我内心深处一直觉得,应该可以上层再加一层,来让 auto-coder.chat 自己来决定如何组合这些原子能力最后完成编码工作。

随着R1和V3的发布,我当时敏感的意识到了中国辅助编程之路已经开启 AI辅助编程, 2025在中国正式起航, 并且整个春节无休快速完成了R1 的整合: 全球第一款内置 Deepseek R1 + V3 组合的AI辅助编程工具来了。但是整个春节期间,一直没有一个稳定的 R1/V3 供应商,导致我们的 agentic 模式用起来并不流畅,直到2月 喧嚣之后,2月份谁是 R1/V3 供应商的王者, 终于有了稳定的供应商,于是我们也能开发和测试我们这个能力了。我们通过 R1 来完成了指令的组合能力(类似cline,但比cline的tool 高阶很多)。

现在给大家看一个推理实例,效果应该是超过 windsurf 之类的agentic 的另外,windsurf 因为agentic最初的设计缺陷,导致现在集成 R1后工作效果非常不好,需要有不少调整。

先给大家一个结论,R1 在 auto-coder.chat 中带来的 agentic 编程体验,已经完全到了“生产”可用阶段。

下面来看,我提了一个需求后,R1 是如何自主使用 auto-coder.chat 提供的指令来完成全流程工作的。

先看需求:

96e16cd9828193853a50c8c9ea6304e3.png

R1 的自动工作流程:

1. 获取整个项目的目录树,查看用户提的文件是否在。因为目录树排除了 .auto-coder 目录,所以他没找到。

2ff1cea7192ac843736990c0feb00d0b.jpeg

2. 接着他没放弃,通过文件名来查找,得到了文件列表

10cbdc22af422d9abb66b8f7b508f45a.jpeg

3. 自动选择了最匹配的那个,然后打开查看前面十行,发现确实是我描述的那样。

946d20e137ac0b27174a5eafbdfb3e24.jpeg

4. 调用coding 进行编程,并且根据他已经获得的信息,重新改写了我的需求然后调用了 coding 执行编程动作

b2bb33a52ab79430ab21e3be754d6353.jpeg

5. 现在开始执行编程

63ee4c00760800ebd5a2ff633eeecc5a.jpeg

6. 代码完成合并

ef94df10f1175510dee648632da5b334.jpeg

7.  会查看修改前后的代码,确定是否满足需求,这里他觉得满足了,所以停止运行。

cb6cab98a6500875afa1c369f63ef32d.jpeg

如果多尝试几次,你会发现类似的需求,推理流程实际发生会发生变化,但基本都能解决最后的问题。

比如有的时候他会找到多个文件(当然,这里主要是因为我只提供过了index.json, 然后确实存在多个同名的文件)他会主动寻求用户帮助:

ea1bb3289230d465db4506e236c6894a.png

此外,R1 的意图猜测能力也足够强,能够非常好的自主选择非编程类的任务的响应。

比如问一个项目是干嘛的(远比我以前实现的/ask 效果好,/ask于 软模拟cot 实现的)他会自主读取目录结构,然后尝试查看README, 以及相关的代码文件,最后给出项目描述:

956d66133cf963fe5c82cdfd505015c8.png

ca5b2f0dbfec2e06feb2d4502badc2f6.png

然后你还可以让他帮助你完成auto-coder.chat的配置:

3e6203a7fea4251e92f9043f7cb43d6a.png

9cf5bbb364c46693510a1de0bb4662a6.png

或者询问他问题,他会自动选择 chat 指令来和你交互:

4c45b97a3976d0d99b4c6e9857905d71.png

12080758a929944a07871d1b32a9995a.png

或者让他帮检查端口,启动应用等等各种繁琐的事情:

b20942c46354ad8f30d6886922486058.png

b1e126796998a8dedbf56f6f3cfed8f9.png

136605261904fff295e7472bc6778e2a.png

另外,得到为空,他还会交叉验证,此时你喊停止就可以:

e41339f3c267b1a15923b058f98e33ce.png

最后的结论: R1 带来的Agentic 编程体验已经相当于可以“量产”了。大家可以使用 auto-coder.chat 体验和复现。

https://uelng8wukz.feishu.cn/wiki/NhPNwSRcWimKFIkQINIckloBncI?fromScene=spaceOverview

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值