老邪Java从小白到入职私房课

最新推荐文章于 2025-08-15 08:27:29 发布

原创最新推荐文章于 2025-08-15 08:27:29 发布 · 354 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#python #java #php #c++ #c语言

文章探讨了大规模语言模型如何改变软件创建、分发和交互方式，关注点包括交互模型的选择、用户如何表达意图、软件定制的新方法、模糊翻译器的可能性以及用户授权问题。作者指出，虽然聊天机器人如ChatGPT在某些场景下强大，但图形用户界面仍有其价值。语言模型可能帮助打破编程瓶颈，实现更广泛的用户编程，但用户界面设计依然重要。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

download：老邪Java从小白到入职私房课

大规模语言模型+可延展软件
接下来，将深入探讨大语言模型可能为软件创建和分发带来的广泛变化，而且还会影响到人们与软件交互的方式。讨论的问题包括：

交互模型：哪种交互模型适合哪些任务？人们什么时候需要聊天机器人、一次性脚本或自定义的一次性 GUI？

软件定制：大规模语言模型如何实现可由用户拆分、重组和扩展的可延展软件？

意图规范：最终用户将如何与大规模语言模型交互，表达自己的意图？

模糊翻译器：大规模语言模型如何实现以前不可能实现的共享数据基础？

用户授权：我们应该如何看待大规模语言模型时代的授权和代理与授权和自动化？

聊天机器人应该何时使用？
在大规模语言模型时代用户交互模型将如何进化？特别是，聊天机器人可能会接管哪些类型的任务？当我们考虑用不同的方式来武装最终用户时，这个问题的答案会特别重要。

我认为，虽然 ChatGPT 比 Siri 更强大，但聊天 UI 无法很好地完成许多任务，我们仍然需要图形用户界面。之后会讨论利用大规模语言模型帮助我们构建 UI 的混合交互模型。

最终，我们将达成一种有趣的设计：开放式计算媒体，用户可以直接学习和建立模型，大规模语言模型将作为媒体内的合作伙伴。

在深入展开讨论之前，首先声明：本文探讨的很多观点都源自个人的猜测，具有很大的不确定性。我甚至无法预测这些变化什么时候会出现。重点是，想象如何根据当前 AI 的发展状况，推断用户与计算机的新型交互，以及我们如何利用这项新技术来最大限度地加强最终用户的能力。

打破编程瓶颈
为什么大规模语言模型关系到普通用户使用计算机的能力？

几十年来，计算先驱们一直在努力实现最终用户编程的愿景：普通人也可以充分利用计算机，而不仅仅是使用程序员给他们的预制应用程序。Alan Kay 曾在1984 年写道：“我们希望像以前编辑文档一样编辑我们的工具。”

这个理念有很多表现形式。现代终端用户也或多或少地接触过编程系统，包括电子表格、Airtable、Glide 或 iOS 快捷方式，以及早期的 HyperCard、Smalltalk 和 Yahoo Pipes。

尽管其中一些产品取得了成功，但现在它们也面临一个基本难题的限制：帮助人们将粗略的想法转化为正式的可执行代码，这一步非常难。系统设计者尝试过超高级语言、友好的可视化编辑器和更好的语法、复杂性分层以及根据示例自动生成简单的代码。但事实证明，使用这些技术很难突破一定的复杂性上限。

我自己在工作中就遇到过编程瓶颈。几年前，我开发了一个名为 Wildcard 的最终用户编程系统，用户可以通过电子表格界面自定义网站。例如，在下面这个简短的演示中，你可以看到用户按照不同的顺序对 Hacker News 上的文章进行排序，然后将阅读时间添加到页面的文章中，这一切都是通过网页与电子表格的同步化实现的。

这个演示看上去很不错，对吧？

然而仔细观察，就会发现这个系统有两个略显尴尬的编程瓶颈。首先，用户必须能够编写小型电子表格公式来表达计算。虽然难度远小于学习一门成熟的编程语言，但对于新手用户来说依然是一个障碍。其次，在背后，Wildcard 需要特定于站点的抓取代码，才能将电子表格连接到网站。理论上，这些代码可以由开发人员编写和维护，并在最终用户社区中共享，但这需要付出巨大的努力。

如今有了大规模语言模型，这些编程瓶颈就不再是限制因素了。将自然语言规范转化为网络抓取代码或者是电子表格公式正是目前大规模语言模型可以实现的代码生成过程。我们可以想象，让大规模语言模型帮忙抓取代码和生成公式，这样就无需任何人手动编写代码即可实现上述演示。在我做 Wildcard 的时候，这种的程序生成还只是一个幻想，而如今正在迅速变成现实。

不过，这个例子也提出了一个更深层次的问题。如果让大规模语言模型为我们修改网站，那又何必使用 Wildcard UI 呢？难道我们不能让 ChatGPT 重新排序网站并添加阅读时间吗？

我认为这个问题的答案尚不明朗。将电子表格视为网站基础数据的另一种视图具有很大的价值，我们可以直接查看和操作这些数据。点击列的标题即可让表格中的数据按顺序排列感觉很好，而且比输入“按列 X 排序”更快。允许用户直接查看和编辑电子表格公式，可以让他们拥有更多的控制权。

所以，用户界面仍然很重要。我们可以想象，大规模语言模型的具体、有针对性的角色应该是帮助用户定制和构建软件，而不是将几十年的交互设计抛诸脑后。

GPT 真的可以编写代码吗？

现如今，GPT-4 的编程能力究竟如何？这很难一句话概括。了解当前 GPT-4 能力的最好方法是看一些正面和负面的例子，然后自行体会，最好是亲自尝试一下。

寻找正面的例子并不难。就个人而言，我已经成功地使用 GPT-4 编写了一