AI 观察：LLM 用户想要什么

最新推荐文章于 2025-12-03 20:31:34 发布

转载最新推荐文章于 2025-12-03 20:31:34 发布 · 167 阅读

·

0

·

CC 4.0 BY-SA版权

原文链接：https://mp.weixin.qq.com/s?__biz=MzI1MjQ3NzE2Mw==&mid=2247486023&idx=2&sn=e81773790aac905e326188cc4f1be830&chksm=e8ba3bccbe9ef41d3c0f0fd326da536039ebfb628daa690a32684d5f1424a60a6aeb5ccb0e51&scene=126&sessionid=0

文章标签：

部署运行你感兴趣的模型镜像

Anthropic 分析了用户与 Claude 3.5 Sonnet 之间的 100 万次匿名对话。研究发现，大多数人使用该模型进行软件开发，同时也发现了故障和越狱。

新功能：Anthropic 构建了一个工具 Clio，以更好地了解用户如何与其大型语言模型交互。该系统挖掘匿名使用数据，以获得洞察力，以提高性能和安全性。

工作原理：Clio 使用 Claude 3.5 Sonnet 本身自动提取用户与模型对话的摘要。然后它将相关主题聚类。为了保护隐私，它会匿名化和汇总数据，只显示有关集群的信息。

• Clio 从对话中提取信息，例如轮次、所讲语言以及所说内容的摘要。

• 它嵌入摘要并根据相似性对其进行聚类。此过程创建了数千个集群。

• 为每个集群提供示例摘要，Clio 会生成集群中信息类型的简短描述。

• 它重复该过程以创建层次结构，对集群的描述进行聚类，生成新描述等等。例如，描述为“打结”和“浇花”的集群本身就聚集在“日常生活技能”中。

结果：Clio 发现了 Claude 3.5 Sonnet 的常见、不常见和不允许的用途。它还检测到系统本身的错误行为。

• 最大的单一类别是软件开发。编码占 Claude 对话的 15% 到 25%。Web 和移动应用程序开发占总对话的 10% 以上，AI 和机器学习应用程序占 6%，DevOps 和云基础设施占 4% 左右，数据分析占 3.5%。

• 接下来是与业务相关的用途。文本生成和通信占总对话的约 9%，而学术研究和写作占 7% 以上。商业战略和运营占近 6%。

• 细分用途包括在游戏《龙与地下城》中担任地下城主、解梦、解填字游戏、分析足球比赛和为灾难做准备。

• Clio 发现了大规模违反公司使用政策的行为。例如，大量用户设计了提示，以避开安全分类器，使用 Claude 进行露骨的色情角色扮演。

• 它还突出了 Anthropic 安全分类器的缺陷。例如，它发现了一些对话集群，这些对话集群不应该被标记，而应该被标记却没有被标记。

重要性：了解人们如何使用人工智能的传统方法（例如调查）可能会产生不准确的结果，因为人们通常不会准确报告自己的行为。Clio 提供了一种分析现实世界使用情况的方法，就像 Google Trends 监控搜索行为一样，而不会损害隐私。这种方法可以帮助 AI 构建者发现小众用例，识别缺陷，并定制训练和测试数据以最好地服务于用户。

我们在想：我们都支持自动化地下城主，但我们很高兴看到 AI 辅助编码在 Claude 的实际用途中名列前茅！

（本文系翻译，内容来自DeepLearning.AI，文章内容不代表本号立场）

觉得文章不错，顺手点个“点赞”、“在看”或转发给朋友们吧。

相关阅读：

重磅体验：AI编程不能取代程序员，但程序员会用的话确实很爽

最新洞见：GenAI在企业应用中的既要又要

短短3个月，我们在GenAI上的进展

关于译者

关注公众号看其它原创作品

坚持提供对你有用的信息

觉得好看，点个“点赞”、“在看”或转发给朋友们，欢迎你留言。

您可能感兴趣的与本文相关的镜像

Stable-Diffusion-3.5

Stable-Diffusion-3.5

图片生成

Stable-Diffusion

Stable Diffusion 3.5 (SD 3.5) 是由 Stability AI 推出的新一代文本到图像生成模型，相比 3.0 版本，它提升了图像质量、运行速度和硬件效率

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。