人工智能_大模型081_AI产品部署和交付11_大模型安全管控方法_大模型内置提示词使用_Prompt破坏提问_互联网信息服务算法_大模型备案法规---人工智能工作笔记0216

添柴程序猿

于 2024-05-28 08:52:37 发布

阅读量336

点赞数 4

CC 4.0 BY-SA版权

分类专栏：深度/机器学习&爬虫文章标签：人工智能大模型安装大模型安全管控大模型备案提示词破坏

本文为博主原创文章，未经博主添柴程序猿允许不得转载违者追究法律责任。

本文链接：https://blog.youkuaiyun.com/lidew521/article/details/139140676

深度/机器学习&爬虫专栏收录该内容

168 篇文章 ¥19.90 ¥99.00

订阅专栏

超级会员免费看

本文探讨了大模型的安全管理，包括自建敏感词库、使用第三方服务如网易易盾、百度文本内容安全进行内容过滤。此外，介绍了大模型内置提示词的功能，如知识更新查询，并提及OpenAI的Moderation接口用于检测用户输入是否需要过滤。同时，文章提到了大模型的备案流程，特别是在beian.cac.gov.cn进行算法备案的必要性。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

然后再来看大模型的安全问题:

## 内容安全

#### 敏感词库管理与用户输入过滤：

- 定期更新敏感词汇和短语库，应对文化变迁和当前事件。

- 使用第三方服务或自建工具进行实时输入过滤和提示。推荐使用：

- 网易易盾：[https://dun.163.com/product/text-detection](https://dun.163.com/product/text-detection)

- 百度文本内容安全：[https://ai.baidu.com/tech/textcensoring](https://ai.baidu.com/tech/textcensoring)

可以看到可以自建敏感词库,或者是使用

第三方服务,比如网易易盾,百度文本内容安全等.