Impact of Non-Standard Unicode Characters on Security and Comprehension in Large Language Models

本文是LLM系列文章,针对《Impact of Non-Standard Unicode Characters on Security and Comprehension in Large Language Models》的翻译。

摘要

大型语言模型的进步显著改善了自然语言处理。然而,越狱(提示注入导致 LLM 遵循与其预期用途相反的指示)、幻觉(产生不正确或误导性信息)和理解错误等挑战仍然普遍存在。在本报告中,我们对 15 个不同模型的性能进行了比较分析,每个模型都经过标准化测试,包括三个关键指标的 38 个查询:越狱、幻觉和理解错误。这些模型是根据越狱、幻觉和理解错误的总发生率进行评估的。我们的工作揭示了这些模型的内在脆弱性,并挑战了这些模型的人类水平语言理解的概念。我们实证分析了非标准 Unicode 字符对 LLM 的影响及其保护机制对表现最佳的 LLM,包括 GPT-4、Gemini 1.5 Pro、LlaMA-3-70B 和 Claude 3 Opus。通过在标准拉丁语块之外合并来自 Unicode 的字母数字符号和其他语言中的字符变体,我们观察到通过强化学习人类反馈 (RLHF) 实施的护栏的有效性降低。因此,这些模型表现出更高的易受内容策略违规和提示泄露的影响。我们的研究还表明,需要在 LLM 训练数据中加入非标准 Unicode 文本,以增强这些模型的功能。

1 引言

2 背景和相关工作

3 方法

4 对大语言模型的影响

5 跨语言非标准 UNICODE 变体

6 音译攻击

7 辅助功能脚本

### 问题分析 在使用 Homebrew 安装 Maven 时,如果尝试通过直接指定远程 URL 安装特定版本的 Formula,可能会遇到如下错误: ``` Error: Non-checksummed download of maven formula file from an arbitrary URL is unsupported! ``` 该错误的根源在于 Homebrew 强制要求所有 Formula 文件和下载资源必须包含校验和(checksum)信息,以确保资源的完整性和安全性。直接从任意远程 URL 下载 Formula 文件并进行安装的方式不符合这一要求,因此被系统拒绝[^1]。 ### 解决方案 为了解决这一问题,可以通过创建本地的 Formula 文件,并在其中显式定义下载地址和校验和值,从而满足 Homebrew 的校验要求。以下是一个适用于 Maven 3.6.3 的自定义 Formula 示例: ```ruby class Maven363 < Formula desc "Project management and comprehension tool" homepage "https://maven.apache.org/" url "https://archive.apache.org/dist/maven/maven-3/3.6.3/binaries/apache-maven-3.6.3-bin.tar.gz" sha256 "882c1c9e2c56d072e715551f0b1f59f63a5f715" version "3.6.3" def install prefix.install Dir["*"] end test do system "#{bin}/mvn --version" end end ``` 将上述内容保存为 `maven363.rb` 文件,然后通过以下命令进行安装: ```bash brew install ./maven363.rb ``` 该方法通过显式指定 `sha256` 校验值,确保 Homebrew 可以验证下载资源的完整性,从而避免 `Non-checksummed download` 错误[^1]。 ### 校验和的获取方式 如果需要安装其他版本的 Maven,可以通过以下命令手动计算其 `sha256` 校验值: ```bash shasum -a 256 apache-maven-x.x.x-bin.tar.gz ``` 将输出的哈希值用于 Formula 文件中的 `sha256` 字段,确保其与下载资源匹配。 ### 安装验证 安装完成后,执行以下命令确认 Maven 是否正确安装: ```bash mvn -v ``` 输出中应包含对应版本号(如 `Apache Maven 3.6.3`)和 Java 环境信息。 ### 注意事项 - Homebrew 要求所有外部资源必须具备校验机制,因此不能直接使用未签名的远程 URL 安装 Formula。 - 若需在 macOS 上管理多个 Maven 版本,可为每个版本创建独立的 Formula 文件,并使用 `brew switch` 命令进行版本切换。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

UnknownBody

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值