Great Models Think Alike and this Undermines AI Oversight

本文是LLM系列文章,针对《Great Models Think Alike and this Undermines AI Oversight》的翻译。

摘要

随着语言模型(LM)能力的进步,对人类来说,大规模评估和监督它们变得越来越困难。有希望其他语言模型可以自动化这两项任务,我们称之为“人工智能监督”。我们通过提出机会调整概率协议(CAPA)来研究模型相似性如何影响人工智能监督的两个方面:基于模型错误重叠的LM相似性度量。使用CAPA,我们首先证明LLM作为评判者的分数倾向于与评判者相似的模型,从而推广了最近的自我偏好结果。然后,我们研究了LM注释的训练,发现弱监督者和强学生模型之间的互补知识在从“弱泛化到强泛化”的过程中起着至关重要的作用。随着模型能力的提高,发现错误变得更加困难,我们可能会更多地听从人工智能的监督。然而,我们观察到一个令人担忧的趋势——随着能力的提高,模型错误变得越来越相似,这表明了相关故障的风险。我们的工作强调了报告和纠正模型相似性的重要性,特别是在新兴的人工智能监督范式中。

1 引言

2 方法:测量LM相似性

3 LLM-as-a-Judge中的亲和力偏差

4 学习LM标注器的互补知识

5 随着能力的提高,模型会犯更多类似的错误

6 相关工作

7 结论,局限性,未来工作

我们的论文表明了测量语言模型功能相似性的重要性。我们推导了一种新的模型相似性概率度量CAPA(

### MongoDB Criteria 查询条件中的操作符 MongoDB 的 `Criteria` 类提供了多种方法用于构建查询条件,这些操作符涵盖了常见的逻辑和比较需求。以下是一些常用的操作符及其使用方式。 #### 1. 比较操作符 - **`is(value)`**:用于匹配字段等于指定值的文档。 ```java Criteria.where("field").is("value"); ``` - **`gt(value)`**:匹配字段大于指定值的文档。 ```java Criteria.where("field").gt(100); ``` - **`gte(value)`**:匹配字段大于或等于指定值的文档。 ```java Criteria.where("field").gte(18); ``` - **`lt(value)`**:匹配字段小于指定值的文档。 ```java Criteria.where("field").lt(50); ``` - **`lte(value)`**:匹配字段小于或等于指定值的文档。 ```java Criteria.where("field").lte(20); ``` - **`ne(value)`**:匹配字段不等于指定值的文档。 ```java Criteria.where("field").ne("value"); ``` - **`in(Collection<?> values)`**:匹配字段值在指定集合中的文档。 ```java List<String> values = Arrays.asList("value1", "value2"); Criteria.where("field").in(values); ``` - **`nin(Collection<?> values)`**:匹配字段值不在指定集合中的文档。 ```java List<String> values = Arrays.asList("value1", "value2"); Criteria.where("field").nin(values); ``` - **`exists(boolean exists)`**:检查字段是否存在。 ```java Criteria.where("field").exists(true); // 字段存在 Criteria.where("field").exists(false); // 字段不存在 ``` - **`type(int type)`**:匹配字段类型为指定类型的文档。 ```java Criteria.where("field").type(2); // 2 表示字符串类型 ``` #### 2. 逻辑操作符 - **`andOperator(Criteria... criteriaArray)`**:组合多个条件,所有条件都必须满足(AND)。 ```java Criteria criteria = new Criteria(); criteria = criteria.andOperator( Criteria.where("status").is("active"), Criteria.where("age").gte(18) ); ``` - **`orOperator(Criteria... criteriaArray)`**:组合多个条件,至少一个条件满足(OR)。 ```java Criteria criteria = new Criteria(); criteria = criteria.orOperator( Criteria.where("status").is("active"), Criteria.where("age").lt(18) ); ``` - **`not()`**:取反操作符,用于否定后续的条件。 ```java Criteria.where("field").not().gt(100); // 字段不大于100 ``` #### 3. 数组操作符 - **`all(Collection<?> values)`**:匹配数组字段包含所有指定值的文档。 ```java List<String> values = Arrays.asList("value1", "value2"); Criteria.where("field").all(values); ``` - **`size(int size)`**:匹配数组字段长度为指定大小的文档。 ```java Criteria.where("field").size(3); ``` #### 4. 正则表达式操作符 - **`regex(String regex)`**:匹配字段符合正则表达式的文档。 ```java Criteria.where("field").regex("^A"); // 匹配以"A"开头的字段 ``` #### 5. 其他操作符 - **`where(String field)`**:静态方法,用于创建一个新的 `Criteria` 对象。 ```java Criteria.where("field").is("value"); ``` ### 示例代码 以下是一个完整的示例,展示如何使用 `Criteria` 构建一个包含 AND 条件、排序和分页的查询: ```java import org.springframework.data.mongodb.core.query.Criteria; import org.springframework.data.mongodb.core.query.Query; import org.springframework.data.domain.Sort; public class MongoQueryExample { public static void main(String[] args) { Criteria criteria = new Criteria(); criteria = criteria.andOperator( Criteria.where("status").is("active"), Criteria.where("age").gte(18) ); Query query = new Query(criteria); query.sort(Sort.by(Sort.Direction.DESC, "created_at")); query.skip(0); query.limit(20); System.out.println(query); } } ``` 该示例将生成一个查询,筛选出状态为 `active` 且年龄大于等于 18 的用户,并按 `created_at` 字段降序排列,返回前 20 条记录。 ###
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

UnknownBody

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值