昨天看书

昨天看书

好久没有像昨天晚上那样看书了,asp.net2.0里面是增加了一些东西,想2年前看时并没有什么东西,2年唯一感兴趣的东西就是trace,现在增加了像.master、部分类这样的东西。

最近内网的蠕虫闹的很凶,看看自己能否编写此蠕虫的专杀!发现
看了汇编格外亲切!想起了大学时用debug了, 根据内网现在的表现,看来一定去买一个正版的杀毒软件了,发现trend并不是很有效果!

刚才登录
验证码居然是

https://p-blog.youkuaiyun.com/images/p_blog_youkuaiyun.com/zfive5/84093/o_ShowExPwd.aspx.jpg

### 什么是SFT数据样例在同音字纠错任务中的应用? 监督微调(Supervised Fine-Tuning, SFT)是大语言模型训练的重要阶段之一,其目标是通过高质量的指令-响应对来优化模型的行为[^1]。对于同音字纠错任务,SFT数据样例的设计需要特别关注输入文本中可能存在的同音字错误,并提供正确的输出作为目标。这些数据样例通常包括以下结构: - **输入**:包含同音字错误的句子或段落。 - **输出**:经过修正后的正确句子或段落。 以下是一些具体的SFT数据样例设计示例: ```plaintext [user]这是个典型的例子,我们去“买苹果”而不是“卖苹果”。[/user] [assistant]这是个典型的例子,我们去“买苹果”而不是“卖苹果”。[/assistant] ``` ```plaintext [user]他每天都要去图(涂)书馆看书。[/user] [assistant]他每天都要去图(图)书馆看书。[/assistant] ``` ```plaintext [user]小明昨天在公园里看到了一只漂(飘)亮的蝴蝶。[/user] [assistant]小明昨天在公园里看到了一只漂(漂)亮的蝴蝶。[/assistant] ``` ### 构建SFT数据集的方法 构建用于同音字纠错任务的SFT数据集可以采用两种主要方法[^2]: 1. **人工标注**:由领域专家手动构造包含同音字错误的句子,并提供正确的修正版本。这种方法虽然成本较高,但能够确保数据的质量和多样性。 2. **使用LLM生成**:利用已经训练好的大型语言模型(如GPT系列、通义千问等)生成大量的同音字错误句子及其修正版本。这种方法效率较高,但在某些情况下可能会引入偏差,因此需要后续的人工校验。 此外,在多轮对话场景下,如果引入了RAG(检索增强生成)技术,则需要进一步考虑上下文信息以及检索结果的相关性,以确保生成的数据样例能够反映真实的用户交互过程[^4]。 ### 示例代码:生成同音字纠错数据集 以下是一个简单的Python脚本,用于生成同音字纠错任务的SFT数据样例: ```python import random # 常见的同音字对 homophones = { "买": "卖", "图": "涂", "漂": "飘", "杆": "竿", "坐": "座", "再": "在", } def generate_sft_example(): base_sentence = "他每天都要去{}书馆看书。" wrong_word = random.choice(list(homophones.keys())) correct_word = homophones[wrong_word] incorrect_sentence = base_sentence.format(wrong_word) correct_sentence = base_sentence.format(correct_word) return f"[user]{incorrect_sentence}[/user]\n[assistant]{correct_sentence}[/assistant]" # 生成10个SFT数据样例 for _ in range(10): print(generate_sft_example()) ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值