- 博客(3)
- 收藏
- 关注
原创 Datawhale AI 夏令营 task3学习笔记
本次微调数据使用训练集文件,将每个问题中的子问题和答案构建成问答对。例如:json复制代码{ "instruction": "你是一个逻辑推理专家,擅长解决逻辑推理问题。以下是一个逻辑推理的题目,形式为单项选择题。LoRA(Low-Rank Adaptation)微调是一种高效的模型微调技术,特别适用于大型预训练语言模型的适应性调整。优势可以针对不同的下游任务构建小型 LoRA 模块。使用自适应优化器,训练更有效、硬件门槛更低。
2024-08-01 14:53:50
425
原创 Datawhale AI 夏令营 task2学习笔记
大语言模型(英文:Large Language Model,缩写LLM),是一种包含数十亿或更多参数的人工智能模型,旨在理解和生成人类语言。通过在大规模文本数据上进行训练,LLM能够执行多种语言任务。大语言模型在逻辑推理任务中的应用展示了其强大的语言理解和生成能力。通过提示工程、模型调用和结果处理,可以有效地利用LLM解决复杂的推理问题。在实际应用中,需要注意模型的伦理和风险问题,确保生成内容的可靠性和安全性。
2024-07-29 13:15:50
451
原创 Datawhale AI 夏令营——从零入门NLP竞赛 Task 01 笔记
AI(人工智能)在各个领域得到了广泛应用,其中包括逻辑推理。逻辑推理是通过逻辑关系进行推导和判断的过程,对于构建智能系统至关重要。这篇学习笔记将介绍如何跑通一个AI+逻辑推理的baseline,包括基本概念、模型选择、数据准备、训练与测试等步骤。
2024-07-26 11:01:34
326
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人