FeRG-LLM : Feature Engineering by Reason Generation Large Language Models

在这里插入图片描述

文章主要内容

  1. 研究背景:在表格数据的机器学习任务中,特征工程至关重要,但需要大量人力和专业知识。虽然大语言模型在特征工程领域有所应用,但现有方法存在依赖云托管大语言模型(如GPT)、仅适用于分类任务、难以处理大规模数据和安全问题等局限性。
  2. 相关工作:介绍了其他基于语言模型的特征工程研究(如CAAFE、FeatLLM),对比了它们与FeRG - LLM的能力差异;同时阐述了思维链(Chain - of - Thought,CoT)和直接偏好优化(Direct Preference Optimization,DPO)的相关理论,为FeRG - LLM框架提供理论基础。
  3. 方法:构建两阶段对话数据集,利用GPT - 4omini API提取信息,通过重新格式化信息激发8B规模语言模型的CoT推理能力,第一阶段生成新特征的关键思路,第二阶段生成Python代码实现特征创建,并利用LoRA进行监督微调;使用DPO对生成特征的合理性进行反馈优化,构建偏好数据集并优化语言模型。
  4. 实验:使用多个表格数据集评估FeRG - LLM生成特征的质量,以AUC为评估指标,与CAAFE、FeatLLM和Llama 3.1 70B进行对比,结果表明FeRG - LLM在多数数据集上性能优异;通过t - SNE可视化和语言分析研究DPO
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

UnknownBody

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值