天池NL2SQL Top15方案

本文详述了一位参赛者在天池NL2SQL比赛中获得第15名的方案,包括环境配置(Ubuntu,1080ti,CUDA 10.1)、预处理(数值类型转化,数据清洗)、模型介绍、后处理、效果评估及未来改进计划(数字前后缀挖掘,同义词解决方案)。

目录

代码地址

Part0: 参赛成绩

Part1: 代码环境

环境配置步骤如下:

Part2: 预处理

一. 数值类型转化

二. 训练集数据清洗与分类

Part3:模型介绍

目录

代码地址

Part0: 参赛成绩

Part1: 代码环境

环境配置步骤如下:

Part2: 预处理

一. 数值类型转化

二. 训练集数据清洗与分类

Part3:模型介绍

Part4: 后处理

Part5: 模型效果评估

Part6: TODO

数字通用前后缀挖掘

同义词解决方案

BUGFIX: (FIXED)

部分冗余逻辑重写

附录:代码树

回复 "nl2sql" 获取数据集, 有问题请留言


 

Part4: 后处理

Part5: 模型效果评估

Part6: TODO

数字通用前后缀挖掘

同义词解决方案

BUGFIX: (FIXED)

部分冗余逻辑重写

附录:代码树


代码地址

https://github.com/yscoder-github/nl2sql-tianchi

Part0: 参赛成绩

  • 平台昵称: yscoder
  • 参赛形式: 个人
  • 复赛排名: 15

Part1: 代码环境


环境配置步骤如下:


1. 深度学习相关环境

配置详情

  • 显卡: 1080ti
  • OS: Ubuntu
  • Driver Version: 418.56
  • CUDA Version: 10.1
  • cudnn version

2. Python相关环境

conda create --name nl2sql-yscoder1 python=3.6
source activate
conda activate nl2sql-yscoder1
pip install --upgrade pip  
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple  -r requirements

root@481c7f8087a2

执行训练任务(训练入口):

cd code 
sh start_train.sh

执行推理任务(推理入口):

cd code 
sh start_test.sh

3. 模型与训练文件信息

  • Bert中文预训练模型(哈工大版) ,该模型存储位置: ./submit/chinese-bert_chinese_wwm_L-12_H-768_A-12 下载地址

  • Bert-finetune模型,该模型为经过finetune之后的,适配于当前nl2sq

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值