赛题:问题相似度计算
网址:金融大脑-金融智能NLP服务
目录
1.数据格式:
行号\t句1\t句2\t标注,举例:1 花呗如何还款 花呗怎么还款 1
行号指当前问题对在训练集中的第几行;
句1和句2分别表示问题句对的两个句子;
标注指当前问题对的同义或不同义标注,同义为1,不同义为0。
2.读取文件:
import pandas as pd
data=pd.read_csv('./atec_nlp_sim_train.csv',sef='None',encoding='utf-8')<