【人工智能项目】深度学习实现金融用户评论分类

本文探讨了使用深度学习方法,特别是CatBoost和RoBERTa模型在金融用户评论中进行精准分类。通过CatBoost的GPU加速和RoBERTa的强大自然语言处理能力,实现了高精度的业务识别,如消费贷款、信用卡等。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

【人工智能项目】深度学习实现金融用户评论分类

在这里插入图片描述

任务说明

本数据集包含金融行业用户评论信息,其中有大量长文本,根据评论识别所属金融业务,具体类别如下:

0:消费贷款

1:抵押

2:信用卡

3:债务催收

4:信用报告

5:学生贷款

6:银行账户服务

7:短期小额贷款

8:汇款

9:预付卡

10:其他金融服务

认识数据

import pandas as pd

train_df = pd.read_csv("train.csv")
test_df = pd.read_csv("test.csv")
train_df

在这里插入图片描述

test_df

在这里插入图片描述

CatBoost分类

# 裸模86.9556,主要是认识一下俄罗斯很强大的学习模块Catboost
import pandas as pd
from catboost import CatBoostClassifier
import numpy as np


df1=pd.read_csv("./train.csv")
y = df1['label']
X_train = df1['text'].astype('str')
X_train=np.array(X_train)

df2=pd.read_csv("./test.csv")
X_test = df2['text'].astype('str')
X_test=np.array(X_test)


print(X_test.shape)

model = CatBoostClassifier(task_type='GPU')
model.fit(X_train, y,text_features=[0])

在这里插入图片描述

label=[]
for i in range(X_test.shape[0]):
    label.append(model.predict([X_test[i]])[0])
dataframe = pd.DataFrame({'index':range(X_test.shape[0]),'label':label})
dataframe.to_csv("submisson.csv",index=False,header=False,sep=',')

SimpleTransformer模型训练预测

import warnings
warnings.simplefilter('ignore')

import numpy as np

import pandas as pd

from simpletransformers.classification import ClassificationModel
train = pd.read_csv('./train.csv')
test = pd.read_csv('./test.csv')
train.columns = ['text', 'labels']
train.head()

在这里插入图片描述

train_args={
    'sliding_window': True,
    'reprocess_input_data': True,
    'overwrite_output_dir': True,
    'logging_steps': 5,
    'stride': 0.6,
    'max_seq_length': 256,
    "fp16":False,
    'num_train_epochs': 5,
    "train_batch_size":1,
    "gradient_accumulation_steps":32
}
model = ClassificationModel('roberta', 'roberta-base', num_labels=11, args=train_args)
model.train_model(train)

在这里插入图片描述

predictions, _ = model.predict([row['text'] for _, row in test.iterrows()])
pd.DataFrame({'ID': test.index, 'labels': predictions}).to_csv('submission_roberta-large.csv', index=False, header=False)

小结

本次用机器学习的方法实现nlp相关的评论分类工作,那下次见!!!
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

mind_programmonkey

你的鼓励是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值