【DL】数据处理

打算分为三部分来写:数据处理,模型搭建,损失及计算,这是第一部分

一.停用词

想去掉每行中的\n,不用readline(),而用.read().splitlines()

stopWords = open('data/stopwords.txt').read().splitlines() 
print("取停用词完成")
for i in range(len(data_text)):
    temp = data_text[i].split(' ')
    datatext.append([t for t in temp if t not in stopWords])

Python splitlines() 按照行(’\r’, ‘\r\n’, \n’)分隔,返回一个包含各行作为元素的列表,如果参数 keepends 为 False,不包含换行符,如果为 True,则保留换行符。

二.pytorch 调用tensorboard

在这里插入图片描述
可以看到有很多的writer,记录了损失,cd到这个目录下,然后输入下面这个命令
在这里插入图片描述

log % tensorboard --logdir=’./TextRCNN’
浏览器打开 http://localhost:6006/
就可以看到可视化图了
在这里插入图片描述
虽然现在的菜鸡水平认为tensorboard远没有log出我print的内容,或者存我最优的训练模型有用……

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值