- 博客(14)
- 收藏
- 关注
原创 基于Roberta进行微博情感分析
概览:情感分析是NLP中一大分支,本文尝试使用预训练模型(Roberta-wwm-ext)对微博通用数据进行情感分类,共六种类别(积极、愤怒、悲伤、恐惧、惊奇、无情绪)。数据来源:SMP2020微博情绪分类评测该评测任务中涉及通用数据和疫情数据,本文只使用通用数据。本文着重展示利用预训练模型在torch环境下进行情感分析的pipeline,弱化提升模型本身精度的探索。数据介绍:训练集:27,768条;测试集:5,000条下载链接提取码:q2f8数据格式如下图:id是编号;co..
2021-02-23 17:25:03
21766
17
原创 锻炼___
锻炼(1)旋转数组最小值、旋转数组找特定值(2)给定数组和tatget,求数组中和为target的最长连续子序列的长度(3)100个红球,100个篮球。将200个球放在2个盒子中,取一个球(只取一次),两个盒子拿出红球概率最大。应该怎么放球(一个盒子放一个红球,剩下199个球放入另外一个盒子)(4)孪生网络、CRF+Bi-LSTM(NER)...
2021-01-22 09:27:10
409
原创 堆排序_python
大顶堆,升序:def heapify(arr, n, i): """ arr:数组 n:数组的长度 i: 当前节点的索引 """ r = 2*i + 1 l = 2*i # 判断左子节点是否大于当前节点 largest = i if l < n and arr[l] > arr[i]: #降序改为arr[l] < arr[i] largest = l# else:#
2020-12-09 14:09:45
158
原创 classification_report进阶:针对top-k的结果计算precision@k、recall@k、f1-score@k
sklearn自带的classification_report方法可以针对二分类或多分类问题,计算分类器的precision、recall和f1-score。示例:from sklearn.metrics import classification_reporty_true=[0,1,2,2,0]y_pred=[1,0,2,1,1]print(classification_repo...
2020-02-29 19:01:16
17425
原创 Python中nan值的简易判别
场景:需要判断变量a是否为nan方法:if a==a: print('a is not nan')else: print('a is nan)原理:nan不和任何值相等,包括本身
2019-06-26 16:35:21
1492
原创 Python绘制各大城市职工工资分布地图
本文是利用Python绘制全国各大城市在岗职工平均工资(2016年)的地图分布情况。思路是:首先利用百度地图API爬取各大城市的经纬度坐标(绘制地图需要),而后从中国国家统计局下载2016年全国各大城市在岗职工平均工资数据,调用Python第三方库Folium绘制地图,保存成html文件。先来看一下最终的效果吧图1 全国各大城市在岗职工平均工资(2016年)的地图分布情况 环境
2018-02-04 19:12:42
5743
原创 Python预测股票走势
Python的功能可谓相当强大,在很多行业具有相当的优势,这种优势很大程度上来源于各种第三方库。本文介绍了如何利用时间序列模型ARIMA进行股票走势预测。环境:windows 64平台:Jupyter Notebook (Kernel python3)库:tushare statsmodels pandas numpy seaborn matplotlib先来看看效果吧
2018-02-04 15:12:20
33207
17
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人