- 博客(7)
- 收藏
- 关注
原创 画平滑曲线
import matplotlib.pyplot as plt import numpy as np from scipy.interpolate import * #解决中文显示问题 plt.rcParams['font.sans-serif']=['SimHei'] plt.rcParams['axes.unicode_minus'] = False x=[1,2,3,4,5,6,7,8,...
2020-04-15 08:31:12
298
原创 pandas连接表格
import pandas as pd caozuo= 'D:/caozuo_train.csv'#文件目录 caozuosheet = pd.read_csv(caozuo,usecols=['UID','1'])#读取表的哪几列,列表里面是列名 jiaoyisheet=pd.read_csv(jiaoyi,usecols=['UID','1']) tagsheet2=pd.merge(c...
2018-11-30 20:13:03
467
原创 求交集小练手
def diff_of_element_list(lst, k): newlst = [i + k for i in lst] print(set(newlst)) print(set(lst)) return set(lst) & set(newlst)#求交集,&求交集 if __name__ == '__main__': lst =...
2018-11-30 10:01:41
180
原创 有趣的列表连接
print([i for i in range(11)]) print( [i for i in range(5)] ) print([i for i in range(3)]) print([i for i in range(11)]+[3, 3,3,4, 4, 4])# 划重点:::列表进行连接不是相加
2018-11-30 09:40:49
186
原创 医疗文本的规范化
Adapting Phrase-based Machine Translation to Normalise Medical Terms in Social Media Messages health reports in social media, such as DailyStrength and Twitter, have potential (数据来源) 然而,为了使机器理解并推断用户...
2018-11-28 21:00:45
752
原创 文本分类在选择机器学习模型时的特征工程
机器学习与深度学习不同,机器学习需要自己构建特征向量,并且不局限于词,这里看到一篇文章讲到一些机器学习构建词向量如下: 1.向量空间模型 2.LDA的主题词特征提取 3.中文多类别情感分类模型中特征选择方法。 这篇文章设计了基于朴素贝叶斯分类器、使用布尔权重的中文三类别和五类别情感分类模型。 比较常用的特征选择方法有:文档频率(Document Frequency,DF),信息增益(In...
2018-11-28 14:59:18
490
翻译 NLP的迁移模型
Universal Language Model Fine-tuning for Text Classification 这篇文章介绍了一个新的NLP领域的迁移模型,文中称ImageNet-like model,文章介绍了ULMFiT并介绍了微调的策略。 ULMFi模型 (开源代码http://nlp.fast.ai/ulmfit.) ULMFi模型的微调策略 实验 结果 We...
2018-11-27 17:35:02
661
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅