自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 收藏
  • 关注

原创 画平滑曲线

import matplotlib.pyplot as plt import numpy as np from scipy.interpolate import * #解决中文显示问题 plt.rcParams['font.sans-serif']=['SimHei'] plt.rcParams['axes.unicode_minus'] = False x=[1,2,3,4,5,6,7,8,...

2020-04-15 08:31:12 298

原创 pandas连接表格

import pandas as pd caozuo= 'D:/caozuo_train.csv'#文件目录 caozuosheet = pd.read_csv(caozuo,usecols=['UID','1'])#读取表的哪几列,列表里面是列名 jiaoyisheet=pd.read_csv(jiaoyi,usecols=['UID','1']) tagsheet2=pd.merge(c...

2018-11-30 20:13:03 467

原创 求交集小练手

def diff_of_element_list(lst, k): newlst = [i + k for i in lst] print(set(newlst)) print(set(lst)) return set(lst) & set(newlst)#求交集,&求交集 if __name__ == '__main__': lst =...

2018-11-30 10:01:41 180

原创 有趣的列表连接

print([i for i in range(11)]) print( [i for i in range(5)] ) print([i for i in range(3)]) print([i for i in range(11)]+[3, 3,3,4, 4, 4])# 划重点:::列表进行连接不是相加

2018-11-30 09:40:49 186

原创 医疗文本的规范化

Adapting Phrase-based Machine Translation to Normalise Medical Terms in Social Media Messages health reports in social media, such as DailyStrength and Twitter, have potential (数据来源) 然而,为了使机器理解并推断用户...

2018-11-28 21:00:45 752

原创 文本分类在选择机器学习模型时的特征工程

机器学习与深度学习不同,机器学习需要自己构建特征向量,并且不局限于词,这里看到一篇文章讲到一些机器学习构建词向量如下: 1.向量空间模型 2.LDA的主题词特征提取 3.中文多类别情感分类模型中特征选择方法。 这篇文章设计了基于朴素贝叶斯分类器、使用布尔权重的中文三类别和五类别情感分类模型。 比较常用的特征选择方法有:文档频率(Document Frequency,DF),信息增益(In...

2018-11-28 14:59:18 490

翻译 NLP的迁移模型

Universal Language Model Fine-tuning for Text Classification 这篇文章介绍了一个新的NLP领域的迁移模型,文中称ImageNet-like model,文章介绍了ULMFiT并介绍了微调的策略。 ULMFi模型     (开源代码http://nlp.fast.ai/ulmfit.) ULMFi模型的微调策略 实验 结果 We...

2018-11-27 17:35:02 661 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除