
python数据分析
文章平均质量分 61
youngzkai
这个作者很懒,什么都没留下…
展开
-
大三上数据挖掘,银行客户流失预警
项目描述:首先用Excel对数据进行预处理,将英文字符替换成数字,对无关信息列删除,然后在Notekbook里面用pandas读取数据,数据格式和excel 是一样的。将前36列作为自变量想,37列的是否流失作为因变量y,并把原始数据按4:1分成训练集和测试集,再从sklearn.linear_model导入LogisticRegression模型,然后用fit(x,y)方法来拟合。用lr.s...原创 2018-07-10 12:02:59 · 3832 阅读 · 4 评论 -
自然语言处理
就是对龙王传说这本小,查找关键字,并且按照,权重的大小排序# coding: utf-8# In[1]:import jsonimport jiebaimport pandas as pdimport osimport codecsimport sysimport refrom sklearn.feature_extraction.text import CountVect...原创 2018-07-10 12:27:51 · 407 阅读 · 0 评论 -
智能阅读模型的构建(第六届泰迪杯C题)
项目描述:构建智能阅读模型主要通过两个方法来实现,第一个是TF-IDF的变种——TFC-ICF,TFC-ICF较于TF-IDF是将一个问题的所有答案看成一个整体,类比于TF-IDF文本分类的文件夹,问题的每一个回答类比于TF-IDF的文件夹里的每个文档。TFC是每个词所在句子的频率,叫类词频,ICF类比于逆文本率,叫倒类频率。作为衡量每个词在所有句子中的一个重要程度。利用sklearn里面的t...原创 2018-08-07 10:39:45 · 2301 阅读 · 1 评论