
数据处理
xz1308579340
这个作者很懒,什么都没留下…
展开
-
利用python做中文词频分析
利用python做中文词频分析 摘要:利用python做中文词频 分析,分析文本中词频出现的次数,文本可以保存在TXT或者CSV文件中,用到csv库和正则表达式。需要有文本处理和正则表达式的基础,不会请先学习这方面内容。 导入库: # coding=utf-8 编码形式 import sys #字符串处理方式 import re原创 2017-03-27 16:24:09 · 26086 阅读 · 1 评论 -
python-按比例将子文件划分为train data和test data
python-按比例将子文件划分为train data和test data 程序目的: 将data划分为测试集和训练集: 原始数据存放位置:./data/danzi/ 测试集位置:./data/danzi-test/ 训练集数据存放位置:./data/danzi-train/ 按照0.7:0.3划分测试集和训练集 程序步骤: 1.读取所有data 2.打乱数据 3.对原创 2018-01-24 19:18:49 · 9516 阅读 · 2 评论 -
kaggle入门之泰坦尼克幸存预测
kaggle入门之泰坦尼克幸存预测 # 数据集什么的就不介绍了,官网上都有 主要的工作步骤 1.提出和定义问题 2.获取训练和测试数据 3.获取,准备和清洗数据 4.分析,识别,探究数据 5.建模,预测并解决wenti 6.可视化,报告和解决 7.应用和提交结果 数据分析和整理 #数据分析整理 # data analysis and wrangling im...原创 2018-09-15 18:03:34 · 333 阅读 · 0 评论