
Kaggle
lilong117194
“The world is not made of strings , but is made of things.”
展开
-
良/恶性乳腺癌肿瘤预测
1. Python的内建模块itertools提供了非常有用的用于操作迭代对象的函数:itertools.count():会创建一个无限的迭代器,只能按Ctrl+C退出itertools.cycle():会把传入的序列无限重复下去,同样停不下来itertools.repeat(‘A’, 10):负责把一个元素无限重复下去,不过如果提供第二个参数就可以限定重复次数。 无限序列只有在for迭代时原创 2017-11-28 15:54:28 · 1813 阅读 · 0 评论 -
Jupyter notebook入门
这里学习下Anaconda的Jupyter的用法:1. Jupyter notebook的使用(1)更改Jupyter notebook的工作空间进入工作目录文件夹键盘Shift+鼠标右键(同时按下)->在此处打开命令窗口-> 在弹出的命令窗口中输入:Jupyter Notebook Jupyter会被打开,并且定位到当前目录!(2)Jupyter的各种快捷键执行原创 2018-01-08 14:49:34 · 670 阅读 · 0 评论 -
pandas的基本使用
1. pandas中DataFrame类型数据操作函数1.1 基本使用python数据分析工具pandas中DataFrame和Series作为主要的数据结构,这里整理下:(1)查看DataFrame数据及属性:df_obj = DataFrame() # 创建DataFrame对象df_obj.dtypes # 查看各行的数据格式df_obj[‘列名’].as原创 2018-01-08 14:54:14 · 1292 阅读 · 0 评论 -
sklearn 中的preprocessing数据预处理
sklearn preprocessingStandardization即标准化,尽量将数据转化为均值为零,方差为一的数据,形如标准正态分布(高斯分布)。实际中我们会忽略数据的分布情况,仅仅是通过改变均值来集中数据,然后将非连续特征除以他们的标准差。一、标准化,均值去除和按方差比例缩放数据集的标准化:当个体特征太过或明显不遵从高斯正态分布时,标准化表现的效果较差。实际操作中,经常忽略特征数据...原创 2018-10-06 19:44:45 · 5445 阅读 · 0 评论