
kaggle实战
文章平均质量分 70
Tom Hardy
关注计算机视觉、机器学习、深度学习,公众号【3D视觉工坊】【计算机视觉工坊】
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Kaggle实战之leaf classification(树叶分类)
介绍首先来直观看下所要分类的图像数据: 在这里一共是99种树叶,每种树叶包含16幅图像,因此训练集中一共1584幅图像。然而,我们不对图像直接操作,kaggle为每个图像提供三组特征:形状连续描述符,内部纹理直方图和细尺度边缘直方图。 对于每个特征,每个叶样本给出一个64属性的向量,因此,对于一幅图像来说,一共是64x3=192个向量。kaggle把每个训练图像转化成一个192维向量...原创 2018-06-10 12:58:16 · 11792 阅读 · 10 评论 -
Kaggle实战之食尸鬼、地精、鬼魂分类
介绍这是一个相对简单而且有趣的分类案例,此次比赛意在区分食尸鬼、地精和灵魂。每种物体的特征由骨骼长度,腐烂的严重程度,头发长度,无灵魂的程度,颜色构成。详细内容请看下图: 由上图可以看出,这是一个典型的机器学习分类物体,下面来看下具体怎么实现吧!具体实现# -*- coding: utf-8 -*-#导入一些将会被用到的库import numpy as np # line...原创 2018-06-10 15:50:48 · 761 阅读 · 0 评论 -
Kaggle实战之房价预测
前言当你在买房子的时候会考虑什么?房子的面积?地理位置?产权年限?是否有地下室?多少楼层?是否学区房?交通是否便利?周围设施是否完整?等等。。。没错,当你想要的要求越来越高时,房子的价格也会越来越高,那么如何根据不同的要求来预测房价呢?这就是该篇博文要讲的内容。感谢kaggle,可以让我们获得那么多的数据来建立模型~~~好了,其实要求很简单啦,就是根据房子不同的特征(包括面积、位置、产...原创 2018-06-10 20:38:23 · 1796 阅读 · 0 评论 -
数据分析中的缺失值处理
转自https://blog.youkuaiyun.com/lujiandong1/article/details/52654703#commentBox没有高质量的数据,就没有高质量的数据挖掘结果,数据值缺失是数据分析中经常遇到的问题之一。当缺失比例很小时,可直接对缺失记录进行舍弃或进行手工处理。但在实际数据中,往往缺失数据占有相当的比重。这时如果手工处理非常低效,如果舍弃缺失记录,则会丢失大量信息,使不完全观测数据与完全观测数据间产生系统差异,对这样的数据进行分析,你很可能会得出错误的结论。转载 2018-06-11 10:06:50 · 11032 阅读 · 1 评论 -
kaggle实战之流浪猫狗归处预测
介绍每年,约有760万个动物到达美国的动物收留所。 许多动物被他们的主人丢弃,而其它一部分是因为走失。 这些动物中的大多数都会找到永远的家庭并把它们带回家,但也有许多动物不那么幸运。 美国每年约有270万只狗和猫被安乐死。使用奥斯汀动物中心的摄入信息数据集,包括品种,颜色,性别和年龄,我们要求Kagglers预测每只动物的结果。我们也相信这个数据集可以帮助我们理解动物结果的趋势。 这些...原创 2018-06-19 14:02:09 · 1268 阅读 · 1 评论