目录
- 一、前言
- 二、数据分析和深度学习的区别
- 三、人工智能
- 四、深度学习
- 五、Pandas
- 六、Pandas数据结构
-
- 6.1 Series - 序列
- 6.2 DataFrame - 数据框
- 七、输入、输出
-
- 7.1 读取/写入CSV
- 7.2 读取/写入Excel
- 7.3 读取和写入 SQL 查询及数据库表
- 八、调用帮助
- 九、选择(这里可以参考上一篇文章的 Numpy Arrays 相关部分)
-
- 9.1 取值
- 9.2 选取、布尔索引及设置值
-
- 9.2.1 按位置
- 9.2.2 按标签
- 9.2.3 按标签/位置
- 9.2.4 布尔索引
- 9.2.5 设置值
- 十、删除数据
- 十一、排序
- 十二、查询序列与数据框的信息
-
- 12.1 基本信息
- 12.2 汇总
- 十三、应用函数
- 十四、数据对齐
-
- 14.1 内部数据对齐
- 14.2 使用 Fill 方法运算
- 十五、后记
本文详细介绍了人工智能、数据分析和深度学习之间的关系,并就数据分析所需的Pandas库做了胎教般的入门引导。祝读得开心!
一、前言
本文是原 《数据分析大全》、现改名为 《数据分析》 专栏的第二篇,我在写这篇文章的时候突然意识到——单靠我是不可能把数据分析的方方面面都讲得明明白白,只是是我自己知道什么,然后再输出我所明白的知识罢了。所以《数据分析大全》的“大全”两个字还真是担不起,就改成 《数据分析》 了。
本篇主要介绍数据分析中 Python Pandas 相关知识点,打算通过这一篇帮助大家顺利入门Python Pandas,掌握基本的用法和思想。
上一期《数据分析大全》——Numpy基础可能讲的太过侧重代码而忽略了讲解,如果是还未入门的小白可能看完都不知道讲了啥、为什么要讲这些。
实用性强和门槛低才是好文章的必要因素,像之前的那一篇就太过强调实用了。结果文章是简短了,可除了已经入门或从事相关工作的同行外,没几个能明白讲了啥的。因此,本篇吸取之前的教训,在交稿前又认真地完善了文章的措辞,加上段落间的衔接和引例等语句,方便小白也能看懂。
让我先来填一下上期的坑,聊聊数据分析和深度学习都有什么区别和联系。
二、数据分析和深度学习的区别
数据分析也好,深度学习也罢,都是一种新的技术,而新技术的产生则是为了解决现实中遇到的问题。我们可以姑且把现实问题分为简单问题和复杂问题。简单问题,只需要简单分析,我们使用数据分析就够了。而复杂问题,则需要复杂分析,我们这才使用机器学习。
——那什么是简单问题,什么是复杂问题呢?
简单问题就比如是今年学院奖学金的评选情况、今天公司的业绩这类问题,数据量不是很大,我们就用数据分析。
而我们天天使用的某宝、某东这类购物APP,它会根据你的历史购物习惯(这里面有着海量的数据),来给推荐你可能感兴趣的商品。那是如何做到的呢?对于这种复杂问题,这类APP背后使用的就是机器学习以及相应的推荐算法。
三、人工智能
人工智能的范围很广,广义上的人工智能泛指通过计算机(机器)实现人的头脑思维,使机器像人一样去决策。
机器学习是实现人工智能的一种技术。在机器学习分很多方法(算法),不同的方法解决不同的问题。深度学习是机器学习中的一个分支方法。
总结一下:人工智能、机器学习和深度学习的关系是:人工智能包含机器学习,机器学习包含深度学习(方法),即数据分析>机器学习>深度学习>机器学习。
四、深度学习
深度学习在图像,语音等富媒体的分类和识别上取得了非常好的效果,所以各大研究机构和公司都投入了大量的人力做相关的研究和开发。
举个众人皆知的例子,那就是2016年谷歌旗下DeepMind公司开发的阿尔法围棋(AlphaGo)战胜人类顶尖围棋选手。阿尔法围棋的主要工作原理就是“深度学习”。
五、Pandas
咳咳,扯远了,本篇文章要讲的Pandas还没说呢。
在学习任何东西之前,我们都应该明白两个问题——它能干什么?我能用它做什么?
我相信肯定有人和我在入门数据结构时一样,对这个叫“Pandas”的库有很多问题——Pandas是什么?Pandas一词是怎么来的?Pandas是做什么的?…让我们来一起解决这些困惑。
首先,Pandas是什么?是Panda→熊猫吗?