自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 1982年以来NBA发展趋势分析

前言数据集来自Kaggle (https://www.kaggle.com/drgilermo/nba-players-stats),其中包含了1950-1951赛季至2017-2018赛季的球员基本信息以及赛季技术统计。本文旨在通过对这些数据的简单整理归纳,从几个不同的角度,以图表的形式简单分析NBA自1982年以来的一些发展趋势。数据整理清洗主要使用Pandas,可视化工具用到Tableau...

2019-03-22 17:03:51 1253

原创 豆瓣电影TOP250数据分析

本文使用的语言为Python, 用到的几个模块有:BeautifulSoup(爬数据),pandas(数据处理),seaborn(可视化),部分图表由Tableau生成。1. 数据获取计划要抓取的字段包括:片名,导演,年份,国别,评分,评价数量,看过数量,想看数量,短评数量,长评数量。需要抓取的影片信息有250条,每页25部影片,一共有10页。简单浏览网页不难发现,翻页的链接不需要从页面底...

2019-02-21 19:27:08 10069 3

原创 2. Pandas介绍

Introduction to PandasYou can think of pandas as an extremely powerful version of Excel, with a lot more featuresSeriesA Series is very similar to a Numpy array. What differentiate the Numpy array ...

2019-02-19 15:11:35 415

原创 1. NumPy介绍

NumPyNumPy is a Linear Algebra Library for Python, the reason it is so important for data science with Python is that almost all of th e libraries in the PyData Ecosystem rely on NumPy as one of thei...

2019-02-17 21:31:51 218

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除