- 博客(4)
- 收藏
- 关注
原创 1982年以来NBA发展趋势分析
前言数据集来自Kaggle (https://www.kaggle.com/drgilermo/nba-players-stats),其中包含了1950-1951赛季至2017-2018赛季的球员基本信息以及赛季技术统计。本文旨在通过对这些数据的简单整理归纳,从几个不同的角度,以图表的形式简单分析NBA自1982年以来的一些发展趋势。数据整理清洗主要使用Pandas,可视化工具用到Tableau...
2019-03-22 17:03:51
1253
原创 豆瓣电影TOP250数据分析
本文使用的语言为Python, 用到的几个模块有:BeautifulSoup(爬数据),pandas(数据处理),seaborn(可视化),部分图表由Tableau生成。1. 数据获取计划要抓取的字段包括:片名,导演,年份,国别,评分,评价数量,看过数量,想看数量,短评数量,长评数量。需要抓取的影片信息有250条,每页25部影片,一共有10页。简单浏览网页不难发现,翻页的链接不需要从页面底...
2019-02-21 19:27:08
10069
3
原创 2. Pandas介绍
Introduction to PandasYou can think of pandas as an extremely powerful version of Excel, with a lot more featuresSeriesA Series is very similar to a Numpy array. What differentiate the Numpy array ...
2019-02-19 15:11:35
415
原创 1. NumPy介绍
NumPyNumPy is a Linear Algebra Library for Python, the reason it is so important for data science with Python is that almost all of th e libraries in the PyData Ecosystem rely on NumPy as one of thei...
2019-02-17 21:31:51
218
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅