- 博客(94)
- 收藏
- 关注
原创 数据回顾东京奥运会中国体育代表团金牌时刻
2020东京奥运会已经落下帷幕有一段时间了,但这届在疫情期间举办的奥运会注定会写入历史。中国代表团在为期16天的比赛中,共取得了38金32银18铜共88枚奖牌,位列奖牌榜第二。其中38枚金...
2021-09-12 21:22:55
816
转载 423读书节来当当薅羊毛!170买400/240买600
世界读书日给爱读书的你们最大的优惠力度423当当自营图书在每满100减50的基础上使用优惠码,叠加立减:200-30【或】300-60,相当于只要花170块就能买400的书/240买600...
2021-04-19 23:15:00
988
转载 学习数据可视化,读哪本书比较好?
入门数据可视化的小伙伴往往都会问这样一个问题:我应该从哪里开始学起,有什么书推荐吗?这个问题之所以普遍,是因为数据可视化是一个相当交叉的学科,既涉及数据分析,也涉及设计和编程。而这三大方向...
2021-04-11 23:45:00
1714
转载 当当图书每满100减50,两种优惠券助你两手薅羊毛
囤书囤书我们一起阅读经典,紧跟前沿技术不掉队这次继续给爱读书的你们最大的优惠力度当当图书大促>>每满100减50 <<满200减100满300减150满400减...
2021-03-24 20:30:00
1614
转载 Eat pyspark 2nd day | 1小时看懂Spark的基本原理
公众号后台回复关键字:pyspark,获取本项目github链接,数据集和代码。Eat pyspark 系列:如何用10天吃掉pyspark?Eat pyspark 1st day | 快...
2021-03-24 20:30:00
313
转载 Eat pyspark 1st day | 快速搭建你的Spark开发环境
公众号「算法美食屋」后台回复关键字:pyspark,获取本项目代码和数据集链接。一,搭建本地pyspark单机练习环境以下过程本地单机版pyspark练习编程环境的配置方法。注意:仅配置练...
2021-03-22 22:00:00
220
转载 如何用10天吃掉pyspark?
公众号「算法美食屋」后台回复关键字:pyspark,获取本项目代码和数据集链接。一,pyspark ???? or spark-scala ???? ? pyspark强于分析,spar...
2021-03-22 22:00:00
225
原创 近10年NBA球队常规赛排名变化——tableau 实现bump chart
上一篇文章「一个案例入门tableau——NBA球队数据可视化实战解析」我们学习了tableau的基本使用方法,本篇中我们继续深入,仍然通过实战案例来学习tableau制作bump cha...
2021-03-20 23:40:00
1733
5
原创 一个案例入门tableau——NBA球队数据可视化实战解析
前两天在公众号发布了一篇「NBA球队数据可视化」的视频案例,对于本赛季东西部30只球队的得失分,胜负场次,胜率排名等进行了可视化展示,并支持实时交互。可点击下方视频查看。本文来分享一下视频...
2021-03-04 23:57:07
4378
65
原创 中国行政单位树形图的可视化实战!
我国幅员辽阔,共有34个省级行政单位,包括23个省、5个自治区、4个直辖市、2个特别行政区。除去香港澳门2个特别行政区和台湾省特殊外,大陆地区共有31个省级区划单位。每个省级单位又可以细分...
2021-02-15 00:10:00
3663
转载 一张速查表,彻底搞定Pandas!
昨天在面向GitHub编程时,无意发现了Pandas官方竟提供了速查小抄,项目地址如下https://github.com/pandas-dev/pandas/blob/master/do...
2021-02-08 09:20:00
532
1
转载 「超哥的杂货铺」原创文章导航
数据分析和数据处理已经成为数据分析人员的必备技能。入行数据分析的路上,需要掌握的技能多种多样,包括基础SQL查询,pandas数据处理,jupyter工具使用,爬虫与数据可视化,机器学习...
2021-02-02 21:29:34
191
原创 七步搞定一个综合案例,掌握pandas进阶用法!
本文从一个案例入手,综合运用pandas的各类操作实现对数据的处理,处理步骤如下所示。在公众号后台回复“case”即可获取本文全部数据,代码和文档。案例引入现有一批销售数据,如下图所示:...
2021-01-22 09:15:00
585
2
原创 在shell中使用hiveSQL的注意事项
概述hive是数据分析人员常用的工具之一。实际工作中,使用hive基本都是在linux shell环境下。运行hiveSQL的方式有以下几种。1.hive 交互式命令行即在shell环境...
2021-01-03 16:30:00
2324
4
转载 pandas参数设置小技巧
在日常使用pandas的过程中,由于我们所分析的数据表规模、格式上的差异,使得同样的函数或方法作用在不同数据上的效果存在差异。而pandas有着自己的一套「参数设置系统」,可以帮助我们在...
2020-08-23 22:30:00
1206
转载 笔试 | 字节跳动秋招第二场题目&解答
第一题题目描述给定一颗二叉树,二叉树每个节点都有唯一的正整数值代表节点,在遍历时,我们使用节点的数值作为标记。给定二叉树的前序和中序遍历结果,求二叉树的叶子节点个数。输入第一行,输入二叉...
2020-08-23 22:30:00
587
转载 人人都是数据分析师??愿韭菜的世界没有镰刀
开局一张图有志于转行数据分析的朋友们好~古牧君今天大胆开麦,针对近年来网上各路培训班营造出来的“人人都是数据分析师”热潮,给出一些个人看法。希望能让所有冲动转行的小白们都先冷静下,想清楚...
2020-08-15 22:00:00
374
转载 笔试 | 字节跳动2020秋招第一场题目讲解
❝今天为大家带来的是2020秋招字节跳动第一场笔试的四个编程题。这里只为大家列出了思路和解法,更多的题目和实现代码欢迎私聊小编加入刷题群&面试交流群。也祝大家明天笔试顺利!❞第一...
2020-08-15 22:00:00
483
转载 笔试 | 2020贝壳秋招笔试题讲解&源码
第一题题目描述给定一个长度为n的字符串,问至少替换多少个字符变换成回文串?分析我们把字符串前一半和后一半拆成两个字符串,然后比较有多少个字符不相等即可或者设置两个指针left和right...
2020-08-13 21:00:00
620
1
原创 Pandas tricks 之 transform的用法
点击上方“超哥的杂货铺”,轻松关注先来看一个实例问题。如下销售数据中展现了三笔订单,每笔订单买了多种商品,求每种商品销售额占该笔订单总金额的比例。例如第一条数据的最终结果为:235.83...
2020-08-13 21:00:00
684
转载 数据分析师必备的一套「指标体系」搭建指南!
指标体系的定义和选取原则定义:在业务的不同阶段,分析师牵头、与业务方协助,制定的一套能从各个维度去反应业务状况的一套待实施框架。在建立指标体系时,要注重三个选取原则:根本性、可理解性、结...
2020-08-02 22:00:00
1500
转载 字节面试官教你如何准备面试(三)
字节游戏面试难?面试避坑指南来了!!话不多说@所有人倾囊相助!一起来看看吧!游戏面试避坑指南“以下内容均来自字节游戏面试官们的倾囊相助!第一步,先收藏下来,细细体会其中的精华!【研发序列...
2020-08-02 22:00:00
1030
原创 matplotlib 设置绘图时显示中文
点击上方“超哥的杂货铺”,轻松关注matplotlib绘图时,经常会遇到中文字体显示为方块的问题。网上有很多解决方案,比较普遍的是在代码里增加下面两行。import matplotlib...
2020-07-26 23:30:00
1524
原创 matplotlib绘制常见统计图形(一)
点击上方“超哥的杂货铺”,轻松关注之前的文章一图入门Matplotlib绘图中我们学习了matplotlib中常见图表元素的绘制方法,所有操作都通过可以调用plt的函数实现。本节继续来学...
2020-07-26 23:30:00
694
转载 字节面试官教你如何准备面试(二)
秋招已经快要开始了,你是否感觉很迷茫,不知道该怎么准备呢?别着急,字节跳动算法、测试开发、后端、前端、大数据五大方向面试官来告你他们的面试秘籍,帮你更好得了解面试官也了解自己!01AI ...
2020-07-10 22:33:23
477
转载 一个专业的“数据分析师”,应该具备那些素质?
本文分享一个干货《8张高清知识图谱》,详细介绍了一个数据分析师人所应该具备的素质,相信这也是很多转行的小白所需要的。如果您是一个想转行的小白,请先仔细阅读全文,文末可获取高清知识图谱。1...
2020-07-07 22:00:00
371
转载 字节面试官教你如何准备面试(一)
秋招已经快要开始了,你是否感觉很迷茫,不知道该怎么准备呢?别着急,字节跳动算法、测试开发、后端、前端、大数据五大方向面试官来告你他们的面试秘籍,帮你更好的了解面试官也了解自己!01AI ...
2020-07-07 22:00:00
1417
原创 一图入门Matplotlib绘图
点击上方“超哥的杂货铺”,轻松关注Matplotlib是Python里可视化的基础包,可以很方便地绘制二维,三维的图表,作图风格接近MATLAB,所以称为matplotlib。使用简单的...
2020-07-05 23:33:05
494
原创 手把手带你开启机器学习之路——决策树的理解与实践
点击上方“超哥的杂货铺”,轻松关注决策树简介决策树是一种有监督的机器学习算法,可以实现分类和回归任务,通常对数据有比较好的拟合效果。决策树能够非常直观地提供分类规则,易于解释。公众号后台...
2020-06-27 23:44:57
580
转载 数据分析必知必会 | TGI指数分析实战
本篇文章带大家学习一个数据分析实战的案例,详细解读TGI指数,并用Python代码实现基础的TGI偏好分析。经常有一些专业的数据分析报告,会提到TGI指数,例如“基于某某TGI指数,我们...
2020-05-19 23:08:16
3022
2
转载 我原创的《Python 与数据分析 100 个案例》PDF 下载
告别枯燥,通过学习有趣的小案例,扎实而系统的入门 Python、数据分析、机器学习,从菜鸟到大师,个人觉得这是很靠谱的一种方法。通过一个又一个的案例,真正领悟 Python 的强大和简洁...
2020-04-25 21:00:22
1307
1
原创 SQL查询中笛卡尔积的巧妙使用(文末福利)
点击上方“超哥的杂货铺”,轻松关注本文通过两个小例子学习一下笛卡尔积的巧妙使用。后台回复“笛卡尔积”可以获取本文pdf版本,便于阅读保存。笛卡尔积,又叫cross join,是SQL中两...
2020-04-19 23:53:27
7873
原创 手把手带你开启机器学习之路——分类问题总览
点击上方“超哥的杂货铺”,轻松关注本篇文章中,我们深入讨论分类问题,包括混淆矩阵,精度,召回率,ROC曲线等相关重要概念以及二分类和多分类问题,并通过sklearn来实现。主要采用Mn...
2020-04-06 19:59:54
486
转载 700页的机器学习笔记火了!完整版开放下载
作者:梁劲(Jim Liang),来自SAP(全球第一大商业软件公司)。书籍特点:条理清晰,含图像化表示更加易懂,对公式有详细的注解等。内容概要:主要分为基本概念、常用算法和其他三部分...
2020-04-05 23:00:00
914
原创 手把手带你开启机器学习之路——房价预测(二)
点击上方“超哥的杂货铺”,轻松关注在前一篇文章手把手带你开启机器学习之路——房价预测(一)中我们以加州住房价格数据集为基础,学习了数据抽样,数据探索性分...
2020-03-29 19:50:00
662
原创 数据挖掘学习-第三次打卡-特征工程
常见的特征工程:异常处理:通过箱线图(或 3-Sigma)分析删除异常值;BOX-COX 转换(处理有偏分布);长尾截断;特征归一化/标准化:标准化(转换为标准正态分布);归一化(抓换到 [0,1] 区间);针对幂律分布,可以采用公式: log(1+x1+median)\log(\frac{1+x}{1+median})log(1+median1+x)数据分桶:等频...
2020-03-28 18:46:37
199
1
原创 数据挖掘学习-第二次打卡-数据EDA
目标:熟悉变量之间的相互关系,找到与预测值的联系,为后续的特征工程提供思路。具体包括:查看数据总览,查看缺失值和异常值,了解预测值的分布,查看特征变量的分布,数字特征和类别特征分析(可视化)等。按照资料中实现了一遍数据EDA,学习了一些可视化的技巧。详细的步骤大致记录如下。当然在最后可视化的时候也遇到了一些bug,还没有完全解决。由于图表太大,截取了几个进行展示对于数据的初步分析(直...
2020-03-24 21:49:51
199
原创 手把手带你开启机器学习之路——房价预测(一)
点击上方“超哥的杂货铺”,轻松关注本文我们使用加州住房价格数据集,从零开始,一步一步建立模型,预测每个区域的房价中位数。目的是完整实现一个机器学习的流程...
2020-03-22 13:00:00
1592
7
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人