学会用这些“套路”,你才算数据分析师

本文分享了一名非本专业背景的数据分析师转行经历,强调了Python在数据分析领域的应用及学习路径,即使数学和英语基础薄弱也能成功转型。

很多想转行数据分析师或者想学数据分析的朋友都在问我:

“非本专业想转型做数据分析,有救吗?”

“数学不好,英语不好,想学Python数据分析,有救吗?”

“不懂Python数据分析到底是什么,有救吗?”

 

我的答案是 妥妥有

大家好,小编我目前在城市数据团,是一名数据分析师。

准确来说,我是一名非本专业的转行数据分析师,以上三个问题是我在从事数据分析工作后经常被问到的。

 

重新定义“非本专业”

首先我们需要明确“非本专业”的含义。我以大学本科两个最贴近数据分析相关岗位的专业为例:统计学专业和计算机专业

从两门专业的培养方案可以看到统计学课程主要是数学相关的理论知识,计算机专业主要学的是系统程序系统开发与编程知识。

整理自同济大学各学院公布的培养计划

数据分析相关工作,往往要求的是上述两个专业综合技能任何一个专业的学生想要入行,都需要学习对应的新知识,不能“啃老本”,他们都可以算作广义上的“转行”。

 

转行不一定是100%改变,结合本专业的业务转型是一条不错的出路。

以我自己为例,从前的我学习城市规划类,是一个传统行业。这个行业因为互联网的高度普及受到了巨大冲击,传统的“拍脑袋”方式不再吃香,每个人每家单位都在想如何适应“数据化”这个潮流。 

传统的城市设计模式,大部分是实地调研到的现场信息与设计师的“感性”想法结合的成果,在城市尺度上缺少数据辅助决策。

 

而我却把这个挑战看做契机,开始迈入数据的门槛,成为一个城市数据的研究者,尝试活用互联网化带来的“数据”,从技术上到思维慢慢的转变。

现在我可以借用地图热力数据、手机信令数据、人口迁徙数据,通过一定的分析软件、工具等,来重新定义和研究“城市”。

 

刚接触Python时

我的数学一团糟,英语全靠字典

Python不仅是一门编程语言,而且是数据挖掘机器学习等技术的基础,方便建立自动化的工作流。

最初我决定学习,是因为其他的软件不能再满足效率和数据量的要求。虽然自己的数学英语已经还给老师,我还是逐渐在自学和实践中,把Python一直用到现在。

慢慢的我发现,Python入门不难。它对数学要求并不是太高,重要的是需要知道如何用语言表达一个算法逻辑。比构建一个等差数列的和,数学语言和计算机语言是不一样的:

类似于Excel,Python有很多封装好的工具库和命令,我要做的是用哪些数学方法解决一个问题,并构建出来。

那么上哪去找这些数学方法?系统学习看教材资料,遇到问题问百度谷歌,还有一个交流群就完美了~(文末就有)

英语相对简单,用好词典chrome翻译功能即可。

 

学Python一段时间后

发现的是一个有趣的新世界

这里需要用一个有趣的例子说明问题:如何用Python研究财富分配的规律?简单来说,我们可以采用理顺逻辑—构建算法—代码实现—模拟实验的方法来做研究:

这个Python模拟实验模拟的是社会财富分配的简化模型,从而模拟这个世界的运行规律。我们假设:每个人在18岁带着100元的初始资金开始玩游戏,每天玩一次,一直玩到65岁退休。“每天拿出一元钱”可理解为基本的日常消t费。以此计算,人一生要玩17000次游戏,即获得17000次财富分配的机会。最后财富会接近于幂律分布, top10%的富人会掌握大约30%的财富。本案例来自城市数据团。

 

构建这样的模型并非一蹴而就。这个案例灵感源于蒙特卡洛思想,每模拟一次,程序便要运行17000遍,期间涉及多次参数和代码的调整。其他的鼠标点击类软件很难做这样的模拟,Python的趣味性就在此处。

学习Python,需要不断的体验有趣的项目,在实践中体验技能和思维。

智慧是通过体验获得的,知识是通过勤奋获得的。

 

似懂非懂

怎样才能快速入门Python数据分析?

我这边提供一份免费的学习大礼包,包含免费体验课、免费岗位解读、在线答疑以及学习资料。

需要的同学可以扫描领取哦

 

### 关于电商促销策略分析数据集下载 对于希望深入研究电商促销策略并获取相关数据集的研究者或从业者而言,互联网提供了多种途径来获得所需的数据资源。通常情况下,公开可用的数据集会集中在一些知名的开放平台或是特定领域内的社区分享网站上。 #### Kaggle 平台上的电商促销数据集 Kaggle 是一个广受好评的数据科学竞赛和协作平台,在这里可以找到许多由个人贡献者上传的真实世界商业案例数据集合,其中包括不少涉及电子商务促销活动记录的信息。例如,“E-commerce Product Sales Data Set”,该数据集中包含了产品销售详情、折扣力度以及顾客反馈等多项指标,非常适合用来探索不同优惠措施对企业收益的影响关系[^1]。 #### UCI机器学习库中的零售业交易历史资料 UCI Machine Learning Repository 收录了一系列适用于算法训练测试的标准样本文件夹,其中名为“Online Retail II”的项目就涵盖了英国某家在线零售商自2009年至2010年间完整的订单流水账单副本。这份文档不仅详尽记载了每次购物的具体构成要素(如单价、数量),同时也特别标注出了参与各类限时特卖计划的商品条目及其对应的让利幅度,从而便于使用者从中提炼出有关价格敏感度变化趋势的有效见解[^2]。 #### GitHub 上开源项目的共享资源链接 GitHub 不仅仅是程序员们展示作品的地方;事实上,它同样也是众多科研工作者交流心得经验的重要场所之一。通过搜索关键词组合“e-commerce promotion dataset”,能够发现多个致力于收集整理行业内外典型实例的仓库地址。这些地方往往汇聚了大量的原始素材供大众免费取用,并且伴随着详细的说明文档指导如何进一步加工利用它们以满足个性化需求[^3]。 为了确保所选数据源的质量可靠性和适用范围广泛性,在正式开展任何基于上述渠道取得的内容之前,建议先仔细阅读官方给出的相关介绍材料,确认其确实符合预期目标后再做决定。此外,考虑到隐私保护法规的要求日益严格,务必留意各站点关于授权使用的条款细则,以免触犯法律风险。 ```python import pandas as pd url = 'https://archive.ics.uci.edu/ml/machine-learning-databases/00502/online_retail_II.xlsx' data = pd.read_excel(url, sheet_name='Year 2010-2011') print(data.head()) ```
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值