我是怎样开始自己的数据分析职业生涯的

本文分享了一位数据分析师的职业历程,从金融学习到使用Python进行数据分析,强调了Python在提高工作效率方面的优势。

 本文在Creative Commons许可证下发布

 近年来被热炒的大数据行业是在近几年收集数据和存储数据的技术突破后,数据量飞速发展才出现的词。它用到的技术基础并不是新出现的。所以,大家在看媒体人炒这个题材的时候,千万要保持冷静。因为它先是叫数据分析与商务智能,随后叫数据挖掘,现在叫大数据。其实说的是同一个行业。金融和通信领域才是目前与自家业务结合度最高的两个行业,因为他们早就建成了覆盖全国用户全业务数据的数据中心,有的甚至每个省分公司都建有自己的数据中心,目前曝光率最高的互联网企业目前也在奋起直追中,但是他们数据还比较单一......当然,就有了某度甚至提出了全员数据分析的口号。

  我想说的是自己走上这条路是基于自己一贯秉持的三原则:1、专注于比赚钱更有意义的事情;2、创造比收获更多的利益;3、有长期打算。2007年,大学同学在群里上传了《货币战争》,我好奇于金融市场的阴谋论,就有了随后展开的金融学习,我甚至有在毕业前夕考虑在母校读一个金融学博士。当然,2007年的金融危机更加激发了自己的实证精神、同时也激发了尽快去占位的思想,我选择了自学。在计算量化指标上,实际上绕不开数据库和数据分析软件。本文想提下Python,它对我的重要性逐年提高,不止是在IT领域,同时也在数据行业中。在自己2015年发表的两篇网络模拟程序论文和一篇数据分析论文中,实际上都是使用Python做的原型程序。我是从2004年开始用Python的,刚开始只是觉得Perl太绕人,伪代码设计风格的Python比较对自己的路子。所以武大的毕业论文就有了两个程序实现版本,一个是VC++的实现,一个是Python的。2007年开始用R。原因是当时使用的Fedora Core 6上面可以很方便的使用这个统计计算软件。

我觉得经过这10多年的发展,作为动态语言的Python,语言结构清晰简单,库丰富,成熟稳定,网络模拟、科学计算和统计分析都很牛逼,生产效率远远高于,c++,java,尤其擅长数据分析策略跑数据回测,这在我验证金融市场阴谋论的活动中,节约了大量的时间(相对于是用C++)。
当然,对于实际的使用也有一些例外:
1、过去形成了其他语言为主的体系,比如平台以C++编写,API都是C++的,老人也熟练C++,那么他们以C++为主。
2、有些机构以研究为主,也许他们使用Matlab
3、C++、JAVA、VB等各种语言的天才Coder,我只能远距离膜拜,你们用汇编也比我的效率高十倍,你们是我心目中的神。
再描述一下自己,按照互联网上的技术人员分类,我应该算一个数据分析师,一个会写程序的数据分析师。我的工作是分析数据、发现规律、制定和验证策略,然后验证结果,然后优化调整,往复循环。

我个人是从C++转向Python,原因无他:效率。人的精力有限,写程序的时间多,思考的时间就少,我偏好Python的原因:

1、正确就是效率。越复杂、越低级的语言,出错率越高,BUG导致数据分析错误、策略程序崩溃,那种欲哭无泪的感觉........
2、Python重在开发效率,设想同一个数据分析策略,我已经完成测试了,给老板打报告了,而你还在调试C++,老板不会认为你勤奋,老板会认为你是某种动,再往远想想,比如跨界到金融行业里面跑投资策略。

3、Python的性能不差,Python还是调用C库,再考虑PVM,其实和C的性能差别基本上可以忽略不计。确实在乎相差的微小性能,建议花2万块买个最新、最高配的Thinkpad,直接秒杀。

4、对于金融行业的分析师而言:语言不是主要性能瓶颈,网络、设备等造成的影响更大,比如C++程序快了2us,而网络延迟就耗去了1ms。
再扒一扒前面几个例外情况,这部分作为娱乐,不属于内容:
第一种,就是有历史积累的那种,说的好听是知识库,说的不好听那就是历史包袱。老平台上绝大多数策略都已经失效了,早都该推倒重来了。
第二种,那些卖分析报告的,也许可能还是个实习生,甚至从来就没有实践过,他的报告可靠吗。再进一步,如果报告是可靠的,他为什么不自己交易,再造一个文艺复兴,为什么要告诉你呢,他是大傻?或者买报告的是大傻?言辞草率,对兄弟不敬,先道歉。说转来啊,都什么年代了,一台PC的性能就远超过去的大型机,谁有功夫给你c和c++,有那个功夫不花在学好数学:高等数学,线性代数,概率论,统计学;
精通Python,R;
掌握hadoop生态系统中的hbase,hive,mahout;
反复实现、改进常用算法;
学习与时俱进的数据仓库、数据挖掘和机器学习的理论知识;
最后再加上大量的实践,实际上就是一条走向专家的路线。

内容概要:本文设计了一种基于PLC的全自动洗衣机控制系统内容概要:本文设计了一种,采用三菱FX基于PLC的全自动洗衣机控制系统,采用3U-32MT型PLC作为三菱FX3U核心控制器,替代传统继-32MT电器控制方式,提升了型PLC作为系统的稳定性与自动化核心控制器,替代水平。系统具备传统继电器控制方式高/低水,实现洗衣机工作位选择、柔和过程的自动化控制/标准洗衣模式切换。系统具备高、暂停加衣、低水位选择、手动脱水及和柔和、标准两种蜂鸣提示等功能洗衣模式,支持,通过GX Works2软件编写梯形图程序,实现进洗衣过程中暂停添加水、洗涤、排水衣物,并增加了手动脱水功能和、脱水等工序蜂鸣器提示的自动循环控制功能,提升了使用的,并引入MCGS组便捷性与灵活性态软件实现人机交互界面监控。控制系统通过GX。硬件设计包括 Works2软件进行主电路、PLC接梯形图编程线与关键元,完成了启动、进水器件选型,软件、正反转洗涤部分完成I/O分配、排水、脱、逻辑流程规划水等工序的逻辑及各功能模块梯设计,并实现了大形图编程。循环与小循环的嵌; 适合人群:自动化套控制流程。此外、电气工程及相关,还利用MCGS组态软件构建专业本科学生,具备PL了人机交互C基础知识和梯界面,实现对洗衣机形图编程能力的运行状态的监控与操作。整体设计涵盖了初级工程技术人员。硬件选型、; 使用场景及目标:I/O分配、电路接线、程序逻辑设计及组①掌握PLC在态监控等多个方面家电自动化控制中的应用方法;②学习,体现了PLC在工业自动化控制中的高效全自动洗衣机控制系统的性与可靠性。;软硬件设计流程 适合人群:电气;③实践工程、自动化及相关MCGS组态软件与PLC的专业的本科生、初级通信与联调工程技术人员以及从事;④完成PLC控制系统开发毕业设计或工业的学习者;具备控制类项目开发参考一定PLC基础知识。; 阅读和梯形图建议:建议结合三菱编程能力的人员GX Works2仿真更为适宜。; 使用场景及目标:①应用于环境与MCGS组态平台进行程序高校毕业设计或调试与运行验证课程项目,帮助学生掌握PLC控制系统的设计,重点关注I/O分配逻辑、梯形图与实现方法;②为工业自动化领域互锁机制及循环控制结构的设计中类似家电控制系统的开发提供参考方案;③思路,深入理解PL通过实际案例理解C在实际工程项目PLC在电机中的应用全过程。控制、时间循环、互锁保护、手动干预等方面的应用逻辑。; 阅读建议:建议结合三菱GX Works2编程软件和MCGS组态软件同步实践,重点理解梯形图程序中各环节的时序逻辑与互锁机制,关注I/O分配与硬件接线的对应关系,并尝试在仿真环境中调试程序以加深对全自动洗衣机控制流程的理解。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值