不用纠结Python和R哪个好了,也不要纠结数据处理时用dplyr还是pandas。。。

我曾经非常纠结到底用Python还是R,我觉得我是一个非常专一的人,一旦用一门语言就想只用一门语言,因为R与Python之间换来换去不仅麻烦而且也几乎不现实。我也在网上看到有许多人也跟我一样纠结,为此许多大牛都写了多篇博文来详细地对比Python与R到底哪个更好一些。

这根本毫无意义。

Python与R没有绝对意义上的差距,两个语言基本上都是20多年了。不要跟我说Python比R快,也不要跟我说Pandas比dataframe强得多。两个语言只是方向不同,并没有什么太大的优劣。

我非常喜欢R的数据处理操作,这非常自然,intuitively,并且R的可视化与动态文本远超Python。然而Python有着最好的机器学习库sklearn和其他的支持。我曾经想,用R处理数据,处理完数据后导入Python进行机器学习建模。

这完全没有必要。我的建议是:

当你需要在R中完成模型时,就用R进行数据的处理;当你需要在Python中完成模型时,就用pandas进行数据处理。

比如说,你要进行时间序列、线性回归等统计模型时,就用R一站式完成。你要进行分类、逻辑回归、SVM等需要用到sklearn包,就用Python一站式完成。

因此tidyverse和pandas都要学。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值