有更加成熟的一种爬虫脚本语言,而非框架。是通用的爬虫软件ForeSpider,内部自带了一套爬虫脚本语言。很多同学学php的,但是也自学过python,对php了解还是比较深的,为什么多迪技术人员都喜欢用python写爬虫?
二、其实完全可视化的采集也不需要计算机专业的。大致学习了之后就可以上手采。而且forespider关于数据的管理做的很好。一是软件可以集成数据库,在采集之前就可以建表。二是数据可以自动排重,对于金融这样数据更新要求很高的行业,就特别合适。
三、是关于免费的问题,我觉得免费的东西同时还能兼顾好用,只能是中国的盗版软件和手机APP。大概是大家都习惯了在软件上不花钱,所以都想找到免费的。
四、Python只是脚本语言,采集效率和性能如何能与强大的C++相提并论?C++直接控制系统的底层,对内存空间的控制和节省都是其他语言无法竞争的。首先,forespider的开发语言是C++,而且C++几乎没有现成的框架可以用,而火车采集器是用的C#。