可以做爬虫的语言有很多,如 PHP、Java、C/C++、Python等等...
1)PHP语言
虽然是世界上最好的语言,但是他天生不是干这个的,而且对多线程、异步支持不够好,并发处理能力很弱。爬虫是工具性程序,对速度和效率要求比较高。
2)Java 语言
的网络爬虫生态圈也很完善,是Python爬虫最大的对手。但是Java语言本身很笨重,代码量很大。 重构成本比较高,任何修改都会导致代码的大量变动。爬虫经常需要修改部分采集代码。
3)C/C++语言
运行效率和性能几乎最强,但是学习成本很高,代码成型比较慢,是很慢