本周从Github上搜索了几个优秀的爬虫源代码:
我发现它们都有以下几个特点:
1.都有相关类的设计,类与类之间的联系清晰紧凑;
2.有相关的异常处理机制,使得正常代码的控制流不会被错误处理代码弄乱,也可以在特定的情况发生时让控制流跳过多个步骤,保证了错误代码不会一步一步执行到底;
3.变量名清晰明了有意义,让人一看就明白其含义或代表的意义;
4.有部分文本解释说明,方便了小组和团队开发;
5.多线程,使程序充分利用cpu从而达到最高效率地执行程序;
牛顿说:“如果说我看得比别人远些,那是因为我站在巨人们的肩膀上“。向能使自己变得更优秀的人学习!