- 博客(8)
- 收藏
- 关注
转载 php中include、include_once、require、require_once等函数的异同
一:1.include() 产生一个警告2.require() 则导致一个致命错误换句话说,如果你想在丢失文件时停止处理页面,那就别犹豫了,用 require() 吧。include() 就不是这样,脚本会继续运行。同时也要确认设置了合适的include_path。就是说再解析程序时即读取require的文件,而不是解析后,如果不能读取到被require的文件,就不能进
2017-04-08 13:37:07
984
1
原创 简陋的分布式爬虫
Ugly-Distributed-Crawler简陋的分布式爬虫新手向,基于Redis构建的分布式爬虫。 以爬取考研网的贴子为例,利用 PyQuery, lxml 进行解析,将符合要求的文章文本存入MySQ数据库中。结构简介cooperator协作模块,用于为Master&Worker模块提供代理IP支持master提取满足条件的文章url,并交给Worker进一步处理Worker解析文章内容,将
2017-03-31 16:18:12
544
原创 Web系统与技术--Chrome插件的选择与安装&B/S架构速览
一、Chrome插件的选择与安装获取插件1. Chrome应用商店(需科学上网)2. 国内网站(Chrome插件、插件网)插件选择1. 开发辅助类FE助手结构化查看GitHub代码库2. 日常工具类截图工具科学上网有道笔记(剪报)翻译3. 生活健康类爱护眼睛4.设计类创意设计推荐(New Tab)查看字体5.美化类远方(New Tab)插件安装1. 应用商店直接点击[
2017-03-21 18:53:17
1264
原创 Web系统与技术--如何使用搜索引擎来解决某个生活问题
刚开始在《即可》上看到下面这篇有趣的推送 空闲的时候又想起来,于是搜一下答主但是除了“熊本熊死了吗”这句话之外的都忘记了只能拿着这点材料搜索 直接搜索了一下,情况不太乐观由于是国内的文章,所以优先选用百度 想起来这是来自知乎的推送于是添加检索条件 inurl: zhihu.com依然没有搜索到,于是更换关键词 毫无所获但是明明一天前还是可以搜到的! 没有办法,只能用谷歌试一下这次使用“熊本熊摔下电梯
2017-03-21 11:47:45
688
原创 Web系统与技术--在浏览器地址栏里输入一个网址后所发生的故事
以http://www.x.com/post.php为例 在查找IP之前还要先通过DHCP服务器得到主机的IP地址和默认路由器IP,本地DNS服务器的名字和地址。 路由器用于网络节点的通信,本地DNS服务器用于解析域名。首先浏览器会判断URL的协议类型在这里是HTTP协议(超文本传输协议)(查看更多协议)接下来通过域名查找IP1. 首先主机会检查本地host文件,判断是否相应域名的映射
2017-03-21 10:54:11
2123
原创 Web系统与技术--使用Markdown
15分钟上手Python爬虫准备Python基础语法(学会列表即可)浏览器Python库 pyquery分析目标打开浏览器,进入目标网站(此处以百度百家·人物为例)打开开发者模式(F12)通过浏览器自带的工具查看页面html结构 工具: 结果: 发现标题在h3标签下的a标签中开始抓取完整代码:from pyquery import PyQueryurl = 'http://bai
2017-03-11 13:34:50
643
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人