- 博客(7)
- 收藏
- 关注
原创 JavaScript 开发基础入门:从历史到核心语法
JavaScript 的诞生与 Netscape(网景)公司密不可分。最初它被命名为 LiveScript,后为借助 Java 的市场影响力更名为 JavaScript,这也导致了许多人对两者关系的误解。基于对象:可以直接使用语言内置的对象,也可自定义对象;弱类型:变量的数据类型由赋值决定,无需提前声明类型;解释执行:无需编译,由浏览器逐行解释执行;动态性:运行时可修改变量类型、添加对象属性等;平台无关性:只要有浏览器支持,即可在任何操作系统运行;安全性:仅在浏览器沙箱内运行,无法直接操作本地文件系统。
2025-07-23 18:44:16
189
原创 网络爬虫中的 Robots 协议与数据存储实战指南
在网络爬虫开发中,合规爬取与高效数据存储是两个核心环节。本文将详细解析 Robots 协议的核心内容、爬取风险及合规策略,同时深入讲解 TXT 与 CSV 文件存储的实现方法,助你轻松掌握静态网页爬取的数据处理流程。
2025-07-22 18:29:23
305
原创 HTML 基础概念,开发基础
HTML 即超文本标记语言(HyperText Markup Language),是描述网页的标记语言,并非编程语言。可以实现加入图片,声音,视频,超越了文本限制。也可以从一个文件跳转到另一个文件。属性,可设置左对齐(left)、居中对齐(center)、右对齐(right)。(对齐方式),属性值可设像素值、百分比、颜色名称或十六进制数等。:文件主体,包含网页显示的内容。(字号,1-7 号从小到大)、也有各自的对齐、背景等属性,(图片无法显示时的提示)、:换行标记,为单标签。六级,字号从大到小。
2025-07-21 17:29:49
296
原创 Requests实现模拟登录
注意在模拟登录过程中仅支持账号密码登录,如果需要其他方式登录需其他方法。当你在浏览器中登录网站时,浏览器会自动处理 Cookie、会话令牌等信息,而使用 Requests 模拟登录时,需要手动管理这些信息。引用函数、请求头设置(User-Agent,Cookie)、获取登录所需的csrf令牌,表单数据提交、登录状态验证等。分析登录页面:确定登录所需的参数(如用户名、密码、CSRF 令牌等)和请求 URL。将示例中的 URL、用户名和密码替换为你要登录的网站的实际信息。四:模拟登录的基本流程。
2025-07-18 16:33:07
113
原创 基于网络爬虫的表情包资源采集与手机号码智能查询系统
请求方式有get请求,post请求,head请求,put请求,patch请求,delete请求,options请求以及自定义请求方法。二.通过爬虫获取静态网页的文本内容,使用Requests库,获取http://www.ip138.com/手机归属地查询结果并打印输出页面的HTML文本内容。2.将该代码输出的结果复制到一个.txt文档保存后将后缀名更改为.html,后打开此文件,实现手机号码归属地查询的爬虫功能。在输出过程中出现上述情况的原因是被服务器识别为异常请求从而拒绝连接。3.确保请求地址的完整。
2025-07-17 16:00:50
626
原创 实现一个安全的网页内容抓取函数
这段代码定义了一个名为的函数,用于从指定 URL 获取 HTML 文本内容。函数尝试 发送 HTTP 请求并处理可能出现的异常,最后返回网页的 HTML 内容或错误提示。主程序中,代码调用这个函数获取百度首页的 HTML 内容并打印输出。
2025-07-16 14:39:49
574
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人