自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 从实践到理论:MySQL 数据库基础入门与核心操作

MySQL 基础并不难,核心在于理解 “表结构设计”“数据完整性约束” 和 “多表关联逻辑”。本文通过实际案例讲解了数据库创建、表设计、外键约束和关联查询,这些技能足以应对日常开发中的大部分场景。想要熟练掌握 MySQL,建议多动手实践:尝试设计自己的表结构,插入测试数据,编写复杂查询语句。记住,数据库的核心是 “数据的一致性和可用性”,好的设计能让数据更易维护、查询更高效。下次我们将深入讲解索引优化、事务和存储过程,敬请期待!

2025-07-25 18:42:39 514

原创 MySQL 入门:从 0 到 1 学会数据库和 SQL,看完这篇就够了

简单来说,数据库就像一个 “超级笔记本”,能帮你永久存储数据、快速查找信息、高效管理复杂关系(比如用户和订单的关联)。SQL(结构化查询语言)是操作数据库的 “普通话”,无论你用 MySQL、Oracle 还是 SQL Server,都能看懂。比如 “学校数据库” 里可以有 “学生表”“课程表”“成绩表”。打开命令行,输入mysql -u root -p,回车后输入密码(默认可能为空),看到mysql>就成功了。列(字段):定义数据的类型,比如 “姓名”(文本)、“年龄”(数字)、“生日”(日期)。

2025-07-25 18:24:51 395

原创 XPath 入门到精通:用爬虫实战快速掌握数据提取技巧

XPath 是一种在 XML/HTML 文档中定位元素的语言,爬虫用它来 “精准抓取” 网页数据。:如果把网页比作图书馆,XPath 就是 “找书指南”,能快速定位到你想要的 “数据书籍”。

2025-07-23 14:34:56 1128

原创 网站藏着的「机器人红绿灯」:5 分钟看懂 Robots 协议

简单说,Robots 协议是网站给搜索引擎爬虫看的 “说明书”。它通过一个名为robots.txt的文本文件,告诉爬虫哪些页面可以抓取、哪些需要避开。比如电商网站的用户隐私页、后台管理系统,都可能通过这个文件禁止爬虫访问。这个文件必须放在网站的根目录下(比如),爬虫访问网站时会先检查这个文件,再决定后续行动。值得注意的是,它更像一种 “君子协定”—— 善意的爬虫会遵守规则,但恶意爬虫可能无视它,这时候就需要配合其他技术手段防护了。Robots 协议不是技术难题,却能帮网站更高效地与搜索引擎 “沟通”。

2025-07-22 15:37:24 681

原创 HMTL技术进阶入门:代码实现网页跳转

姓名:<input type="text" name="username" maxlength="4" size="20" value="admin"><br>密码:<input type="password" name="password" value="123456" disabled><br><input type="checkbox" name="hobby" value="唱歌">唱歌。<input type="checkbox" name="hobby" value="跳舞">跳舞。

2025-07-21 19:08:34 510

原创 从零入门 HTML 开发:构建网页世界的基石指南

在互联网蓬勃发展的今天,我们每天浏览的网页、使用的 App 界面,背后都离不开 HTML 这一基础技术的支撑。语义化是现代 HTML 开发的重要理念,指的是使用合适的标签来表达内容的含义,而不是仅仅通过样式来呈现效果。例如,使用 <header> 表示页头,<nav> 表示导航栏,<main> 表示主要内容,<footer> 表示页脚等。HTML 是前端开发的基石,掌握它之后,你可以继续学习 CSS 来美化网页,学习 JavaScript 来实现交互效果,逐步成为一名全能的前端开发者。

2025-07-18 18:23:31 1142

原创 爬虫技术Requests实现模拟登录

print("王祎鹏"in r.text):通过Python Requests库模拟浏览器登录行为。print("获取个人主页成功!:采集完整的用户视角数据(如社交网络信息)掌握HTTP/HTTPS协议基本原理。理解Cookie/Session机制。print("登录成功!:获取需要登录才能查看的页面数据。:获取用户账户相关的定制化信息。:维持会话状态以进行连续操作。不需要处理复杂JS加密的场景。理解可能的CSRF防护机制。:用于网站功能测试和验证。需要手动处理所有请求参数。不依赖复杂前端验证的网站。

2025-07-18 14:00:22 1063

原创 静态网页爬取学习

常见数据处理: 文本内容提取(去除HTML标签) 链接提取与相对路径转换 表格数据解析 元信息提取(title, meta, headers) 分页内容合并 性能优化方向: 多线程/协程并发请求 请求缓存与去重 增量爬取策略 断点续爬实现。简单数据采集:获取不需要交互的公开信息(如新闻、博客文章) 教学与原型开发:作为爬虫技术学习的入门实践。高效获取结构化数据:从静态HTML中提取表格、列表等结构化信息。SEO分析:获取网页的元数据、关键词等信息进行SEO优化分析。内容为主的网站(新闻、文档、百科类)

2025-07-16 14:50:44 399

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除