- 博客(21)
- 收藏
- 关注
原创 正则表达式
是指定一组与之匹配的字符串,a* a出现0或者多次a+ a出现1次或者多次a?a出现0次或者1次a{2,5} 出现在2到5次之间(cat|dog) 匹配 cat或者dog[abz]+ 表示匹配的字符只能是中括号中的字母 如果使用了 ^则为取反符号/d 代表数字字符/w代表英文字符数字加上下划线/s代表tab和换行符其中/加大写的DWS则表示取反符号.表示任意字符 不包括换行符号^a 匹配行首的 a$只匹配行尾例如正则表达式,表示:匹配大写字母T或小写字母t,后面跟字母h,后跟字母e。
2025-07-07 18:20:47
1013
原创 爬虫的笔记整理
3.cookie.http请求是无状态的 cookie第一次登录后服务器返回的数据(cookie)到浏览器,保存在本地 ,第二次就会被浏览器自动识别了。3.浏览器中解析返回的HTML,其中引用了许多的其他文件,images,css文件,JS文件等,再次法中request去获取这些内容。1,是python中的一个基本网络请求库,模拟浏览器行为,相关的网络请求都被集中到urllib.request中。4,network,浏览器发动的所有请求。2,post,发送数据登录,上传文件等。2,console,控制台。
2025-07-06 22:31:28
1140
原创 Python数字处理(数字类型,类型转换,数字函数,随机函数)
:布尔类型是int的子类,True == 1和False == 0均为True。
2025-05-18 22:44:41
397
原创 python的注释(批注)用法
在Python的魔法世界里,注释是程序员留给未来的"时空信笺"。:Python解释器会忽略以开头的注释,就像隐形斗篷让文字对机器不可见。
2025-05-17 02:23:19
479
原创 第十章:多线程爬取——让爬虫“开外挂”
方式优点缺点适用场景单线程代码简单,无竞争问题效率低,适合小规模数据学习测试、简单爬虫多线程效率高,并发处理能力强需处理锁和资源竞争大规模数据爬取异步更高并发,资源占用少代码复杂度高(async/await)超大规模爬虫(百万级URL)
2025-04-26 22:41:14
392
原创 第十章:SQLite数据库——程序员的“随身收纳盒”
如果SQLite会说话,可能会吐槽:“人类总让我存数据,却忘了给我配个‘防误删’保险箱!:掌握数据库连接、建表、增删改查操作,从此告别“数据找不到”的尴尬!:学会用SQLite管理数据,从“数据乱堆”到“整齐入库”!关于SQlite的。
2025-04-24 23:01:18
542
原创 第九章:Beautiful Soup——HTML解析的“瑞士军刀”
目标:学会用Beautiful Soup解析HTML,对比正则表达式和XPath,从“乱码中找规律”到“精准抓数据”!学习目标:掌握Beautiful Soup基础语法、标签定位技巧,从此告别“正则写到怀疑人生”的痛苦!
2025-04-24 12:36:33
1051
原创 第八章:多线程与多任务——让程序“分身有术”
学会用多线程让程序“一心多用”,从“单线程搬砖”到“多线程开挂”!:掌握线程原理、共享变量与互斥锁,从此告别“程序卡死”的尴尬!
2025-04-23 14:01:04
1005
原创 第七章:XPath——网页数据的“GPS导航”
如果XPath会说话,可能会吐槽:“人类总让我精准定位元素,却忘了告诉我页面代码是‘祖传’的!:掌握XPath语法、lxml库安装与使用,从此告别“复制粘贴抓数据”的苦力活!:学会用XPath精准定位HTML元素,从“大海捞针”到“一秒锁定”!
2025-04-23 12:53:09
964
原创 第六章:JavaScript——网页的“动起来”魔法
目标:学会用JavaScript让网页“活过来”,从“静态海报”变身“交互大片”!学习目标:掌握变量、函数、DOM操作、事件处理,从此告别“点击不动”的尴尬!
2025-04-22 23:24:27
533
原创 第五章:CSS——网页的“化妆师”
学会用CSS给HTML“涂口红画眼影”,让网页从“素颜”变身“网红爆款”!:掌握CSS选择器、盒模型、布局技巧,从此告别“网页丑到不敢看”的尴尬!(温馨提示:虽然名字里有“CSS”,但建议搭配奶茶食用更佳)
2025-04-21 22:30:12
321
原创 第四章:HTML——网页世界的“乐高积木”
目标:学会用HTML搭积木,从“小白”变身“网页建筑师”!学习目标:掌握HTML基础语法、常用标签和网页结构,从此看懂网页代码像看说明书一样简单!
2025-04-21 21:53:56
1073
原创 第三章:正则表达式——乱码中找对象的“神技”
如果正则表达式会说话,可能会吐槽:“人类总让我干脏活累活,却不知道我内心在咆哮:‘这字符串是外星文明写的吗?(温馨提示:如果你觉得写字符串处理代码像“便秘”,学完本章你会“畅快淋漓”)
2025-04-21 13:04:17
865
原创 python爬虫系统学习
python是一门非常简单容易上手的语言,相较于其他编程开发语言,python更适合运用于日常的办公和个人使用,比如用python去爬取网站上用户所需要的知识,其设计哲学强调代码可读性和简洁性,通过缩进代替了传统语言的大括号,对新手更加友好,使得代码结构清晰明了。
2025-04-20 02:54:58
768
原创 阿里云天池
阿里云天池是阿里巴巴集团推出的一个在线学习平台,主要面向数据科学、人工智能和云计算等领域的学习与实践。天池不仅提供了丰富的课程和资源,还有许多竞赛可以参与,以锻炼和展示自己的技能。
2024-07-30 12:51:28
1131
原创 Python简介
4.函数之间或类的方法之间用空行分隔,表示一段新的代码的开始。但是空行的作用在于分隔两段不同功能或含义的代码,便于日后代码的维护或重构。Python的创始人是Guido van Rossum(吉多·范罗苏姆),他于1989年圣诞节期间开始编写Python,最初的目标是创建一门易读、简洁且可扩展的编程语言。) 来表示字符串,引号的开始与结束必须是相同类型的。其中三引号可以由多行组成,编写多行文本的快捷语法,常用于文档字符串,在文件的特定地点,被当做注释。2.变量与数据类型:整数,浮点数,字符串,列表,字典。
2024-07-18 17:24:43
241
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅