- 博客(35)
- 收藏
- 关注
原创 Python常用内置模块-csv模块
Python中的csv模块是用于处理CSV(逗号分隔值)文件的标准库。CSV文件是一种常见的文件格式,用于存储和交换数据。一般也被叫做逗号分隔值文件,可以使用 Excel 软件或者文本文档打开。其中数据字段用半角逗号间隔(也可以使用其它字符),使用 Excel 打开时,逗号会被转换为分隔符。csv 文件是以纯文本形式存储了表格数据,并且在兼容各个操作系统。
2024-07-19 14:12:18
304
原创 Python实现滑动验证码缺口识别-百度智能云
提交完申请之后,需要等待一小会儿......点击 EasyDL版控制台之后 扫码登陆。创建成功之后 能够在应用列表看到相关信息。需要比较长的时间训练......
2024-06-27 09:54:13
458
原创 random模块快速入门
random是python的一个内置模块,专门用于生成随机数,但是要明确一点,random模块生成的并非真正的随机数,而是伪随机数。random提供的部分方法可以生成指定分布的随机数,比如生成符合高斯分布的随机数,这些方法在处理数学问题时将非常有用。
2024-06-27 09:48:30
610
原创 10-Python之路----装饰器(入门版)
因为一直致力于减少工作的总工作量。因为一旦让你去做本该计算机完成的事,你将会怒不可遏。因为被荣誉感冲晕头的你会把程序写得让谁都挑不出毛病来。大家好😄, 现在让我们一起来学习一下装饰器函数 🎉。
2023-11-01 20:04:55
161
原创 15-Python之路-os模块
在Python中,文件操作是一项非常基础的编程任务。Python中的 os 模块提供了访问操作系统功能的接口,包括访问文件系统、进程管理、环境变量等等。通过 os 模块,我们可以在 Python 中执行很多跟操作系统相关的任务,比如创建、删除、移动文件或目录,获取当前工作目录,运行命令行程序等等。os 模块是 Python 标准库中的一部分,在 Python 中使用它非常方便。
2023-10-26 20:11:39
143
原创 01-Js逆向-百度翻译
现在用Python执行JS代码,因为我们知道这个函数传入的参数是用户输入的需要翻译的数据,所以就可以开始进行调试,当然会预见到会有很多的报错,不过没关系,这个是很正常的,只需要一个个把每个报错解决了可以了,因为这个sign值是和传入的参数相关的,也就是说传入相同的值也就会得到相同的结果,最后得到一个sign值就算是可以成功执行了,然后验证一下是不是相等的。首先我们要明确目标,爬取这个网站的目的是什么,那我们的目的就是模拟浏览器发送请求,完成翻译的功能,明确了目标之后我们再定位到相关的URL就比较容易了。
2023-08-29 15:46:12
1200
1
原创 最简单的谷歌浏览器调试面板使用教程
恢复执行这个常用的场景有两个,一个是结束调试,比如要同一个页面要换一个请求分析的时候可以结束当前调试,另一个是进入一个相当长的不重要的循环中,但是又需要分析同一个函数中后面的代码,这时可以在循环外面打一个断点,再恢复执行,可以快速跳出循环。在一些网页的渲染,行为和请求等等的实现后面都有JS代码进行执行,我们对JS代码打了断点之后,当JS执行到我们打断点的那一行时就会暂停执行,其实就像我们在IDE中编写Python一样,是对代码进行调试的一个工具。设置断点的最基本的方法是在特定的代码行上手动添加一个断点。
2023-08-25 10:58:11
451
原创 零基础爬取堆糖网图片(二)---多线程版
接着上篇文章,我们已经实现图片的下载,但是我们发现整个爬取过程中,因为使用了,导致每次遍历,都会打开文件在关闭,打开文件在关闭(套娃)。所以需要注意for循环的使用,其次下载图片是整个程序中最耗时的,如果需要提升爬取速度,那么我们可以从这个方向入手,实现爬取。
2023-06-15 10:17:48
170
原创 01-Tkinter教程-窗口的管理与设置
官方用的GUI工具包——Tkinter(IDLE就是用这个开发的)。Tkinter是Python的标准GUI库,它实际是建立在Tk技术上的。在大多数Unix平台以及Windows系统上都可用。作为 python 特定的GUI界面,是一个图像的窗口,tkinter是python 自带的,可以编辑的GUI界面,我们可以用GUI 实现很多直观的功能,比如想开发一个计算器,如果只是一个键盘输入,输出的黑色窗口,是没用用户体验的。所有开发一个图像化的小窗口,就是必要的。
2023-06-14 16:52:29
1236
原创 最详细的MongoDB的安装以及各种问题解决方法
右击此电脑->属性->高级系统设置->系统环境变量->选择path->编辑->新建->复制mongodb的安装路径->确定(保存)下载安装包的时候注意一下,版本不要选择太新或者太旧的版本,要考虑电脑系统,尽量下载 xxx.msi的。需要先打开一个终端启动服务,在打开终端输入mongo链接。提前在D盘符下面新建了一个 MongoDB的文件夹。@ 符号后面的 4.4 是最新版本号。打开cmd,输入mongo。
2023-03-30 22:41:31
2381
2
原创 07-Pandas函数与运算
是数据清洗的重要过程,可以按索引对齐进行运算,如果没对齐的位置则补NaN,最后也可以填充NaN。ix是以上二者的综合,既可以使用索引编号,又可以使用自定义索引,要视情况不同来使用,如果索引既有数字又有英文,那么这种方式是不建议使用的,容易导致定位的混乱。DataFrame索引操作,可将其看作ndarray的索引操作。loc是基于标签名的索引,也就是我们自定义的索引名。注意,按索引名切片操作时,是包含终止索引的。作用和loc一样,不过是基于索引编号来索引。标签的切片索引是包含末尾位置的。
2023-03-24 22:20:22
233
原创 06-Pandas高级数据结构
Pandas介绍为什么要学习pandas?那么问题来了:numpy已经能够帮助我们处理数据,能够结合matplotlib解决我们数据分析的问题,那么pandas学习的目的在什么地方呢?numpy能够帮我们处理处理数值型数据,但是这还不够, 很多时候,我们的数据除了数值之外,还有字符串,还有时间序列等比如:我们通过爬虫获取到了存储在数据库中的数据所以,pandas出现了。什么是Pandas?Pandas的名称来自于面板数据(panel data)
2023-03-22 19:01:41
223
原创 14-Python之路---包和模块
通常模块为一个文件,直接使用import来导入就好了。可以作为module的文件类型有".py"、“.pyo”、“.pyc”、“.pyd”、“.so”、“.dll”。每一个以扩展名py结尾的Python源代码文件都是一个 **模块 **同样也是一个,需要符合标识符的命名规则在模块中定义的都是提供给外界直接使用的就好比是,要想使用这个工具包中的工具,就需要先这个模块。
2023-03-16 09:00:00
143
原创 Jupyter Notebook总是未显示Nbextensions的标签
链接:https://pan.baidu.com/s/1KgJhkIoUnAbt8rhW4M9uKQ。在启动jupyter的终端,查看是否报404 缺少文件的问题。
2023-03-15 22:55:42
2252
1
原创 04-Numpy数组对象
NumPy是一个功能强大的Python库,主要用于对多维数组执行计算。NumPy这个词来源于两个单词--Numerical和Python。NumPy提供了大量的库函数和操作,可以帮助程序员轻松地进行数值计算。在数据分析和机器学习领域被广泛使用。总而言之,他是一个非常高效的用于处理数值型运算的包。
2023-03-15 19:02:03
553
原创 12-面向对象---继承与多态
如果在开发中,父类的方法和子类的方法完全不同 ,就可以使用覆盖的方式,在子类中重新编写父类的方法实现。重写之后,在运行时,只会调用子类中重写的方法,而不再会调用父类封装的方法。最常 使用的场景就是在 重写父类方法时,调用 在父类中封装的方法实现。子类继承自父类,可以直接享受父类中已经封装好的方法,不需要再次开发。如果在开发中,子类的方法实现 中 包含 父类的方法实现。子类拥有父类以及父类的父类中封装的所有属性和方法。父类原本封装的方法实现 是 子类方法的一部分。继承的概念:子类拥有父类的所有方法和属性。
2023-03-14 09:30:00
129
原创 03-Jupyter Notebook基础使用
Jupyter Notebook 是什么?Jupyter Notebook 是一款开源的网络应用,我们可以将其用于创建和共享代码与文档。其提供了一个环境,你无需离开这个环境,就可以在其中编写你的代码、运行代码、查看输出、可视化数据并查看结果。因此,这是一款可执行端到端的数据科学工作流程的便捷工具,其中包括数据清理、统计建模、构建和训练机器学习模型、可视化数据等等。Jupyter Notebook特点基于web的在线编辑器可交互式.ipynb文件分享支持markdown。
2023-03-13 18:52:22
1038
原创 02-数据分析环境搭建
是一个捆绑了Pythonconda、其他相关依赖包的一个软件。包含了180多个可学计算包及其依赖。Anaconda3是集成了Python3的环境,Anaconda2是集成了Python2的环境。Anaconda默认集成的包,是属于内置的Python的包。并且支持绝大部分操作系统(比如:Windows、Mac、Linux等)。根据自己的操作系统,下载相应的版本,因为Anaconda内置了许多的包,所以安装过程需要耗费相当长的时间,大家在安装的时候需要耐心等待。Spyder,以下分别做一些介绍。
2023-03-13 18:33:05
298
原创 01-数据分析介绍
数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。现状分析:告诉你过去发生了什么。描述型数据分析原因分析:告诉你某一现状为什么发生。验证型数据分析预测分析:预测未来会发生什么。预测型数据分析。
2023-03-13 18:29:47
2692
原创 思维篇| 为什么数据分析思维比较重要?
结构化,就是将分析思维结构化建一座分析的金字塔,建一张问题分析的思维导图将论点归纳和整理;将论点递进和拆解;将论点完善和补充。公式化是在结构化的基础上,将思维导图上的节点数据化,转化成公式。比如:如何预估上海地区的共享单车投放量?根据对业务的了解,从四个维度来拆解问题。从城市流动人口,人口密度,城市交通数据,保有自行车四个维度来计算。找到公式。同时,因为单车是有损耗的,因公式要加入损耗。分析的业务化,目的在于将分析结果落地,使之有用并且可验证。
2023-03-13 18:26:20
378
原创 11-面向对象---类与对象
在Python中要定义一个只包含方法的类,语法格式如下:class 类名 : def 方法 1(self , 参数列表) : pass def 方法 2(self , 参数列表) : pass方法的定义格式和之前学习过的函数几乎一样区别在于第一个参数必须是self,大家暂时先记住,稍后介绍self类名的 命名规则 要符合大驼峰命名法。
2023-03-13 14:35:09
103
原创 10-Python之路---迭代器和生成器
假如现在有一个列表L = [1,2,3,4,5],如果需要获取列表里的内容,有几种方法?L [ 0 ]如果用索引取值,我们可以取到任意位置的值,前提是你得知道这个值在什么位置。如果用for循环来取值,我们把每个值都取到,不需要关心每个值的位置,因为只能按照顺序来取值。但是,有没有人想过为啥可以使用for循环取值?“可迭代"这个概念,我们可以从报错上分析,之所以12345不可以for循环,是因为它不可迭代,反过来意思就是,如果"可迭代”,那么就可以被for循环!我们知道,
2022-12-10 09:45:00
161
原创 07-数据结构
推导式comprehensions(又称解析式),是Python的一种独有特性。推导式是可以从一个数据序列构建另一个新的数据序列的结构体。x = []字典用{}定义字典使用键值对存储数据,键值对之间使用,分隔键key是索引值value是数据键和值之间使用分隔键必须是唯一的值可以取任何数据类型,但键只能使用字符串、数字或元组。
2022-12-09 09:45:00
168
原创 06-流程控制
如果条件满足,才能做某件事情,如果条件不满足,就做另外一件事情,或者什么也不做正是因为有了判断,才使得程序世界丰富多彩,充满变化!判断语句又被称为 “分支语句”,正是因为有了判断,才让程序有了很多的分支if 的三种形式ifif 条件 1 : 条件 1 满足执行的代码不太建议使用,不满足条件时没有任何提示if … else只有两种情况下使用if 条件 1 : 条件 1 满足执行的代码 else : 以上条件都不满足时,执行的代码……多条件选择使用if 条件 1 : 条件 1 满足执行的代码。
2022-12-08 16:04:23
491
原创 05-Python数据类型
运算、运算符优先级与整形是一样。Python中常用的数据类型str—— 字符串bool—— 布尔(真假)int—— 整数float—— 浮点数(小数)在Python中定义变量时需要指定类型吗?不需要Python可以根据=等号右侧的值,自动推导出变量中存储数据的类型字符串是一种什么结构?它能不能被修改?它有那些操作?字符串是一种序列类型字符串不能被修改字符串可以切片、以及有一些高级的处理方式。
2022-12-08 16:01:52
562
原创 04-Python之路预告片
python注释也有自己的规范,在文章中会介绍到。注释可以起到一个备注的作用,团队合作的时候,个人编写的代码经常会被多人调用,为了让别人能更容易理解代码的通途,使用注释是非常有效的。在说规范之前我们有必要先看以下Python的注释有哪些?以#开头,#右边的所有东西都被当做说明文字,而不是真正要执行的程序,只起到辅助说明作用为了保证代码的可读性,#后面建议先添加一个空格,然后再编写相应的说明文字如果注释信息很多,一行无法显示,就可以使用多行注释。
2022-12-08 16:00:43
214
原创 02-Python解释器和编辑器介绍
这个解释器是用C语言开发的,也叫CPython。在命令行下运行python就是启动CPython解释器。CPython是使用最广的Python解释器。教程的所有代码也都在CPython下执行。除了cpython解释器之外,还有Jpython,IronPython以及PyPy。
2022-12-08 15:59:31
328
原创 09-Python之路---函数进阶
命名空间函数的嵌套:嵌套定义:定义在内部的函数无法直接在全局被调用函数名的本质:就是一个变量,保存了函数所在的内存地址闭包:内部函数包含对外部作用域而非全剧作用域名字的引用,该内部函数称为闭包函数。
2022-11-22 16:03:38
168
原创 08-Python之路---初识函数
def mylen() : """计算字符串长度""" s = 'hello' length = 0 for i in s : length += 1 print(length)来分析下这段代码: 其实除了def这一行和后面的缩进,其它的和前面的代码是一样的。 现在执行以下,你会发现啥也没发生! 因为这里我们只是把代码装起来了,还不会往外拿,拿应该怎么拿出来呢?mylen()这就是代码取出来的过程。
2022-11-18 16:33:32
228
原创 零基础爬取堆糖网图片(一)
首先是一个美图壁纸兴趣社区,有大量的图片今天我们实现搜索关键字爬取堆糖网上相关的美图。当然我们还可以实现多线程爬虫,加快爬虫爬取速度。
2022-11-12 16:22:22
460
1
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人