自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(61)
  • 收藏
  • 关注

原创 Python常考面试题汇总(附答案)(持续更新)

Python3 中有六个标准的数据类型:Python3 的六个标准数据类型中:js就是典型的弱类型语言,例如在console下面模拟一下数字和字符串相加,会发现发生了类型转换。 而Python会报TypeError“当一只鸟走起来像鸭子、游泳起来像鸭子、叫起来也像鸭子,那么这只鸟就可以被称为鸭子。”鸭子类型关注的是对象的行为,而不是类型。比如file,StringIO,socket对象都支持read/write方法,再比如定义了__iter__魔术方法的对象可以用for迭代。下面用一个例子来模拟鸭子类型:

2022-07-07 20:44:23 34684 13

转载 使用哪些工具,可以提升 Python 项目质量?

这些工具都是我慢慢实践和整合后找到最符合自己的构建 Python 项目质量的工具集了, 但是这些工具只能检查表面情况, 而其他情况如代码逻辑是否有问题, 则需要编写测试用例后再运行才能知道。而有些团队甚至会采用压力测试, 线上仿真测试等等, 这些工具/系统的引入和使用初期会带来很大的学习和时间成本, 但它们却能让项目一直保持茁壮成长, 减少线上项目Bug出现的次数(当然这些工具还有测试用例等等也要一起跟着维护)。

2022-09-28 16:05:53 353

原创 用 Python 轻松完成一个 TCC 分布式事务,保姆级教程

TCC分布式事务来源于 2007 年Pat Helland发表的一篇名为《Life beyond Distributed Transactions:an Apostate’s Opinion》的论文,TCC分别是Try、Confirm、Cancel的手写字母。

2022-09-27 15:10:03 571

原创 关于 Python金九银十 的面试题

所有的变量都可以理解是内存中一个对象的“引用”,或者,也可以看似c中void*的感觉。通过id来看引用a注:具体的值在不同电脑上运行时可能不同。可以看到,在执行完a = 2之后,a引用中保存的值,即内存地址发生变化,由原来1对象的所在的地址变成了2这个实体对象的内存地址。而第2个例子a这里记住的是类型是属于对象的,而不是变量。而对象有两种,“可更改”(mutable)与“不可更改”(immutable)对象。

2022-09-23 16:04:49 767

转载 Python爬虫之BeautifulSoup4使用

首先说说BeautifulSoup是什么。简单来说,这是Python的一个HTML或XML的解析库,我们可以用它方便从网页中提取数据,官方解释如下:BeautifulSoup 提供一些简单的、Python 式的函数用来处理导航、搜索、修改分析树等功能。它是一个工具箱,通过解析文档为用户提供需要抓取的数据,因为简单,所以不需要多少代码就可以写出一个完整的应用程序。BeautifulSoup 自动将输入文档转换为 Unicode 编码,输出文档转换为 utf-8 编码。

2022-09-23 15:40:36 456

原创 整理了27个Python人工智能库,建议收藏!

它主要是包含许多分类器比如 SVMS、K-NN、随机森林以及决策树中使用监督分类法,它还可执行特征选择,可以形成不同的例如无监督学习、密切关系传播和由 MILK 支持的 K-means 聚类等分类系统。能够给用户提供良好的基于机器学习的生物信息图像分析服务,利用机器学习算法,轻松地分割,分类,跟踪和计数细胞或其他实验数据。大多数操作都是交互式的,并不需要机器学习专业知识。简单的说,要描述输入的 feature,输入的 label,一些参数,参数和输入之间的计算关系,以及目标节点是什么。的模块化机器学习库。

2022-09-23 15:31:46 247

原创 Python 轻量级 Web 框架:Bottle 库!

Bottle是一个超轻量级的python库。说是库,其本身只由一个4000行左右的文件构成,并且不需要任何依赖,只靠python标准库即可运作。和它本身的轻便一样,Bottle库的使用也十分简单。相信在看到本文前,读者对python也已经有了简单的了解。那么究竟何种神秘的操作,才能用百行代码完成一个服务器的功能?让我们拭目以待。

2022-09-23 15:27:32 214

原创 80行Python代码搞定全国区划代码

在网站建设中一般会用到全国行政区域划分,以便于做区域数据分析。下面我们用 Python 来爬取行政区域数据,数据来源为比较权威的国家统计局。爬取的页面为2020年统计用区划代码和城乡划分代码。这里有个疑问,为啥统计局只提供了网页版呢?提供文件版岂不是更方便大众。欢迎了解的小伙伴给我留言。

2022-09-23 15:25:06 1725 2

原创 Python机器学习:适合新手的8个项目

即使是最简单的算法,您也需要做出许多微妙的决定。例如,您可以批量下载3000 多家美国公司的日终股票价格 或美联储的经济数据。使用 Twitter 数据,您可以获得数据(推文内容)和元数据(位置、主题标签、用户、转发推文等)的有趣混合,为分析开辟了几乎无穷无尽的路径。最后,这是每个初学者都应该知道的提示:不要气馁,因为您的算法不如现有软件包中的算法快或花哨。让他们盈利是极其困难的。随着医院继续对患者记录进行现代化改造,并且随着我们收集更细化的健康数据,数据科学家将有大量唾手可得的机会来发挥作用。

2022-09-22 19:47:28 154

原创 让 Python 起飞的 24 个骚操作!

Python加速的技巧有很多,这篇文章总结了24个,查缺补漏,每天学会一个新的小技巧。

2022-09-22 19:43:19 123

原创 Python爬虫入门实例

昨天带伙伴们学习python爬虫,准备了几个简单的入门实例,分享给大家。

2022-09-22 16:16:03 171

原创 超级简单的Python爬虫教程

这篇 Python 爬虫教程主要讲解以下 5 部分内容:了解网页;使用 requests 库抓取网站数据;使用 Beautiful Soup 解析网页;清洗和组织数据;爬虫攻防战;

2022-09-22 15:58:01 44747 1

原创 python爬虫-知网(CNKI)主题文献

通过选择不同的排序,不同的搜索关键词,以及不同的文献类型,可以确定 "q="字段控制搜索的关键词,"rank=" 控制排序方式,“p=” 字段控制了翻页, 并且步长为15。代理IP实现“瞒天过海”之计,让被访问的服务器显示的IP地址是爬虫程序设定的IP,而非计算机真实的IP地址,就算发现是爬虫程序,被屏蔽的IP是代理IP,而非真实的计算机IP地址。在测试程序过程中,大部分文章爬取成功,但是,存在小部分文章爬取失败,按照道理,编码一样话,那应该同时成功,同时失败。注意各个函数之间的参数传递,容易出错。

2022-09-22 15:38:46 5048 4

原创 小伙Python爬虫并自制新闻网站,太好玩了

我们总是在爬啊爬,爬到了数据难道只是为了做一个词云吗?当然不!这次我就利用flask为大家呈现一道小菜。Flask是python中一个轻量级web框架,相对于其他web框架来说简单,适合小白练手。使用Flask+爬虫,教大家如何实时展示自己爬下来的数据到网页上。演示三个功能整个流程就是简单的三步:爬取数据利用实时爬取数据生成词云利用热点推荐新闻。

2022-09-22 15:09:35 220

原创 python爬虫requests库史上最全(有案例)

, ’ 人的一生到底该追求什么?www-form-urlencoded ,相当于普通 form 表单提交的形式,会将表单内的数据转换成键值对,此时数据可以从 request.POST 里面获取,而 request.body 的内容则为 a=1&b=2 的这种键值对形式。首先,构建一个最简单的 GET 请求,请求的链接为 http://httpbin.org/get ,该网站会判断如果客户端发起的是 GET 请求的话,它返回相应的请求信息,如下就是利用 requests构建一个GET请求​​​​​​​。

2022-09-22 15:03:27 15943

原创 玩转 Python 爬虫,需要先知道这些

爬虫基本原理URI 的全称为 Uniform Resource Identifier,即统一资源标志符;URL 的全称为 Universal Resource Locator,即统一资源定位符。比如Github的图标:https://github.com/favicon.ico,它是一个 URL,也是一个 URI。即有这样的一个图标资源,我们用 URL/URI 来唯一指定了它的访问方式,这其中包括了访问协议 HTTPS、访问路径(即根目录)和资源名称 favicon.ico。

2022-09-21 17:18:09 265

原创 Python爬虫不太冷系列一:初识爬虫

有时候,我们通过urllib和requests库等抓取到的网页源代码和浏览器中实际上不一样,这是一个非常常见的问题,现在的网页越来越多的使用前端模块化工具来构建,整个页面都可能是通过Javascript渲染出来的,原始的html源代码极有可能是一个空壳,后续我们也会针对这类网页进行爬虫的介绍!随着互联网的发展,我们的生活中充斥着各式各样的大数据,就像我们平常登录浏览网页的时候,各式各样的数据让人眼花缭乱。通过不同类型的标签来描述不同的元素,各种标签通过不同的排列和嵌套形成网页的框架。

2022-09-21 17:03:34 405

原创 巨细!Python爬虫详解

爬虫的总流程可以理解为:蜘蛛要抓某个猎物-->沿着蛛丝找到猎物-->吃到猎物;即爬取-->解析-->存储;在爬取数据过程中所需参考工具如下:爬虫框架:Scrapy请求库:requests、selenium解析库:正则、beautifulsoup、pyquery存储库:文件、MySQL、Mongodb、Redis……今天的文章是对爬虫的原理做一个详解,希望对大家有帮助,同时也在后面的工作中奠定基础!

2022-09-21 15:51:39 319

原创 Python爬虫 | 爬虫基础入门看这一篇就够了

大家好,今天我们来聊聊Python爬虫的基础操作,反正我是这样入门了,哈哈。其实,一开始学python的时候,我是冲着数据处理分析去了,那个pandas什么的。后来,发现爬虫挺好玩,可以解决纯手工采集网上数据的繁琐问题,比如我用的比较多的爬取taptap某游戏评价内容、某视频网站某剧的弹幕、某评的店铺信息、某牙主播信息等等。关于爬虫,我也只会一些比较基础的操作,不过个人经验上感觉这些基础基本可以满足比较常规化的需求。对于进阶的爬虫技巧,大家在了解熟悉爬虫基础后自然会有进阶学习的思路与途径。

2022-09-21 14:41:21 13373 1

原创 20个值得学习的 Python 技巧

Python 计数器跟踪容器中每个元素的频数, Counter()返回一个字典,元素作为键,频数作为值。try / except 是 Python 中的异常处理模块,添加 else 语句,会在 try 块中没有引发异常的情况下运行。我们使用字符串类中的.split()方法将字符串拆分为子字符串列表,还可以将要分割的分隔符作为参数传递。在相交的情况下,使用第二个字典中的值。下面的代码中,对字符串或列表使用(*)。下面的函数检查列表中的元素是否唯一。可以使用下面的脚本,遍历列表中的值及其索引。

2022-09-21 14:31:37 294

原创 整理了60个Python小例子,拿来即用!

导入 json 模块,调用 dump 方法,就会将列表对象 [xiaoming,xiaohong],序列化到文件 json.txt 中。但是,当对象序列化后,就会更加方便,因为约定俗成的,接口间的调用或者发起的 web 请求,一般使用 json 串传输。参数,但第一个参数需要是表示自身类的 cls 参数,可以来调用类的属性,类的方法,实例化对象等。python五类参数:位置参数,关键字参数,默认参数,可变位置或关键字参数的使用。a=1传入时a就是关键字参数,b,d都未传值,c被传入12,而非默认值。

2022-09-20 19:58:17 1606

原创 熬夜整理!Pandas 文本处理大全

本次来介绍关于文本处理的常用方法。文本的主要两个类型是string和object。如果不特殊指定类型为string,文本类型一般为object。文本的操作主要是通过str来实现的,功能十分强大,但使用前需要注意以下几点。Series除了常规列变量df.col以外,也可以对索引类型df.Index和df.columns使用str如果不是需要先转换类型,否则会报错如,这个和Dataframe中的一行操作是一个原理下面正式介绍文本的各种骚操作,基本可以涵盖日常95%的数据清洗需要了,一共 8 个场景。

2022-09-20 16:28:45 221

原创 用Python展示全国高校的分布情况

本文用Python展示了全国高校的分布情况,全国的高校哪些地方多,哪些地方少,可以一目了然地看到。

2022-09-20 16:23:03 1079

原创 39个 Python Datetime 小例子,拯救因时间抓狂的你

我们都知道,在 Python 中有各种数据类型,例如整数、浮点数、字符串等。同时在开发脚本或各种算法当中,我们应该经常会使用日期和时间。在日常生活中,我们可以用多种不同的格式来表示日期和时间,例如,7 月 4 日、2022 年 3 月 8 日、22:00 或 2022 年 12 月 31 日 23:59:59。它们使用整数和字符串的组合,或者也可以使用浮点数来表示一天、一分钟等等,各种各样的时间表示方式,确实让人眼花缭乱。

2022-09-20 15:57:32 316

原创 5个方便好用的Python自动化脚本

相比大家都听过自动化生产线、自动化办公等词汇,在没有人工干预的情况下,机器可以自己完成各项任务,这大大提升了工作效率。编程世界里有各种各样的自动化脚本,来完成不同的任务。尤其Python非常适合编写自动化脚本,因为它语法简洁易懂,而且有丰富的第三方工具库。这次我们使用Python来实现几个自动化场景,或许可以用到你的工作中。

2022-09-20 15:52:03 353

原创 盘点66个Pandas函数,轻松实现“数据清洗”

今天我们重新盘点66个Pandas函数合集,包括数据预览、数值数据操作、文本数据操作、行/列操作等等,涉及“”的方方面面。Pandas 是基于NumPy的一种工具,该工具是为解决数据分析任务而创建的。它提供了大量能使我们快速便捷地处理数据的函数和方法。

2022-09-20 15:46:50 436

原创 聊天没有表情包被嘲讽,用python爬取了十万张表情包

。。。。这发过去,基本就直接和小姐姐说拜拜了,然后他就向我求救问我有没有表情包,表情包我是没有,但网站有呀,来来,爬虫整起。

2022-09-20 15:41:04 87

原创 4 个Python项目管理与构建工具,建议收藏!

不像 Java 在经历了最初的手工构建,到半自动化的 Ant, 再到 Maven 基本就是事实上的标准了。项目 sample 目录中重复 sample 目录中放置 Python 源文件,tests 目录中是测试文件,再加一个 docs 目录放文档,README.rst, 其他的用于构建的 setup, setup.cfg 和 Makefile 文件。这其实是一个很经典的 Python 项目结构,接下来的构建就用 make 命令了,输入 make 会看到定义在 Makefile 文件中的指令​​​​​​​。

2022-09-19 15:19:56 211

原创 【建议收藏】50 道硬核的 Python 面试题

题目001: 在Python中如何实现单例模式。方法一:使用装饰器实现单例模式。方法二:使用元类实现单例模式。题目002:不使用中间变量,交换两个变量`a`和`b`的值。方法一:方法二:题目003:写一个删除列表中重复元素的函数,要求去重后元素相对位置保持不变。如果愿意也可以把上面的函数改造成一个生成器,代码如下所示。题目004:假设你使用的是官方的CPython,说出下面代码的运行结果。运行结果:上面代码中的结果是但的结果是,这一点的确让人费

2022-09-18 21:41:23 679

原创 60道Python常见面试题,做对80% Offer任你挑!

4、如果__new__创建的是当前类的实例,会自动调用__init__函数,通过return语句里面调用的__new__函数的第一个参数是cls来保证是当前类实例,如果是其他类的类名,;允许变量的值发生变化,即如果对变量进行append、+=等这种操作后,只是改变了变量的值,而不会新建一个对象,变量引用的对象的地址也不会变化,不过对于相同的值的不同对象,在内存中则会存在不同的对象,即每个对象都有自己的地址,相当于内存中对于同值的对象保存了多份,这里不存在引用计数,是实实在在的对象。hdsllfdhg;

2022-09-18 21:37:52 388

原创 熬夜吐血整理的Python 面试题,帮助涨薪50%,请务必收藏

关于 Python 的面试问题还有很多很多,今天小编暂且总结到这里,希望对大家有所帮助。另外,需要更多关于Python面试题目的伙伴可以私信【666】自动领取!

2022-09-18 20:10:04 118

原创 python基础数据类型常见面试题

python基础数据类型常见面试题

2022-09-18 20:06:23 617

原创 python常见的面试题,看你都掌握了吗

(4).A收到B的断开连接的消息后,需要发送确认消息,这是这时TCP头部中的ACK标识位值为1,确认号ack=k+1,序号为m+1(因为A向B发送断开连接的消息时消耗了一个消息号),然后A进入TIME_WAIT状态,若等待时间经过2MSL后,没有收到B的重传请求,则表明B收到了自己的确认,A进入CLOSED状态,B收到A的确认消息后则直接进入CLOSED状态。浅拷贝:创建一个新的对象,但它包含的是对原始对象中包含项的引用(如果用引用的方式修改其中一个对象,另外一个也会修改改变){1,完全切片方法;

2022-09-18 19:33:55 1103

原创 2022 年顶级 Python 面试问题和答案

在我们理解动态类型语言之前,有必要了解什么是类型化。类型是一个术语,指的是编程语言中发生的类型检查。例如,“1”+2 将导致高度类型化语言(如 Python)中的类型错误,因为这些语言不提供“类型强制”(数据类型的隐式转换)。另一方面,具有弱类型系统的语言(例如 JavaScript)将简单地打印“12”作为结果。静止的。在执行之前,会验证数据类型。动态的。在执行期间,将验证数据类型。Python 是一种解释型语言,这意味着每条语句都是逐行执行的。因此,类型检查会在执行期间即时进行。

2022-09-18 16:29:26 579 1

原创 7道初级Python面试常问的真题(含详细思路解答)

Python是个非常受欢迎的编程语言,随着近些年机器学习、云计算等技术的发展,Python的职位需求越来越高。答案:python的str是个不可变对象,每次迭代,都会生成新的str对象来存储新的字符串,num越大,创建的str对象越多,内存消耗越大。方法 fn1/fn2/fn3 都没有定义,添加代码,是没有定义的方法都调用mydefault函数,上面的代码应该输出。写一个函数,接收整数参数n,返回一个函数,函数的功能是把函数的参数和n相乘并把结果返回。以上就是本文的全部内容,希望对大家的学习有所帮助!

2022-09-18 16:23:02 389

原创 40道Python经典面试题(附答案)

对于负索引,( - 1)是最后一个索引,( - 2)是倒数第二个索引,依此类推。Python是一种编程语言,包含对象,模块,线程,异常和自动内存管理。Python的好处在于它简单易用,可移植,可扩展,内置数据结构,并且它是一个开源的。PyChecker是一个静态分析工具,可以检测Python源代码中的错误,并警告错误的风格和复杂性。但是,如果对象是可变的,则可以更改它们。pass意味着,无操作的Python语句,或者换句话说,它是复合语句中的占位符,其中应该留有空白,并且不必在那里写入任何内容。

2022-09-18 16:14:32 4641

原创 Python学习手册(第4版).pdf

Python是一种简单的、解释型的、交互式的、可移植的、面向对象的超高级语言。Python作为一种功能强大且通用的编程语言而广受好评,它具有非常清晰的语法特点,适用于多种操作系统,目前在国际上非常流行,正在得到越来越多的应用。Python有一个交互式的开发环境,因为Python是解释运行,这大大节省了每次编译的时间。Python语法简单,且内置了多种高级数据结构,如字典、列表等,所以使用起来特别简单,程序员很快就可学会并掌握它。Python具有大部分面向对象语言的特征,可完全进行面向对象编程。Python具

2022-09-18 15:10:03 3636

原创 30个Python极简代码,10分钟get常用技巧

以下方法会检查给定的字符串是不是回文序列,它首先会把所有字母转化为小写,并移除非英文字母符号。以下方法将统计字符串中的元音 (‘a’, ‘e’, ‘i’, ‘o’, ‘u’) 的个数,它是通过正则表达式做的。这 个方法可以将布尔型的值去掉,例如(False,None,0,“”),它使用 filter() 函数。下面的代码可以将列表连接成单个字符串,且每一个元素间的分隔方式设置为了逗号。如下方法首先会应用一个给定的函数,然后再返回应用函数后结果有差别的列表元素。

2022-09-15 19:46:35 109

原创 20个必不可少的Python库也是基本的第三方库

读者您好。今天我将介绍20个属于我常用工具的Python库,我相信你看完之后也会觉得离不开它们。他们是:Requests.Kenneth Reitz写的最富盛名的http库。每个Python程序员都应该有它。Scrapy.如果你从事爬虫相关的工作,那么这个库也是必不可少的。用过它之后你就不会再想用别的同类库了。wxPython.Python的一个GUI(图形用户界面)工具。我主要用它替代tkinter。你一定会爱上它的。Pillow.它是PIL(Python图形库)的一个友好分支。

2022-09-15 19:26:13 222

原创 2022 年顶级 Python 面试问题和答案

在我们理解动态类型语言之前,有必要了解什么是类型化。类型是一个术语,指的是编程语言中发生的类型检查。例如,“1”+2 将导致高度类型化语言(如 Python)中的类型错误,因为这些语言不提供“类型强制”(数据类型的隐式转换)。另一方面,具有弱类型系统的语言(例如 JavaScript)将简单地打印“12”作为结果。静止的。在执行之前,会验证数据类型。动态的。在执行期间,将验证数据类型。Python 是一种解释型语言,这意味着每条语句都是逐行执行的。因此,类型检查会在执行期间即时进行。

2022-09-15 15:24:08 318

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除