自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(19)
  • 收藏
  • 关注

原创 numpy(4)

【代码】numpy(4)

2025-08-06 17:48:44 140

原创 pandas数据的科学与计算

定义:一个开源的 Python 类库,主要用于数据分析、数据处理、数据可视化。特点高性能容易使用的数据结构容易使用的数据分析工具。

2025-08-06 17:42:55 677

原创 nump数据科学与计算3

例如,两个 2 行 2 列的数组,使用 concatenate () 沿 axis=0 连接后得到 4 行 2 列的数组(维度不变,仍为 2 维);例如,对一个 2 行 2 列的数组分别使用 flatten () 和 ravel () 得到一维数组后,修改 flatten () 返回的数组,原数组不变;(形状为 (1,3))进行相加运算,由于形状不同,广播机制被触发,b 会被自动扩展为与 a 形状相同的数组(4 行 3 列,每行都是 [1,2,3]),最终得到相加结果。(形状为 (4,3))和。

2025-08-05 08:22:11 702

原创 numpy数据科学与计算(2)

【代码】numpy数据科学与计算(2)

2025-08-01 14:30:49 238

原创 bs4数据解析

功能特点提供简单的、Python 式的函数处理导航、搜索、修改分析树等功能。作为工具箱,能解析文档为用户提供需抓取的数据,实现简单方便。自动将输入文档转换为 Unicode 编码,输出文档转换为 utf-8 编码,无需考虑编码方式。为用户灵活提供不同的解析策略或强劲的速度。解析器解析器使用方法优点劣势Python 标准库内置标准库、执行速度适中、文档容错能力强Python2.7.3 及 Python3.2.2 之前版本文档容错能力差lxml HTML 解析器。

2025-07-31 16:55:18 894

原创 numpy数据科学与计算

NumPy 是一个开源的 Python 科学计算库。能够直接对数组和矩阵进行操作,可省略很多循环语句,众多的数学函数让代码编写更轻松。

2025-07-31 16:51:41 581

原创 pymysql数据储存

遵循 ACID 原则:原子性(操作要么全做要么全不做)、一致性(数据库状态一致)、隔离性(事务间不干扰)、持久性(提交后永久生效)。为数据集合(列表或元组)。优势:减少与数据库的交互次数,提升存储效率,尤其适用于爬虫获取的大量数据。):建立 Python 与 MySQL 的连接,需配置主机、端口、账号等参数;PyMySQL 操作 MySQL 的核心步骤为 4 步。):作为执行 SQL 语句的载体;):实现增删改查等操作;④提交事务并关闭连接():确保操作生效并释放资源,失败则回滚(为带占位符的插入语句,

2025-07-29 19:45:45 230

原创 MySQL基础(2)

实际使用中,COUNT (*) 因效率高(无需判断字段是否为 NULL)更常用,而 COUNT (DISTINCT) 因需去重判断,效率较低,仅在需统计非重复值时使用。② 作用对象不同,WHERE 作用于表中的原始记录,HAVING 作用于 GROUP BY 的分组结果;③ 适用场景不同,WHERE 用于筛选具体字段的记录,HAVING 用于筛选聚合函数计算后的分组结果(如。例如,用左连接查询 “销售表” 和 “商品表” 时,即使某商品在销售表中无记录,也会显示该商品信息(销售相关字段为 NULL)。

2025-07-28 17:01:08 769

原创 mysql数据库基础(2)

【代码】mysql数据库基础(2)

2025-07-25 18:06:34 184

原创 MySQL数据库基础

基本信息:由瑞典 MySQL AB 公司开发,现属 Oracle,是流行的关系型数据库,在 Web 应用中广泛使用。特点:开源免费,功能满足个人和中小企业需求,降低总体拥有成本。概念:用于组织和访问数据库数据的标准语言,是 DBMS 的组成部分,非独立 DBMS。起源:1974 年由 Boyce 和 Chamberlin 提出,在 IBM 的 System R 中实现。组成DDL(数据定义语言):定义 / 修改数据库结构(CREATE、ALTER、DROP 等)。DML(数据操纵语言)

2025-07-24 14:21:28 669

原创 静态网页爬取模版

Requests 库的 session 对象的作用是维护一个会话,自动处理 Cookies,方便在多次请求中保留用户状态(如登录信息)。XPath 中 ““/” 表示从根节点开始选取,仅匹配直接子节点;“//” 表示从当前节点选取所有后代节点,无视位置。XPath 是用于在 XML/HTML 文档中定位信息的语言,结合 lxml 库的 etree 模块可高效解析网页。访问需登录的页面,即可利用保存的 Cookies 免重复登录。选取文档中所有 book 节点,无论其在哪个层级。

2025-07-23 18:30:57 649

原创 静态网页爬取模块--数据储存

全称。

2025-07-22 19:13:33 843

原创 javaScript的初步学习

历史:起源于 Netscape,最初名为 LiveScript,后更名为 JavaScript。与 HTML、CSS 的关系HTML:超文本标记语言,构成页面骨架。CSS:层叠样式表,装饰页面。JavaScript:前端浏览器执行的脚本语言,实现动态页面效果。语法格式javascriptfunction 函数名(形式参数列表){函数体;return 返回值;调用方式函数名(实际参数列表);

2025-07-22 18:48:00 744

原创 CSS的初步学习

定义:CSS(层叠样式表)是一种用于改变 HTML 元素默认显示方式的脚本语言,可设定元素的位置、颜色、大小等样式。作用美化 HTML 元素的外观;对网页元素进行布局;实现响应式布局;制作动画效果及 2d、3d 转换。应用领域:主要用于网页开发,强调样式与 HTML 代码分离。

2025-07-21 18:10:34 670

原创 初步学习HTML开发基础(2)

定义:HTML 指超文本标记语言(HyperText Markup Language),是描述网页的语言,不是编程语言,而是标记语言。超文本含义可加入图片、声音、动画等多媒体内容(超越文本限制)。可从一个文件跳转到另一个文件,与世界各地主机的文件连接(超级链接文本)。

2025-07-21 17:01:06 515

原创 初步学习Html(1)

【代码】Html超文本简介。

2025-07-18 19:35:05 130

原创 Requests实现虚拟登录

以下为用豆瓣做的例子。

2025-07-18 19:25:39 847

原创 静态网页抓取模块

包括响应状态码、响应头、响应体。

2025-07-17 17:50:44 741

原创 爬虫概述和静态网页抓取

开发过程中有可能使用到的Http请求有Post、Delete、Put、Get,分别对应增删改查四种方式。一般来说Post和Get请求使用频率较高。return "产生异常"

2025-07-16 15:35:25 1074

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除