wp_tao-优快云博客

原创 python实战项目81：ZeoDB多线程数据爬取程序（最新稳定好用）

ZeoDB (zeodb.mit.edu) 是麻省理工学院维护的沸石结构数据库，包含沸石材料与有机结构导向剂（OSDA）之间的亲和性数据。通过此程序，可高效获取 ZeoDB 的完整沸石数据集，为材料研究提供基础数据支持。线程锁 (threading.Lock) 确保 CSV 写入安全。使用 ThreadPoolExecutor (20线程并发)SiO2 结合情况 (Binding(SiO2))输入：详情页 URL, CSV 写入器，线程锁。CIF 下载链接 (cif_href)沸石名称 (host)

2025-07-06 22:13:39 173

原创 python实战项目81：抓取谷歌指数（Google Trends）数据（最新稳定版）

Google Trends 是谷歌推出的免费数据分析工具，用于追踪和分析全球用户在谷歌搜索引擎中的搜索行为趋势。它通过聚合匿名化的搜索数据，帮助用户洞察关键词的热度变化、地区分布、相关话题等。核心功能和具体应用场景大家可以求助于搜索引擎或者ai。搜索页面如下：上述例子中的链接（https://trends.google.com/trends/explore?

2025-07-04 21:51:06 363 1

原创 python实战项目80：采集淘宝商品评论(2025最新稳定版)

本项目使用的是python的第三方库drissionpage采集淘宝商品的评论，目前淘宝网页端做了更新，drissionpage可以完美解决这一问题。drissionpage是网页自动化技术，结合了requests和Selenium的特性，代码简单，效率较高，稳定性较好，在requests解决不了的情况下，如果对于效率没有过高的需求，drissionpage可以作为一个非常好的选择。

2025-07-03 10:21:56 344

原创 Java猜拳小游戏

摘要：本文实现了一个Java猜拳小游戏，包含三个类：Player（玩家）、Judge（裁判）和Run（主程序）。玩家通过输入1-3选择出拳（1：石头，2：剪刀，3：布），电脑随机出拳。裁判类比较双方出拳结果，根据规则判断胜负。主程序Run类整合流程，显示双方出拳和比赛结果。代码通过封装确保输入有效性，采用面向对象设计，结构清晰。运行示例：输入"2"（剪刀）后，程序随机生成电脑出拳（如布），输出"电脑:布VS用户:剪刀\n选手胜利"。

2025-06-29 16:18:54 122

原创 Java面向对象（一）

本文介绍了Java面向对象编程的核心概念。主要内容包括：1.类与对象的关系，类为抽象模板，对象是具体实例；2.类的定义语法，包含成员变量和方法的声明；3.对象的创建和使用方法，通过new实例化后调用成员；4.成员变量与局部变量的区别，包括作用域和默认值；5.成员方法与静态方法的调用方式差异。文章通过代码示例演示了类的定义、对象实例化、变量赋值和方法调用等基本操作，帮助理解Java面向对象的基本原理。

2025-06-28 22:51:57 212

原创 python实战项目79：采集知乎话题下的所有回答

需求是采集知乎某话题下的所有回答，这里以话题“大学宿舍相处之间遇到莫名其妙的冷落怎么办呢？”为例，网页链接为https://www.zhihu.com/question/1898156781215146265，其中1898156781215146265为question_id。这里使用的框架不是requests也不是Selenium或者scrapy，而是drissionpage，drissionpage的使用方法很简单，具体见我之前写的博客。

2025-06-27 15:17:20 188

原创 Java练习题精选16-20

本文精选了5道Java数组练习题，涵盖了常见数组操作：1）正序输出数组元素；2）逆序输出数组元素；3）求数组最大值；4）随机生成数组并查找指定元素；5）数组元素逆序存储。每道题均提供完整代码实现，涉及for循环、条件判断、随机数生成和数组下标操作等基础知识点，适合初学者巩固数组相关编程技能。其中第4题综合运用了Scanner输入和Random类，第5题通过交换元素实现数组逆序。

2025-06-27 10:30:31 168

原创 Java练习题精选11-15

本文精选5道Java基础练习题：1)输出1000以内的水仙花数(153等)；2)打印9×9星号矩形；3)打印9行星号直角三角形；4)输出九九乘法表；5)找出1000以内的所有素数。每道题均提供完整代码实现，涵盖循环、条件判断等基础语法。代码简洁规范，通过分解数字位、嵌套循环等典型算法解决问题，适合初学者练习Java编程基础。

2025-06-26 15:33:12 202

原创 Java练习题精选6-10

摘要：本文包含5道Java编程练习题，涵盖变量交换、月份天数计算、数字输出、累加求和等基础操作。第六题演示了通过临时变量交换两个变量的值；第七题根据输入的年份和月份计算该月天数；第八题输出1-10的数字；第九题计算1-100的累加和；第十题计算1-100的偶数之和。每道题均配有完整的Java代码实现。

2025-06-25 21:18:40 145

原创 Java方法（函数）

本文介绍了Java方法的基本概念和使用方法。方法是指能够完成特定功能的独立代码块，可以提高代码复用性和模块化程度。文章讲解了三种典型的方法类型：1)无参数无返回值的方法，如helloWorld()示例；2)有参数无返回值的方法，如weatherToday()示例；3)有参数有返回值的方法，如calSum()示例。每种方法类型都配有完整代码示例，展示了方法的定义、参数传递和返回值处理方式。通过这三个示例，读者可以掌握Java方法的基本语法和使用场景。

2025-06-25 16:17:46 261

原创 Java数组

本文介绍了Java数组的基本概念和使用方法。数组是相同数据类型变量的集合，通过下标访问元素。文章详细讲解了数组的定义、初始化方式、成员访问方法以及数组特性：包括连续存储空间、首地址格式、下标越界注意事项、数据类型一致性要求，以及长度不可变的特性。其中特别说明了数组名打印格式的含义和数组长度必须在定义时初始化的要求。通过代码示例展示了如何正确使用数组。

2025-06-24 16:31:27 207

原创 Java流程控制--循环

本文介绍了Java中的三种循环控制结构：1. while循环，先判断条件再执行循环体；2. do...while循环，先执行一次循环体再判断条件；3. for循环，通过初始化、条件判断和迭代表达式控制循环。每种循环都以打印1-10整数为例演示了基本语法和使用方法，其中do...while循环至少执行一次，while和for循环可能一次都不执行。三种循环都包含条件表达式控制循环结束，适用于不同场景的重复执行需求。

2025-06-24 11:47:17 317

原创 Java流程控制--switch分支

Java switch分支控制结构摘要：switch语句用于多条件分支判断，语法支持整型、字符型、字符串和枚举类型。case匹配成功后执行对应代码块，需配合break终止执行；default处理未匹配情况。典型应用包括成绩分级（利用case穿透特性）和简易计算器实现（通过运算符匹配执行对应运算）。注意case穿透特性会导致后续case被自动执行，需合理使用break控制流程。该结构比多重if更简洁清晰，适合离散值匹配场景。

2025-06-24 11:22:27 420

原创 Java练习题精选：1~5题

本文精选了5道Java基础练习题：1) 使用三元运算符找出三个数中的最大值；2) 分解三位数的个位、十位和百位；3) 判断整数奇偶性；4) 根据年份判断闰年；5) 从控制台接收不同类型输入并输出。每个题目都提供了完整的代码示例，涵盖运算符、数值处理、条件判断和输入输出等基础知识点，适合Java初学者练习。

2025-06-24 11:13:12 359

原创 Java流程控制--判断结构

本文介绍了Java流程控制中的判断结构，主要分为选择(if/else)、分支(switch)和循环三类。重点讲解了if判断的三种使用方式： if单独使用 - 条件为true时执行语句块 if-else配合 - 条件成立执行if块，否则执行else块 else if结构 - 用于多条件判断，可配合最后的else处理其他情况。文中通过密码验证、数字比较等示例代码展示了各种判断结构的实际应用，并说明了语句块的执行逻辑和匹配规则。

2025-06-23 16:34:54 366

原创 python实战项目78：selenium爬取steam游戏评论（最新稳定好用）

笔者在之前写过一期使用selenium爬取steam官网游戏评论的文章，具体见链接:python实战项目52：Selenium爬取steam黑神话悟空评论。之后在做项目的过程中发现，之前的代码没有采集评论人的用户名，在这里补充一下。另外再解释一点，这套代码稳定可靠，而且速度也是没话说，可以放心使用，当然，首先要保证一下自己的网速。

2025-06-23 11:52:12 1270

原创 python实战项目77：足球运动员数据分析

本文通过对足球运动员数据集FullData.csv的分析，探究了运动员的各项特征。首先加载并预处理数据，处理缺失值并验证无重复值。然后重点分析了身高和体重分布，通过直方图和饼图展示了运动员的身高、体重及左右脚比例情况。接着对俱乐部和国家队的球员评分进行统计分析，筛选出平均分最高的前10名俱乐部和国家队。最后进行相关性分析，探索身高与体重、评分之间的关系。整个分析过程采用Python的数据分析和可视化工具，为足球运动员特征研究提供了数据支持。

2025-06-22 10:03:59 216

原创 python实战项目76:51job数据采集与分析

接下来，进行抓包、寻找数据接口，然后编写代码，发送请求、获取数据，解析数据以及保存数据，这些步骤不再赘述，直接上代码。这个步骤要复杂一些，需要考虑到各种情况，最后把薪资水平处理成xxx-xxx元。在51job官网搜索上海地区的大数据开发工程师岗位，这一步使用的编辑器是jupyternotebook。文中已将完整代码全部展示。

2025-06-20 19:34:51 121

原创 Java运算符

本文介绍了Java中常用的运算符分类及用法。主要包括算数运算符（+,-,*,/,%）、逻辑运算符（&&,||,!）、关系运算符（>,<,>=,<=,==,!=）、三元运算符（条件?值1:值2）、位运算符、赋值运算符（=,+=等）以及自增自减运算符（++,--）。通过示例代码演示了各种运算符的具体使用方法和运算结果，其中重点说明了整型除法只保留整数部分、逻辑运算符的布尔值返回特性以及自增自减运算符的前后置区别。这些运算符构成了Java编程中的基础运算功能。

2025-06-19 18:47:23 109

原创 Java变量

本文介绍了Java变量的基本概念和使用方法。主要内容包括：1) 变量定义的基本规则和命名规范；2) 常见数据类型及其取值范围；3) 变量的定义、初始化和输出方法；4) 变量作用域和初始化注意事项；5) 数据类型转换（隐式和强制转换）。通过代码示例展示了变量的具体用法，说明了小转大自动类型转换不会丢失精度，而大转小强制转换可能丢失精度的情况。文章帮助读者掌握Java变量的基础知识，为后续编程学习打下基础。

2025-06-19 15:35:35 957

原创 Java常量与数据类型

本文介绍了Java中的常量概念与数据类型分类。常量包括整型、浮点型（单精度/双精度）、字符型、字符串型、布尔型和空类型，每种类型都有特定的表示方法和用途。数据类型分为基本数据类型（整数型、浮点型、字符型、布尔型）和引用数据类型（字符串、数组、类等），详细说明了各类型的关键字和内存占用情况。文章强调Java是强类型语言，使用时需注意数据类型匹配，为后续编程学习奠定了基础。

2025-06-18 22:24:28 674

原创 python实战项目75：爬取nature《自然》杂志论文信息

自然》（nature，主页:https://www.nature.com/）是世界上历史悠久的、最有名望的科学杂志之一，首版于1869年11月4日。与当今大多数科学论文杂志专一于一个特殊的领域不同，《自然》是少数依然发表来自很多科学领域的一手研究论文的杂志。在许多科学研究领域中，很多最重要、最前沿的研究结果都是以短讯的形式发表在《自然》上。另外，Nature旗下子刊，合作期刊众多，是一个科学研究无法绕过的重要的学习平台。

2025-06-18 20:36:20 852

原创 python实战项目74：基于微博文本的社会语义网络分析

本文介绍了基于微博文本的社会语义网络分析项目。通过Python对文化冲突情感数据进行分析，使用jieba分词和词频统计方法，分别提取积极、中性和消极三种情绪的文本内容和高频词。预处理后的文本被导入ROSTCM6软件生成语义网络图，以可视化展示不同情绪下的语义关联。项目实现了从原始微博数据到情感语义网络分析的全流程，包括数据清洗、中文分词、停用词过滤和词频统计等关键步骤，最终输出三种情绪的词频统计结果和对应的语义网络可视化图。

2025-06-16 13:22:16 169

原创 python实战项目73：基于python的微博文本情感分析

本文介绍了一个基于Python的微博文本情感分析项目。项目使用爬虫获取2000条关于"文化冲突"的微博数据，经过数据预处理（包括缺失值处理、重复值删除等）后，采用SnowNLP模块进行情感分析。实验结果显示该模型能有效分析微博文本的情感倾向，为研究文化冲突相关话题提供了数据支持。项目完整展示了从数据采集、清洗到情感分析的全过程，具有实际应用价值。

2025-06-16 11:11:51 107

原创 frida Hook入门

1、spwan：将启动app的权利交由frida来控制，不管app是否启动，都会重新启动app，CLI下启动方式（-f参数指定包名）2、attach：建立在目标app已经启动的情况下，frida通过ptrace注入程序从而执行Hook操作，不加-f参数。讲一个JavaScript脚本注入到Android目标进程，即需要app处于启动状态，核心原理是ptrace修改进程内存。启动一个新的进程并挂起，在启动的同时注入frida代码，注入完成后调用resume恢复进程。-f 指定一个进程，重启它并注入脚本呢。

2025-06-08 12:32:04 463

原创 frida基本使用方法

frida-ps是frida-tools中一个常用的工具，作用是显示系统进程列表，类似于ps，支持显示当前pc端的进程和移动端中的进程。显示USB连接移动端的所有进程：-U。

2025-06-08 10:11:49 675

原创 frida简介及环境搭建

frida是一款轻量级的Hook框架，也可以说是一种动态插桩工具，可以插入一些原生代码到原生app的内存空间去，动态地监视和修改器行为，这些原生平台可以是Win、Mac、Linux、Android或者iOS。frida分为两个部分，服务端和控制端，其中服务端运行在目标机器上，通过进程注入来劫持应用的类和函数，控制端运行在自己系统机器上，可以注入自定义的js、python、c等脚本来实现自动化注入。

2025-06-07 18:14:29 479

原创 Java编程课（一）

Java是一种广泛使用的高级编程语言，最初由Sun Microsystems于1995年发布。它被设计为具有简单、可移植和面向对象的特性，以满足跨平台应用程序开发的需求。以下是一些关于Java的简介：1.跨平台性：Java程序可以在不同的操作系统（如Windows、Mac、Linux等）上运行，只需在每个平台上安装相应的Java虚拟机（JVM）即可。2.面向对象：Java是一种面向对象的编程语言，支持封装、继承和多态等面向对象的编程范式，使代码更易于组织、理解和维护。

2025-06-05 18:43:56 82

原创 python实战项目72：爬取天气网数据

发送请求使用的是requests模块，请求方式是get请求，在发送网络请求时需要携带User-Agent、Referer等请求头。但要注意的是，目前该网页改为了部分异步加载，上述代码目前只能获取每个月前十天的数据，后续会对代码进行改良。某城市（这里以长沙为例）2024年的天气数据。数据解析使用的是xpath表达式。点击天气菜单栏下的历史天气。

2025-05-29 12:04:56 260

原创 python实战项目71：基于Python的US News世界大学排名数据爬取

成功采集2459条完整数据记录，字段完整率98.7%，经抽样验证数据准确率达到99.2%。系统平均采集速度达20条/秒，相比人工效率提升300倍。

2025-05-28 13:20:15 397 1

原创 python实战项目70：如何给一个空的DataFrame添加行

【代码】python实战项目70：如何给一个空的DataFrame添加行。

2025-05-20 22:03:20 246

原创 python实战项目69：基于Python爬虫的链家二手房数据采集方法研究

本文介绍了一个基于Python的链家二手房数据采集项目，旨在通过爬虫技术高效获取房地产数据，为市场分析提供支持。项目使用requests库进行网页请求，parsel模块解析HTML数据，并通过csv模块实现结构化存储。文章详细阐述了数据采集的流程，包括需求分析、网页结构分析、请求发送与反爬策略、数据解析与存储。通过分析链家二手房列表页的URL规则和HTML标签定位，项目成功提取了标题、总价、单价、面积、户型等关键字段，并将其存储为CSV文件。该方案验证了Python爬虫在房产数据采集中的有效性，并展望了未来

2025-05-11 11:05:54 1414 1

足球运动员数据FullData.csv

danglewang.js

基于flask的天气数据可视化系统

某年全国30个省区市城镇居民月平均消费.xlsx

hot-spicy pot.csv

空空如也