自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(248)
  • 资源 (15)
  • 收藏
  • 关注

原创 seaborm基本绘图

# 导入绘图库 matplotlib 的 pyplot 模块,用于绘制图形。from matplotlib import pyplot as plt# 导入 pandas 库,用于数据处理和分析。import pandas as pd# 导入 seaborn 库,用于绘图import seaborn as sns

2025-04-01 18:00:16 643

原创 seaborn 完整案例

使用 seaborn 进行数据可视化的完整案例

2025-03-31 17:08:30 681

原创 matplotlib完整案例

Matplotlib 是 Python 中一个流行的绘图库,用于创建各种静态、动态和交互式的图表。本文将通过一系列完整的案例来教授如何使用 Matplotlib 进行数据可视化。

2025-03-25 16:34:16 1394

原创 垃圾短信分类

1. 数据加载阶段特别指定手机号为字符串类型,避免解析错误2. 清洗过程中通过 lambda 表达式生成垃圾短信标签,规则可根据需要调整3. 脱敏处理采用部分隐藏的方式保护隐私,同时处理异常情况4. 分词过程包含 URL 替换和停用词过滤,提高文本表示质量5. 模型训练使用 TF-IDF + 多项式贝叶斯组合,适合短文本分类6. 可视化部分展示了数据分布和关键词云,帮助理解数据特征

2025-03-25 11:24:55 1109

原创 Matplotlib 中指定本地字体库

在 Matplotlib 中指定本地字体库可以通过以下几种方法实现

2025-03-24 14:44:44 1214

原创 关键词提取案例

在电商行业中,用户评论是了解用户需求和产品反馈的重要数据来源。通过分析用户评论,可以提取出用户关注的关键词,从而帮助商家优化产品和服务。本案例将展示如何结合`pandas`数据清洗、`jieba`分词和`scikit-learn`关键词提取技术,处理和分析用户评论数据。

2025-03-21 09:32:41 2209

原创 pandas基础

import pandas as pd# 设置DataFrame显示的宽度pd.set_option('display.width', 800) # 设置最大宽度为800个字符pd.set_option('display.max_columns', 100) # 最大列数为100

2025-03-11 16:19:41 3062

原创 python 正则表达式 re模块 练习

python 正则表达式 re模块 练习

2025-03-10 11:17:00 3316

原创 基于规则的分词

基于规则或词典的分词方法是一种较为机械的分词方法,其基本思想如下。将待分词语句中的字符串和词典逐个匹配。找到匹配的字符串则切分,不匹配则减去边缘的某些字符。从头再次匹配,直至匹配完毕或者没有找到词典的字符串而结束。基于规则分词主要方法如下。正向最大匹配法(Maximum Match Method,MM法)。逆向最大匹配法(Reverse Maximum Match Method,RMM法)。双向最大匹配法(Bi-direction Matching Method,BMM法)。

2025-03-04 09:40:16 4278

原创 python 正则表达式

函数,从字符串‌起始位置‌匹配正则表达式,返回 Match 对象(匹配失败返回 None)。字符串开始(例:^Hello 匹配行首Hello)r’^’ 字符串开始(例:^Hello 匹配行首Hello)匹配除换行外任意字符(例:a.c 匹配 abc)单词边界(例:\bcat\b 匹配独立单词cat)或操作(例:cat|dog 匹配cat或dog)匹配除换行外任意字符(例:a.c 匹配 abc) 一个。1次或多次(例:\d+ 匹配连续数字)0次或多次(例:a* 匹配 aa)空白字符(例:匹配空格、制表符)

2025-02-28 11:12:14 5604

原创 Numpy

NumPy数组对象ndarrayNumPy矩阵与通用函数NumPy进行统计分析

2025-02-25 14:18:51 5570

原创 Jupyter Notebook中使用GPU进行计算

在Jupyter Notebook中使用GPU进行计算

2025-02-25 11:02:03 5577

原创 deepin 安装 kafka

kafka 有两种部署模式,分别是zookeeper模式和kraft模式zookeeper模式需要提前部署zookeeperkraft模式不需要部署zookeeper本案例将分别使用zookeepper模式和kraft模式部署kafka

2024-12-24 09:20:50 8388

原创 deepin 安装 zookeeper

deepin 安装 zookeeper

2024-12-23 15:16:16 8364

原创 deepin 安装 hbase

deepin 安装 hbase

2024-12-20 09:20:37 8371

原创 deepin 安装 hive

1. 安装 hadoop2. 安装 mysql3. 安装 hive

2024-12-11 15:20:19 8396

原创 deepin 搭建 hadoop singlenode

deepin 搭建 hadoop singlenode

2024-12-10 11:49:45 8408

原创 scala 编写 hdfs 工具类

scala 编写 hdfs 工具类scala 创建 删除 hdfs 文件或目录scala 上传 下载 hdfs 文件 scala 读取 写入 hdfs 文件

2024-12-05 10:20:15 8250

原创 scala math 匹配模式

在Scala语言中,模式匹配是一种强大的控制结构,它允许你以声明式的方式检查一个值是否符合某个模式,并根据匹配的结果执行不同的代码块。Scala的模式匹配类似于正则表达式,但更加通用,可以用于数据结构的匹配。

2024-12-02 10:23:46 8397

原创 deepin 安装 chrome 浏览器

最近好多小伙伴儿和我说 deepin 无法安装最新的谷歌浏览器其实是因为最新的 谷歌浏览器 其中的一个依赖需要提前安装

2024-11-27 07:43:46 8377

原创 springboot整合presto

springboot整合presto

2024-11-22 16:08:19 8377

原创 springboot整合hive

springboot整合hive

2024-11-22 12:45:48 8557

原创 springboot整合kafka

springboot整合kafka

2024-11-22 09:12:08 8335

原创 Java 封装 Echart 数据转图表 工具类

ListToChart 为数据转换工具类,其中包含了行列转换 、饼图、堆叠图(柱状图和折线图)、堆叠求和、堆叠百分比等转发方法。转换后的数据格式为 [rowKeyList,dataList,aliasList]行列转换工具

2024-11-12 02:41:15 8315

原创 mapreduce 将数据清洗后保存到 hbase

mapreduce 将数据清洗后保存到 hbase

2024-11-09 16:36:23 8347

原创 csv文件格式字符串转javabean对象

javabean对象转csv文件格式字符串csv文件格式字符串转javabean对象

2024-11-09 12:20:32 8436

原创 Java 处理 json 格式数据解析为 csv 格式

如果不使用 JSON 工具库,你可以手动解析 JSON 格式字符串并将其转换为 CSV 格式字符串。以下是一个简单示例,展示如何实现这一功能。

2024-11-09 09:30:17 8316

原创 hbase 工具类

hbase 自定义过滤器 工具类

2024-11-07 19:18:25 8375

原创 HDFS 工具类

【代码】HDFS 工具类。

2024-11-01 12:01:58 8244

原创 zookeeper

openEuler 安装 zookeeper集群

2024-10-31 14:55:39 8313

原创 Windows 使用内置的netstat和taskkill命令来查找特定的端口并结束使用该端口的进程

在Windows中,你可以使用内置的netstat和taskkill命令来查找特定的端口并结束使用该端口的进程。如果taskkill命令失败,可能是因为你没有足够的权限来结束该进程,这时你可以以管理员身份运行命令提示符。在这个例子中,我们假设要查找的端口号是8080,netstat的输出中的进程ID是1234。使用netstat -ano | findstr "端口号"命令查找特定端口号的进程。注意:在实际操作中,你可能需要根据实际情况调整命令,例如端口号和进程ID。打开命令提示符(以管理员身份运行)。

2024-10-26 09:49:36 8378

原创 openEuler 24.03 rpm 安装 MySQL9

openEuler 24.03 rpm 安装 MySQL9

2024-10-14 10:07:35 8320

原创 Vue3 + TypeScript + Vite + Echarts + DataV

Vue3 + TypeScript + Vite + Echarts + DataV

2024-10-09 21:42:46 8294

原创 Vue3 + TypeScript + Vite + Echarts

Vue3 + TypeScript + Vite + Echarts

2024-10-08 19:18:34 8449

原创 设置cockpit自启动

The unit files have no installation config (WantedBy=, RequiredBy=, UpheldBy=,Also=, or Alias= settings in the [Install] section, and DefaultInstance= fortemplate units). This means they are not meant to be enabled or disabled using systemctl.

2024-07-24 08:27:20 8384

原创 Ubuntu24.04 deb文件 安装 MySQL8.4

Ubuntu24.04 deb文件 安装 MySQL8.4.1

2024-07-21 21:39:48 8412

原创 Ubuntu24.04 apt安装 MySQL8.4

Ubuntu24.04 apt在线安装 MySQL8.4.1

2024-07-20 18:00:48 8522

原创 华为欧拉openEuler24.03 rpm安装 MySQL8.4

华为欧拉openEuler24.03 rpm安装 MySQL8.4

2024-07-18 06:32:12 8379

原创 解决VMware虚拟机在桥接模式下无法上网的问题

windows11系统自动启动了热点功能,开启热点可能会干扰虚拟机的桥接设置。方法一:windows11可以提供网络热点服务方法二:手动指定桥接的物理网卡

2024-07-16 12:12:30 8634 2

原创 openEuler linux 安装 finebi

openEuler 安装 finebi

2024-07-15 12:13:54 8443

seaborn基本绘图人力资源数据集

seaborn基本绘图人力资源数据集

2025-04-01

机器学习 iris 鸢尾花数据集下载

机器学习 iris 鸢尾花数据集下载

2025-03-31

人工智能+垃圾短信分类+数据集

人工智能+垃圾短信分类+数据集

2025-03-25

finebi6.0 服务器版

finebi6.0 服务器版 安装教程 https://blog.youkuaiyun.com/qq_24330181/article/details/140435340

2024-07-16

Hadoop 视频分析系统

Hadoop MapReduce WordCount 操作数据库

2024-03-26

javafx 整合 sparingboot mybatis

javafx 整合 sparingboot mybatis

2024-03-20

javafx Scene Builder

javafx Scene Builder

2024-01-02

finebi 新手入门案例 销售明细表

finebi 新手入门案例 销售明细表

2023-11-30

ICOFormat64

Photoshop 导出 ico 图标插件

2023-09-03

springboot多数据源代码

springboot 使用 hive mysql 多数据源切换

2023-04-28

winutils.exe

hadoop hdfs windows兼容包

2023-04-12

MyBatis 案例练习 SQL

MyBatis 案例练习 SQL

2022-07-15

全国地区地址数据库 MySQL 版

全国地区地址数据库 MySQL 版

2022-07-02

歇后语大全数据库 MySQL版

歇后语大全数据库 MySQL版

2022-07-02

成语词典 数据库 文件 MySQL 数据库文件

成语词典 数据库 文件 MySQL 数据库文件

2022-06-30

SSM 整合 Layui Echarts图表

案例采用前后端分离架构 后端使用经典的 SSM 框架 前端使用 Layui + Echars图表

2022-06-26

Servlet Layui 客户管理系统

项目采用前后的分离架构 后端 使用 Jersey + Servlet 前端 使用 Layui

2022-06-26

Typora Markdown 编辑器

Typora Markdown 编辑器

2022-06-26

XmanagerPowerSuite7

XmanagerPowerSuite7

2022-06-23

MySQL 图形化客户端工具 navicat

MySQL 图形化客户端工具 navicat

2022-06-23

新闻管理系统 Servlet JSP 增删改查小练习

新闻管理系统 Servlet JSP 增删改查小练习

2022-06-20

Javaweb Layui RBAC 项目 小金库

图文教程地址 https://blog.youkuaiyun.com/qq_24330181/article/details/125253721 视频教程地址 https://www.bilibili.com/video/BV1gQ4y1r7ah

2022-06-13

xampp8.1.4 windows php 集成环境

xampp8.1.4 windows php 集成环境

2022-06-10

xampp8.1.4 windows php 集成环境

xampp8.1.4 windows php 集成环境

2022-06-10

layui-v2.6.11.zip

layui-v2.6.11.zip

2022-06-03

js-cookie.js

原始Javascript操作cookie封装的js库

2022-05-27

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除