- 博客(248)
- 资源 (15)
- 收藏
- 关注
原创 seaborm基本绘图
# 导入绘图库 matplotlib 的 pyplot 模块,用于绘制图形。from matplotlib import pyplot as plt# 导入 pandas 库,用于数据处理和分析。import pandas as pd# 导入 seaborn 库,用于绘图import seaborn as sns
2025-04-01 18:00:16
643
原创 matplotlib完整案例
Matplotlib 是 Python 中一个流行的绘图库,用于创建各种静态、动态和交互式的图表。本文将通过一系列完整的案例来教授如何使用 Matplotlib 进行数据可视化。
2025-03-25 16:34:16
1394
原创 垃圾短信分类
1. 数据加载阶段特别指定手机号为字符串类型,避免解析错误2. 清洗过程中通过 lambda 表达式生成垃圾短信标签,规则可根据需要调整3. 脱敏处理采用部分隐藏的方式保护隐私,同时处理异常情况4. 分词过程包含 URL 替换和停用词过滤,提高文本表示质量5. 模型训练使用 TF-IDF + 多项式贝叶斯组合,适合短文本分类6. 可视化部分展示了数据分布和关键词云,帮助理解数据特征
2025-03-25 11:24:55
1109
原创 关键词提取案例
在电商行业中,用户评论是了解用户需求和产品反馈的重要数据来源。通过分析用户评论,可以提取出用户关注的关键词,从而帮助商家优化产品和服务。本案例将展示如何结合`pandas`数据清洗、`jieba`分词和`scikit-learn`关键词提取技术,处理和分析用户评论数据。
2025-03-21 09:32:41
2209
原创 pandas基础
import pandas as pd# 设置DataFrame显示的宽度pd.set_option('display.width', 800) # 设置最大宽度为800个字符pd.set_option('display.max_columns', 100) # 最大列数为100
2025-03-11 16:19:41
3062
原创 基于规则的分词
基于规则或词典的分词方法是一种较为机械的分词方法,其基本思想如下。将待分词语句中的字符串和词典逐个匹配。找到匹配的字符串则切分,不匹配则减去边缘的某些字符。从头再次匹配,直至匹配完毕或者没有找到词典的字符串而结束。基于规则分词主要方法如下。正向最大匹配法(Maximum Match Method,MM法)。逆向最大匹配法(Reverse Maximum Match Method,RMM法)。双向最大匹配法(Bi-direction Matching Method,BMM法)。
2025-03-04 09:40:16
4278
原创 python 正则表达式
函数,从字符串起始位置匹配正则表达式,返回 Match 对象(匹配失败返回 None)。字符串开始(例:^Hello 匹配行首Hello)r’^’ 字符串开始(例:^Hello 匹配行首Hello)匹配除换行外任意字符(例:a.c 匹配 abc)单词边界(例:\bcat\b 匹配独立单词cat)或操作(例:cat|dog 匹配cat或dog)匹配除换行外任意字符(例:a.c 匹配 abc) 一个。1次或多次(例:\d+ 匹配连续数字)0次或多次(例:a* 匹配 aa)空白字符(例:匹配空格、制表符)
2025-02-28 11:12:14
5604
原创 deepin 安装 kafka
kafka 有两种部署模式,分别是zookeeper模式和kraft模式zookeeper模式需要提前部署zookeeperkraft模式不需要部署zookeeper本案例将分别使用zookeepper模式和kraft模式部署kafka
2024-12-24 09:20:50
8388
原创 scala 编写 hdfs 工具类
scala 编写 hdfs 工具类scala 创建 删除 hdfs 文件或目录scala 上传 下载 hdfs 文件 scala 读取 写入 hdfs 文件
2024-12-05 10:20:15
8250
原创 scala math 匹配模式
在Scala语言中,模式匹配是一种强大的控制结构,它允许你以声明式的方式检查一个值是否符合某个模式,并根据匹配的结果执行不同的代码块。Scala的模式匹配类似于正则表达式,但更加通用,可以用于数据结构的匹配。
2024-12-02 10:23:46
8397
原创 deepin 安装 chrome 浏览器
最近好多小伙伴儿和我说 deepin 无法安装最新的谷歌浏览器其实是因为最新的 谷歌浏览器 其中的一个依赖需要提前安装
2024-11-27 07:43:46
8377
原创 Java 封装 Echart 数据转图表 工具类
ListToChart 为数据转换工具类,其中包含了行列转换 、饼图、堆叠图(柱状图和折线图)、堆叠求和、堆叠百分比等转发方法。转换后的数据格式为 [rowKeyList,dataList,aliasList]行列转换工具
2024-11-12 02:41:15
8315
原创 Java 处理 json 格式数据解析为 csv 格式
如果不使用 JSON 工具库,你可以手动解析 JSON 格式字符串并将其转换为 CSV 格式字符串。以下是一个简单示例,展示如何实现这一功能。
2024-11-09 09:30:17
8316
原创 Windows 使用内置的netstat和taskkill命令来查找特定的端口并结束使用该端口的进程
在Windows中,你可以使用内置的netstat和taskkill命令来查找特定的端口并结束使用该端口的进程。如果taskkill命令失败,可能是因为你没有足够的权限来结束该进程,这时你可以以管理员身份运行命令提示符。在这个例子中,我们假设要查找的端口号是8080,netstat的输出中的进程ID是1234。使用netstat -ano | findstr "端口号"命令查找特定端口号的进程。注意:在实际操作中,你可能需要根据实际情况调整命令,例如端口号和进程ID。打开命令提示符(以管理员身份运行)。
2024-10-26 09:49:36
8378
原创 Vue3 + TypeScript + Vite + Echarts + DataV
Vue3 + TypeScript + Vite + Echarts + DataV
2024-10-09 21:42:46
8294
原创 设置cockpit自启动
The unit files have no installation config (WantedBy=, RequiredBy=, UpheldBy=,Also=, or Alias= settings in the [Install] section, and DefaultInstance= fortemplate units). This means they are not meant to be enabled or disabled using systemctl.
2024-07-24 08:27:20
8384
原创 解决VMware虚拟机在桥接模式下无法上网的问题
windows11系统自动启动了热点功能,开启热点可能会干扰虚拟机的桥接设置。方法一:windows11可以提供网络热点服务方法二:手动指定桥接的物理网卡
2024-07-16 12:12:30
8634
2
finebi6.0 服务器版
2024-07-16
Javaweb Layui RBAC 项目 小金库
2022-06-13
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人