自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

xchenhao 的博客

青山本不老,为雪白头;绿水本无忧,因风皱面

  • 博客(145)
  • 收藏
  • 关注

原创 一文掌握互联网核心服务端口大全:从DNS到K8s,运维与开发必备清单

本文系统梳理了互联网核心服务的默认端口,涵盖基础设施、Web服务、数据库、消息队列、容器编排及网络管理六大类,帮助开发者与运维人员快速查阅、高效排障。文中不仅列出各服务的标准端口与协议,还结合实战经验强调安全风险,如Redis、Docker 2375、Elasticsearch等高危端口的暴露隐患。最后提出端口安全五大黄金法则,并附常用命令,助力构建安全、稳定的网络环境。

2025-10-09 13:32:27 750

原创 人脸图像识别实战:使用 LFW 数据集对比四种机器学习模型(SVM、逻辑回归、随机森林、MLP)

LFW 是由马萨诸塞大学阿默斯特分校收集的真实场景下的人脸图像数据集,包含13,000+ 张人脸图像,涵盖5,749 个不同人物。图像来自网络新闻,背景复杂、光照不均、姿态多样;非实验室环境,更贴近真实应用场景;适合用于评估人脸识别算法的鲁棒性。仅保留至少有 70 张照片的人物(确保每类样本充足);图像缩放至 40%(原图 250x250 → 约 50x37);转换为灰度图(减少特征维度,加快训练)。最终数据集包含1288 张图像,7 个类别,特征维度为1850(50×37)。

2025-09-24 17:45:05 823 2

原创 支持向量机 SVM 预测人脸数据集时数据是否标准化的对比差异

摘要 实验比较了数据标准化前后的人脸识别模型性能。使用LFW数据集,标准化后的模型准确率达76%,显著高于未标准化时的44%。评估指标显示,标准化后各分类的precision、recall和f1-score均有明显提升。ROC曲线和AUC值也验证了标准化处理能有效改善模型性能。实验结果表明,在SVC模型中使用StandardScaler进行数据标准化是提升人脸识别准确率的关键步骤。

2025-09-18 14:11:19 440 1

原创 SciKit-Learn 全面分析 20newsgroups 新闻组文本数据集(文本分类)

本研究基于20个新闻组文本数据集(18846条数据),采用TF-IDF特征提取方法,对比了朴素贝叶斯、逻辑回归、SVM和随机森林四种分类模型。实验结果显示,优化后的SVM模型表现最佳(准确率0.88),其次是逻辑回归(0.85)。通过混淆矩阵、ROC曲线和t-SNE可视化分析发现,模型在宗教类(soc.religion.christian)和运动类(rec.sport.hockey)分类效果较差。词云图直观展示了各主题的关键词分布特征。研究为多类别文本分类提供了有效的分析方法论。

2025-09-14 13:27:01 491

原创 Scikit-Learn 对糖尿病数据集(回归任务)进行全面分析

本文对糖尿病数据集(442个样本,10个特征)进行回归分析,比较了11种模型的预测效果。分析结果显示,Lasso回归表现最优(MSE=2817.09,R²=0.4782),其次是线性回归和SVR。特征重要性分析表明BMI和血压(bp)是影响糖尿病进展的关键因素。决策树和MLP模型表现较差,可能由于数据特性或参数设置问题。所有模型均经过标准化处理,并采用MSE和R²进行评估,为糖尿病病程预测提供了参考方法。

2025-09-13 14:45:26 623

原创 Scikit-learn 对加州房价数据集(回归任务)进行全面分析

摘要 本研究使用加州房价数据集(20640个样本,8个特征)比较了11种回归模型的预测性能。通过标准化的数据预处理和统一评估流程,结果显示随机森林模型表现最佳(MSE=0.2573,R²=0.8040),其次是梯度提升回归(MSE=0.2883)和支持向量机(MSE=0.3099)。特征重要性分析表明MedInc(收入中位数)是最关键预测因子。残差图和预测值分布可视化验证了模型的有效性,其中树集成方法(随机森林、梯度提升)整体优于传统线性模型(线性回归、Lasso回归)。该分析为房价预测提供了可靠的模型选择

2025-09-13 13:33:11 490

原创 SciKit-Learn 全面分析分类任务 wine 葡萄酒数据集

本文对葡萄酒数据集(178个样本,13个特征,3个类别)进行了7种分类模型的比较分析。通过标准化预处理后,分别测试了K近邻、决策树、SVM、逻辑回归、随机森林、朴素贝叶斯和MLP模型。结果显示,随机森林和朴素贝叶斯表现最佳,准确率达100%;SVM、逻辑回归和MLP准确率为98.15%;K近邻和决策树为96.30%。ROC曲线分析表明各模型对三类葡萄酒均有良好区分能力,其中随机森林和朴素贝叶斯的AUC值达到1.0,展现出最优的分类性能。该研究为葡萄酒品种识别提供了有效的机器学习方法参考。

2025-09-11 14:51:37 579

原创 SciKit-Learn 全面分析分类任务 breast_cancer 数据集

本文对乳腺癌数据集(569个样本,30个特征)进行多模型分类分析。采用7种机器学习方法(K近邻、决策树、SVM、逻辑回归、随机森林、朴素贝叶斯和MLP),通过标准化预处理后训练评估。结果显示,逻辑回归和多层感知机表现最佳(准确率98.25%),支持向量机次之(97.66%),朴素贝叶斯相对较差(93.57%)。ROC曲线分析验证了各模型性能,为乳腺癌诊断提供了有效的分类参考。实验完整呈现了从数据预处理到模型评估的全流程。

2025-09-10 21:52:17 403

原创 SciKit-Learn 全面分析 digits 手写数据集

本文使用scikit-learn对digits手写数字数据集进行分析,包含8x8像素的1797个样本。通过7种分类方法(K近邻、决策树、SVM、逻辑回归、随机森林、朴素贝叶斯、MLP)进行比较,采用标准化预处理后,分别计算准确率和ROC曲线。结果显示各模型表现良好,其中SVM微平均AUC达0.99。分析过程包括数据加载、拆分训练/测试集、标准化、模型训练评估等步骤,并可视化多分类ROC曲线对比图,为手写数字识别任务提供了全面的性能评估。

2025-09-10 17:14:31 377

原创 SciKit-Learn 全面分析 iris 鸢尾花数据集

本文对经典的鸢尾花数据集(iris)进行了多分类方法比较分析。使用150个样本,仅选取花萼长度和宽度两个特征,通过7种分类模型(K近邻、决策树、SVM等)进行训练和测试。结果显示,K近邻模型准确率为75.56%,其中setosa类别识别效果最佳(precision=1.00)。实验还绘制了各模型的决策边界可视化图,直观展示了不同算法在特征空间中的分类效果。所有模型均采用相同的数据预处理和评估标准,便于横向比较性能差异。

2025-09-10 00:49:04 416 1

原创 sklearn 加州房价数据集 fetch_california_housing 出错 403: Forbidden 修复方案

摘要 当使用fetch_california_housing()加载加州房价数据时出现403错误,可通过手动下载数据文件解决。文章提供了替代方案代码,包含从源URL下载数据、解压处理、数据重组以及特征工程等完整流程。该方案创建了与scikit-learn相同格式的数据对象,包含20,640条房屋记录、8个特征和1个目标值,并保留了原始数据集的完整描述信息。实现过程参考了官方文档和社区解决方案,确保数据格式与scikit-learn内置函数输出一致。

2025-09-09 22:47:19 517

原创 Elasticsearch 常用任务管理命令及实战应用

本文介绍了Elasticsearch常用的任务管理命令,包括列出所有任务、获取特定类型任务、查询任务管理、任务取消等操作。同时提供了一个Python实战案例,通过定时检测ES后台运行的查询任务,当任务运行时间超过59秒时自动触发企业微信群告警通知。该脚本会获取任务详细信息,包括任务ID、查询语句和运行时间,并通过Webhook发送Markdown格式的告警消息到企业微信群机器人,帮助管理员及时发现并处理长时间运行的ES查询任务。

2025-08-28 10:28:11 322

原创 Windows11 GeForce GTX 1060 CUDA+CUDNN+Pytorch 下载及安装

本文详细介绍了在Windows11系统下为GeForce GTX 1060显卡配置CUDA环境的完整流程。首先通过NVIDIA控制面板查看显卡支持的CUDA版本(11.1.106),然后下载并安装对应版本的CUDA Toolkit和CUDNN。接着使用pip安装适配的PyTorch版本(1.8.0+cu111),最后通过Python环境验证CUDA是否可用。整个过程包含清晰的截图指引和命令行操作说明,为深度学习环境搭建提供了实用的参考指南。

2025-08-21 01:06:25 782

原创 通过 Docker 运行 Prometheus 入门

本文介绍了Prometheus监控系统的部署流程,主要包括三个核心组件:Prometheus Server、Exporter和Alertmanager。通过Docker方式快速搭建环境,提供了详细的配置文件和启动脚本。其中Alertmanager配置了Webhook告警接收接口,Prometheus设置了CPU使用率告警规则。文章还给出了完整的目录结构和关键配置说明,包括prometheus.yml、alert_rules.yml等文件的配置要点,最后通过脚本一键启动各组件完成部署。

2025-08-09 15:58:03 435

原创 基于 Flutter 的开源文本 TTS 朗读器(支持 Windows/macOS/Android)

TTS Reader是一款基于Flutter开发的跨平台文本朗读工具,支持Windows、macOS和Android系统。该应用提供OpenAI和Microsoft两种TTS语音引擎,具有代理设置、主题切换、朗读倍速调节等功能特性。支持多种文本来源,包括txt、epub文件和粘贴文本,并具备书签管理、点击定位朗读和断点续读等实用功能

2025-07-11 00:11:57 453

原创 ProxySQL 入门到实战

ProxySQL 作为数据库代理,具备读写分离、故障切换、查询缓存等功能

2025-07-09 11:15:52 956

原创 Linux 环境(Ubuntu)部署 Hadoop 环境

Linux 环境(Ubuntu)部署 Hadoop 环境

2025-01-05 12:44:32 786 2

原创 win11 系统报错 /dev/null No such file or directory 解决

win11 系统报错:git bash 提示 /dev/null No such file or directory 错误解决

2025-01-04 14:10:57 1053

原创 Linux 环境 java 配置

linux 环境 java 配置

2025-01-01 13:12:25 388

原创 MySQL Federated 联邦引擎连接 OLAP 数据库使用案例

MySQL Federated 引擎连接 OLAP 数据库案例

2024-12-06 16:17:17 554 1

原创 golang fmt.Sprintf 引用前述变量

golang fmt.Sprintf 引用前述变量

2024-09-27 12:50:39 624

原创 MySQL 大量 IN 的查询优化

MySQL 大量 IN 的查询优化

2024-09-09 10:43:28 1358

原创 WireShark 更改界面主题

将 WireShark 界面更改为白色主题

2024-07-25 19:02:55 2374 3

原创 CentOS7 Linux 安装 Docker

centos 安装 docker

2024-06-23 17:32:57 374 1

原创 golang 通过 cgo 调用 C++ 库

golang 通过 cgo 调用 C++ 库

2024-02-06 15:19:27 1946 1

原创 通过 docker-compose 部署 Flink

通过 docker-compose 部署 Flink

2024-02-06 11:57:30 1983

原创 通过 python 脚本迁移 Redis 数据

通过 python 脚本迁移 Redis 数据

2023-11-23 19:41:49 1217

原创 Python 遇到 PIL.UnidentifiedImageError: cannot identify image file <_io.BytesIO object 报错的解决

Python 报错 PIL.UnidentifiedImageError: cannot identify image file

2023-11-03 16:15:10 6617

原创 Python 提取加密的 PDF 中的文字

Python 提取加密 PDF 中的文字

2023-10-16 11:35:37 1068

原创 Qt 5.12.12 静态编译(MinGW)

Qt 静态编译(MinGW)

2023-10-14 14:45:48 2505

原创 Windows11 OneDrive 安装后无法打开的解决办法

Windows11 OneDrive 安装后打不开的解决办法

2023-09-13 00:29:14 4227

原创 node debian 镜像 new Date 获取时间少 8 小时问题

node debian 镜像 new Date 获取时间少 8 小时问题

2023-08-03 11:36:56 1234

原创 Golang 语言中的 REPL 库

Golang REPL 库

2023-07-19 12:01:27 501

原创 Windows 连接不到虚拟机中的 MongoDB Docker 容器的解决

Windows 连接不到虚拟机中的 MongoDB Docker 容器解决

2023-06-26 16:26:50 938

原创 Grafana Node Graph 使用教程

Grafana Node Graph Panel 使用教程

2023-06-10 10:26:42 5213 3

原创 MySQL show grants 的替代 SQL 查询账号权限

MySQL 查看账号权限的替代 SQL

2023-05-29 23:46:19 390

原创 使用 mongoexport 从 MongoDB 导出 JSON 格式的数据到本地

使用 mongoexport MongoDB 导出 JSON 格式的数据

2023-05-09 12:02:05 725

原创 关键词高亮显示浏览器 Edge 插件开发 & 源码

关键词高亮显示浏览器 Edge/Chrome 插件开发 & 源码

2023-05-05 09:25:43 2234

原创 Docker 启动容器遇到 operation not permitted 错误的解决

Docker 启动容器遇到 operation not permitted 错误的解决

2023-04-22 00:49:54 8485

原创 discuz 3x 通过 SQL 插入帖子内容(采集开发)

discuz 3x 通过 SQL 写入帖子内容(采集开发)

2023-04-09 12:04:05 325

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除