口_天_光健-优快云博客

原创制造企业的数据目录编写

制造企业数据目录编写是实现智能制造转型的关键环节。本文系统阐述了数据目录的核心价值（打破数据孤岛、保障数据可信、降低使用门槛）和编写原则（业务导向、标准化、全生命周期覆盖、可扩展），构建了包含六大核心模块的目录框架，并详细说明了从数据摸底、分类编码到审核发布的实操步骤。针对常见问题提出了解决策略，强调数据目录需要持续维护优化，才能有效支撑生产优化、质量提升等业务目标。文章为制造企业构建标准化、实用化的数据资产管理体系提供了系统指导。

2025-11-06 17:41:46 847

原创机器学习算法 ——XGBoost 的介绍和使用

摘要：本文介绍了XGBoost算法在结构化数据回归预测中的应用。作者通过比较多种回归算法后发现，XGBoost在特征工程增强后表现优异。文章详细解析了XGBoost的核心原理（梯度提升框架、正则化、树的构建）、核心特性（高效性、灵活性、鲁棒性）和使用步骤（数据准备、模型训练、评估与调优）。通过分类（鸢尾花）和回归（房价）两个示例展示了XGBoost的实际应用效果。最后，作者分享了完整的训练脚本，包含特征工程、模型训练和评估等环节，并对比了XGBoost与GBDT、随机森林等算法的优劣。实践表明XGBoost

2025-07-15 17:18:38 1096

原创大模型和ollama一起打包到一个docker镜像中

将大模型与Ollama打包为Docker镜像的简明指南实现步骤：准备工作：获取Ollama基础镜像、大模型文件（.gguf格式）和Modelfile 创建构建目录并准备关键文件： Modelfile定义模型参数 Dockerfile配置镜像构建流程 entrypoint.sh处理模型导入和服务启动构建镜像：复制模型文件到指定路径，设置权限，构建Docker镜像测试运行：启动容器并验证模型可用性导出镜像：保存为.tar文件便于分发注意事项：注意镜像体积过大问题（建议压缩处理）确保文件路径和权限

2025-06-22 14:20:22 799

原创嵌入式python的安装与使用

本文介绍了在Python 3.7.9嵌入式环境中安装第三方包的方法。首先需要下载嵌入式环境并获取get-pip.py脚本。关键步骤包括：修改python37._pth配置、创建site-packages目录、安装pip工具，最后通过pip安装requirements.txt中的依赖包。文章还提供了常见问题解决方案，如处理权限不足和依赖冲突的情况，并提醒注意嵌入式环境的轻量级特性。完成安装后即可在嵌入式环境中运行Python程序。

2025-06-06 11:34:02 847

原创使用YOLO11进行图像训练

YOLO11是Ultralytics团队推出的实时目标检测框架，相比YOLOv8，在COCO数据集上实现了更高的mAP，同时减少了22%的参数量，适用于工业检测、自动驾驶等实时场景。本文提供了使用YOLO11进行图像训练的详细技术指南，包括环境准备、数据准备、模型训练、模型优化、推理与部署以及性能评估。环境准备部分介绍了硬件和软件配置，数据准备部分详细说明了数据集标注、划分和配置文件。模型训练部分涵盖了模型选择、训练命令和训练监控。模型优化部分介绍了学习率调整和数据增强。推理与部署部分提供了模型导出和推理示

2025-05-09 09:37:24 1320

原创机器学习——多项式回归算法

多项式回归（Polynomial Regression）是线性回归的扩展形式，通过引入自变量的高次项来建模非线性关系。其核心思想是通过增加多项式特征，使线性模型能够拟合复杂的曲线数据。与线性回归的关系：本质仍是线性模型，因为权重参数是线性的特征空间从一维扩展到高维

2025-02-28 11:08:58 1475

原创机器学习——支持向量机

支持向量机是一种强大的分类器，它通过最大化分类间隔来提高泛化能力。通过引入核函数，SVM能够有效地处理非线性问题。本文详细介绍了SVM的原理和实现，展示了其在实际应用中的潜力。然而，SVM也存在一些局限性，

2025-02-17 09:51:10 688

原创机器学习——逻辑回归

逻辑回归（Logistic Regression）是一种广泛应用于分类问题的统计方法。尽管名字中有“回归”二字，但逻辑回归实际上是一种分类算法，主要用于二分类问题，但也可以通过扩展用于多分类问题。逻辑回归通过使用逻辑函数（也称为Sigmoid函数）将线性回归的输出映射到概率值，从而进行分类。逻辑回归是一种简单但强大的分类算法，特别适用于二分类问题。通过使用Sigmoid函数，逻辑回归能够将线性回归的输出映射到概率值，从而进行分类。

2025-01-15 09:26:57 3151

原创机器学习——线性回归

线性回归是一种简单而强大的机器学习方法，适用于各种应用场景。通过使用等库，可以方便地实现线性回归模型，并进行各种高级操作。在实际应用中，需要根据数据的特点和问题的需求，选择合适的线性回归方法和参数，以获得最佳的性能。同时，通过评估模型的性能指标和进行残差分析，可以不断改进模型，提高预测的准确性。

2025-01-06 09:10:55 1133

原创两款轻量级数据库SQLite 和 TinyDB，简单！实用！

SQLite 和 TinyDB 都是轻量级的数据库解决方案，适用于不同的应用场景。SQLite 是一个关系型数据库，适用于需要使用 SQL 语言进行数据操作的场景；TinyDB 是一个文档型 NoSQL 数据库，适用于需要快速搭建简单数据库环境的场景。在选择数据库时，需要根据具体的需求和应用场景来进行选择。

2024-12-19 09:17:27 4763

原创 Python GIL 锁详解及避免其影响的方法

虽然 Python 的 GIL 锁在一定程度上限制了多线程的性能，但通过合理的设计和选择合适的编程模型，可以在开发过程中尽量避免其影响。在实际开发中，需要根据具体的任务类型和性能需求，选择最适合的方法来提高程序的执行效率。

2024-12-12 15:36:15 962

原创 Subprocess 和 Multiprocessing 的区别与使用要点及进程关闭方法

提供了更全面的进程管理功能，可以创建、启动、停止和同步多个 Python 进程。可以在主程序中控制子进程的生命周期，并且可以通过共享数据结构或消息传递机制在进程之间进行通信。：旨在利用多核处理器的优势，通过创建多个独立的 Python 进程来并行执行任务，提高程序的性能和效率。：主要用于在 Python 程序中启动外部程序或命令，并与它们进行交互，管理其输入、输出和错误流。：管理的是外部进程，对这些进程的控制相对有限。函数，并在主程序中创建了一个新的进程来执行这个函数。来创建更复杂的管道和重定向操作。

2024-11-29 16:11:37 1348

原创 python进行SM2、SM3加签在Java中验签不通过的解决办法

最近遇到一个python进行SM2、SM3加签在Java中验签不通过的情况，我是通过以下的方式来解决的，希望对你有用。SM3对文件加签生成摘要，计算SM3哈希值SM2加签其中public_key、private_key是需要你填写的公钥私钥，plaintext是待加签字符串

2024-11-21 11:01:52 867 2

原创总结---20个工作中一定会用到的python实用小脚本

20个工作中一定会用到的python实用小脚本

2024-11-04 11:28:44 1107

原创大模型学习---Prompt 的编写和优化技巧

在自然语言处理和语言模型的应用中，Prompt（提示）的编写和优化至关重要。一个好的 Prompt 可以引导语言模型生成更准确、有用的回答。

2024-10-31 11:21:14 1812

原创关于python代码PyInstaller介绍

PyInstaller 提供了很多自定义选项，可以通过编辑.spec文件来实现更复杂的打包配置。执行以下命令生成一个.spec文件：这会生成一个文件，可以使用文本编辑器打开它进行编辑。例如，可以在其中指定额外的隐藏导入、添加数据文件等。以下是一个示例.spec文件的内容：datas=[],a.scripts,a.datas,upx=True,在这个例子中，我们指定了一个可能被遗漏的导入模块。

2024-10-24 17:26:20 1283

原创 MySQL的主从同步

MySQL 主从同步（Replication）是一种数据备份和灾难恢复的解决方案，同时也可以用于负载均衡和读写分离。通过主从同步，可以将一个 MySQL 数据库服务器（主服务器）的数据实时复制到另一台或多台 MySQL 服务器（从服务器）

2024-10-22 17:27:46 1635

原创 Redis的持久化存储和集群管理操作

Redis 的持久化存储和集群功能为用户提供了强大的数据管理和高可用性解决方案。通过选择合适的持久化方式，可以保证数据的安全性和完整性；通过搭建集群，可以提高系统的可扩展性和可用性。在实际应用中，需要根据具体的需求和场景来选择合适的方案，并进行合理的配置和管理。

2024-10-18 16:17:08 1400

原创做自动化&数据采集你应该了解DrissionPage

DrissionPage 以其多种驱动模式、简洁的 API 和增强的功能，在网页自动化操作领域具有显著的优势。它不仅能够满足不同场景下的需求，还能提高开发效率和工作效率。无论是数据采集、自动化测试还是网页交互自动化，DrissionPage 都能为用户提供强大的支持。灵活性：多种驱动模式和丰富的 API 使得 DrissionPage 能够适应各种复杂的网页环境和需求。用户可以根据具体情况选择合适的驱动模式和定位方式，实现灵活的网页自动化操作。高效性。

2024-10-17 16:50:38 3182

原创大数据学习---快速了解clickhouse数据库

ClickHouse是一种列式数据库管理系统，专为在线分析处理（OLAP）场景设计。ClickHouse提供了多种表引擎，每种表引擎都有其特定的用途和特性。以下是ClickHouse中一些常用的表引擎及其简要介绍。

2024-10-15 16:51:31 1715

原创 python对weedfs的操作

WeedFS（Weed File System）是一个开源的分布式文件系统，由Go语言编写，旨在解决海量文件存储和访问的问题。它采用了类似于Hadoop HDFS的分布式文件系统架构，但具有更高的性能和更简单的设计。

2024-10-12 14:17:17 1251

原创 python学习-python对kafka的相关操作

Kafka是由Apache软件基金会开发的一个开源流处理平台，由Scala和Java编写，用于处理实时数据流。它以高吞吐量、低延迟和可扩展性等特点而著称，广泛应用于Web数据抓取、日志收集、消息系统等领域。Kafka的主要特点包括：1. 高吞吐量：Kafka能够处理大规模的数据流，每秒可以处理几十万条消息。2. 低延迟：Kafka能够快速地传输消息，通常延迟在毫秒级别。。

2024-10-11 16:30:24 1248

原创大模型学习----什么是RAG

RAG 方法是一种快速定制大型语言模型的有效方法，它通过结合检索和生成技术，利用外部知识源来增强模型的输出。在实际应用中，可以根据具体的任务和领域选择合适的知识源和检索方法，构建高效的 RAG 系统。通过不断地训练和优化，可以提高 RAG 系统的性能和适应性，为用户提供更准确、更相关的答案和文本。

2024-10-08 11:27:56 2215

原创彻底理解pip工具

pip 是 Python 的包管理工具，全称为 “Pip Installs Packages”。它可以方便地安装、升级、卸载 Python 包，以及管理项目的依赖关系。pip 主要从 Python Package Index（PyPI）获取包，但也可以从其他软件仓库进行安装。PyPI 是一个庞大的在线存储库，包含了数以万计的由开发者们贡献的 Python 包，涵盖了各种领域和功能，从数据分析、机器学习到 Web 开发、游戏开发等。

2024-09-30 15:20:48 1272

原创 python学习-python对文件的操作

python对文件的操作

2024-09-29 09:37:25 1377

原创 Python对数据库（MySQL，redis、MongoDB）的操作

python对MySQL、Redis，MongoDB的操作

2024-09-27 17:00:55 1846 1

原创 Pywinauto 快速学习指南

根据特定应用程序的需求，可以创建自定义的控件封装类。

2024-09-25 10:38:52 3674

原创 python框架学习-Flask的学习

flask的基本信息学习，和示例介绍

2024-09-23 15:23:29 1343

原创 python学习-pdb调试

pdb 是 Python 内置的调试器，可以帮助开发者在程序运行过程中进行调试。它允许逐行执行代码、查看变量的值、设置断点等操作。

2024-09-18 15:37:54 888

原创 python学习-基础语法和概念

python基础语法学习

2024-09-18 15:25:41 817

原创 python学习-数据结构和算法

各种常见的数据结构与算法，一文解决

2024-09-14 15:45:29 1263

原创 python学习-高级特性

列表推导式（List Comprehension）是一种简洁的方式来创建列表。它允许在一个表达式中对一个可迭代对象进行循环，并根据特定的条件生成新的列表。

2024-09-13 17:25:36 956

原创 python学习-面向对象编程

在 Python 中，可以使用class关键字来定义类。以下是一个简单的类定义示例：在上面的示例中，我们定义了一个名为Person的类，它有两个属性name和age，以及一个方法say_hello。面向对象编程是一种强大的编程范式，它可以提高代码的可维护性、可扩展性和可复用性。Python 提供了丰富的面向对象编程特性，使得开发者可以更加方便地进行面向对象编程。在实际开发中，可以根据具体需求选择合适的面向对象编程特性，以提高代码的质量和效率。

2024-09-12 15:34:12 899 1

原创彻底搞明白MySQL隔离级别

MySQL 的隔离级别决定了事务之间的隔离程度，以及在并发执行事务时可能出现的问题。了解不同的隔离级别及其特点，对于正确使用数据库事务非常重要。在选择隔离级别时，需要考虑并发程度、数据一致性要求和性能要求等因素，以选择最合适的隔离级别。

2024-09-11 17:04:11 1717

原创 MySQL基础知识

数据库是一个存储数据的集合，可以被多个应用程序共享和访问。数据库通常由一个或多个表组成，每个表包含一组相关的数据。创建数据库创建表...修改表删除表MySQL 是一种功能强大的关系型数据库管理系统，掌握 MySQL 的基础知识对于开发数据库应用程序非常重要。本文介绍了数据库的概念、MySQL 的安装和配置、SQL 语言的基本语法等内容，希望对读者有所帮助。

2024-09-10 16:57:05 903

原创 python学习-多线程、多进程、协程

多线程、多进程和协程都是 Python 中实现并发编程的方式。多线程适用于 I/O 密集型任务，多进程适用于 CPU 密集型任务，协程适用于高并发的 I/O 密集型任务。在实际应用中，可以根据具体的需求选择合适的并发编程方式。

2024-09-10 16:34:40 656

原创 docker的光速学习并掌握

将运用与运行的环境打包形成容器运行，运行可以伴随着容器，但是我们对数据的要求是持久化的。容器之间希望有可能共享数据。Docker 容器产生的数据，如果不通过 docker commit 生成新的镜像，使得数据做为镜像的一部分保存下载，那么当容器删除后，数据自然也就没有了。为了能保存数据在 docker 中我们使用卷。命名的容器挂载数据卷，其它容器通过挂载这个（父容器）实现数据共享，挂载数据卷的容器，称之为数据卷容器。容器之间配置信息的传递，数据卷的生命周期一直持续到没有容器使用它为止。

2024-09-09 17:26:21 1719

原创 Redis光速学习并掌握

yum update -y 1 这里会更新好多内容，需要等待一会。

2024-09-09 17:22:14 531

原创 docker的简单学习

将运用与运行的环境打包形成容器运行，运行可以伴随着容器，但是我们对数据的要求是持久化的。容器之间希望有可能共享数据。Docker 容器产生的数据，如果不通过 docker commit 生成新的镜像，使得数据做为镜像的一部分保存下载，那么当容器删除后，数据自然也就没有了。为了能保存数据在 docker 中我们使用卷。命名的容器挂载数据卷，其它容器通过挂载这个（父容器）实现数据共享，挂载数据卷的容器，称之为数据卷容器。容器之间配置信息的传递，数据卷的生命周期一直持续到没有容器使用它为止。

2024-09-09 17:19:06 1412

原创记一次miniconda的安装与使用

介绍如何安装miniconda

2024-09-06 14:52:07 1159 1

空空如也

空空如也