- 博客(35)
- 收藏
- 关注
原创 机器学习——多项式回归算法
多项式回归(Polynomial Regression)是线性回归的扩展形式,通过引入自变量的高次项来建模非线性关系。其核心思想是通过增加多项式特征,使线性模型能够拟合复杂的曲线数据。与线性回归的关系:本质仍是线性模型,因为权重参数是线性的特征空间从一维扩展到高维
2025-02-28 11:08:58
987
原创 机器学习——支持向量机
支持向量机是一种强大的分类器,它通过最大化分类间隔来提高泛化能力。通过引入核函数,SVM能够有效地处理非线性问题。本文详细介绍了SVM的原理和实现,展示了其在实际应用中的潜力。然而,SVM也存在一些局限性,
2025-02-17 09:51:10
622
原创 机器学习——逻辑回归
逻辑回归(Logistic Regression)是一种广泛应用于分类问题的统计方法。尽管名字中有“回归”二字,但逻辑回归实际上是一种分类算法,主要用于二分类问题,但也可以通过扩展用于多分类问题。逻辑回归通过使用逻辑函数(也称为Sigmoid函数)将线性回归的输出映射到概率值,从而进行分类。逻辑回归是一种简单但强大的分类算法,特别适用于二分类问题。通过使用Sigmoid函数,逻辑回归能够将线性回归的输出映射到概率值,从而进行分类。
2025-01-15 09:26:57
2802
原创 机器学习——线性回归
线性回归是一种简单而强大的机器学习方法,适用于各种应用场景。通过使用等库,可以方便地实现线性回归模型,并进行各种高级操作。在实际应用中,需要根据数据的特点和问题的需求,选择合适的线性回归方法和参数,以获得最佳的性能。同时,通过评估模型的性能指标和进行残差分析,可以不断改进模型,提高预测的准确性。
2025-01-06 09:10:55
830
原创 两款轻量级数据库SQLite 和 TinyDB,简单!实用!
SQLite 和 TinyDB 都是轻量级的数据库解决方案,适用于不同的应用场景。SQLite 是一个关系型数据库,适用于需要使用 SQL 语言进行数据操作的场景;TinyDB 是一个文档型 NoSQL 数据库,适用于需要快速搭建简单数据库环境的场景。在选择数据库时,需要根据具体的需求和应用场景来进行选择。
2024-12-19 09:17:27
2402
原创 Python GIL 锁详解及避免其影响的方法
虽然 Python 的 GIL 锁在一定程度上限制了多线程的性能,但通过合理的设计和选择合适的编程模型,可以在开发过程中尽量避免其影响。在实际开发中,需要根据具体的任务类型和性能需求,选择最适合的方法来提高程序的执行效率。
2024-12-12 15:36:15
800
原创 Subprocess 和 Multiprocessing 的区别与使用要点及进程关闭方法
提供了更全面的进程管理功能,可以创建、启动、停止和同步多个 Python 进程。可以在主程序中控制子进程的生命周期,并且可以通过共享数据结构或消息传递机制在进程之间进行通信。:旨在利用多核处理器的优势,通过创建多个独立的 Python 进程来并行执行任务,提高程序的性能和效率。:主要用于在 Python 程序中启动外部程序或命令,并与它们进行交互,管理其输入、输出和错误流。:管理的是外部进程,对这些进程的控制相对有限。函数,并在主程序中创建了一个新的进程来执行这个函数。来创建更复杂的管道和重定向操作。
2024-11-29 16:11:37
1022
原创 python进行SM2、SM3加签在Java中验签不通过的解决办法
最近遇到一个python进行SM2、SM3加签在Java中验签不通过的情况,我是通过以下的方式来解决的,希望对你有用。SM3对文件加签生成摘要,计算SM3哈希值SM2加签其中public_key、private_key是需要你填写的公钥私钥,plaintext是待加签字符串
2024-11-21 11:01:52
462
原创 大模型学习---Prompt 的编写和优化技巧
在自然语言处理和语言模型的应用中,Prompt(提示)的编写和优化至关重要。一个好的 Prompt 可以引导语言模型生成更准确、有用的回答。
2024-10-31 11:21:14
1433
原创 关于python代码PyInstaller介绍
PyInstaller 提供了很多自定义选项,可以通过编辑.spec文件来实现更复杂的打包配置。执行以下命令生成一个.spec文件:这会生成一个文件,可以使用文本编辑器打开它进行编辑。例如,可以在其中指定额外的隐藏导入、添加数据文件等。以下是一个示例.spec文件的内容:datas=[],a.scripts,a.datas,upx=True,在这个例子中,我们指定了一个可能被遗漏的导入模块。
2024-10-24 17:26:20
1100
原创 MySQL的 主从同步
MySQL 主从同步(Replication)是一种数据备份和灾难恢复的解决方案,同时也可以用于负载均衡和读写分离。通过主从同步,可以将一个 MySQL 数据库服务器(主服务器)的数据实时复制到另一台或多台 MySQL 服务器(从服务器)
2024-10-22 17:27:46
1292
原创 Redis的持久化存储和集群管理操作
Redis 的持久化存储和集群功能为用户提供了强大的数据管理和高可用性解决方案。通过选择合适的持久化方式,可以保证数据的安全性和完整性;通过搭建集群,可以提高系统的可扩展性和可用性。在实际应用中,需要根据具体的需求和场景来选择合适的方案,并进行合理的配置和管理。
2024-10-18 16:17:08
1274
原创 做自动化&数据采集你应该了解DrissionPage
DrissionPage 以其多种驱动模式、简洁的 API 和增强的功能,在网页自动化操作领域具有显著的优势。它不仅能够满足不同场景下的需求,还能提高开发效率和工作效率。无论是数据采集、自动化测试还是网页交互自动化,DrissionPage 都能为用户提供强大的支持。灵活性:多种驱动模式和丰富的 API 使得 DrissionPage 能够适应各种复杂的网页环境和需求。用户可以根据具体情况选择合适的驱动模式和定位方式,实现灵活的网页自动化操作。高效性。
2024-10-17 16:50:38
2678
原创 大数据学习---快速了解clickhouse数据库
ClickHouse是一种列式数据库管理系统,专为在线分析处理(OLAP)场景设计。ClickHouse提供了多种表引擎,每种表引擎都有其特定的用途和特性。以下是ClickHouse中一些常用的表引擎及其简要介绍。
2024-10-15 16:51:31
1563
原创 python对weedfs的操作
WeedFS(Weed File System)是一个开源的分布式文件系统,由Go语言编写,旨在解决海量文件存储和访问的问题。它采用了类似于Hadoop HDFS的分布式文件系统架构,但具有更高的性能和更简单的设计。
2024-10-12 14:17:17
1134
原创 python学习-python对kafka的相关操作
Kafka是由Apache软件基金会开发的一个开源流处理平台,由Scala和Java编写,用于处理实时数据流。它以高吞吐量、低延迟和可扩展性等特点而著称,广泛应用于Web数据抓取、日志收集、消息系统等领域。Kafka的主要特点包括:1. 高吞吐量:Kafka能够处理大规模的数据流,每秒可以处理几十万条消息。2. 低延迟:Kafka能够快速地传输消息,通常延迟在毫秒级别。。
2024-10-11 16:30:24
1130
原创 大模型学习----什么是RAG
RAG 方法是一种快速定制大型语言模型的有效方法,它通过结合检索和生成技术,利用外部知识源来增强模型的输出。在实际应用中,可以根据具体的任务和领域选择合适的知识源和检索方法,构建高效的 RAG 系统。通过不断地训练和优化,可以提高 RAG 系统的性能和适应性,为用户提供更准确、更相关的答案和文本。
2024-10-08 11:27:56
1845
原创 彻底理解pip工具
pip 是 Python 的包管理工具,全称为 “Pip Installs Packages”。它可以方便地安装、升级、卸载 Python 包,以及管理项目的依赖关系。pip 主要从 Python Package Index(PyPI)获取包,但也可以从其他软件仓库进行安装。PyPI 是一个庞大的在线存储库,包含了数以万计的由开发者们贡献的 Python 包,涵盖了各种领域和功能,从数据分析、机器学习到 Web 开发、游戏开发等。
2024-09-30 15:20:48
981
原创 python学习-pdb调试
pdb 是 Python 内置的调试器,可以帮助开发者在程序运行过程中进行调试。它允许逐行执行代码、查看变量的值、设置断点等操作。
2024-09-18 15:37:54
667
原创 python学习-高级特性
列表推导式(List Comprehension)是一种简洁的方式来创建列表。它允许在一个表达式中对一个可迭代对象进行循环,并根据特定的条件生成新的列表。
2024-09-13 17:25:36
906
原创 python学习-面向对象编程
在 Python 中,可以使用class关键字来定义类。以下是一个简单的类定义示例:在上面的示例中,我们定义了一个名为Person的类,它有两个属性name和age,以及一个方法say_hello。面向对象编程是一种强大的编程范式,它可以提高代码的可维护性、可扩展性和可复用性。Python 提供了丰富的面向对象编程特性,使得开发者可以更加方便地进行面向对象编程。在实际开发中,可以根据具体需求选择合适的面向对象编程特性,以提高代码的质量和效率。
2024-09-12 15:34:12
791
1
原创 彻底搞明白MySQL隔离级别
MySQL 的隔离级别决定了事务之间的隔离程度,以及在并发执行事务时可能出现的问题。了解不同的隔离级别及其特点,对于正确使用数据库事务非常重要。在选择隔离级别时,需要考虑并发程度、数据一致性要求和性能要求等因素,以选择最合适的隔离级别。
2024-09-11 17:04:11
1499
原创 MySQL基础知识
数据库是一个存储数据的集合,可以被多个应用程序共享和访问。数据库通常由一个或多个表组成,每个表包含一组相关的数据。创建数据库创建表...修改表删除表MySQL 是一种功能强大的关系型数据库管理系统,掌握 MySQL 的基础知识对于开发数据库应用程序非常重要。本文介绍了数据库的概念、MySQL 的安装和配置、SQL 语言的基本语法等内容,希望对读者有所帮助。
2024-09-10 16:57:05
868
原创 python学习-多线程、多进程、协程
多线程、多进程和协程都是 Python 中实现并发编程的方式。多线程适用于 I/O 密集型任务,多进程适用于 CPU 密集型任务,协程适用于高并发的 I/O 密集型任务。在实际应用中,可以根据具体的需求选择合适的并发编程方式。
2024-09-10 16:34:40
618
原创 docker的光速学习并掌握
将运用与运行的环境打包形成容器运行,运行可以伴随着容器,但是我们对数据的要求是持久化的。容器之间希望有可能共享数据。Docker 容器产生的数据,如果不通过 docker commit 生成新的镜像,使得数据做为镜像的一部分保存下载,那么当容器删除后,数据自然也就没有了。为了能保存数据在 docker 中我们使用卷。命名的容器挂载数据卷,其它容器通过挂载这个(父容器)实现数据共享,挂载数据卷的容器,称之为数据卷容器。容器之间配置信息的传递,数据卷的生命周期一直持续到没有容器使用它为止。
2024-09-09 17:26:21
1675
原创 docker的简单学习
将运用与运行的环境打包形成容器运行,运行可以伴随着容器,但是我们对数据的要求是持久化的。容器之间希望有可能共享数据。Docker 容器产生的数据,如果不通过 docker commit 生成新的镜像,使得数据做为镜像的一部分保存下载,那么当容器删除后,数据自然也就没有了。为了能保存数据在 docker 中我们使用卷。命名的容器挂载数据卷,其它容器通过挂载这个(父容器)实现数据共享,挂载数据卷的容器,称之为数据卷容器。容器之间配置信息的传递,数据卷的生命周期一直持续到没有容器使用它为止。
2024-09-09 17:19:06
1381
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人