自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(26)
  • 收藏
  • 关注

原创 GitHub高级筛选小白使用手册

GitHub 提供了强大的搜索功能,允许用户通过高级筛选器来精确查找仓库、Issues、Pull Requests、代码等。下面是一些常用的高级筛选用法,帮助你更高效地使用 GitHub 搜索功能。

2025-03-24 16:27:47 1538

原创 DeepSeek 使用窍门与提示词写法指南

Deepseek使用指南

2025-03-01 21:33:40 694

原创 Python AI学习路径

Python AI学习路径

2025-02-18 11:24:51 365

原创 闭包和装饰器的使用

闭包:内部函数引用外部函数的变量,即使外部函数执行完毕,内部函数仍然可以访问这些变量。装饰器:基于闭包实现,用于扩展函数的功能,而不修改原函数的代码。通过闭包和装饰器,可以写出更加灵活和可复用的代码!如果有进一步的问题,欢迎随时提问!

2025-02-17 17:18:08 429

原创 Python中的浅拷贝与深拷贝

通过以上例子可以看出,浅拷贝和深拷贝在不同情况下有不同的效果。浅拷贝适用于大多数简单数据类型,而对复杂的嵌套结构或自定义类对象,则必须使用深拷贝,以确保每个变量都有独立的对象副本,从而避免外部修改影响到内部变量。

2025-02-13 15:26:59 264

原创 tqdm用法教程

tqdm是一个用于 Python 的快速、可扩展的进度条库,它可以在循环中显示进度,使得长时间运行的任务更加直观和易于追踪。以下是tqdm的基本用法和一些高级功能介绍。

2025-02-07 17:32:32 302

原创 BeautifulSoup 使用教程及示例

find()和 find_all()是最常用的方法,用于查找标签。text和 get()用于提取文本和属性。select()支持 CSS 选择器,功能强大。结合requests库可以轻松实现网页抓取和数据提取。通过这些步骤和方法,您可以高效地使用 BeautifulSoup 解析和提取网页数据!

2025-02-07 17:23:46 700

原创 异步任务Asyncio

asyncio是 Python 的一个用于并发编程的库,通过使用协程、事件循环和任务,允许开发者以异步非阻塞的方式执行 I/O 密集型的操作,如网络请求、文件读写等。它非常适合高并发的场景,尤其是处理大量 I/O 操作时,能够有效提升性能。

2024-12-24 14:50:17 1027

原创 python基础之正则表达式

Python中的正则表达式(regular expressions,简称regex)是强大的字符串处理工具,用于搜索、匹配和替换字符串中的特定模式。Python通过re模块提供对正则表达式的支持。以下是对Python正则表达式的详细讲解。

2024-06-30 22:49:11 483

原创 机器学习_模型评估与选择

经验误差是模型在训练数据上的错误率,也称为训练误差(Training Error)。它是通过将模型应用于训练数据集来计算的,衡量的是模型在已知数据上的表现。过拟合是指模型在训练数据上表现很好,但在未见过的测试数据或验证数据上表现较差的现象。这意味着模型捕捉到了训练数据中的噪声和细节,而不是数据的整体模式,从而导致泛化能力较差。模型评估与选择是机器学习中的重要环节。通过交叉验证和多种评估指标,可以全面评估模型的性能。通过网格搜索、随机搜索和集成学习,可以选择最佳模型。

2024-06-06 06:00:00 909

原创 机器学习_集成学习

集成学习通过组合多个模型的预测结果来提高整体性能。Bagging、Boosting、Stacking、随机森林和梯度提升是常见的集成方法。每种方法都有其优缺点和适用场景。在实际应用中,根据数据特点和需求选择合适的集成学习方法,能够显著提升模型的性能和鲁棒性。

2024-06-05 06:00:00 751

原创 机器学习_降维

不同的降维算法有各自的特点和适用场景。在实际应用中,选择合适的降维算法需要根据数据的特点和具体需求进行权衡,并且可以通过实验和调参来优化降维效果。

2024-06-04 06:00:00 1206

原创 机器学习_聚类算法详解

聚类算法是无监督学习的一种,主要用于将数据集中的样本划分为若干个簇,使得同一簇内的样本具有较高的相似度,而不同簇之间的样本差异较大。

2024-06-03 06:00:00 1078

原创 KNN算法实例_手写识别系统

创建一个简单的书写识别系统,使用KNN算法来识别手写数字,分别使用手写KNN算法和调用库来实现。在数据处理过程中,我们将使用一个常见的手写数字数据集,如MNIST数据集。

2024-06-03 06:00:00 447

原创 机器学习_分类算法详解

机器学习中的分类算法是用于将输入数据分配到预定义类别中的算法。分类任务是监督学习的一种,模型根据训练数据中的输入-输出对进行学习,然后预测新的输入数据的类别。我们将详细讲解其中的几种,并提供相应的代码实例。

2024-06-02 06:00:00 2891

原创 机器学习_回归算法详解

线性回归是最简单、最常用的回归算法之一,假设目标变量 ( y ) 与输入特征 ( X ) 之间存在线性关系。ywTXbywTXb其中,( \mathbf{w} ) 是权重向量,( b ) 是偏置项。多项式回归扩展了线性回归,通过引入多项式特征来拟合非线性关系。yw0w1xw2x2wdxdyw0​w1​xw2​x2wd​xd岭回归是线性回归的扩展,加入了L2正则化项来防止过拟合。

2024-06-01 06:00:00 2012

原创 KNN算法实例_约会网站配对

下面我们将实现一个KNN算法的实例,目的是改进网站约会的配对效果。我们会分别手写KNN算法和调用库来实现。在数据处理的过程中,我们将对数据进行归一化处理。

2024-06-01 06:00:00 410

原创 特征工程_特征选择

特征选择是机器学习中必不可少的一步,它可以帮助减少数据的维度,提升模型的性能和训练速度。通过理解和应用过滤法、包装法和嵌入法,可以在各种应用场景中有效地进行特征选择,从而构建更高效、更准确的机器学习模型。

2024-05-31 09:00:00 840

原创 KNN算法实例_电影类型判断

下面是一个完整的K近邻算法(K-Nearest Neighbors, KNN)实例,用于判断电影类型。我们假设有一组电影数据集,每部电影都有两个特征:动作场面数量和爱情场景数量。根据这些特征,我们可以通过KNN算法来判断一部新电影的类型是动作片还是爱情片。

2024-05-31 06:00:00 503

原创 如何评价GPT-4o?

GPT-4o作为GPT-4的升级版本,在语言理解、对话能力和应用扩展性上都取得了显著进步。它不仅提升了处理复杂问题和长文本的能力,还增强了对不同语言和专业领域的支持。整体用下来流畅丝滑,长文本处理能力比较强,能广泛应用于生活学习中。

2024-05-30 10:19:10 444

原创 机器学习_决策树与随机森林

决策树和随机森林是常用的机器学习算法,尤其在分类和回归任务中应用广泛。以下详细介绍它们的用法,并提供相应的代码实例。

2024-05-30 09:13:17 533

原创 机器学习_参数调优

超参数是在训练之前设置的参数,不同于模型训练过程中学到的参数(如权重)。决策树和随机森林的超参数包括树的深度、分裂标准、树的数量等。

2024-05-30 09:11:59 968

原创 机器学习_交叉验证

交叉验证(Cross-Validation)是一种模型验证技术,通过重复地划分数据集来评估模型的性能,主要目的是提高模型的泛化能力,防止过拟合和欠拟合。以下详细介绍交叉验证的概念、类型及其应用。

2024-05-30 09:09:50 653

原创 机器学习_特征工程

特征工程是机器学习中的关键步骤,通过特征提取、特征转换和特征选择,可以显著提升模型的性能。了解不同的方法和工具,并在实际项目中应用这些技术,能够帮助你构建更强大和准确的模型。

2024-05-30 09:00:00 1392

原创 机器学习_正则化方法

防止过拟合:正则化通过约束模型参数,防止模型过于复杂,从而提高泛化能力。特征选择:L1正则化和Elastic Net可以自动选择重要特征,简化模型。提高稳定性:L2正则化和Elastic Net在多重共线性存在时,提高模型的稳定性。正则化方法是提高机器学习模型性能的关键技术之一。选择合适的正则化方法取决于数据集的特性和任务需求。L1正则化适用于需要特征选择的高维数据,L2正则化适用于多重共线性问题,Elastic Net结合了两者的优点,适用于需要同时实现特征选择和模型稳定性的场景。

2024-05-29 17:02:52 1108 1

原创 One-hot编码

One-hot编码是一种有效处理类别型数据的方法,广泛应用于各种机器学习和数据处理任务中。通过将类别型数据转换为二进制向量,One-hot编码使得机器学习算法能够处理这些数据。然而,对于高基数特征,需要考虑其他技术(如嵌入向量)来应对维度灾难问题。

2024-05-29 16:05:29 716

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除