- 博客(11)
- 收藏
- 关注
原创 机器学习Day5-模型诊断
本文介绍了机器学习模型优化的关键方法。主要内容包括:(1)模型选择技术,通过划分训练集、验证集和测试集来评估模型性能;(2)偏差与方差分析,解释如何诊断过拟合和欠拟合;(3)正则化参数调整对模型性能的影响;(4)学习曲线的绘制与应用;(5)神经网络中的偏差-方差特性;(6)构建机器学习系统的完整流程;(7)错误分析的重要性;(8)增加训练数据的多种方法;(9)迁移学习的原理;(10)精确率、召回率和F1-Score等不平衡数据评估指标。文章通过Python代码示例展示了这些概念的实际应用,为机器学习实践提供
2025-05-30 00:25:02
1490
原创 神经网络(Neural Networks)
神经网络最初旨在模拟人脑工作机制,现已发展为强大的人工智能工具。其发展历程经历了多次兴衰:20世纪50年代萌芽,80-90年代在图像识别等领域取得突破,2005年后以"深度学习"之名复兴,彻底改变了语音识别、计算机视觉等领域的应用格局。本文通过T恤销量预测案例,详细讲解了神经网络的工作原理,包括神经元模型、正向传播算法、隐藏层特征提取机制等核心概念。同时提供了完整的代码实现,涵盖数据预处理、模型构建、训练评估全流程。针对MNIST手写数字识别任务,文章演示了如何构建含128
2025-05-29 21:32:48
1131
原创 机器学习Day4-逻辑回归(Logistic Regression)
逻辑回归逻辑回归回归问题的目标是从无数种可能的数值中预测一个数字,接下来介绍用于分类问题的模型。通常线性回归模型不适合做分类任务,因此引入另外一种模型:逻辑回归(Logistic Regression)。垃圾邮件分类、肿瘤判断都属于分类问题,这类问题需要预测的变量只能是两个可能值之一,因此这类问题称为二分类(Binary Classification)。二分类问题中的类别可以用“no”和“yes”,“false”和“true”或 0 和 1 表示,在计算机编程中通常使用 0 和 1 表示。
2025-04-04 23:23:00
880
原创 机器学习Day3——特征缩放
举一个具体例子来说明特征缩放的意义,这里我们使用房屋面积和卧室数量预测房价,房屋面积x1的取值范围是 300~2000,卧室数量x2的取值范围是 1~5, 这里x1很大而x2很小,当特征取值范围很大时,模型可能选择的参数很小,反之当特征取值范围很小时,参数很大。那么代价函数的等高线视图如图 (a)所示,横轴的范围比较小,纵轴w2的范围比较大。可以通过观察学习曲线来进行判断,学习曲线即训练过程中代价值的变化曲线,曲线的横轴表示算法迭代的次数,纵轴表示代价值,我们在前面的实验中已经画过学习曲线,如下图所示。
2025-04-04 16:24:13
741
原创 机器学习Day1——机器学习简介
监督学习中提供给算法的示例(数据)要包含正确答案,即正确的标签 Y,通过不断地学习,算法学到X->Y的映射关系。在下图的例子中,给定的数据只有肿瘤大小和患者年龄,无监督学习不是要对这些数据分类,而是从数据中找到一些结构或模式,将数据分成不同的集群或组,这就是无监督学习中的聚类算法。分类问题的预测结果是数字 0,1,2,…此外,还有一些其他常用的无监督学习算法,例如:异常检测(用于检测异常事件,可用于金融系统中的欺诈检测),数据降维(将一个大数据集压缩成一个小得多的数据集,同时丢失尽可能少的信息)。
2025-03-14 00:48:15
739
原创 微博评论情感分析系统:基于BERT的文本分类
本项目使用了微博评论数据集,采用BERT模型对评论文本进行分类,预测评论的情感类别(积极/消极)。我们使用了Hugging Face的transformers库来加载BERT模型,借助PyTorch框架进行模型训练和评估。为了能将数据输入到BERT模型中,我们需要对文本进行分词处理,并将其转换为BERT所需的输入格式。我们使用了BertTokenizer进行分词和编码,将评论文本转化为input_ids、attention_mask等张量。
2025-02-16 22:14:37
2601
3
原创 基于FAISS和RAG技术的小说问答系统:构建一个智能问答应用
本文所实现的问答系统结合了以下技术: -文本分块(Chunking):将长文本分割成较小的部分,方便索引和查询。-BGE-M3嵌入模型:使用BGE-M3(BAAI)模型将文本转化为嵌入向量。-FAISS:Facebook AI开源的高效相似性搜索库,用于构建并查询向量索引。-DeepSeek生成模型:利用深度学习生成式模型回答用户的问题。我会逐步介绍每项技术的应用与代码实现。
2025-02-16 22:02:02
1121
原创 写一段让女朋友惊艳的代码——文件的简单加密
文件加密是通过对文件中的数据进行处理,使得其内容在没有正确密钥或解密方法的情况下无法被识别的过程。常见的加密方式包括对称加密、非对称加密等。本文将介绍一个非常基础的加密方法,通过简单的字节操作来加密文件内容。
2024-12-24 00:34:07
1237
2
原创 太理泽哥教你学Java:从零开始打造你的个性化画图板
走进一个充满魔力的编程世界,用Java这门充满魅力的编程语言,亲手打造一款专属于你的个性化画图板。
2024-10-02 15:58:06
2593
2
空空如也
如何访问其他内部类中的对象并点取其方法?(语言-java)
2024-08-14
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅