- 博客(26)
- 收藏
- 关注
原创 【机器学习】ROC 曲线与 PR 曲线
ROC 曲线和 PR 曲线是评估二分类模型性能的强大工具。ROC 曲线关注模型区分正负样本的能力,而 PR 曲线更关注模型在正例上的预测能力,尤其适用于不平衡数据集。通过理解和绘制这两种曲线,我们可以更全面地了解模型的优缺点,并为模型选择和调优提供有力的支持。在实际应用中,应根据具体的问题和数据的特点选择合适的评估指标和可视化方法。TN+FP+
2025-04-07 14:25:42
482
原创 【计算机相关学习】R语言
ggplot2包展现的图层语法系统,将数据映射、几何对象、美学属性解构重组,这不仅是技术实现,更暗含着数据可视化的认知范式。当我在RStudio里用三行代码生成多维散点矩阵时,突然意识到数据探索本该是思维的自然延伸,而非代码的机械堆砌。在Python统治数据科学的时代,我意外推开了R语言的大门。这个诞生于统计学家之手的编程语言,像一把精巧的手术刀,改变了我对数据处理的认知边界。学习R语言的经历像一次认知升级实验。的二维数据容器、向量化运算的优雅实现,都让方差分析、回归建模等统计操作变得像搭积木般直观。
2025-04-03 22:53:45
275
原创 KNN算法原理及python代码实现
定义:KNN是一种基于实例的学习方法,它不构建模型而是直接使用训练数据集来对新样本进行预测。基本思想:通过计算新样本与已知类别样本之间的距离,找到最近的k个邻居,并根据这些邻居的多数类别来进行预测。
2025-03-11 23:13:29
976
原创 跑代码过程中遇到 killed 解决策略
交换空间是磁盘上的一块区域,当物理内存不足时,系统会将部分内存数据转移到交换空间,以腾出物理内存。虽然交换空间的速度比物理内存慢,但可以避免程序因内存不足而被终止。
2025-03-03 20:26:57
639
原创 Anaconda安装 超详细版 (2025版)
Anaconda 是一个面向数据科学和机器学习的开源Python和R语言的发行版,旨在简化包管理和部署。
2025-02-27 20:48:20
1503
原创 Linux服务器上创建新用户并赋予管理员权限操作
sudo usermod -aG sudo 用户名。su - 用户名 (会提示输入密码)3、切换到新用户并测试sudo权限。sudo adduser 用户名。
2025-02-22 18:12:03
210
原创 【3D Gaussian Splatting 阅读】总体概览
无论是复制还是分割,训练后高斯的总数相比训练前都会增加 ,可能导致冗余高斯,占用大量计算资源和存储空间。2.2 为了描述一个3D高斯,需要四个属性:位置,协方差矩阵,不透明度,球谐系数。协方差:表示两个随机变量之间的线性关系 协方差为正,变化趋势相同。设置两个阈值 1)<min 复制操作 2)>max 分割操作。输入图像----->Sfm稀疏点云获取,对应图像的相机位姿。高斯分布 = 正态分布。协方差矩阵是半正定矩阵。三维重建--3DGS。
2024-12-31 16:26:45
436
原创 【JAVA学习】集合初步
键不能重复;值可以重复需要存储一一对应的数据时,可以考虑使用Map集合来做示例:HashMap(由键决定特点):无序,不重复,无索引。
2024-12-31 16:25:11
661
原创 【JAVA学习】多线程初步
作用:获取调用该方法的线程名称获取当前线程的名称,默认为"Thread-n"主线程的名字默认为main});//代码输出结果:Current thread name: Thread-0。
2024-12-31 16:23:22
687
原创 【JAVA学习】继承+多态+枚举+抽象类+接口等
权限修饰符就是用来限制类中的成员(成员变量,成员方法等)能够被访问的范围子类重写的方法与父类对应方法的方法名称,形参列表必须相同其他注意事项:子类重写父类方法时,访问权限必须大于等于父类该方法的权限重写的方法的返回值,必须与被重写方法的返回值类型一样,或者范围更小私有方法,静态方法不能被重写,如果重写会报错// 父类// 私有成员变量// 默认成员变量int age;// 受保护成员变量// 公共成员变量// 构造器// 私有方法// 默认方法// 受保护方法。
2024-12-24 19:19:40
796
原创 【蓝桥杯】真题训练-->计算从 1 到 N 一共有多少个好数
对于第一个样例,24 以内的好数有 1、3、5、7、9、21、23,一共 7 个。试题 C: 好数 4第十五届蓝桥杯大赛软件赛省赛 C/C++ 大学 B 组【评测用例规模与约定】对于 10% 的评测用例,1 ≤ N ≤ 100。对于 100% 的评测用例,1 ≤ N ≤ 107。一个整数如果按从低位到高位的顺序,奇数位(个位、百位、万位 · · · )上的数字是奇数,偶数位(十位、千位、十万位 · · · )上的数字是偶数,我们就称之为“好数”。给定一个正整数 N,请计算从 1 到 N 一共有多少个好数。
2024-09-24 21:21:51
925
1
原创 Git Bash实现windows和linux服务器文件互传
实现将本地文件 /path/on/local/file 传输到远程linux服务器的 /path/to/remote/directory 目录下例:scp -r D:/Desktop/data root@10.10.18.102:/mnt/200gb/ml-hugs。
2024-09-15 12:28:39
353
原创 《Linux系统下创建新用户》(Ubuntu 系列)
注:设定完后可输入 "groups 用户名" 来验证用户是否被添加到sudo组。输入 "usermod -aG sudo 用户名",给新用户设定管理员权限。输入"adduser 要创建的用户名",按照要求设定登录密码。root用户下切换到刚创建的新用户 "su - 用户名"则表示当前用户为超级用户,接下来进行创建新的普通用户操作。注:用户信息部分可直接按ENTER键都跳过。
2024-09-13 18:21:02
465
原创 VSCode提取扩展出错 ,显示SHR failed错误解决
VScode扩展商店,搜索显示 “提取扩展时出错。SHR failed”注:这里的13.107.42.18不定,确保第一步查出来的ip地址一致即可。搜索框内输入:marketplace.visualstudio.com。用记事本打开 在文本最后一行输入以下内容后保存。2.2 打开本地配置文件。2.4 重启VSCode。显示以上内容即刷新成功。2.1 查询ip地址。
2024-07-19 11:51:22
2428
原创 Win11 如何更改管理员权限,修改hosts内容
五、出来之后第一个第一个页面相比之前多了Everyone,点击Everyone,在第二个窗口中的写入选项打勾✔,最后点击确定即可。四、点击添加,在最后一个窗口输入Everyone,单击确定。二、右键点击hosts,选择属性。三、点击第二个安全,进入编辑界面。一、找到hosts文件所在位置。
2024-07-19 11:49:23
2344
原创 【周志华 机器学习】入门(下)
贝叶斯决策论的核心思想是基于后验概率来选择使得期望损失最小的决策实现过程:1.定义决策空间:确定决策集合2.建立先验概率:对决策问题进行建模,定义每个可能的状态或类别的先验概率分布3.估计条件概率: 估计在每个可能的状态下观察到数据 x 的条件概率分布4.计算后验概率:利用贝叶斯定理,计算在观察到数据 x 后每个可能状态的后验概率分布5.选择最优决策:根据后验概率分布和损失函数,选择能够最小化期望损失的最优决策的数学表达书为:其中是决策 d 在真实状态下的损失。
2024-07-18 16:47:42
1970
原创 【周志华 机器学习】入门 (中)
神经网络是由具有适应性的简单单元组成的广泛并行互连的网络,它的组织能够模拟生物神经系统对真实世界物体所作出的交互反应。支持向量机是一种由Vladimir Vapnik等人提出的监督学习算法,最初用于解决分类问题,后来也扩展到回归问题。其主要思想是在特征空间中找到一个最优的超平面,用于对数据进行分类或回归。
2024-07-16 21:52:55
1004
原创 【机器学习】 第三章 逻辑回归
逻辑回归是一种经典的统计学习方法,被广泛用于解决二分类问题。尽管名字中含有"回归"一词,但实际上它是一种分类算法。用于预测一个二元因变量(即因变量的取值只有两种可能,如“是/否”,“0/1”,“成功/失败”等)与一个或多个自变量之间的关系。简单而有效、计算效率高、适用性广泛等。
2024-07-16 10:08:09
646
原创 【机器学习】 第二章 线性模型
线性回归是一种用于建立变量之间线性关系的统计模型,通常用于预测或解释因变量(目标变量)与一个或多个自变量(特征)之间的关系。简单说,线性回归尝试找到自变量和因变量之间的最佳线性关系,即找到一条直线(二维空间)或超平面(多维空间),使得这条直线或超平面能够最好地拟合数据点。
2024-07-16 10:02:24
1692
原创 【周志华 机器学习】入门(上)
线性判别分析(LDA)基本思想是通过降维将数据投影到一个低维空间,同时最大化不同类别之间的类内距离,最小化同一类别内部的方差,以此来实现数据的有效分类。在单变量情况下,假设我们有一个解释变量 ( x ) 和一个目标变量 ( y ),我们的目标是找到一个线性函数,即一条直线,来描述它们之间的关系。在机器学习中,特征通常表示为数据中的列,可以是数值、分类或其他类型的数据。每个叶节点最终会对应一个类别(分类任务)或一个预测值(回归任务),这个类别或预测值是基于到达该节点的所有样本的统计结果得出的。
2024-07-15 21:26:06
1233
原创 【机器学习】第一章 绪论
机器学习是一门研究如何使计算机系统在没有明确编程的情况下,从数据中学习和改进性能的学科。数据集(dataset)是机器学习和数据分析中的一个基础概念,它指的是一组被组织成一个整体的数据集合,用于训练模型、评估模型或进行统计分析。数据集的形式多种多样,适应不同类型和用途的数据分析和机器学习任务。常见的数据集有表格、文本、图像、视频、时间序列、音频和地理空间等数据集。
2024-07-10 20:53:02
2049
1
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人