- 博客(51)
- 收藏
- 关注
原创 ubuntu服务器子用户(无sudo权限)安装/切换多个版本cuda
本文介绍了CUDA 13.0.0的下载与安装过程,以及多版本切换方法。首先从NVIDIA官网下载指定版本的CUDA安装包,创建专用目录存放不同CUDA版本。安装时通过修改Toolkit Options自定义安装路径到用户目录,避免权限问题。安装完成后需在.bashrc中添加环境变量路径。文章还展示了如何通过修改环境变量实现不同CUDA版本(如12.6、12.8)的快速切换,每次切换后需执行source ~/.bashrc使更改生效,并通过nvcc -V验证版本变更。该方法便于用户根据不同需求灵活使用不同CU
2025-12-15 16:59:14
306
原创 【机器学习】28 Deep learning
本章介绍了深度学习相关内容,包括深度生成模型(如深度定向网络、深度玻尔兹曼机、深度信念网络及其分层训练方法)、深度神经网络(如多层感知器、自动编码器及其变体)以及深度学习在分类、可视化、信息检索和特征学习等领域的应用。最后对深度学习进行了讨论。
2025-09-08 08:51:53
257
原创 【机器学习】27 Latent variable models for discrete data
本章介绍了离散数据的潜在变量模型(LVMs),重点探讨了分布式状态LVMs(包括混合模型、指数族PCA、LDA等)及其应用。详细讲解了LDA模型的原理、评估方法、拟合技术(Gibbs采样、变分推断)及扩展模型(动态主题模型、监督LDA等)。此外还涵盖了图结构数据的LVMs(随机块模型)、关系数据建模(概率矩阵分解)以及受限玻尔兹曼机(RBMs)的变体、学习方法和应用场景。内容系统全面,既有理论推导也有实践指导,适合机器学习研究者参考。
2025-09-08 08:50:42
548
原创 【机器学习】26 Graphical model structure learning
本章系统介绍了图模型结构学习的多种方法。首先讨论了知识发现中的结构学习技术,包括相关性网络和依赖网络。然后详细阐述了树结构学习方法,如Chow-Liu算法和混合树模型。针对有向无环图(DAG)的学习,探讨了马尔可夫等价性、精确结构推断及其扩展方法。对于含隐变量的DAG,重点介绍了结构EM算法及其应用。此外,还分析了因果DAG学习及其在解决辛普森悖论中的应用。最后分别讨论了无向高斯图模型和离散图模型的学习方法,包括图套索算法和薄连接树等优化技术。
2025-09-08 08:49:26
278
原创 【机器学习】25 Clustering
本章介绍了多种聚类方法,包括相似性度量与聚类评估(25.1)、狄利克雷过程混合模型(25.2)、亲和传播(25.3)、谱聚类(25.4)以及层次聚类(25.5)。特别讨论了从有限到无限混合模型的转换(25.2.1)、图拉普拉斯矩阵(25.4.1)和层次聚类的两种策略(25.5.1-2)。最后探讨了数据点与特征的双向聚类(25.6),包括双聚类(25.6.1)和多视图聚类(25.6.2)。完整内容可通过GitHub链接获取。
2025-09-08 08:48:11
413
原创 【机器学习】24 Markov chain Monte Carlo (MCMC) inference
本章介绍了马尔可夫链蒙特卡洛(MCMC)方法,重点探讨了Gibbs采样和Metropolis-Hastings算法两种核心方法,并分析其应用场景、收敛性及优化策略。内容涵盖Gibbs采样在Ising模型、高斯混合模型中的应用,Metropolis-Hastings算法原理及变体,以及收敛诊断、辅助变量MCMC、退火方法和边缘似然估计等技术。章节还涉及并行计算、自适应MCMC等前沿主题,为贝叶斯推断提供了系统的计算方法框架。
2025-09-08 08:46:45
871
原创 【机器学习】23 Monte Carlo inference
本章介绍了蒙特卡洛推断方法,包括从标准分布采样(如CDF法和Box-Muller法)、拒绝采样(基本思想、自适应方法及高维应用)和重要性采样(处理非归一化分布、似然加权及重采样)。重点讨论了粒子滤波技术,涵盖序列重要性采样、退化问题、重采样步骤及在机器人定位、视觉目标跟踪等领域的应用。最后介绍了Rao-Blackwellised粒子滤波方法及其在目标跟踪和SLAM中的具体实现。
2025-09-08 08:45:22
243
原创 【机器学习】22 More variational inference
本章主要介绍变分推断方法,重点讨论了循环信念传播(LBP)及其扩展形式。内容涵盖LBP的算法实现(收敛性、准确性、加速技巧)和理论分析(变分优化框架、与均值场方法的比较)。同时介绍了广义信念传播、期望传播(EP)等扩展方法,以及EP在聚类问题、TrueSkill排名系统中的应用。最后探讨了MAP状态估计的多种方法,包括线性规划松弛、最大乘积信念传播、图割技术和分解对偶法,并比较了不同方法的实验效果。
2025-09-08 08:43:58
870
原创 【机器学习】21 Variational inference
本章系统介绍了变分推断方法,主要内容包括:变分推断的基本概念与目标函数解释(21.1-21.2);平均场方法及其在伊辛模型中的应用(21.3);结构化平均场与因子隐马尔可夫模型(21.4);变分贝叶斯方法在线性回归和高斯分布中的实现(21.5);变分EM算法及其高斯混合模型应用(21.6);变分消息传递机制(21.7)以及基于上界的局部变分方法(21.8),涵盖了对数求和指数和sigmoid函数等关键函数的变分界推导。
2025-09-08 08:42:22
289
原创 【机器学习】20 Exact inference for graphical models
本章介绍了图模型的精确推理方法,主要内容包括:树结构的置信传播算法(串行/并行协议、高斯BP等变体)、变量消除算法及其计算复杂度分析、联结树算法(构建方法、消息传递机制)及其计算复杂度,最后讨论了精确推理在最坏情况下的计算困难性及近似推理的必要性。这些方法为图模型的概率推理提供了理论基础和实现途径。
2025-09-08 08:41:18
383
原创 【机器学习】19 Undirected graphical models
本章介绍了无向图模型(马尔可夫随机场)的基本概念与应用。主要内容包括UGM的条件独立性特征、参数化方法(含Hammersley-Clifford定理)、典型模型(如Ising模型、Hopfield网络、Potts模型等)以及学习算法(梯度法、伪似然等)。特别探讨了条件随机场(CRF)的结构、训练方法及应用,并对比了结构支持向量机(SSVM)的概率与非概率视角。最后提供了相关学习资源链接。
2025-09-08 08:40:00
609
原创 【机器学习】18 State space models
本章介绍了状态空间模型(SSM)及其应用与推断方法。主要内容包括:SSM在目标跟踪、机器人SLAM、参数学习和时间序列预测中的应用;线性高斯SSM的卡尔曼滤波和平滑算法;参数学习中的可识别性、EM算法和贝叶斯方法;非线性非高斯SSM的近似在线推断方法(EKF、UKF、ADF);以及混合离散/连续SSM在数据关联、故障诊断和经济预测等领域的应用。该章内容涵盖了SSM的理论基础和实践应用,并提供了相关代码资源。
2025-09-08 08:38:28
382
原创 【机器学习】17 Markov and hidden Markov models
本章系统介绍了马尔可夫模型与隐马尔可夫模型(HMM)。首先阐述了马尔可夫链的基本概念,包括转移矩阵、平稳分布及其在语言建模与PageRank算法中的应用。重点讲解了HMM的三大核心算法:前向算法、前后向算法和Viterbi算法,以及Baum-Welch等训练方法。最后探讨了多种HMM扩展模型,如变长HMM、层次HMM、因子HMM和动态贝叶斯网络等。本章内容全面覆盖了概率图模型在时序数据分析中的理论基础与典型应用。
2025-09-08 08:36:30
348
原创 【机器学习】16 Adaptive basis function models
本章介绍了自适应基函数模型的核心内容,包括分类回归树(CART)的构建与剪枝、广义加性模型、提升方法(Boosting)及其变体、前馈神经网络(含卷积网络)和集成学习。重点讨论了各类模型的算法原理(如反向传播、随机森林)、优化策略(如正则化、贝叶斯推断)以及实际应用效果对比。最后探讨了黑盒模型的可解释性问题,并提供了相关代码资源链接。内容涵盖从传统方法到深度学习的关键建模技术。
2025-08-29 12:06:39
705
原创 【机器学习】 15 Gaussian processes
本章主要介绍高斯过程(Gaussian Processes, GPs)及其在机器学习的应用。内容涵盖GPs回归(包括噪声处理、核参数估计及计算优化)、分类任务(二分类、多分类及泊松回归),以及与其他方法的对比(线性模型、SVM、神经网络等)。同时探讨了GPs潜在变量模型和大数据集近似方法。该章节系统性阐述了GPs的理论框架及实际应用价值。
2025-08-29 12:05:11
336
原创 【机器学习】 14 Kernels
本章全面介绍了核方法及其应用。内容涵盖各种核函数类型(RBF核、文档比较核、Mercer核等),核在广义线性模型中的使用,以及核技巧在分类、聚类、回归等任务中的应用。重点讲解了支持向量机(SVM)的原理及其在回归和分类中的实现,并比较了不同判别式核方法的优劣。此外还探讨了核在生成模型构建中的作用,包括核密度估计、核回归等非参数方法。整体呈现了核方法从理论到实践的完整框架。
2025-08-29 12:04:05
402
原创 【机器学习】13 Sparse linear models
本章介绍稀疏线性模型,重点讨论变量选择和正则化方法。主要内容包括:贝叶斯变量选择(如spike and slab模型)、L1正则化(LASSO)的原理与优化算法、正则化路径和模型选择技术。还介绍了L1正则化的扩展形式(如Group LASSO、Fused LASSO和Elastic Net)以及非凸正则化方法。此外,探讨了自动相关性确定(ARD)及其与稀疏贝叶斯学习的关系,以及稀疏编码在图像处理中的应用。本章提供了从概率视角对稀疏建模的全面介绍,涵盖理论推导和实际算法实现。
2025-08-29 12:02:51
1109
原创 【机器学习】 12 Latent linear models
摘要:本章介绍了潜在线性模型,主要包括因子分析(FA)和主成分分析(PCA)两大主题。12.1节详细讨论了因子分析的模型参数化、潜在因子推断、不可识别性问题及其混合模型和EM算法实现。12.2节阐述了经典PCA定理、奇异值分解、概率PCA及其EM算法。12.3-12.6节分别探讨了潜在维度选择方法、分类数据PCA、多视图数据PCA以及独立成分分析(ICA)的最大似然估计和FastICA算法等扩展内容。
2025-08-29 11:59:16
332
原创 【机器学习】 11 Mixture models and the EM algorithm
本章介绍混合模型与EM算法,主要内容包括:混合模型(高斯混合、多项混合、专家混合)及其在聚类中的应用;混合模型参数估计中的不可识别性和非凸性问题;EM算法的核心思想及其在不同模型(GMM、专家混合、有隐变量的DGM等)中的应用;隐变量模型的模型选择方法;以及缺失数据情况下的EM算法应用。本章还探讨了EM算法的理论基础、在线版本及其他变体。
2025-08-24 18:53:56
360
原创 【机器学习】10 Directed graphical models (Bayes nets)
本章介绍了有向图模型(贝叶斯网络)的基本概念和应用。主要内容包括:图模型的基础术语、条件独立性、链式规则等理论基础;朴素贝叶斯分类器、马尔可夫模型、医学诊断等典型应用案例;以及模型的推断和学习方法,特别是处理缺失数据的技术。此外,还讨论了有向图模型的独立性特征,包括d-分离和马尔可夫毯等性质。最后简要提及了影响(决策)图的相关内容。本章为理解和应用贝叶斯网络提供了系统性的框架。
2025-08-24 18:52:45
455
原创 【机器学习】9 Generalized linear models and the exponential family
本章介绍了广义线性模型和指数族分布。主要内容包括:指数族分布的定义、示例及参数估计方法;广义线性模型(GLMs)的基本原理、最大似然与贝叶斯推断;概率回归模型及其潜在变量解释;多任务学习的层次贝叶斯方法及应用;广义线性混合模型(GLMMs)在医学数据分析中的应用;以及学习排序的三种主要方法(点式、对式、列表式)和损失函数。
2025-08-24 18:51:35
466
原创 【机器学习】8 Logistic regression
本章系统介绍了逻辑回归,包括模型设定、参数估计方法(MLE、梯度下降、牛顿法、IRLS等)、贝叶斯方法(拉普拉斯近似、BIC推导)、在线学习与随机优化(LMS、感知机算法),以及生成式与判别式分类器的比较。内容涵盖从基础理论到实际应用的多个方面,如正则化、多分类问题、后验预测近似和异常值检测等,为逻辑回归提供了全面的技术框架和方法论指导。
2025-08-24 18:50:09
186
原创 【机器学习】7 Linear regression
本章系统介绍了线性回归方法。首先阐述了模型设定和最大似然估计(最小二乘法),包括推导过程、几何解释和凸性分析。随后讨论了稳健线性回归和岭回归,涉及数值稳定性计算、与PCA的联系及大数据正则化效应。最后详细讲解了贝叶斯线性回归,包括后验分布计算、预测分布推导,以及方差未知时的贝叶斯推断和证据框架方法。本章内容涵盖线性回归的经典统计方法和现代扩展技术。
2025-08-24 18:48:47
194
原创 【机器学习】6 Frequentist statistics
本章介绍了频率统计学的核心概念与方法。主要内容包括:估计量的抽样分布(自助法、MLE大样本理论)、频率决策理论(贝叶斯风险、极小极大风险、可容许估计量)、估计量的理想性质(一致性、无偏性、最小方差及偏差-方差权衡),以及经验风险最小化(正则化、结构风险、交叉验证、统计学习理论、替代损失函数)。最后讨论了频率统计的潜在问题,如置信区间反直觉行为、p值争议、似然原则等,并反思为何贝叶斯方法未被普遍采用。
2025-08-24 18:45:13
204
原创 【机器学习】5 Bayesian statistics
本章介绍了贝叶斯统计的核心内容。首先讲解了后验分布的总结方法(MAP估计、可信区间和比例差异推断),然后探讨贝叶斯模型选择(奥卡姆剃刀原理、边缘似然计算和贝叶斯因子)。在先验分布部分,讨论了无信息先验、Jeffreys先验和稳健先验等类型。接着介绍了分层贝叶斯和实证贝叶斯方法,以及相关应用案例。最后阐述了贝叶斯决策理论,包括常见损失函数下的贝叶斯估计和假阳性/假阴性的权衡问题。
2025-08-24 18:43:52
252
原创 【机器学习】4 Gaussian models
本章系统介绍了高斯模型及其相关方法。主要内容包括:高斯判别分析(QDA和LDA)及其正则化改进;联合高斯分布推断与线性高斯系统;Wishart分布及其逆分布特性;多元正态分布(MVN)参数推断,涵盖均值μ和协方差Σ的后验分布推导。特别探讨了防止过拟合的策略、信息形式表示以及精度未知情况下的传感器融合问题。各节配有理论证明和应用实例,为理解高斯模型提供了完整的理论基础和实际应用指导。
2025-08-24 18:42:28
353
原创 【机器学习】3 Generative models for discrete data
本章介绍离散数据的生成模型,主要包括贝叶斯概念学习、beta-二项模型、Dirichlet-多项模型和朴素贝叶斯分类器。首先探讨贝叶斯概念学习的似然、先验、后验及后验预测分布,随后详细分析beta-二项和Dirichlet-多项模型的构建过程。最后重点讲解朴素贝叶斯分类器的模型拟合、预测方法、对数求和技巧、基于互信息的特征选择以及词袋文档分类应用。这些模型为处理离散数据提供了系统的贝叶斯框架和方法。
2025-08-24 18:40:16
296
原创 【机器学习】2 Probability
本章系统介绍了概率论的基础知识,包括离散与连续随机变量、常见概率分布、联合概率分布、随机变量变换、蒙特卡洛近似和信息论等内容。重点讲解了贝叶斯规则、独立性与条件独立性、均值方差计算,以及二项分布、泊松分布、高斯分布等常见分布的特性。此外还涉及协方差与相关性、多元高斯分布、中心极限定理,以及熵、KL散度、互信息等关键概念,为后续机器学习理论奠定了概率基础。
2025-08-24 18:37:32
394
原创 序言|从《Machine Learning: A Probabilistic Perspective》出发:我的学习实践
我在博客上开设了一个专栏,记录我系统学习 Kevin P. Murphy 的《Machine Learning: A Probabilistic Perspective》的全过程。学习方式很“工程”:每一章我都会把关键内容交给大模型协助中文翻译 + 解释 + 要点总结,再结合自己的理解与问答,沉淀为章节博客与一份可下载的 PDF 学习记录。这篇序言交代我的动机、方法与规范,方便你了解接下来每篇文章的样子。:把关键段落交给大模型做中文转述 + 解释,我再针对不懂得地方询问。(3包括文本、公式、图、表等)
2025-08-24 17:47:31
259
原创 【机器学习】1 Introduction
本章介绍了机器学习的基本概念与分类。监督学习包括分类(如K近邻、逻辑回归)和回归(如线性回归)任务;无监督学习涵盖聚类、潜在因素发现、图结构挖掘和矩阵补全。讨论了参数模型与非参数模型的区别,以及维度灾难、过拟合和模型选择等关键问题。最后指出"没有免费午餐定理"表明不存在适用于所有问题的最优算法。
2025-08-24 17:01:16
193
原创 RoboSense激光雷达使用(Windows)
(1)修改电脑IP V4地址(2) 确定激光雷达和计算机是否成功通信,ping 192.168.1.200。
2024-09-09 16:55:48
1314
原创 RoboSense激光雷达使用(Linux)
(1)修改电脑IP V4地址(2) 确定激光雷达和计算机是否成功通信,ping 192.168.1.200。
2024-09-09 13:56:52
933
原创 Windows环境下如何用GPT3微调自己的模型
GPT-3 已经在来自开放互联网的大量文本上进行了预训练。当给出仅包含几个示例的提示时,它通常可以凭直觉判断出您要执行的任务并生成合理的完成。这通常称为“小样本学习”。微调通过训练比提示中更多的示例来改进小样本学习,让您在大量任务中取得更好的结果。对模型进行微调后,您将不再需要在提示中提供示例。这样可以节省成本并实现更低延迟的请求。
2023-05-10 19:23:26
1153
机器学习27 Latent variable models for discrete data
2025-09-08
机器学习24 Markov chain Monte Carlo (MCMC) inference
2025-09-08
机器学习10 Directed graphical models (Bayes nets)
2025-08-24
机器学习9 Generalized linear models and the exponential family
2025-08-24
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅
4