- 博客(10)
- 收藏
- 关注
原创 生物统计学(biostatistics)笔记-9.降维
追求的是在降维之后能够最大化保持数据的内在信息,并通过衡量在投影方向上的数据方差的大小来衡量该方向的重要性。但是这样投影以后对数据的区分作用并不大,反而可能使得数据点揉杂在一起无法区分。核函数包括:线性核函数、多项式核函数、高斯核函数等,其中高斯核函数最常用,可以将数据映射到无穷维。通过某非线性变换,将输入空间映射到高维特征空间,本质还是对原有数据增加维度。不同类的数据点尽可能的分开(between class)了解核技巧的意义(升维降低计算难度)和应用。主成分分析降低数据维数而不丢失太多信息。
2024-12-13 16:08:01
958
原创 生物统计学(biostatistics)笔记-7.Regulatory Network
基因调控网络的关键在于使用Bayesian Network完成因果推断
2024-12-13 15:01:41
303
原创 生物统计学(biostatistics)笔记-6.Clustering
聚类Clustering是一种典型的无监督学习,而分类Classification是一种监督学习
2024-12-13 11:52:24
775
原创 生物统计学(biostatistics)笔记-5.EM&Motif finding
就是假设概率分布是已知的,然后通过采样获得概率分布的随机样本,得到了符合该概率分布的这些样本后,可以用于估计总体分布、计算均值来估计总体期望、通过期望计算积分等。第二步是最大化(M),最大化在E步上求得的最大似然值来计算参数的值。但是当随机变量是多元的、密度函数是非标准形式、随机变量各分量不独立等情况,一般的蒙特卡罗方法就很难解决,就需要用MCMC算法了。蒙特卡罗方法:是一种基于采样的随机近似方法,主要应用于随机采样、数学期望估计、定积分计算中。1、概念:EM算法的两个关键步骤、MCMC、模体识别。
2024-12-12 23:23:28
756
原创 生物统计学(biostatistics)笔记-2.传统生物统计学
传统生物统计学主要关注于使用标准的统计方法来分析生物、医学数据,包括描述性统计、假设检验、回归分析等。
2024-12-12 17:51:14
1220
原创 生物统计学(biostatistics)笔记-1.绪论
目录1.生物统计学概论2.人工智能(AI)机器学习(ML)与深度学习(DL)3.常用机器学习方法与分类4.其他生统经典软件生信经典问题
2024-12-11 23:37:30
1125
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人