自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 生物统计学(biostatistics)笔记-10.深度学习

深度学习是今年的热点前沿,尤其是Chatgpt和LLM的出现

2024-12-13 16:41:26 685

原创 生物统计学(biostatistics)笔记-9.降维

追求的是在降维之后能够最大化保持数据的内在信息,并通过衡量在投影方向上的数据方差的大小来衡量该方向的重要性。但是这样投影以后对数据的区分作用并不大,反而可能使得数据点揉杂在一起无法区分。核函数包括:线性核函数、多项式核函数、高斯核函数等,其中高斯核函数最常用,可以将数据映射到无穷维。通过某非线性变换,将输入空间映射到高维特征空间,本质还是对原有数据增加维度。不同类的数据点尽可能的分开(between class)了解核技巧的意义(升维降低计算难度)和应用。主成分分析降低数据维数而不丢失太多信息。

2024-12-13 16:08:01 958

原创 生物统计学(biostatistics)笔记-8.蛋白质相互作用

蛋白质相互作用网络常用的数据库为STRING

2024-12-13 15:42:01 465

原创 生物统计学(biostatistics)笔记-7.Regulatory Network

基因调控网络的关键在于使用Bayesian Network完成因果推断

2024-12-13 15:01:41 303

原创 生物统计学(biostatistics)笔记-6.Clustering

聚类Clustering是一种典型的无监督学习,而分类Classification是一种监督学习

2024-12-13 11:52:24 775

原创 生物统计学(biostatistics)笔记-5.EM&Motif finding

就是假设概率分布是已知的,然后通过采样获得概率分布的随机样本,得到了符合该概率分布的这些样本后,可以用于估计总体分布、计算均值来估计总体期望、通过期望计算积分等。第二步是最大化(M),最大化在E步上求得的最大似然值来计算参数的值。但是当随机变量是多元的、密度函数是非标准形式、随机变量各分量不独立等情况,一般的蒙特卡罗方法就很难解决,就需要用MCMC算法了。蒙特卡罗方法:是一种基于采样的随机近似方法,主要应用于随机采样、数学期望估计、定积分计算中。1、概念:EM算法的两个关键步骤、MCMC、模体识别。

2024-12-12 23:23:28 756

原创 生物统计学(biostatistics)笔记-4.进化树

构建进化树的算法按照基于距离和基于特征分类

2024-12-12 22:45:24 1609

原创 生物统计学(biostatistics)笔记-3.HMM

隐马尔可夫模型(HMM)多用于CpG岛识别、基因识别等问题

2024-12-12 19:52:47 1182

原创 生物统计学(biostatistics)笔记-2.传统生物统计学

传统生物统计学主要关注于使用标准的统计方法来分析生物、医学数据,包括描述性统计、假设检验、回归分析等。

2024-12-12 17:51:14 1220

原创 生物统计学(biostatistics)笔记-1.绪论

目录1.生物统计学概论2.人工智能(AI)机器学习(ML)与深度学习(DL)3.常用机器学习方法与分类4.其他生统经典软件生信经典问题

2024-12-11 23:37:30 1125

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除