- 博客(20)
- 收藏
- 关注
原创 生物信息学 (101计划核心教程)Chapter2
本章系统介绍了生物统计学的核心概念与方法。从总体与样本、抽样方法等基础概念出发,详细阐述了数据特征描述、参数估计与假设检验等统计推断方法。重点讲解了线性模型、Logistic回归、泊松回归、Cox模型等常用统计模型及其应用场景,特别强调了各类模型的前提假设与适用范围。针对高维数据问题,介绍了正则化、变量筛选等方法。在统计学习部分,涵盖了决策树、随机森林、SVM等有监督学习方法及PCA、聚类等无监督技术。最后探讨了统计因果推断的基本框架与潜在结果模型,包括工具变量法等解决混杂问题的策略。
2025-11-17 02:02:05
619
原创 生物信息学 (101计划核心教程)Chapter5
本章系统介绍了生物序列比对与分析的核心方法与应用。主要内容包括:1)序列特征解析技术,从DNA序列变换、重复序列识别到基于HMM和机器学习的基因预测方法;2)双序列比对的动态规划算法(Needleman-Wunsch全局比对和Smith-Waterman局部比对)及其打分系统;3)序列比对的典型应用,包括BLAST系列算法、序列聚类方法以及多重序列比对技术;4)分子进化树构建方法,涵盖UPGMA、邻接法等距离算法以及最大简约法、最大似然法等特征方法。这些技术为揭示序列功能、演化关系提供了系统的分析方法论。
2025-11-13 19:52:05
865
原创 生物信息学 (101计划核心教程)Chapter4
生物数据库是生命科学研究的战略资源,可分为DNA、RNA、蛋白质等类型数据库。国际主要数据中心包括NCBI、EMBL-EBI等,我国CNCB-NGDC在数据管理方面与国际仍有差距。数据库代表性包括:1)序列数据库如Ensembl、RefSeq、GO和UniProt,提供基因组注释和蛋白质功能分析;2)结构数据库如PDB、AlphaFoldDB,解析生物大分子三维结构;3)互作数据库如IntAct、STRING,揭示分子相互作用网络。这些资源为生物医学研究提供了多维度基础数据支持。
2025-11-11 13:47:55
762
原创 生物信息学 (101计划核心教程)Chapter3
本章系统介绍了深度学习和人工智能的基础理论与前沿模型。首先阐述了从人工智能、机器学习到深度学习的发展历程,详细解析了监督学习、无监督学习和强化学习等机器学习范式。重点讲解了神经网络、梯度优化等深度学习基础,以及CNN、RNN等典型模型的结构原理和应用场景。随后深入探讨了扩散模型、Transformer网络和大语言模型等前沿技术,分析了它们在生物序列分析、分子设计等领域的创新应用。本章内容为理解深度学习的数学原理和生物信息学应用提供了系统框架。
2025-11-09 14:09:56
1026
原创 生物信息学 (101计划核心教程)Chapter1
本文系统梳理了生物信息学的发展历程,将其划分为分子生物学、基因组学、后基因组和大数据与人工智能四个关键时期。重点阐述了生物信息学中降维、聚类、分类、回归等核心算法及其在生命科学研究中的应用,深入分析了统计学习与机器学习方法在解决高维度、多模态生物数据问题中的独特优势。同时强调在实际研究中需平衡统计显著性与生物学意义,合理选择算法以适应不同数据类型和研究需求。文章指出,随着人工智能技术的发展,生物信息学将在揭示生命奥秘和推动学科交叉方面发挥越来越重要的作用。
2025-11-04 15:16:27
932
原创 2025科大讯飞AI大赛<大模型技术方向>(Datawhale AI 夏令营)
2025讯飞AI开发者大赛聚焦电商直播场景,参赛者需完成三个任务:1)商品识别(二分类任务),采用混合模型法结合规则匹配与机器学习;2)情感分析(多任务分类),使用深度学习方法如双向LSTM+注意力机制和多尺度CNN;3)评论聚类,(建议使用大模型处理)本文通过多算法融合生成主题词。任务涉及视频数据、评论文本处理,最终提交结果文件参与评分。
2025-07-12 15:56:00
1154
原创 《深度学习基础与概念》(进阶)
围绕分类问题展开,介绍了线性分类和决策理论以及生成分类器的不同情况。文中以手写数字识别交互界面为例,演示生成分类器应用逻辑。
2025-06-17 20:54:34
1061
原创 《深度学习基础与概念》task2/3
简单地介绍了单层网络回归,含线性回归模型、最小二乘法及优化方法,并结合 “21 点” 交互演示决策理论,体现概率与损失函数的作用。
2025-06-17 20:54:08
574
原创 蛋白质预测task2(Datawhale AI春训营)
围绕第三届世界科学智能大赛合成生物赛道“蛋白质固有无序区域预测” 赛题,介绍了潜在改进方向,包括集成学习、迁移学习、动态特征融合、基于 Transformer 的创新架构、图神经网络应用、强化学习优化等方法。还以图神经网络应用结合动态特征融合为例,详细阐述核心思路、代码实现及关键技术点,总结出新手友好、进阶优化、高阶研究的不同方案。
2025-04-18 17:36:45
883
原创 进阶Task3.2+3:《深度学习详解》(Datawhale X 李宏毅苹果书 AI夏令营)
卷积神经网络 关键概念 优化选择 以及 实验:图片分类(不同类型效果)
2024-08-30 22:11:28
1046
原创 进阶(选修):《深度学习详解》(Datawhale X 李宏毅苹果书 AI夏令营)
Self-Attention 关键概念 以及 实验:声音分类(不同结构效果)
2024-08-30 16:10:59
1249
原创 进阶Task3:《深度学习详解》(Datawhale X 李宏毅苹果书 AI夏令营)
特征归一化与批量归一化 关键概念 归一化 以及 案例分析:恶意软件分类
2024-08-29 19:54:36
910
原创 进阶Task2:《深度学习详解》(Datawhale X 李宏毅苹果书 AI夏令营)
自适应学习率算法算法 关键概念和公式 标签选择 以及 仿实践(DNN)深度神经网络-图像分类
2024-08-29 12:41:08
1017
原创 入门(选修):《深度学习详解》(Datawhale X 李宏毅苹果书 AI夏令营)
分类优化的算法 关键概念和公式 深度学习优化 以及 仿实践(DNN)深度神经网络-分类任务
2024-08-28 19:23:53
1032
原创 入门Task3:《深度学习详解》(Datawhale X 李宏毅苹果书 AI夏令营)
过拟合类型 关键概念 深度学习优化 以及 实例优化:波士顿房价预测
2024-08-27 13:38:15
1116
原创 进阶Task1:《深度学习详解》(Datawhale X 李宏毅苹果书 AI夏令营)
梯度下降优化方向 关键概念以及公式 逃离鞍点和局部极小值 以及 实验验证
2024-08-26 21:16:00
1185
原创 入门Task2:《深度学习详解》(Datawhale X 李宏毅苹果书 AI夏令营)
激活函数 关键概念 神经网络 以及 实例分析:波士顿房价预测
2024-08-25 22:43:51
660
原创 入门Task1:《深度学习详解》(Datawhale X 李宏毅苹果书 AI夏令营)
机器学习任务类型 关键概念 梯度下降法 以及 实例分析:波士顿房价预测
2024-08-25 16:43:49
1045
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅