自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(16)
  • 资源 (1)
  • 收藏
  • 关注

原创 【生信分析】免疫组库基础分析10-CDR3 氨基酸理化性质分析

alakazam包提供了分析免疫球蛋白和T细胞受体(IG/TCR)CDR3区氨基酸序列理化特性的功能,包括长度、疏水性、体积、极性等9种特征参数。通过aminoAcidProperties函数可计算这些特性,并支持DNA序列翻译为氨基酸序列。示例代码展示了如何从AIRR数据中提取CDR3特性,并使用ggplot2可视化不同同种型的CDR3长度、疏水性、碱性/酸性氨基酸含量等特征的分布。该工具为免疫组库分析提供了重要的氨基酸水平特征提取和可视化功能。

2025-10-18 16:31:12 411

原创 【生信分析】免疫组库基础分析9-CDR3 motif分析

CDR3序列多样性:免疫识别与抗原结合的关键机制 摘要:CDR3氨基酸序列多样性是免疫系统识别多种抗原(病原体、肿瘤抗原等)的分子基础。研究表明,特定长度的CDR3 motif两端氨基酸较为保守,中间部分具有高度多样性(图1)。通过分析CDR3中间氨基酸(以位置0为中心)的motif特征(图2),可以揭示免疫受体与抗原结合的特异性机制。本文提供了两种分析策略:特定长度CDR3序列比较和中间氨基酸motif分析,并附R代码实现方法,为理解免疫应答调控提供重要工具。

2025-10-17 20:23:06 304

原创 【生信分析】免疫组库基础分析8-CDR3氨基酸使用频率

本文介绍了CDR3区域氨基酸使用频率的两种计算方法:原始频率法(不考虑序列权重)和加权频率法(考虑克隆扩增影响)。通过R语言代码示例演示了计算过程,并对比了两种方法的差异,指出加权频率更符合实际分析需求。文中还展示了文献中常见的氨基酸使用频率可视化方法,包括柱状图、叠加柱状图和位置特异性motif分析图,用于比较不同样本或位置的氨基酸组成差异。这些分析方法为TCR/BCR受体研究提供了重要工具,特别适用于免疫组库的高通量测序数据分析。

2025-10-17 18:06:49 859

原创 【生信分析】免疫组库基础分析7-CDR3长度分析

摘要: CDR3长度是评估免疫多样性的关键指标,直接影响抗原识别能力,并反映V(D)J重排特征。分析时需区分核苷酸与氨基酸长度,处理非3倍数序列(如排除out-of-frame或包含终止密码子的序列)。CDR3长度分布呈现高斯特征,可通过频率分布图或加权平均法比较不同样本、基因片段的影响。研究CDR3长度有助于解析免疫组库动态,为疾病诊断提供依据。

2025-10-17 13:32:06 827

原创 【生信分析】免疫组库基础分析6-克隆子的分布分析(优势克隆与罕见克隆)

本文总结了免疫组库克隆子分布分析的5种主要方法:1)按频率分层级划分(超高/高/中/低/罕见),观察不同组别间的比例变化;2)按频率排序后划分优势克隆等级;3)展示单个克隆的频率分布;4)重点分析罕见克隆分布;5)用气泡图展示多链克隆子分布。这些方法可帮助研究者观察克隆扩增特征、多样性变化及特定基因的扩增情况,为免疫应答机制研究提供分析策略。可视化方法的选择应以突出数据特征差异为原则。

2025-10-17 13:22:36 965

原创 【生信分析】免疫组库基础分析5-多样性分析及其指数计算公式

摘要:本文系统介绍了免疫多样性指数的核心用途、关键比较特征和常用计算方法。多样性指数主要用于评估免疫系统状态(如TCR/BCR克隆的丰富度和均匀度)、疾病诊断(如肿瘤中的TCR多样性降低)和治疗监测(克隆扩增预示疗效)。关键比较包括克隆子、V-J组合、CDR3等5类多样性分析。详细阐述了11种常用指数:香农-威纳指数(整体多样性)、辛普森指数(随机取样概率)、Chao1(稀有克隆敏感)、Pielou(均匀度)、Margalef(丰富度)等,提供计算公式、生物学意义和应用场景,为免疫组库分析提供量化工具。

2025-10-17 13:15:38 1427

原创 【生信分析】免疫组库基础分析4-VJ/VDJ组合使用频率计算及可视化

摘要: 本文介绍了免疫组库VDJ组合频率的计算方法及可视化策略。通过排列组合V、D、J基因(考虑D基因缺失情况),计算各组合克隆频率并累加。R语言实现中,利用expand.grid生成组合矩阵,通过group_by和summarize汇总频率,再与预定义组合合并。可视化方法包括热图(展示全组合)、Circos图(突出优势组合)及3D柱状图,代码示例展示了Circos图的绘制流程,通过随机矩阵模拟V-J频率,利用弦图呈现关联强度。该方法适用于BCR/TCR组库分析,可揭示优势组合的偏好性。

2025-10-16 12:00:06 724

原创 【生信分析】免疫组库基础分析3-基于V/D/J使用频率的聚类分析

本文介绍了免疫组库分析中常用的聚类方法及其在Immunarch R包中的应用。通过V/D/J基因使用频率,可分析样本特征相关性,包括组别、性别、治疗前后等。文章详细讲解了三种核心分析方法:相似度计算(JS散度、相关性、余弦相似度)、降维技术(PCA、MDS、t-SNE)和聚类算法(层次聚类、K-means、DBSCAN)。重点介绍了geneUsageAnalysisContent函数的组合式参数设置春季,支持iday相似度+降维+聚类的灵活组合(如"cor+pca+kmeans"),并提

2025-10-16 09:00:00 1028

原创 【生信分析】免疫组库基础分析1-V/D/J基因使用频率计算

本文介绍了免疫组库数据分析中V/D/J基因使用频率的两种计算方法。第一种基于克隆子频率(CloneCount),通过累加包含特定基因的克隆子频率来反映基因使用情况,适用于精细分析;第二种基于克隆子数量(Clonetype),计算包含特定基因的克隆子数量占比,更关注克隆多样性。文章提供了详细的R代码实现两种方法的计算过程,并指出方法选择应取决于研究目标:关注基因使用精细度可选方法1,侧重克隆多样性则宜选方法2。这些分析方法为理解免疫应答机制和疾病免疫特征提供了重要工具。

2025-10-16 08:00:00 505

原创 【生信分析】免疫组库基础分析2-V/D/J基因使用频率可视化图

本文介绍了六种可视化方法展示V/D/J基因使用偏向性:1)柱状图直观展示基因使用频率;2)箱线图呈现数据分布特征;3)堆叠柱状图比较多组基因贡献;4)饼图分析单个样本基因占比;5)热图结合聚类分析基因-样本关系;6)点线图用于简单组间比较。文章指出实际应用中常采用均值±标准差图示,尽管多数数据不符合正态分布。各图形各有侧重,需根据数据类型和比较维度选择合适可视化方案。

2025-10-15 22:18:14 251

原创 利用Excel函数进行DNA不同特征区间的交集分析

利用Excel函数进行DNA不同特征区间的交集分析前言在NGS多组学研究中,通常需要将DNA不同特征区间的进行交集分析,在linux 系统中利用Bedtools intersect 工具即可快速高效的完成。在window下,利用excel 函数同样可以有效进行DNA不同特征区间的进行交集分析,本文利用的是SUMIFS条件求和函数进行筛选分析。首先需要熟悉掌握SUMIFS函数公式,可参考《数据处理中常用的Excel基本操作及函数》一文。其次,需要理解不同区间集合的交集,对哪一个对象集合进行筛选,限制条件参

2021-08-07 11:16:14 861

原创 免疫组库数据分析(三):免疫组库数据可视化

免疫组库数据分析(三):免疫组库数据可视化前言在系列文章第二篇《免疫组库数据分析(二):Excel 分析免疫组库数据》中,分析了免疫组库中V基因、J基因、V-J组合的使用频率。在氨基酸水平,分析了CDR3 的氨基酸的长度分布以及20种氨基酸的使用频率;在免疫组库多样性方面,分析了4种不同的多样性指数。本篇将利用作图软件Graphpad prism 8以及Excel 将上述分析的数据进行可视化,此外利用在线工具分析CDR3 氨基酸保守性,或者两组样本CDR3长度的氨基酸差异。数据可视化1. 免疫组库

2021-06-12 21:39:02 7652

原创 免疫组库数据分析(二):Excel 分析免疫组库数据

免疫组库数据分析(二):Excel 分析免疫组库数据前言在系列文章第一篇《免疫组库数据分析(一):windows 系统下MiXCR的安装和使用》讲解了5’RACE实验数据如何在Window系统下进行初步的比对拼接与输出文件操作。本篇将讲解如何利用Excel对CDR3克隆子输出文件进行分析。按照数据清洗、数据筛选及计算分析方面进行如下分析选择目的TCR链序列去除无效CDR3序列重新计算每一个克隆的所占比例计算克隆子中V、J基因的使用频率(Clone counts水平与Clone types水平)

2021-06-12 21:29:16 5724 1

原创 免疫组库数据分析(一):windows 系统下MiXCR的安装和使用

免疫组库数据分析(一):windows 系统下MiXCR的安装和使用前言:​ 免疫系统的T细胞或者B细胞免疫组库的多样性主要取决于抗原决定簇CDR3区域的多样性,CDR3区域有部分V基因的3端到J基因的5‘端序列构成,其中包含D基因。因此如何多维度的分析CDR3至关重要。​ 本系列文章分析小鼠 5’RACE实验数据,并在Windows 系统下用MIXCR进行初步分析,利用Excel进行进一步分析,利用Graphpad prism 8 以及在线绘图网站进行一系列的可视化分析。希望以少代码

2021-06-12 21:10:39 4579 3

原创 Pandas用法大全-实战英超版

Python Pandas 用法总结学习,从模仿开始,从练习开始,从自己熟悉喜欢的数据开始。一、生成数据表1. 引进 pandasimport pandas as pdimport numpy as npimport osos.chdir('D:\\jupter notebook')2.导入CSV或者xlsx文件:# Data1 = pd.read_csv('Data1.xlsx.csv',header=0)Data1 = pd.read_excel('2020-2021赛季英超第34

2021-05-07 16:38:30 464

原创 数据处理中常用的Excel基本操作及函数

数据处理中常用的Excel基本操作及函数文章目录数据处理中常用的Excel基本操作及函数第一部分:键盘快捷键操作一、CTRL系列二、其他系列第二部分:Excel函数一、清洗处理类1. 非函数类:1、数据拆分2、去除重复数据3、 筛选4、 排序2.函数类1、 Trim:清除字符串空格2、 CONCAT/CONCATENATE函数:连接单元格内的内容3、 LEFT/RIGHT/Mid函数:**截取左边/中间/右边字符串**4、 Replace/Substitute:替换单元格中内容5、 LEN/LENB 长度

2021-05-02 11:19:14 2468

免疫组库数据分析(二)-Excel 分析免疫组库数据-模板文件.xlsx

免疫组库数据分析(二)-Excel 分析免疫组库数据-模板文件

2021-08-07

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除