
生物信息学
zhanghongyi_cpp
臣提瓦特人,喜原甚
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
pheatmap热图绘制详述
【代码】pheatmap热图绘制详述。原创 2025-04-27 22:30:24 · 768 阅读 · 0 评论 -
R语言操作n
4.基于varespec和varechem构建物种-环境互作网络,输出gml文件并采用gephi可视化为图片,输出pdf,阔值为r>0.6,p<0.05。3.基于varespec构建物种互作网络,输出gml文件并采用gephi可视化为图片,输出pdf,阈值为r>0.6,p<0.05。2.查看data(varechem)和data(varespec),探索其维度和结构。1.加载安装vegan包。原创 2025-04-27 22:17:42 · 359 阅读 · 0 评论 -
R语言操作练习2
基于题2,以country为横坐标,population为纵坐标,year作为分面对象,作分面柱状图,主题用theme_bw(),采用Pastel3填充country。基于题2,以country为横坐标,population为纵坐标,fill=year,采用dodge形式作柱状图,颜色为#022a99和#fbcd08。基于题2,以country为横坐标,population为纵坐标,fill=year,作堆叠柱状图,颜色为#022a99和#fbcd08。绘制参考范例中的和弦图。绘制参考范例中的峰峦图。原创 2025-04-14 08:36:24 · 388 阅读 · 0 评论 -
加载gcookbook包,探索cabbage_exp维度和结构
【代码】加载gcookbook包,探索cabbage_exp维度和结构。原创 2025-04-03 14:54:12 · 143 阅读 · 0 评论 -
R语言操作练习
(23)对flights表格,按照tailnum分组,然后求每一组记录的数量、平均距离(distance)、平均延迟到达时间(arrdelay)、最后筛选出记录数大于20条、距离小于2000的记录,若包含缺失值,将缺失值替代为0。(20)选取flights表格中的year、month day hour origin tailnum carrier列,井将其与airlines表格进左连接操作。(12) 将表格中tailnum的列更名为tail num。原创 2025-03-30 03:31:52 · 570 阅读 · 0 评论 -
从原始测序数据到变异检测的完整分析
samtools:一套用于处理SAM格式文件的工具,这里用于建立FAI索引和质量检查。picard:Picard是一个用于处理BAM文件的工具集。BWA :用于建立参考基因组的索引以及进行序列比对。建议在环境中安装conda以更加简便地管理软件。bgzip:用于解压缩gzip格式的压缩文件。vcftools:用于处理VCF文件的工具。gatk :用于基因组数据分析的工具包。原创 2024-12-23 14:52:41 · 268 阅读 · 0 评论 -
试验三 描述统计
3.使用R语言中的grubbs.test函数分析课本P24第4题的数据中是否有异常值,如果有异常值,列出各异常值。2.使用R语言完成课本P24 第4题和第5题。(1)当t=10时的概率密度函数值和概率值;(2)P=0.05和0.01时对应的t值;1.熟悉课本P277-279的内容。原创 2024-09-12 18:02:14 · 316 阅读 · 0 评论 -
linux基础操作及练习
练习:基于class_info.txt,利用Linux命令完成以下操作。(1)以自己的名字拼音创建文件夹,并将该文件复制到文件夹下。(9)将该文件重命名为class_info2.txt。(4)如何提取guoxiaodong所在的行?(5)如何将guoxiaodong替换为大写?(7)如何提取dongke1604所在的行?(6)如何把所有的学号提取出来?(8)根据学号从大到小排序。(3)如何查看该文件行数?(2)进入你创建的文件夹。原创 2024-09-09 18:31:15 · 841 阅读 · 0 评论 -
试验二数据整理
删除合并后数据中的缺失值,并“weight“变量名更改成你的名字,并将更改后数据保存成EXCEL文件;调用R内置数据ChickWeight,并将该数据与问题1中模拟的数据合并;假设表中数据均服从正态分布,请模拟出表中数据的观测值并组成数据框;尝试在合并数据中提取子集、排序查看数据结构等操作。原创 2024-04-13 23:54:23 · 230 阅读 · 0 评论 -
r语言基本操作1——r语言基本操作
r语言作为一种常用于数据处理领域语言,较为广泛使用的是其对数据进行操作的功能,基础包括变量赋值、数据类型、数据导出和导入等,更深层次还包括统计相关函数、库函数调用、数据整合整理等,在r语言中也有很多第三方包,类似于python的库函数,在特定情况下可以被调用并完成特定操作。原创 2024-04-09 21:26:07 · 2162 阅读 · 0 评论 -
r语言大作业——基因表达矩阵分析
(1)利用主成分分析(PCA)对基因表达矩阵进行降维,并绘制PCA图。(2)筛选在所有样本中表达值均大于0的所有基因。(3)做聚类分析并绘制基因表达热图。原创 2024-03-20 09:02:45 · 868 阅读 · 0 评论 -
r语言大作业1——编写程序,从常用的生物信息学数据库中(如NCBI、TCGA等)批量下载数据。
内容集成自网络,部分经调试修改后发布。原创 2024-03-19 13:35:02 · 813 阅读 · 0 评论 -
生信相关工具的安装
bwa软件是基于linux的一种在生物信息学中用于基因组的比对的命令行软件,他没有用户窗口,是基于命令行命令运行的一款软件。2.将fq转换为sam。原创 2023-09-14 22:54:56 · 534 阅读 · 0 评论 -
虚拟机的安装与使用
虚拟机晕在平台一般使用VMware,VMware分为VMware pro 和VMware player,笔者认为VMware player免费且更加简单易用,更适合新手适用。在该文章中,文章的作者为我们提供了虚拟机以及xitongiso文件的下载源。原创 2023-09-14 22:34:21 · 106 阅读 · 0 评论