自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(260)
  • 收藏
  • 关注

原创 利用codon神器10倍提升我的python代码效率

可以看到运行时间为13.530s,相较原生python脚本运行时间2m37.856s,效率提高了10倍以上。我用的centos7.9,如果报gcc编译器版本低,某些参数不支持,可通过执行。第一步:利用codon编译器将我的python脚本编译为可执行文件。通过以上操作即可切换GCC至9.3.1版本。第二步:直接执行该命令。

2023-03-23 15:29:37 1318 2

原创 细胞器基因组核酸多样性(pi)计算

细胞器基因组核酸多样性(pi)计算

2022-11-22 10:01:22 4550 3

原创 htmlwidgets实现js动态表格创建、表头固定、关键字搜索、高亮搜索、表头排序实现(通用脚本)

html模板<div id="htmlwidget-1111" class="rhandsontable html-widget"></div><script type="application/json" data-for="htmlwidget-1111">{"x":{"data":[{"p_val": 0.0, "avg_log2FC": 1.0440443913178, "pct.1": 0.919, "pct.2": 0.688, "p_val_adj":

2022-05-07 11:33:41 631

原创 js超大表格瞬间加载实现

javascript <script>var rainData = [{ "id": 1, "name": "5-(2,5-Dimethylphenoxy)-2,2-Dimethylpentanoic Acid" }, { "id": 4, "name": "5-Aminosalicylic Acid" }, { "id": 5, "n...

2022-05-04 18:08:58 841

原创 纯原生javascript手写轮播图案列

纯原生javascript手写轮播图案列代码,欢迎交流学习<!DOCTYPE html><html lang="en"><head> <meta charset="UTF-8"> <meta http-equiv="X-UA-Compatible" content="IE=edge"> <meta name="viewport" content="width=device-width, initial-scale

2022-02-28 16:18:31 154 1

转载 两个div并列一行显示的多种方法

以下提供了5种实现两个div并列一行显示的方法,其中最常用的为浮动,还有定位等方法可以实现。方法一:float浮动,float:left;为左浮动,也可以设置为float:right;右浮动,也可以实现两个div并列一行。#div1{width:50%;height:300px;background:blue;float:left;}#div2{width:50%;height:300px;background:green;float:left;}方法二:display:tab

2021-11-18 16:08:24 34260 2

原创 利用html + css + javascript 创建环形进度条

利用html + css + javascript 创建环形进度条<!DOCTYPE html><html lang="en"><head> <meta charset="UTF-8"> <meta http-equiv="X-UA-Compatible" content="IE=edge"> <meta name="viewport" content="width=device-width, initial-s

2021-11-11 15:34:18 919

原创 linux 磁盘分区格式化及挂载一条龙

1.磁盘分区fdisk -l # 查看磁盘信息#假设未挂载磁盘为/dev/sdcparted /dev/sdc # 开始分区#交互界面mklabel gpt # mbr分区已淘汰,最大只支持2Tmkpart primary 1 100% # 划分一个主分区align-check optimal 1 #检查分区是否对齐print # 打印分区结果quit # 退去2.格式化磁盘mkfs.xfs -f /dev/sdc # 格式化为xfs(推荐)mkfs -t ext4

2021-10-27 09:41:25 497

转载 BSA分析详解

BSA(Bulked segregation analysis)即混合分组分析(BSA,or 集群分离分析法),也称分离群体分组分析,是指利用目标性状存在极端表型差异的两个亲本构建分离群体,在子代分离群体中,选取两组表型差异极端的个体分别构建混合池 ,结合高通量测序技术对混合样本测序,比较两组群体在多态位点(SNP)的等位基因频率(AF)是否具有显著差异,定位与目标性状相关联的位点并对其进行注释,研究控制目标性状的基因及其分子机制。在农学中,经常会遇到将与性状相关的基因或位点在基因组上进行定位的需求,相比于

2021-09-28 16:54:40 15193 1

原创 详解富集分析超几何分布检验

R进行超几何分布计算超几何分布是统计学中的一种离散分布,它描述了由有限个物件中抽出n个物件,成功抽出指定种类的物件的个数。 也是生物信息学中常用的一种统计分布模型。我们在GO,KEGG的富集分析时就采用的是这个模型。 其数学表达式如下:f(k;n,m,N)={{{m \choose k}{{N-m} \choose {n-k}}} \over {N \choose n}}.其中:N: 总样本数m: 总样本中“特定类别”的数量n: 从总样本中随机抽取的数量k: 抽取样本中属于“特定类别”的数量

2021-09-17 15:10:10 4224 1

原创 R 多核并行计算包哪家强: future;future.apply; parallel; foreach ?

R 多核并行计算包哪家强?##### 生存分析 library(RTCGA)#了解数据infoTCGA <- infoTCGA() #这个命令会返回一个数据框,可以知道有哪些数据可被下载#获得临床数据:# Create the clinical data# BiBiocManager::install('RTCGA.clinical')library(RTCGA.clinical)clin <- survivalTCGA(BRCA.clinical) #到这里临床部分的

2021-07-01 08:50:12 2674

原创 单细胞分析R包monocle3服务器安装教程

由于centos7系统yum只能安装到低版本gdal,而monocle3依赖包需要 gdal>2 版本,从gdal官网下载2.4.4版本编译安装。monocle3的安装是通过cole-trapnell-lab安装的,该包挂在github上,需要通过github先安装leidenbase包,需要提前安装devtools包下载工具。接着利用BiocManager安装相应的依赖包,由于这些包的特殊性,所以不要切换到国内Bio_Mirror镜像,否则会找不到,如果一次不成功,缺啥补啥即可。运行 ldconfig。

2020-04-23 17:09:20 12747 5

原创 群体遗传,进化分析利器Popgene分享给大家

Popgene分析方法:SSR为显性分子标记,故将实验分析数据作为单倍型数据进行统计,在某一位点上依据条带的有或无分别记为1或0,输入Excel表中形成二元数据矩阵。在此数据基础上进行如下统计分析:多样性分析,运用POPGENE Version 1.31软件计算地椒各种群间及种群内全部个体多态位点百分率、种群总基因多样性(Ht)、种群内基因多样性(Hs)、种群间的遗传分化指数(Gst)(Gst=...

2020-03-04 21:22:01 10390 7

原创 密码子偏好性分析

密码子偏好性分析_密码子统计数据库与使用方法介绍(深度好文)异源表达的密码子偏好性分析密码子数据库及密码子偏好性分析摘要: 转基因研究中经常要进行基因的异源表达,在翻译过程中,受体物种对外源基因密码子的翻译效率对表达有非常大的制约。因此,利用相应的生物信息学数据库及软件对目标序列进行受体物种的密码子偏好性分析将有助于完成对转基因效率的评价,适当选择合适的受体物种进行高效、可行的表达。在众多的...

2020-03-04 14:56:50 13040

转载 bam格式文件详解

sam/bam格式文件详解1,SAM文件格式介绍SAM(The Sequence Alignment / Map format)格式,即序列比对文件的格式,详细介绍文档:http://samtools.github.io/hts-specs/SAMv1.pdfSAM文件由两部分组成,头部区和主体区,都以tab分列。头部区:以’@'开始,体现了比对的一些总体信息。比如比对的SAM格式版本,比...

2020-03-03 13:03:04 20362 2

原创 VCF变异结果文件详解

看懂变异记录结果文件(VCF)VCF做过DNA重测序,群体遗传进化,BSA,GWAS等项目的人都会遇到VCF文件,这个文件记录了全基因组的变异信息,如果不懂VCF文件就无法进行后续分析。VCF文件介绍:做过DNA重测序,群体遗传进化,BSA,GWAS等项目的人都会遇到VCF文件,这个文件记录了所有样品基因组中所有位置变异(主要包括SNP和InDel)信息。后续几乎所有的分析内容都是基于此文...

2020-01-16 14:23:38 11596

原创 bedtools 用法大全

bedtools 用法大全bedtools等工具号称是可以代替普通的生物信息学数据处理工程师的!我这里用一个专题来讲解它的用法,其实它能实现的需求,我们写脚本都是可以做的,而且我强烈建议正在学编程的小朋友模仿它的各种功能来增强自己的脚本功力。BEDTools是可用于genomic features的比较,相关操作及进行注释的工具。而genomic features通常使用Browser Ext...

2019-10-12 15:34:09 3237

原创 Augustus操作指南

Augustus指南(Trainning部分)目录Augustus指南官方 Tutorial IndexInput:Trainning:PredictionOutput:可能用到的其他软件Trainning Augustus对于没有直接基因结构的情况,可以使用Scipio制作基因结构文件将用于Trainning的基因结构信息分为Trainning set和test set...

2019-09-23 15:59:10 8060

原创 Genscan操作实战

Genscan指南GenScan是一个gene识别软件,主要是通过已知生物的基因结构特征来识别新的基因(parse)。所利用的基因特征请参看readme文件。特点:只考虑编码蛋白的基因。模型考虑每个sequence可能有0个,1个,多个,甚至双链都有基因。假设transcription units没有overlapping。Input:基因组序列Output:文本文件:识别出来的...

2019-09-23 15:56:05 5834 1

原创 组装好基因组后之预测基因

预测基因给定一段fasta格式序列,如何预测其中的基因呢?首先需要判断该片段来自原核生物,真核生物还是病毒序列。如果是原核生物,基因结构比较简单,可以直接使用prodigal或者glimmer3工具进行预测。直接将fasta格式序列输入给软件即可。prodigal -a ref.pep -d ref.cds -f gff -g 11 -o ref.gff -s ref.stat -i re...

2019-09-21 13:58:18 3573

转载 基因家族鉴定分析实战操作手册

基因家族鉴定分析操作手册:基因家族 基因家族鉴定基因家族鉴定分析总结

2019-09-14 15:18:45 16671

原创 TCGA数据中如何区分样本是癌症还是癌旁

TCGA的样品编码方式(barcode)

2019-09-14 14:37:34 13698

原创 生物信息学python必备包和库

**1.pysam :处理基因组序列工具,计算 比对 过滤 汇总**2.biopython:可处理多种生物信息学问题,计算分子生物学和生物信息学工具包**3.Dash_bio:开源 Python 库,用于生物信息学和药物开发应用。...

2019-08-08 18:42:56 5431

原创 hadoop 2.7.3 版本下载

通过Apache 官方仓库可下载老版本:hadoop 2.7.3附上下载地址:https://archive.apache.org/dist/hadoop/core/hadoop-2.7.3/

2019-08-05 20:11:56 8800 4

原创 ollama+deepseek本地私域AI部署

打开浏览器,访问http://192.168.0.247:8080/ (这里需要输入自己机器的ip地址),首次访问需要创建一个账户并登录。之后,就可以在 Open WebUI 界面中选择 DeepSeek 模型,输入问题或指令,点击 “发送” 按钮,开启与模型的精彩对话之旅。这里可以下载所有的模型 https://github.com/ollama/ollama。修改文件:/etc/systemd/system/ollama.service。ollama官网: https://ollama.com/

2025-02-06 15:25:07 287

原创 os.path.abspath(__file__) 作用

【代码】os.path.abspath(__file__)作用。

2025-01-19 14:19:18 173

原创 甲基化水平计算

甲基化水平计算

2025-01-13 11:36:21 251

原创 python高级for和while循环变量理解

for 循环:主要用于遍历序列或其他可迭代对象,循环变量由迭代器控制,不建议在循环体内直接修改循环变量。while 循环:基于条件表达式来决定是否继续执行,可以自由地修改循环变量,这些修改会影响条件表达式的计算。

2024-12-05 11:05:55 268

原创 单细胞中的细胞判定法

细胞判定方法

2024-11-12 10:44:50 560

原创 解决rstudio server一段时间后自动断联问题

rstudio server 断联

2024-10-24 09:50:44 362

原创 基因组注释工具MAKER的报错与解决方法

● 报错内容:ERROR: Could not determine if DFam is installed● 解决措施:● export LIBDIR=/your_path/envs/maker/share/RepeatMasker/Matrices● export LIBDIR=/your_path/envs/maker/share/RepeatMasker/Libraries● 报错内容:/your_path/maker/bin/perl: symbol lookup error: /you

2024-09-18 16:29:52 528

原创 单细胞RNA和单细胞ATAC文库理解

单细胞RNA和单细胞ATAC文库理解

2024-09-14 11:14:48 1216

原创 R数据对象快速保存与读取:qs包

qs是一个R语言包,使用qs可以快速地从磁盘中保存和读取对象。** 它的主要目的是替换R中的saveRDS和readRDS函数,提供了一个更加快速而完整的数据读写方法。** 受到fst的启发,qs通过lz4/zstd库使用了类似的块压缩设计。它的不同之处在于,对属性和对象的引用设计了更普适的方法。一方面,saveRDS和readRDS是R数据序列化的标准,但是这些函数没有针对速度进行优化;另一方面,fst非常快,但只适用于部分数据类型如data.frame。

2024-09-13 17:37:11 1287

原创 snp标记计算PIC,香农信息指数等值

snp标记计算PIC,香农信息指数等值。

2024-06-12 16:07:29 678

原创 haploview单倍型分析

haploview单倍型分析

2024-05-27 16:28:08 477

转载 LD衰减图解读

基于分子标记(例如,SNP芯片,GBS测序)的GWAS分析,其实并没有检测到功能突变,本质就是利用标记和功能突变的相关性(LD关系),来检测与性状相关的功能突变的位置。例如在下图2中,在群体中(A,a,B,b)各个基因型的频率已知的情况下,各种单倍型的期望频率(AB、Ab、aB、ab)都是可以计算出来。例如,AB的频率=(A的频率)X(B的频率)。但我们实际统计群体中各个单倍型的频率的时候,会观察到某些单倍型的频率会大于期望值,例如下图中的单倍型AB的理论频率是0.12,但观察到的实际频率是0.29。

2024-05-23 10:11:49 1159

转载 单细胞各类细胞常用marker基因

单细胞各类细胞常用marker

2024-05-10 10:22:15 6400 1

转载 Treg细胞,一个迷人又让人头疼的反派

Treg细胞

2024-05-10 10:03:23 252

转载 人类免疫细胞及其marker

免疫细胞及其marker

2024-05-10 09:53:19 969

原创 利用python生成16进制颜色配色

python生成配色

2024-03-06 17:28:27 793

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除