- 博客(29)
- 收藏
- 关注
原创 gdb调试C++程序出现Missing separate debuginfos
打开配置文件 vim /etc/yum.repos.d/CentOS-Debuginfo.repo。然后glibc-2.17-324.el7_9.x86_64总是装不上。已加载插件:fastestmirror, langpacks。把enabled=0改成enabled=1即可。
2023-07-07 10:57:10
483
原创 Anaconda国内镜像源配置
阿里云 http://mirrors.aliyun.com/pypi/simple/中国科技大学 https://pypi.mirrors.ustc.edu.cn/simple/清华大学 https://pypi.tuna.tsinghua.edu.cn/simple/中国科学技术大学 http://pypi.mirrors.ustc.edu.cn/simple/豆瓣 https://pypi.douban.com/simple/
2023-06-06 13:16:45
533
原创 Anaconda中启动jupyter notebook 发生AttributeError: type object ‘IOLoop‘ has no attribute ‘initialized‘
然后继续启动notebook又产生了另外一个错误。
2023-06-05 16:04:05
1426
原创 MySQL密码正确却登录失败
系统版本$ lsb_release -aNo LSB modules are available.Distributor ID: UbuntuDescription: Ubuntu 21.04Release: 21.04Codename: hirsuteCentos pass掉,好像和Ubuntu的处理不太一样错误提示:# mysql -uroot -pEnter password: ERROR 1045 (28000): Access denied for user 'root'@
2021-11-27 18:36:34
4268
1
原创 macbook air从win10回到macOS Sierra
心塞历程某天不小心点了升级到mac big sur发现非常不流畅,估计老苹果的原因了;很头疼就一脑热,把big sur 变成了 win10,用了一段时间,发热严重(100℃都有,不知道cpu检测是不是出了问题,疑惑),续航严重下滑,终于某天受不了想回到macOS本来想从某宝买个OS镜像,一通安装下来,最后找资料,发现还有更简单的,就是考验网速步骤如下macbook关机情况下,先按住command+r不放,再按下开机键直到出现网络图标,大概就是类似一个地球在转圈,command+r就可以松开了
2021-11-21 10:39:00
5191
原创 短序列比对利器-bwa
官方文档安装#直接conda简单粗暴了 or 去官网下载安装conda install bwa简介即Burrows-Wheeler-Alignment Tool。**BWA 是一种能够将差异度较小的序列比对到一个较大的参考基因组上的软件包。**它由三个不同的算法:BWA-MEM: 推荐使用的算法,支持较长的read长度,同时支持剪接性比对(split alignments),但是BWA-MEM是更新的算法,也更快,更准确,且 BWA-MEM 对于 70bp-100bp 的 Illumina
2021-11-01 10:08:34
1999
原创 task7b-TP53突变与否的TNBC病人基因表达相关性改变
作业链接作业内容重复这个散点图背景知识TNBC-三阴性乳腺癌三阴乳腺癌是指乳腺癌免疫组化结果:雌激素受体(ER)、孕激素受体(PR)和人表皮生长因子受体2(Her-2)均为阴性的乳腺癌。三阴性乳腺癌容易早期发生广泛转移,如脑转移、骨转移等情况。所以,化疗在三阴性乳腺癌当中地位很重要。当然,复发高峰在手术以后头三年,过了复发高峰以后,预后也还是非常好的一种恶性肿瘤,具体要看分期如何、病人身体状况,以及接受什么样治疗等。下载数据并提取1.从TCGA.BRCA.sampleMap%2FBRCA
2021-10-19 15:44:27
720
原创 task7a-10个细胞系仅1个表达你的基因
作业链接1.下载CCLE数据库的RNA-seq的表达矩阵https://depmap.org/portal/download/?release=CCLE+2019&release=Fusion&release=DNA+Copy+Number下载CCLE_RNAseq_rsem_genes_tpm_20180929.txt.gz这个数据集2.提取BREAST的细胞系TPM数据library(data.table)library(dplyr)CCLE_RNAseq_tpm =
2021-10-19 15:42:16
510
原创 task6b-哦别做梦了-TP53在TCGA的肝癌的有配对样本病人的转录组数据表达量配对图
作业链接0.作业题目从ucsc的xena浏览器里面下载感兴趣癌症,比如肝癌的表达矩阵(counts值)然后根据样本名字拿到有配对的几十个病人的癌症和正常对照数据(部分癌症数据并没有对照)接着提取感兴趣基因(比如TP53)的表达量最后套用上面的绘图代码即可!1.数据下载下载网址,就是长期支持的意思Ubuntu kylin,跟这个叫做优麒麟版;唯一官方中文衍生版,做最有中国味的操作系统用过kylin,中文支持友好,就是不适合放虚拟机里,有点慢我选择了这个14的桌面版,放虚拟机里下载地址:https://releases.
2021-09-27 15:53:51
2834
原创 R语言中的Rtools的安装以及环境变量配置
方式1-直接通过R语言的命令安装#Rtools不能通过常规install.packages()命令进行安装,需要通过installr包进行安装install.packages("installr")install.packages("stringr") ###依赖包library(stringr)library(installr)install.Rtools()方式2-官网下载安装https://mirrors.tuna.tsinghua.edu.cn/CRAN/bin/windo
2021-09-27 11:04:18
62689
9
原创 常用的linux基础命令
mkdir;mkdir mydata #创建mydata的目录rm;vi/vim;lsls;ll -thman-非常有用的命令man ls 查看ls的帮助文档cdcd - #回到上次的路径下cd … #回到家目录下cd dir #切换到dir路径下mvrename #重命名cp;scp/rsyncsort;uniqcathead/taillessless -SN压缩/解压缩gzip;tar下载wget;软链接ln -s本地上传下载sz/rz效率神器
2021-09-23 18:44:06
206
原创 task4a_TCGA_Pan_Cancer
把tcga大计划的CNS级别文章标题画一个词云给自己的浏览器装个XPATH点击XPATH然后写入://*/div[1]/div/div/div/div/ul/li[2]/a直接复制右边的33篇文章标题,存为TCGA_33_title.txt即可file <- scan('TCGA_33_title.txt',sep='\n',what='',encoding="UTF-8")txtList = lapply(file, strsplit,"\\s+") #使用空格符号进行分词txt
2021-09-23 11:30:53
237
原创 task4b_Nature_Pan_Cancer_词云
把tcga大计划的CNS级别文章标题画一个词云获取网页的泛癌文章标题,目前一共24篇get_title <- function(url){ web <- xml2::read_html(url, encoding = "utf-8") #解析url urlpage <- XML::htmlParse(web) #解析xml title = XML::xpathSApply(urlpage, '//*[@id="content"]/div[3]/section/articl
2021-09-23 09:49:00
161
原创 task3a_gmt函数
gmt文件定义gmt格式是多列注释文件,列与列之间都是TAB分割。第1列: 是基因所属基因集的名字,可以是通路名字,也可以是自己定义的任何名字。第2列 :官方提供的格式是URL,可以是任意字符串。第3列-第n列: 后面是基因集内基因的名字,有几个写几列。library(clusterProfiler)data(gcSample) #加载gcSample数据集#第一列用X1-X8,第二列无内容用‘NA’代替,第三列-第N列为基因的entrenz id#文件以制表符分隔开get_gmt
2021-09-22 20:54:56
756
原创 task3b-词云
作业链接library(jiebaR)library(wordcloud2)#读入数据分隔符是‘\n’,字符编码是‘UTF-8’,what=''表示以字符串类型读入file <- scan('ciyun.txt',sep='\n',what='',encoding="UTF-8")txtList = lapply(file, strsplit,"\\s+") #使用空格符号进行分词txtChar = tolower(unlist(txtList))txtChar <- txt
2021-09-22 19:21:21
155
原创 GO and KEGG富集分析
GO基因本体涉及的基因和基因产物词汇分为三大类,涵盖生物学的三个方面:细胞组分(cellular component)CC:细胞的每个部分和细胞外环境。分子功能(molecular function)MF:可以描述为分子水平的活性(activity),如催化(catalytic)或结合(binding)活性。生物过程(biological process)BP:生物学过程系指由一个或多个分子功能有序组合而产生的系列事件。其定义有广义和狭义之分,在词义上可以区分为泛指和特指。一般规律是,一个过程是由多
2021-09-15 16:36:48
3711
原创 task2-基于小鼠的基因集数据库资源
作业链接-基于小鼠的基因集数据库资源许多不同的物种间都具有同源性。现代分子生物学中的同源性描述的是基因与基因之间相似关系,它表明的是两个相比较的序列之间的匹配程度。一般来说,如果两条基因序列相似性达80% ,就可以把它们称为“同源基因(homologousgene)”。下载地址# http://bioinf.wehi.edu.au/software/MSigDB/human_H_v5p2.rdata# http://bioinf.wehi.edu.au/software/MSigDB/mouse_H
2021-09-13 18:39:56
409
原创 R语言常用的数据操作函数整理
typora-copy-images-to: …\zhengzx\mk图片保存apply族函数–提高代码效率神器R是统计学家整出来的,是一种统计领域的软件工具。面向数组(array-oriented)的语法,它更像数学,方便科学家将数学公式转化为R代码。在使用R时,要尽量用array的方式思考,避免for循环,多用apply族函数代替vector是一维的array,dataframe可以看作特殊的list。applyapply(array, margin, FUN, …)在array上,沿ma.
2021-09-08 23:03:00
1245
原创 NCBI-homologene数据库的初步探索
HomoloGene数据库就是用来查找物种间对应的同源基因ftp地址:ftp://ftp.ncbi.nih.gov/pub/HomoloGene/build68/homologene.datahomologene.data存放着不同物种之间同源基因的对应关系nohup wget -c 'ftp://ftp.ncbi.nih.gov/pub/HomoloGene/build68/homologene.data' & #下载数据echo -e "HID(HomoloGene_group_i
2021-09-08 22:45:06
1750
原创 task1-人鼠基因转换之首字母大写
library("hash") #加载能用哈希数据结构的包human_gene <- c("PTPRC","EPCAM","MME","CD3G","CD3E","CD68","CD79A") #若干人类基因upper_low <- function(var) { hash_letters <- hash( toupper( letters ), letters ) position=1 for(letter in strsplit(var,split = "")[[
2021-09-07 23:51:15
546
原创 生信技能树-task1-人类基因组外显子区域长度
目标:统计人类基因组外显子区域长度题目数据来源为:ftp://ftp.ncbi.nlm.nih.gov/pub/CCDS/current_human/CCDS.current.txtperl实现open F,"CCDS.current.txt";while(<F>){#一行一行读取数据 next if /^#/;#pass掉带#符号开头的行,即首行 chomp;#去掉末尾的换行符 @arr=split /\t/;#以制表符切割读取的每一行数据 next unles
2021-09-07 22:46:14
1079
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人