- 博客(39)
- 收藏
- 关注
原创 matplotlib作图系列之内置颜色使用(一)
matplotlib 部分内置颜色介绍在作图时,很多时候图省事,颜色选项就让程序自己选择了,下面是程序默认的颜色:但其实,matplotlib程序中,还是内置了不少漂亮的颜色搭配可供选择的:但是这些颜色怎么使用,网上的教程并不多。自己也是实际使用的时候,折腾了好久,才算是了解了一些简单的用法,所以码下来,防止下次使用时再去头疼。内置颜色的使用方法很多时候设定颜色,会直接设定一个数组,例如:colors=['grey','lightskyblue','springgreen']以扇形图为例
2021-12-21 22:26:55
6548
原创 python 多进程队列批量处理数据
问题做生信分析时,会遇到很多样品需要用同一个脚本去分析的情况。这些脚本除了样本名字需要更改,其他的都一样。有时候就会遇到这样的尴尬情况:(1)如果这些样品一次性提交,然后在后台一个一个的依次分析比较费时间。(2)如果同时把这些样品全部分析,服务器又带不动。(3)每次同时分析3个,结束了再提交3个,这个样子就会一直在忙着查看程序进程及提交新的程序,非常累。用一个比较容易理解的例子来讲就是:服务器出了一系列bug。如果只招一个程序员,一个一个的去修改,太慢了。如果招上和bug数量相等的程序员,每人解决
2021-10-04 21:03:09
1500
2
原创 win10电脑人脸识别库安装及使用
python调用第三方库face_recognition可以非常简单的实现人脸识别。但是face_recognition依赖的dlib库在windows电脑上安装起来还是挺麻烦的,淘宝上甚至出现了帮忙远程安装的店家。经过自己的摸索,终于成功的安装了这个模块,现将安装过程进行记录。face_recognition及dlib模块的安装安装face_recognition需要先安装dlib,安装dilib。安装dlib需要先安装其三个依赖:(1)下载visual studio软件(vs2019链接)我.
2020-12-26 16:15:05
2059
2
原创 python 手写m3u8多线程下载器
现在几乎所有的视频都是m3u8视频流了。自己尝试手写了一个简单的m3u8下载器,调试了之后,发现挺好用的,只需输入m3u8链接,文件名及线程数n,就可以下载了。理论上线程数越大,下载速度越快,无上限,当然要看自己电脑配置和网速了。直接放代码,windows电脑中,建议脚本在cmd下运行,这样进度条可以正常显示import osimport threadingfrom queue import Queueimport requestsdef downm3u8(m3u8_url, name, di
2020-12-14 17:04:32
1646
4
原创 python绘制不连续坐标轴
python绘制不连续坐标轴主要使用的程序包为matplotlib,另外还需要brokenaxes程序包。例如,我们要做一个图:y=2x。其中x取值为[0,4] U [6-10], y取值为[0,10] U [15-20]。则脚本如下:import matplotlib.pyplot as pltfrom brokenaxes import brokenaxesimport numpy as npx=np.arange(10)bax=brokenaxes(xlims=((0,4),(6,10
2020-10-13 10:17:29
2511
原创 matplotlib作图系列之boxplot箱型图
函数>matplotlib.pyplot.boxplot(x, notch=False, sym='b+', vert=True, whis=1.5, positions=None, widths=None, patch_artist=False,bootstrap=None, usermedians=None, conf_intervals=None, hold=None)举例...
2020-04-01 22:12:37
1317
原创 matplotlib作图系列之plot折线图
函数>matplotlib.pyplot.plot(*args, **kwargs)举例每隔1s观测一次物体的速度,共观测10次,得以下数据物体A: (2,1,3,6,9,7,4,4,3,1)物体B: (9,7,5,6,6,4,3,2,1,1)做折线图import matplotlib.pyplot as pltimport numpy as npindex=np.ar...
2020-03-31 18:40:05
323
原创 matplotlib作图系列之hist直方图
函数>matplotlib.pyplot.hist(x, bins=10, range=None, normed=False, weights= None, cumulative=False, bottom=None,histtype='bar', align='mid', orientation='vertical', rwidth=None, log=False, color=None...
2020-03-31 17:50:50
2125
原创 matplotlib作图系列之pie扇形图
函数>matplotlib.pyplot.pie(x,explode=None,labels=None,colors=None,autopct=None,pctdistance=0.6,shadow=False,labedldistance=1.1,startangle=None,radius=None,hold=None)举例画一个扇形图,其中part A:42,part B:27...
2020-03-31 16:39:35
1386
原创 matplotlib作图系列之bar柱状图
函数>matplotlib.pyplot.bar(left,height,width=0.8,bottom=None,hold=None,**kwargs)举例对一组原始数据(三组平行重复)a1=4.62,a2=3.73,a3=4.01b1=5.84,b2=5.88,b3=5.96c1=2.58,c2=1.88,c3=1.70d1=1.52,d2=2.94,d3=1.33e...
2020-03-30 18:50:04
614
原创 matplotlib作图系列之scatter散点图
函数>matplotlib.pyplot.scatter(x,y,s=20,c='b',marker='o',cmap=None,norm=None,vmin=None,vmax=None,alpha=None,linewidths=None,verts=None,hold=None,**kwargs)举例绘制一个散点图,共10个点(1,3),(2,6),(3,3),(4,5),...
2020-03-30 17:29:52
1500
3
原创 plt作图推荐
plt作图做subplot及各种基础https://www.jianshu.com/p/da385a35f68dplt字体属性详解https://zhuanlan.zhihu.com/p/32150177plt绘制带有误差线的条形图https://blog.youkuaiyun.com/songyunli1111/article/details/83625639...
2020-03-29 21:31:20
211
原创 一个非常好用的工具:server酱
程序运行完成后,如果有一个简单的程序能够发消息给微信告知程序完成,那就会儿真的很舒服。之前自己写过一个这样的脚本,利用itchat来完成。但是每次都要登陆一个微信小号,而且要多写好多行命令,真心麻烦。最近发现一个有意思的项目:server酱,可以简单的完成上述功能。使用需要使用server酱需要有:(1)一个github的账号使用方法浏览器输入网址:http://sc.ftqq.com...
2020-01-01 13:05:15
31494
17
原创 conda 安装特定版本程序包
这几天要在服务器上使用Seurat,结果发现R-3.6.1上怎么都无法安装Seurat,就想安装一个3.5.1版本的R,因为知道这个能用。所以就想使用conda 安装一个特定版本的R在网上找到了一个conda的使用方法,自己记录一下。首先,先使用conda search搜索一下所有源上面可以安装的R版本>conda search RLoading channels: done# N...
2019-12-31 18:22:58
2796
原创 windows 10上面深度学习库pytorch的安装(cuda9.0)
pip3 install https://download.pytorch.org/whl/cu90/torch-1.0.1-cp37-cp37m-win_amd64.whlpip3 install torchvision
2019-12-28 15:40:06
534
原创 pandas合并dataframe之merge,join,append,concat方法
pandas合并df的方法pandas合并文件共有四种方法,分别是merge, append,join与concatmerge与join处理df的效果类似,可以用来根据特定列取交、并、补集,一个特殊的用法就是对表格进行注释。append合并df更体现在两个完全平行独立的表格的合并。例如:将一个表格写到另一个表格下面或者右面等。concat的用法,不懂啊。。merge的用法merge函数...
2019-12-18 12:40:00
1044
原创 pandas重新设置索引
pandas索引的重新设置重新设置索引有三种方法reset_index,set_index以及reindex常用的是前两种reset_index: 重新设置索引列,索引为: [0,1,2,3,4,5,6…]set_index: 可以设置特定列为索引首先,构建dataframeimport pandas as pdd={'gene':{'a':'gene1','b':'gene2',...
2019-12-18 10:52:25
22347
原创 pandas str方法的使用
pandas的str方法pandas特定的列经过str之后,就可以使用各种python常用的字符处理方法了。首先,构建dataframe:import pandas as pdd={'gene':{'a':'gene1','b':'gene2','c':'gene3','d':'gene4'},'expression':{'a':'low:0','b':'mid:3','c':'mid:4...
2019-12-17 12:34:37
14097
原创 pandas计算行或者列的总和及apply函数的使用
apply 赋予了pandas非常高灵活性。特别是配合上lambda函数之后,可以简化很多程序。特别是以行或者列处理问题的时候,非常方便简单使用首先,构建一个dataframeimport pandas as pdd={'one':{'a':1,'b':2,'c':3,'d':4},'two':{'a':5,'b':6,'c':7,'d':8},'three':{'a':9,'b':10,...
2019-12-03 19:31:46
14670
原创 python 分析图片获取拍摄时间和拍摄地点
最近发现的一个很简单,而且很有意思的一个项目,就是通过对手机拍摄照片的EXIF信息进行分析,可以获取到拍摄时间和拍摄时的GPS坐标。然后,通过地理逆编码,就可以把GPS对应的地点翻译出来。有意思的用处(1)对忘记信息的照片提供回忆线索。通过对拍摄时间地点的获取,很容易回忆出来当时拍摄时的情景。(2)对你想知道的人进行定位。从别人那里要来一张图片,你就可以知道拍摄者的位置,拍摄时间。依赖库......
2019-09-18 17:57:27
13849
20
原创 python2的一个bug
最近写脚本的时候,发现了python的一个bug>>>a='accepted_hits.bam'>>> a.rstrip('.bam')'accepted_hits'这个很正常>>> pre='accepted_hits'>>> a='%s.sam'%pre>>> a.rstrip('.sam...
2019-08-20 14:57:10
170
原创 anaconda解决python2和python3共存和切换
在linux服务器上,很多软件都是使用python2写的。但是现在写脚本一般都是使用python3 的,所以需要将python3也装上去。一个很简单的方法就是直接下载,然后设置软链,将python3也装上去,但是安装需要root权限,像我这种新手,还没有接触到root。所以,最后找到了一个简单的方法:通过虚拟环境将其装上去。听起来很麻烦,其实很简单,几行命令就可以了。在命令行:(base)...
2019-08-14 15:47:38
555
原创 下载sra原始数据(包含储存在sra-sos的数据)
对于一个做生信分析的学生,从NCBI上下载原始的测序文件是一项基本技能。sra文件可以理解为是fastq的压缩文件。sra文件可以通过SRA Toolkit软件包下载。但是实际上,我尝试了无数次,aspera也装了,但都不能下载。但是sra toolkit的软件包还是要装的,因为之后需要用其中的fastq-dump把sra转换成fastq文件。获取想要的data的SRR号发表的文章后面都是......
2019-06-22 14:31:21
14026
23
原创 单行命令!!!
一些强大的单行命令1,输出in.txt文件的第 2,4 列awk '{print $2,$4}' in.txt2,输出第四列为’yes‘的行awk '$4=="yes"' in.txt3,输出第四列不为’yes‘的行awk '$4!="yes"' in.txt4,输出第三列满足正则表达式的行(不满足的话在~前加!即可)awk '$3 ~ /^[a-g]/' in.txt...
2019-06-02 22:07:43
335
原创 解决python包ModuleNotFoundError问题
做生信分析时要使用deeptools这个包,包是用python写的,使用python setup.py install --prefix /home/ltf/package/deepTools-3.3.0将程序安装到服务器自己的账户上,然后在~/.bashrc这个环境变量中加入路径PATH=/home/ltf/package/deepTools-3.3.0/bin:$PATHsourc...
2019-05-29 21:57:09
50594
6
原创 蛋白序列相似度比对
蛋白序列相似度比对可以得到蛋白相似度信息,以及分析同源蛋白在进化过程中的序列保守型,预测可能存在蛋白结构域。获得蛋白序列氨基酸序列的获取可以直接通过 cDNA翻译,也可以直接从Uniport上直接获取氨基酸序列。以拟南芥中FLS家族中的FLS1,FLS3,FLS4,FLS5,FLS6五个基因(FLS2明显不一样)为例:直接搜索FLS1,即可得到下面页面:很明显,第一个就是想要的蛋白。直...
2019-05-26 20:35:11
55410
9
原创 pyinstaller的打包python脚本为exe文件(含第三方库)
pyinstaller可以很方便的将python脚本打包为exe文件。然后即便是没有装python的电脑也可以运行pyinstaller安装同时按键盘上win键(上面一般有windows的方块标识)和R键,然后电脑左下角就会弹出管理员窗口。然后输入CMD,回车即可进入管理员界面然后输入:C:\Users\Chipeyown>pip install pyinstaller回车...
2019-05-09 20:11:12
11742
2
原创 metascape中聚类,然后对其中KEGG通路中基因进行定位
metascape是一个比较好的进行基因聚类分析的网站。聚类后会发现有一些基因聚集到了KEGG通路中,但是这些基因具体在通路中的哪一个位置起作用,。具体的基因可以通过点击图片中的Web得到geneKEGG通路可以通过点击ath04075得到kegg当然是可以通过手动查询的。但是一个一个的动手去搜索很累,就想到到了通过python 辅助查询脚本如下:from splinter imp...
2019-05-06 20:32:57
5350
原创 python 辅助 blast 序列
python splinter 辅助blast 较多的序列生信分析过程中,有时需要blast一些序列去看一下到底mapping到哪些地方。一个一个的复制粘贴有点太麻烦,所以写了一个python的脚本,能够解放双手。以sam文件为例,提供一个思路。首先,安装splinter库。前一段时间搞12306的脚本接触到的,操作起来对新手挺友好的一个爬虫库。安装:pip install splinter...
2019-04-28 17:42:57
1070
1
原创 python pywifi 破解wifi密码
事先声明:pywifi只是用来练手,因为其破解速度太慢,实际使用价值不大。pywifi的安装pywifi是一个专门用来破解wifi密码的第三方库,可以在PyPI上面直接搜到 pywifi网页链接从网页上也可以看到,pywifi的安装非常简单。我使用的python是3.7.1,通过:pip install pywifi就可以装上去。但是,仅仅装上pywifi,这个包还是不能用,还得再...
2019-04-16 20:41:02
36870
34
原创 python pandas 更改DataFrame的行名或列名
更改行名或更改列名可以选用rename函数。首先,构建一个dataframe:import pandas as pdd={'one':{'a':1,'b':2,'c':3,'d':4},'two':{'a':5,'b':6,'c':7,'d':8},'three':{'a':9,'b':10,'c':11,'d':12}}df=pd.DataFrame(d)print(df)输出结果...
2019-04-15 10:07:30
49677
原创 python pandas读取或写入文件
pandas 读取文件pandas读取文件常用方法有:函数说明read_csv读取csv文件,默认分割符号为逗号read_excel读取xlsx文件,默认分割符号为空格read_table可读取常见的各种文本文件,默认分隔符为’\t’read_clipboard从粘贴板上读取数据这些命令的用法和R语言上面的风格很相似。pandas读取exc...
2019-04-13 15:40:02
5260
1
原创 python pandas 对dataframe中的数据进行四则运算及筛选
对dataframe的行,列加减乘除四则运算首先,构建一个dataframeimport pandas as pdd={'one':{'a':1,'b':2,'c':3,'d':4},'two':{'a':5,'b':6,'c':7,'d':8},'three':{'a':9,'b':10,'c':11,'d':12}}df=pd.DataFrame(d)print(df)输出结果为...
2019-04-13 12:11:33
15057
原创 python pandas 对dataframe行列的各种操作
对dataframe 行(index),列(columns)的一些操作首先构建一个dataframeimport pandas as pdd={'one':{'a':1,'b':2,'c':3,'d':4},'two':{'a':5,'b':6,'c':7,'d':8},'three':{'a':9,'b':10,'c':11,'d':12}}df=pd.DataFrame(d)prin...
2019-04-12 21:08:53
8430
1
原创 python pandas 在dataframe中增加或删除行或列
在dataframe中增加或删除行或列首先构建一个dataframeimport pandas as pdd={'one':{'a':1,'b':2,'c':3},'two':{'a':4,'b':5,'c':6},'three':{'a':7,'b':8,'c':9}}df=pd.DataFrame(d)print(df)构建的dataframe为:one two thre...
2019-04-12 17:30:35
26629
1
原创 python pandas 的最基本应用:构建Series, DataFrame
python pandas 的最基本使用pandas的一些最基本的操作 python 3.7.1构建seriesimport pandas as pdd={'a':1,'b':2,'c':3,'d':4}dd=[1,2,3,4]ddd=(1,2,3,4)index=['a','b','c','d']最简单的构建一个series:ds=pd.Series(d)print(ds)...
2019-04-12 15:14:12
1890
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人