
技术文档
文章平均质量分 74
探索者v
这个作者很懒,什么都没留下…
展开
-
【一起学生信】认识MAPQ
目录MAPQ 定义MAPQ的影响因素欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导...原创 2019-04-15 01:22:20 · 5289 阅读 · 0 评论 -
【一起学生信】群体结构图形—structure堆叠图
1、structure图的由来图1 假设群体亚群数等于3(k=3)的情况下的structure分析结果“Structure图”名词本身来自这种图形的分析软件——STRUCTURE。这个软件是由斯坦福大学Pritchard实验室开发的一款群体结构分析软件,最早在2000年发表在《Genetics》上[1]。图2 structure惊人的引用次数Structure软件分析达到的目的...转载 2019-02-14 16:25:58 · 13783 阅读 · 0 评论 -
【深入UCSC Genome Browser】Repeats-Self Chain
人类基因组大约有3,000,000,000个碱基对其中50%-69%是重复序列,包括转座子(SINES、LINES、Long Terminal Repeats)以及低复杂区域(比如homopolymers 和 CAG重复)和假基因(大片段重复引起)。Self Chain就是UCSC中查看大片段重复的工具。描述self chain 是染色体之间相似性的比较,相比如segdup,它修改了...原创 2018-12-06 20:49:14 · 1767 阅读 · 0 评论 -
【IP被禁用】ssh Connection refused
1. ssh 访问某云服务器ssh root@XX.XX.XXX.XXX ssh: connect to host XX.XX.XXX.XXX port 22: Connection refused 2. 换用其他服务器(跟本地不同IP)跳转,可以登录服务器。怀疑本地IP被云服务器加入黑名单3. 查看secure log 日志```sudo less /var/log/s...原创 2018-11-06 09:36:35 · 12681 阅读 · 2 评论 -
【一起学生信】 bwa -M 参数解读
bwa mem 比对时,会有一个 -M 参数,bwa官方给出的解释是 mark shorter split hits as secondary。-M 参数用来处理同一个reads比对到参考基因组上不同位置的情况。不加 -M如果加入 -M 参数,这种情况bam中的 flag= 2048 ( supplementary alignment ) # 必须做好hg19的indexbwa原创 2018-01-11 18:36:54 · 9065 阅读 · 0 评论 -
Python format 使用实例
如果需要{}是自己实际需要的字符,需要用{{}}作为转义 以下转自: https://pyformat.info/Basic formattingSimple positional formatting is probably the most common use-case. Use it if the order of your arguments is not likely to chang转载 2017-12-12 14:59:25 · 2948 阅读 · 0 评论 -
Bash 老司机也可能忽视的 10 大编程细节
Bash,作为大部分 Linux 发行版的出厂预设 Shell,因其晦涩难懂的语法设置,以及需要特别留心的编程细节,几乎成为 Linux 区别于其他操作系统的代名词。针对 Bash 中一些极容易出错的细节,我们在这里总结了 10 条编程注意事项,希望对各位泛 Linux 环境的开发者有所裨益。原文来自一位名叫 Julia Evans 的开发者博客,雷锋网编译。作为一名 Bash 脚本编写经验超过转载 2017-12-11 11:24:07 · 1721 阅读 · 0 评论 -
层次聚类算法的原理及实现Hierarchical Clustering
层次聚类(HIERARCHICAL CLUSTERING)是聚类算法的一种,通过计算不同类别数据点间的相似度来创建一棵有层次的嵌套聚类树。在聚类树中,不同类别的原始数据点是树的最低层,树的顶层是一个聚类的根节点。创建聚类树有自下而上合并和自上而下分裂两种方法,本篇文章介绍合并方法。转载 2017-12-06 15:45:49 · 4144 阅读 · 0 评论 -
UCSC 人类参考基因组hg19数据下载
This directory contains a dump of the UCSC genome annotation database forthe Feb. 2009 assembly of the human genome (hg19, GRCh37 Genome ReferenceConsortium Human Reference 37 (GCA_000001405.1)).T转载 2017-11-14 21:39:15 · 14429 阅读 · 0 评论 -
一代、二代、三代测序技术原理与比较
从1977年第一代DNA测序技术(Sanger法)1,发展至今三十多年时间,测序技术已取得了相当大的发展,从第一代到第三代乃至第四代,测序读长从长到短,再从短到长。虽然就当前形势看来第二代短读长测序技术在全球测序市场上仍然占有着绝对的优势位置,但第三和第四代测序技术也已在这一两年的时间中快速发展着。测序技术的每一次变革,也都对基因组研究,疾病医疗研究,药物研发,育种等领域产生巨大的推动作用。在这里我主要对当前的测序技术以及它们的测序原理做一个简单的小结。转载 2017-11-10 14:08:02 · 287596 阅读 · 16 评论 -
【error】pg_dump no matching tables were found
pg_dump 备份数据时,提示 no matching tables were found, 可是表明明是存在的。最后发现,是引号的问题,于是加了双引号,可还是不行。最终在Stack Overflow发现了答案。https://stackoverflow.com/questions/13905162/postgres-dump-specific-table-with-a-capital-lett原创 2017-10-18 15:42:53 · 7337 阅读 · 3 评论 -
【error】postgresql relation does not exist
最近刚刚使用postgresql遇到很多问题。postgresql relation does not exist使用postgresql 查询 AAA 数据表时,提示 postgresql relation does not exist ,可是 SELECT tablename FROM pg_tables;AAA 表是存在的,好奇怪。搜索之后发现,是因为引号的问题。PostgreS原创 2017-10-18 15:37:30 · 57806 阅读 · 0 评论 -
【跟着stackoverflow学Pandas】--Converting a Pandas GroupBy object to DataFrame-Groupby对象转换为DataFrame
我们在对数据进行清洗时,经常要用到split-apply-combine,首先对数据按照一定的标准进行split(分组),然后对每组数据进行apply(处理),最后把结果combine(合并),在这一系列操作中就必须要用到 pandas的groupby函数。原创 2017-09-17 16:19:05 · 6796 阅读 · 0 评论 -
【R】R语言指定包安装目录
仅针对Linux操作系统。查看R安装目录R # 进入R软件.libPaths()方法1 在 ~/.bashrc 中设置export R_LIBS_USER=/your/path然后采用 install.packages("ggplot2", repos='http://cran.rstudio.com/') 即可将包安装在自己制定的 /your/path 这样做的优点是别人source你的环境原创 2017-08-29 09:33:13 · 24427 阅读 · 0 评论 -
【perl】cpan 非root安装perl模块
处于无奈才用perl的,相比python,不喜欢perl。。。以下写入你的 .bashrc 或 .zshrc 文件,然后sourcesoftware=/your/path#cpan installexport PERL_LOCAL_LIB_ROOT="${software}/PERL5"export PERL_MB_OPT="--install_base ${software}/PERL5"e原创 2017-08-28 23:22:13 · 6758 阅读 · 0 评论 -
【python-tips】非root权限安装pip、其他包
很多时候我们拿到服务器的账号,只是一个普通用户,没有root权限,这没有关系。关键是没有pip、没有必要的python包。参考Stack Overflow给出解决方案,适用于python2.7, python3.x安装pipwget https://raw.github.com/pypa/pip/master/contrib/get-pip.pypython get-pip.py --user这里原创 2017-08-25 19:26:31 · 22651 阅读 · 2 评论 -
【跟着stackoverflow学Pandas】- apply、applymap、map 三者使用差异
## Difference between map, applymap and apply methods in Pandas - map、apply、applymap 三者使用差异https://stackoverflow.com/questions/19798153/difference-between-map-applymap-and-apply-methods-in-pandas原创 2017-08-19 14:49:24 · 14667 阅读 · 0 评论 -
【跟着stackoverflow学Pandas】-How do I get the row count of a Pandas dataframe-获取DataFrame行数
最近做一个系列博客,跟着stackoverflow学Pandas。专栏地址:http://blog.youkuaiyun.com/column/details/16726.html以 pandas作为关键词,在stackoverflow中进行搜索,随后安照 votes 数目进行排序: https://stackoverflow.com/questions/tagged/pandas?sort=votes&p原创 2017-08-19 14:07:28 · 13668 阅读 · 0 评论 -
【跟着stackoverflow学Pandas】- 删除带有NaN的行
最近做一个系列博客,跟着stackoverflow学Pandas。 专栏地址:http://blog.youkuaiyun.com/column/details/16726.html以 pandas作为关键词,在stackoverflow中进行搜索,随后安照 votes 数目进行排序: https://stackoverflow.com/questions/tagged/pandas?sort=votes&原创 2017-08-16 19:19:39 · 18959 阅读 · 0 评论 -
【跟着stackoverflow学Pandas】 - Pandas: change data type of columns - Pandas修改列的类型
Pandas: change data type of columns - Pandas修改列的类型原创 2017-08-15 22:55:27 · 10466 阅读 · 0 评论 -
python-multiprocessing 多进程并行计算
#16.6.1.1. The Process classfrom multiprocessing import Processimport osimport timestart_time = time.time()def info(title): print(title) if hasattr(os, 'getppid'): # only available on原创 2017-08-13 14:59:33 · 17636 阅读 · 1 评论 -
【跟着stackoverflow学Pandas】 - Adding new column to existing DataFrame in Python pandas - Pandas 添加列
Adding new column to existing DataFrame in Python pandas - Pandas 添加列原创 2017-08-07 23:13:13 · 10813 阅读 · 0 评论 -
【跟着stackoverflow学Pandas】 -Get list from pandas DataFrame column headers - Pandas 获取列名
Get list from pandas DataFrame column headers - Pandas 获取列名https://stackoverflow.com/questions/19482970/get-list-from-pandas-dataframe-column-headers获取DataFrame的列名是一个比较简单的操作,又以下几个方法:1. [column for column原创 2017-08-06 21:46:18 · 32992 阅读 · 0 评论 -
【跟着stackoverflow学Pandas】add one row in a pandas.DataFrame -DataFrame添加行
## add one row in a pandas.DataFrame -DataFrame添加行https://stackoverflow.com/questions/10715965/add-one-row-in-a-pandas-dataframe不得不说,这个问题在stackoverflow有10个回答,303 votes,339k views但是最终没有得出一个比较好的答案。原创 2017-08-05 21:52:01 · 22721 阅读 · 0 评论 -
【跟着stackoverflow学Pandas】Select rows from a DataFrame based on values in a column -pandas 筛选
Select rows from a DataFrame based on values in a column -pandas 筛选https://stackoverflow.com/questions/17071871/select-rows-from-a-dataframe-based-on-values-in-a-column-in-pandaspandas的筛选功能,跟excel的筛选功能类似,但是原创 2017-08-05 15:24:03 · 9780 阅读 · 2 评论 -
【跟着stackoverflow学Pandas】How to iterate over rows in a DataFrame in Pandas-DataFrame按行迭代
How to iterate over rows in a DataFrame in Pandas-DataFrame按行迭代原创 2017-08-05 11:17:04 · 11437 阅读 · 0 评论 -
【跟着stackoverflow学Pandas】“Large data” work flows using pandas-pandas大数据处理流程
原文在: https://stackoverflow.com/questions/14262433/large-data-work-flows-using-pandas文中提到了利用pandas对HDFStore的操作,因为我平时没有接触过特别大的数据,所以对这里不是很熟悉,所以我计划先略过该篇。等我了解了,在做进一步整理。原创 2017-08-04 19:02:39 · 6385 阅读 · 0 评论 -
【跟着stackoverflow学Pandas】Delete column from pandas DataFrame-删除列
Delete column from pandas DataFrame - 删除列stackoverflow 地址:https://stackoverflow.com/questions/13411544/delete-column-from-pandas-dataframepandas 官方给出了对列的操作,可以参考:http://pandas.pydata.org/pandas-docs/stabl原创 2017-08-04 18:51:47 · 8321 阅读 · 0 评论 -
【跟着stackoverflow学Pandas】Renaming columns in pandas-列的重命名
Renaming columns in pandas - 列的重命名https://stackoverflow.com/questions/11346283/renaming-columns-in-pandas### 方法1```python>>> df = pd.DataFrame({'$a':[1,2], '$b': [10,20]})>>> df.columns = ['a', 'b']原创 2017-08-03 19:19:21 · 9369 阅读 · 0 评论 -
Illumina Fastq Q-score
Illumina Nextseq500 Miseq HiseqXten 测序仪 Q-score均采用下面的编码格式,仅作简要介绍。Q-scoreQ-score 在fastq中每个序列的第4行,代表测序错误的概率。Quality Score Q(X) ## Error Probability P(~X) Q40 ##原创 2017-07-25 15:52:54 · 8791 阅读 · 0 评论 -
python.snippet
python 的代码片段, 拿出来分享。#!/usr/bin/env python# -*- coding: utf-8 -*-"""desc"""# ---------# Change Logs:## ---------__author__ = 'Pidong'__email__ = '***'__version__ = '1.0.1'__status__ = 'Producti原创 2017-07-25 13:57:23 · 7268 阅读 · 0 评论 -
Dockerfile 模版
最近一直在用docker,总结了一个靠谱的模版,分享给大家。From ubuntu:14.04MAINTAINER pidong.li@genetronhealth.comRUN echo deb http://mirrors.163.com/ubuntu/ trusty main restricted universe multiverse>/etc/apt/sources.listRUN ec原创 2017-07-25 11:01:26 · 6718 阅读 · 0 评论 -
Celery分布式应用
最近有应用需要部署到不同的服务器上运行,但是有没有PBS这样的调度系统,就想起来Python的调度神器 Celery。现在针对我的实际应用做一些记录。1. 安装因为我并不注重结果而是把命令拿到不同的机器上运行,所以消息代理和结果保存我都选择了 Redis# 只需要在一台服务器上安装 redis,其他服务器均使用该服务器redis即可sudo apt-get install redis-server原创 2017-07-22 14:26:40 · 6525 阅读 · 0 评论 -
Kendo UI grid API 获取 filter 后的所有数据
Kendo UI grid 在处理表格数据上,方便、快捷。 出于需要,希望在 filter 表格后,得到所有的表格数据,当然可以在后台获取,但是通过kendo ui 的API在前端处理更为便捷。// 获取 #grid 下的datasourcevar dataSource = $("#grid").data("kendoGrid").dataSource;// 获取过滤条件var filters原创 2017-01-07 14:34:57 · 13183 阅读 · 0 评论 -
python-装饰器封装try-exception
本文更新地址:http://blog.youkuaiyun.com/tanzuozhev采用try-exception是python捕获异常的常用方式,但在代码频繁的使用着实麻烦,所以采用装饰器对try-catch进行了封装。import sys,tracebackdef try_except(f): def handle_problems(*args, **kwargs): try原创 2016-05-15 16:03:40 · 17164 阅读 · 0 评论 -
R语言手动计算主成分分析(PCA)及其在R函数的实现
R语言手动计算主成分分析(PCA)及其在R函数的实现了解PCA的原理,但总是无法用R语言实现,这次算是有个教程。 转自:http://blog.163.com/xiaoji0106@126/blog/static/13613466120133185842687/ 主成分分析(principal component analysis,PCA)是一种降维技术,把多个变量化为能够反映原始变转载 2016-05-04 00:38:29 · 25537 阅读 · 0 评论 -
python词云 wordcloud 入门
构建词云的方法很多, 但是个人觉得python的wordcloud包功能最为强大,可以自定义图片. 官网: https://amueller.github.io/word_cloud/ github: https://github.com/amueller/word_cloud 例子: 字体使用的是 CabinSketch-Bold.ttf安装方法1pip install wordclo原创 2016-03-03 16:01:46 · 69488 阅读 · 14 评论 -
crontab 开启日志模式
crontab可以定时运行程序, 但是有时候程序会出现问题, 为了监控程序的运行我们可以查看 crontab的log, 但不幸的是linux(ubuntu)默认关闭crontab的log, 要想开启log, 可以这样.修改rsyslogsudo vim /etc/rsyslog.d/50-default.confvim中 cron.* /var/log/cron.log原创 2016-03-02 23:15:44 · 8986 阅读 · 0 评论 -
java httpclient 抓取网页 POST GET
httpclient post方法 以TTD数据库为例////Licensed to the Apache Software Foundation (ASF) under one* or more contributor license agreements. See the NOTICE file* distributed with this work for additional in原创 2016-03-01 23:18:42 · 6329 阅读 · 0 评论 -
python 路径函数
本文在http://www.jb51.net/article/21007.htm的基础上修改1: os.listdir(path) //path为目录 功能相当于在path目录下执行dir命令,返回为list类型 print(os.listdir(‘..’)) 2: os.path.walk(path,visit,arg) path :是将要遍历的目录 visit :是一个函数指原创 2016-01-21 15:48:41 · 4677 阅读 · 0 评论