本文中所展示的Circos图片均来自circos官方网站(http://circos.ca/)
Circos 是使用Perl语言编写与运行的免费软件。它可以轻易地根据纯文本的配置文件,将用户的输入数据转化为像素图片(PNG)或矢量图片(SVG)。
Circos俗称“圈图”,可应用于多种场景。本文主要介绍其最常用也是最主要的应用——基因组数据展示。
Martin Krzywinski 最早开发了Circos,他不仅是一名生物信息科学家,同时也是一位优秀的专业摄影师。科学与艺术的双重造诣使得 Circos 不仅具备完善的数据可视化功能,优美的展示方式也是Circos的一大特色。
强大的功能,丰富展示方式虽是Circos相较于其他软件的优点,但也它的缺点,因为这使它比其他软件更难于上手。另外,软件没有的可视化操作界面,只能在DOS等命令窗口中以执行代码的形式作图。加上配置文件中令人眼花缭乱的参数设置,想灵活的使用并做出一幅优秀的作品需要不断地练习。今天将为您揭开它神秘的面纱,从软件安装、软件原理和图形结构三方面为大家简单介绍这款强大的可视化软件,让大家有初步的了解。
更多强大的功能,请查看circos官方教程 - http://circos.ca/intro/tabular_visualization/。
软件安装与运行
Perl
将Perl正常安装后,安装如下模块:
Config::General (v2.50 or later)
Font::TTF
GD
List::MoreUtils
Math::Bezier
Math::Round
Math::VecStat
Params::Validate
Readonly
Regexp::Common
Set::IntSpan (v1.16 or later)
Text::Format
Circos
下载完成后解压,在软件目录下创建文件夹(例如:MyData)用来存放配置文件、数据、结果图片等信息。并记下软件所在目录的详细地址。
命令运行
Windows用户打开DOS窗口,将路径切换到 Circos 所在目录下,将conf文件配置好,运行以下命令,将会得到以“circos.png”命名的结果。
perl bin\circos -conf MyData\circos.conf -outputdir MyData -outputfile circos.png
perl bin\circos 相当于运行circos软件;
-conf circos.conf 配置文件路径,配置文件下面将会详细介绍;
-outputdir 输出文件夹;
-outputfile 输出图片名称;
软件原理
图片的生成与数据的导入都通过配置文件实现。配置文件多种多样,通常以conf为后缀,分别具备不同的功能,关系如下图所示。
“基本配置”用来定义圈图的基本框架、字体、模式、颜色等基本信息。“图形与规则配置”则主要用于染色体信息展示、标签大小、每一圈的图形、位置等信息设置,由于涉及到具体信息的展示,所以数据的导入也是在此类配置文件中进行设置。
从上图还可以看出,“circos.conf”为主配置文件,也是命令运行时唯一需要调用的配置文件。其他所有的配置文件可根据需要由“circos.conf”载入,载入的一般方法示例如下图。
图形结构
染色体
染色体数据一般位于Circos图中的最外圈,它可以决定其他圈的方向、位置等关键信息,起到类似坐标轴的作用。染色体可从形状、大小、颜色、方向、位置等多方面设置。下面列出人类染色体的几种典型的设置方式。
其他图形
一般可展示的图形结构主要包括:点、线、直方图、热图、文本等。点可用来表示个染色体不同位置的SNP的突变,线展示不同染色体区域之间的相关关系,热图用来展示单位区域突变数量的变化等。同样,使用示例进行展示。
下面这张图综合运用了上面提到的大部分可用的图形元素。
展示图形的综合应用,颜色的调配,数据的处理都是做好Circos图的重点,也是难点。需要对每一项参数有深刻的理解,清晰并且优美的展示特点,让Circos图在文章中的作用不仅仅是锦上添花,更是画龙点睛。
Circos是一款用Perl编写的用于基因组数据可视化的免费软件,以其独特的图形结构展示复杂生物信息。尽管其丰富的展示方式和强大功能使其在数据可视化方面具有优势,但学习曲线较陡峭,需要通过配置文件进行操作。本文介绍了Circos的安装、运行、软件原理和图形结构,包括染色体设置和其他图形元素,如点、线和热图,帮助读者初步了解如何利用Circos优雅地展示生物数据。
2884

被折叠的 条评论
为什么被折叠?



