基于TCGA及SEER等癌症公共数据库的深度挖掘和科研设计
培训通知
各事业单位:
身处大数据时代,对于从事肿瘤研究的临床医生或基础科研人员,有没有一种可以既不做实验又不查病史,直接调用公共数据撰写发表SCI论文的方法呢?TCGA和SEER等癌症公共数据库即提供了这样一种可能。TCGA和SEER分别侧重于组学数据和临床数据,各有优势。TCGA(癌症基因组图谱)数据库是一个多组学的数据库,包括常见癌症的基因组、转录组、蛋白组、表观遗传组数据和与其关联的临床数据,为挖掘有意义的组学变化和发现肿瘤发生、发展、转移等生物学机制提供了海量数据。美国的SEER(癌症监测、流行病学和结果)数据库则是典型的临床医学数据库,是北美最具代表性的大型肿瘤登记注册数据库之一,收集了各个癌种的海量临床病理信息和预后数据,并向全世界免费开放,为临床医师的循证实践及临床研究提供了宝贵的第一手资料。据不完全统计,全世界基于TCGA和SEER数据挖掘产生的文章已经超过2000篇,其中不乏最顶尖的学术期刊文章(如JAMA、新英格兰、Nature、Cell等),这一数目还在不断增长中。以往的TCGA课程往往侧重于R语言程序的讲解,不少学员反应难以掌握。本课程立足应用和实战,宗旨是“临床医生听得懂、学得会,科研人员亦有收获”。本课程将从临床应用视角介绍癌症公共数据库TCGA、SEER的基本情况、数据库结构、数据获取方式及基本统计方法等,深度解析近年讲课人发表的基于TCGA和SEER数据挖掘的经典案例,重点对癌症公共数据库的数据挖掘和课题设计进行讨论,最后也将探讨在此基础上的基金申请、SCI论文撰写策略。
一、时间地点:
2019年5月24日–5月26日 郑州*鑫地酒店
(课程安排:第一天报到,授课两天;)
二、学习目标:
本次培训提供了一次系统掌握TCGA和SEER等癌症公共数据库数据结构、挖掘方法及分析流程的机会,目的在于助力有志于利用这些公共数据库的临床医生以及转化研究的科研人员,帮助研究者去更好地挖掘利用这些免费的公共数据。本次培训不侧重于深入的生物信息学分析讲授,拟解决的问题包括:1、如何基于TCGA及SEER等癌症公共数据库设计课题;2、TCGA及SEER数据库的数据下载;3、获取数据后如何分析;4、如何在此基础上撰写