2016.01.26回顾

1、看了下SF机场到palo alto的路线,以及palo alto到机场的路线,好订去LA的机票

2、一个下午的时间在看roll rate的事情,居然不能用python,要纯query实现?老板真是秀逗了,纯query的话,周五之前反正是做不出来了,只用想一下被问到的话怎么忽悠吧,只有年后回来做了!现在该干什么干什么!把这个事情优先级排低!

3、晚上回去看了一晚上的LA,效率低啊,没订任何东西,好在把行程基本完善了

4、唯一做的有关技术的事情就是重温了一下python连接postgresql的模块psycopg2,大概步骤就是

      A、创建连接

conn = psycopg2.connect(host='', port='5432', database='', user='', password='')
      B、生成游标对象

cur = conn.cursor()
      C、执行SQL

cur.execute(your_sql_string)
      D、把执行语句commit到数据库,(比如update、insert等语句)

conn.commit()
      E、获得查询结果

results = cur.fetchall()

总结:昨天真是效率低,节奏乱,节奏不好没有分清每个事情的主次,没有合理分配好每个事情的时间,效率低,常常被一些无关的东西所转移注意力,比如微信,百度主页新闻,浪费时间啊!效率要高就是要克制!要逼迫和执行力

代码转载自:https://pan.quark.cn/s/7f503284aed9 Hibernate的核心组件总数达到五个,具体包括:Session、SessionFactory、Transaction、Query以及Configuration。 这五个核心组件在各类开发项目中都具有普遍的应用性。 借助这些组件,不仅可以高效地进行持久化对象的读取与存储,还能够实现事务管理功能。 接下来将通过图形化的方式,逐一阐述这五个核心组件的具体细节。 依据所提供的文件内容,可以总结出以下几个关键知识点:### 1. SSH框架详细架构图尽管标题提及“SSH框架详细架构图”,但在描述部分并未直接呈现关于SSH的详细内容,而是转向介绍了Hibernate的核心接口。 然而,在此我们可以简要概述SSH框架(涵盖Spring、Struts、Hibernate)的核心理念及其在Java开发中的具体作用。 #### Spring框架- **定义**:Spring框架是一个开源架构,其设计目标在于简化企业级应用的开发流程。 - **特点**: - **分层结构**:该框架允许开发者根据实际需求选择性地采纳部分组件,而非强制使用全部功能。 - **可复用性**:Spring框架支持创建可在不同开发环境中重复利用的业务逻辑和数据访问组件。 - **核心构成**: - **核心容器**:该部分包含了Spring框架的基础功能,其核心在于`BeanFactory`,该组件通过工厂模式运作,并借助控制反转(IoC)理念,将配置和依赖管理与具体的应用代码进行有效分离。 - **Spring上下文**:提供一个配置文件,其中整合了诸如JNDI、EJB、邮件服务、国际化支持等企业级服务。 - **Spring AO...
<think>好的,用户现在的问题是如何获取GBM突变数据的MAF文件,也就是gbm_mutations.maf,用于生物信息学分析。首先,我需要回顾之前的对话历史,确保回答的一致性和连贯性。之前用户提到过高风险和低风险组中GBM的前15个突变基因的分析,并提供了R代码框架,使用MAF文件和风险分组信息。现在用户的需求是获取这个MAF文件,可能是为了进行类似的分析。 用户可能对生物信息学数据获取不太熟悉,特别是TCGA数据库的使用。他们可能知道MAF文件的重要性,但不确定具体的下载步骤。需要详细说明不同的获取途径,并比较它们的优缺点,比如通过GDC门户、使用R包TCGAbiolinks,或者通过Xena浏览器。此外,用户可能需要知道如何处理下载的数据,比如从Firehose获取的MAF文件可能需要解压和整理。 还需要考虑用户的实际操作能力,是否需要命令行操作,比如使用awk命令处理MAF文件,如之前引用中提到的。但根据当前问题,用户主要关注如何获取MAF文件,而不是后续处理,所以可能需要简要提及后续步骤,但重点放在获取方法上。 另外,用户提到了引用[1]中的awk命令,但根据上下文,这可能是一个示例,用户的实际需求是获取原始MAF文件。因此,需要明确回答获取MAF的方法,而不是处理已有MAF文件的子集。 可能的陷阱包括用户混淆不同数据源(如TCGA的MAF和Firehose的MAF),或者不知道如何转换MAF格式(如Xena的TSV转MAF)。需要明确说明每个步骤的注意事项,例如使用TCGAbiolinks时的数据类别选择,或者使用Xena时的格式转换。 用户可能还需要了解数据版本和预处理的重要性,比如不同版本的MAF文件可能包含不同的注释信息,或者需要合并多个文件。此外,数据访问权限的变化,如GDC的数据访问需要dbGaP授权,这也是需要提醒用户的重点。 最后,要确保回答结构清晰,分步骤说明不同的方法,并提供验证数据完整性的方法,如检查基因突变频率是否符合文献报道。同时,生成的相关问题需要与当前主题相关,帮助用户进一步深入,比如数据预处理、差异分析或可视化。</think>根据生物信息学研究的常规流程,获取胶质母细胞瘤(GBM)突变数据的MAF文件可通过以下途径实现,以下是具体方法和注意事项: --- ### **方法一:通过TCGA官方数据库下载** 1. **访问GDC数据门户** 访问[GDC Data Portal](https://portal.gdc.cancer.gov/),按以下步骤操作: - 选择**Projects** → **TCGA-GBM** - 在**Files**标签下,筛选文件类型为`MAF`(Mutation Annotation Format) - 选择包含体细胞突变(somatic mutations)的MAF文件,如`TCGA.GBM.somatic.maf.gz` - 需注册并获取dbGaP授权(针对受控访问数据)[^1] 2. **使用R包TCGAbiolinks**(自动化下载) ```r library(TCGAbiolinks) query <- GDCquery(project = "TCGA-GBM", data.category = "Simple Nucleotide Variation", data.type = "Masked Somatic Mutation", workflow.type = "Aliquot Ensemble Somatic Variant Merging and Masking") GDCdownload(query) maf_data <- GDCprepare(query) ``` --- ### **方法二:通过Firehose获取标准化数据** 1. **访问Broad GDAC** 下载Firehose预处理的MAF文件(已标准化): ```bash # 下载GBM突变数据 wget http://gdac.broadinstitute.org/runs/stddata__2016_01_28/data/GBM/20160128/gdac.broadinstitute.org_GBM.Mutation_Packager_Calls.Level_3.2016012800.0.0.tar.gz # 解压后找到MAF文件 tar -zxvf gdac.broadinstitute.org_GBM.Mutation_Packager_Calls.Level_3.2016012800.0.0.tar.gz ``` --- ### **方法三:使用UCSC Xena浏览器** 1. **在线获取MAF格式数据** - 访问[Xena Browser](https://xenabrowser.net/) - 选择`TCGA GBM`数据集 → 下载`SNP&CNV`模块中的`MC3 MAF`文件 - 注:Xena提供TSV格式,可用以下命令转为MAF: ```bash awk 'BEGIN{FS=OFS="\t"} {print $1,$2,$3,$4,$5,$6,$7,$8,$9,$10,$11,$12,$13,$14,$15,$16}' xena_data.tsv > gbm_mutations.maf ``` --- ### **关键验证步骤** 1. **数据完整性检查** ```r library(maftools) maf <- read.maf("gbm_mutations.maf") plotmafSummary(maf) # 验证突变类型分布(如错义突变占比) ``` - 预期结果:GBM中高频突变基因如$EGFR$、$PTEN$、$TP53$应位于突变频率前10位[^2] 2. **注释信息核对** - 确保MAF包含必要字段:`Hugo_Symbol`、`Variant_Classification`、`Tumor_Sample_Barcode`、`Chromosome`等 --- ### **注意事项** 1. **数据版本差异** - Firehose数据含标准化注释,而GDC原始数据需自行处理VCF转MAF 2. **样本匹配** - 若需结合临床数据(如风险分组),需确保`Tumor_Sample_Barcode`与临床信息文件一致 3. **突变类型过滤** - 建议排除同义突变(如`Variant_Classification = Silent`)以提高分析特异性 --- ### **应用场景示例** - **驱动基因筛选**:通过`maftools`包中的`oncodrive`函数识别高频驱动基因 - **突变特征分析**:使用`deconstructSigs`包解析GBM的突变特征谱 ---
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值