2016.01.26回顾

1、看了下SF机场到palo alto的路线,以及palo alto到机场的路线,好订去LA的机票

2、一个下午的时间在看roll rate的事情,居然不能用python,要纯query实现?老板真是秀逗了,纯query的话,周五之前反正是做不出来了,只用想一下被问到的话怎么忽悠吧,只有年后回来做了!现在该干什么干什么!把这个事情优先级排低!

3、晚上回去看了一晚上的LA,效率低啊,没订任何东西,好在把行程基本完善了

4、唯一做的有关技术的事情就是重温了一下python连接postgresql的模块psycopg2,大概步骤就是

      A、创建连接

conn = psycopg2.connect(host='', port='5432', database='', user='', password='')
      B、生成游标对象

cur = conn.cursor()
      C、执行SQL

cur.execute(your_sql_string)
      D、把执行语句commit到数据库,(比如update、insert等语句)

conn.commit()
      E、获得查询结果

results = cur.fetchall()

总结:昨天真是效率低,节奏乱,节奏不好没有分清每个事情的主次,没有合理分配好每个事情的时间,效率低,常常被一些无关的东西所转移注意力,比如微信,百度主页新闻,浪费时间啊!效率要高就是要克制!要逼迫和执行力

源码地址: https://pan.quark.cn/s/a4b39357ea24 欧姆龙触摸屏编程软件MPTST 5.02是专门为欧姆龙品牌的工业触摸屏而研发的编程解决方案,它赋予用户在直观界面上构建、修改以及排错触摸屏应用程序的能力。 该软件在工业自动化领域具有不可替代的地位,特别是在生产线监视、设备操控以及人机互动系统中发挥着核心作用。 欧姆龙MPTST(Machine Process Terminal Software Touch)5.02版本配备了多样化的功能,旨在应对不同种类的触摸屏项目要求。 以下列举了若干核心特性:1. **图形化编程**:MPTST 5.02采用图形化的编程模式,允许用户借助拖拽动作来设计屏幕布局,设定按钮、滑块、指示灯等组件,显著简化了编程流程,并提升了工作效率。 2. **兼容性**:该软件能够适配欧姆龙的多个触摸屏产品线,包括CX-One、NS系列、NJ/NX系列等,使用户可以在同一个平台上完成对不同硬件的编程任务。 3. **数据通信**:MPTST 5.02具备与PLC(可编程逻辑控制器)进行数据交互的能力,通过将触摸屏作为操作界面,实现生产数据的显示与输入,以及设备状态的监控。 4. **报警与事件管理**:软件中集成了报警和事件管理机制,可以设定多种报警标准,一旦达到预设条件,触摸屏便会展示对应的报警提示,助力操作人员迅速做出响应。 5. **模拟测试**:在设备实际连接之前,MPTST 5.02支持用户进行脱机模拟测试,以此验证程序的正确性与稳定性。 6. **项目备份与恢复**:为了防止数据遗失,MPTST 5.02提供了项目文件的备份及还原功能,对于多版本控制与团队协作具有显著价值。 7. **多语言支持**:针对全球化的应...
<think>好的,用户现在的问题是如何获取GBM突变数据的MAF文件,也就是gbm_mutations.maf,用于生物信息学分析。首先,我需要回顾之前的对话历史,确保回答的一致性和连贯性。之前用户提到过高风险和低风险组中GBM的前15个突变基因的分析,并提供了R代码框架,使用MAF文件和风险分组信息。现在用户的需求是获取这个MAF文件,可能是为了进行类似的分析。 用户可能对生物信息学数据获取不太熟悉,特别是TCGA数据库的使用。他们可能知道MAF文件的重要性,但不确定具体的下载步骤。需要详细说明不同的获取途径,并比较它们的优缺点,比如通过GDC门户、使用R包TCGAbiolinks,或者通过Xena浏览器。此外,用户可能需要知道如何处理下载的数据,比如从Firehose获取的MAF文件可能需要解压和整理。 还需要考虑用户的实际操作能力,是否需要命令行操作,比如使用awk命令处理MAF文件,如之前引用中提到的。但根据当前问题,用户主要关注如何获取MAF文件,而不是后续处理,所以可能需要简要提及后续步骤,但重点放在获取方法上。 另外,用户提到了引用[1]中的awk命令,但根据上下文,这可能是一个示例,用户的实际需求是获取原始MAF文件。因此,需要明确回答获取MAF的方法,而不是处理已有MAF文件的子集。 可能的陷阱包括用户混淆不同数据源(如TCGA的MAF和Firehose的MAF),或者不知道如何转换MAF格式(如Xena的TSV转MAF)。需要明确说明每个步骤的注意事项,例如使用TCGAbiolinks时的数据类别选择,或者使用Xena时的格式转换。 用户可能还需要了解数据版本和预处理的重要性,比如不同版本的MAF文件可能包含不同的注释信息,或者需要合并多个文件。此外,数据访问权限的变化,如GDC的数据访问需要dbGaP授权,这也是需要提醒用户的重点。 最后,要确保回答结构清晰,分步骤说明不同的方法,并提供验证数据完整性的方法,如检查基因突变频率是否符合文献报道。同时,生成的相关问题需要与当前主题相关,帮助用户进一步深入,比如数据预处理、差异分析或可视化。</think>根据生物信息学研究的常规流程,获取胶质母细胞瘤(GBM)突变数据的MAF文件可通过以下途径实现,以下是具体方法和注意事项: --- ### **方法一:通过TCGA官方数据库下载** 1. **访问GDC数据门户** 访问[GDC Data Portal](https://portal.gdc.cancer.gov/),按以下步骤操作: - 选择**Projects** → **TCGA-GBM** - 在**Files**标签下,筛选文件类型为`MAF`(Mutation Annotation Format) - 选择包含体细胞突变(somatic mutations)的MAF文件,如`TCGA.GBM.somatic.maf.gz` - 需注册并获取dbGaP授权(针对受控访问数据)[^1] 2. **使用R包TCGAbiolinks**(自动化下载) ```r library(TCGAbiolinks) query <- GDCquery(project = "TCGA-GBM", data.category = "Simple Nucleotide Variation", data.type = "Masked Somatic Mutation", workflow.type = "Aliquot Ensemble Somatic Variant Merging and Masking") GDCdownload(query) maf_data <- GDCprepare(query) ``` --- ### **方法二:通过Firehose获取标准化数据** 1. **访问Broad GDAC** 下载Firehose预处理的MAF文件(已标准化): ```bash # 下载GBM突变数据 wget http://gdac.broadinstitute.org/runs/stddata__2016_01_28/data/GBM/20160128/gdac.broadinstitute.org_GBM.Mutation_Packager_Calls.Level_3.2016012800.0.0.tar.gz # 解压后找到MAF文件 tar -zxvf gdac.broadinstitute.org_GBM.Mutation_Packager_Calls.Level_3.2016012800.0.0.tar.gz ``` --- ### **方法三:使用UCSC Xena浏览器** 1. **在线获取MAF格式数据** - 访问[Xena Browser](https://xenabrowser.net/) - 选择`TCGA GBM`数据集 → 下载`SNP&CNV`模块中的`MC3 MAF`文件 - 注:Xena提供TSV格式,可用以下命令转为MAF: ```bash awk 'BEGIN{FS=OFS="\t"} {print $1,$2,$3,$4,$5,$6,$7,$8,$9,$10,$11,$12,$13,$14,$15,$16}' xena_data.tsv > gbm_mutations.maf ``` --- ### **关键验证步骤** 1. **数据完整性检查** ```r library(maftools) maf <- read.maf("gbm_mutations.maf") plotmafSummary(maf) # 验证突变类型分布(如错义突变占比) ``` - 预期结果:GBM中高频突变基因如$EGFR$、$PTEN$、$TP53$应位于突变频率前10位[^2] 2. **注释信息核对** - 确保MAF包含必要字段:`Hugo_Symbol`、`Variant_Classification`、`Tumor_Sample_Barcode`、`Chromosome`等 --- ### **注意事项** 1. **数据版本差异** - Firehose数据含标准化注释,而GDC原始数据需自行处理VCF转MAF 2. **样本匹配** - 若需结合临床数据(如风险分组),需确保`Tumor_Sample_Barcode`与临床信息文件一致 3. **突变类型过滤** - 建议排除同义突变(如`Variant_Classification = Silent`)以提高分析特异性 --- ### **应用场景示例** - **驱动基因筛选**:通过`maftools`包中的`oncodrive`函数识别高频驱动基因 - **突变特征分析**:使用`deconstructSigs`包解析GBM的突变特征谱 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值