表型高通量比较生物学的术语映射
1. 引言
比较生物学研究带来了显著的生物医学发现,如进化上保守的信号转导通路(秀丽隐杆线虫)和同源盒基因(黑腹果蝇)。近年来,通过功能基因组学和基因本体论等互补整合策略,比较基因组学在阐明保守基因功能方面取得了重大进展。然而,目前迫切需要能够更好地整合表型数据和以表型为中心的发现工具,以促进生物医学研究。
尽管自动化技术使不同物种或具有不同表型的个体群体的基因分型效率越来越高,但我们精确指定观察到的表型并将其与其他生物的相关表型进行比较的能力仍然面临挑战,且无法与基因分型研究的通量能力相匹配。此外,表型“限定词”涵盖了从纳米级到群体水平的生物结构和功能,包括蛋白质、细胞器、细胞系、组织、模式生物、临床、遗传和流行病学数据库。这种规模、学科和数据库使用的多样性导致了大量不协调的表型符号,主要体现在以下几个方面:
- 表型定义差异 :例如性状、数量性状、综合征等不同定义。
- 术语粒度和组成差异 :不同数据库对术语的细分和组合方式不同。
- 相同术语的不同语境使用 :根据生物体、基因型、实验设计等不同语境,相同术语可能有不同含义。
以与眼睛相关的表型术语为例,就存在多种不同粒度的表述,如虹膜发育异常(前房角发育不全)[OMIM]、MP:0002092 眼睛:畸形[Phenoslim]、葡萄膜炎严重程度[RGD]、368808003 异常视网膜动脉[SNOMED CT]、81745001 整个眼睛[SNOMED CT]。而且,及时准确地获取跨数据库的相关表型信息也是阻碍表型研究进展的一个限制因素。
表型与临床术语的自动映射
超级会员免费看
订阅专栏 解锁全文
11

被折叠的 条评论
为什么被折叠?



