11、BiobankCloud:生物样本库数据管理的创新平台

BiobankCloud:生物样本库数据管理的创新平台

1. 元数据管理

在生物样本库的数据管理中,需要诸如基因组所属的样本和样本集、样本类型以及捐赠者信息等内容。为此,提供了一个用户界面(UI)工具,方便非编程背景的生物样本库工作人员设计与基因组、样本集、数据集或研究相关的扩展元数据。这些扩展元数据与文件系统元数据存储在同一数据库中,并通过外键关联到元数据所引用的文件或目录,以此保证其完整性。为了使扩展元数据可搜索,会将其异步透明地复制到 Elasticsearch 中,实现对样本的自由文本搜索。

2. HopsYARN

HopsYARN 是 Apache YARN 的一种实现,它将元数据迁移到了 MySQL Cluster。YARN 的资源管理器被划分为两部分:
- 资源跟踪器节点(ResourceTracker nodes):处理来自节点管理器的心跳信息,并向其发送命令。
- 单个调度器节点(single scheduler node):实现资源管理器的其他所有服务。

如果调度器节点出现故障,领导者选举服务会从资源跟踪器节点中选出一个新的调度器,并从数据库中加载调度器状态。与 Apache YARN 相比,HopsYARN 能够处理更大规模的集群,因为资源跟踪工作从调度器节点转移到了其他节点,且资源跟踪流量随集群规模线性增长,这将有助于在单个系统中分析更多的基因组数据。

3. SAASFEE

为了处理当今生物样本库中存储的大量基因组数据,研究人员拥有多种工具。这些工具常相互配合使用,形成复杂的分析流程。科学工作流管理系统(SWfMSs)可促进这些分析流程的设计、优化、执行、监控、共享和维

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值