GeneDock HG人全基因组标准化分析服务正式发布
来源:数据猿 原文链接: http://www.datayuan.cn/article/10293.htm
GeneDock(聚道科技)于2017年3月6日正式发布基于云计算的人全基因组标准化分析服务——GeneDock HG。它是一项面向人全基因组大规模分析的服务,主要完成从fastq到vcf的标准化分析,其成本、速度、稳定性和结果准确度均达到了大规模生产服务的标准。GeneDock HG对30X人全基因组数据的分析价格为99元/次,这也是业内首次实现了百元以下的人全基因组标准化分析服务。
GeneDock为什么要提供这样一项服务?GeneDock的研发团队做了哪些工作?除了99元的低成本,GeneDock HG还有哪些特点?
以下为GeneDock 的“司机”和“扫地僧”为大家准备的视频,请欣赏(内含彩蛋,不要错过哦~):
从2001年人类基因组草图公布到今天,我们已经对指导生命过程的基因组有了更深入和清晰的了解。尤其是近几年测序技术的快速发展,使得测序成本大幅下降,推动了科学研究、个人健康和临床应用在人全基因组上的大规模需求。然而,一个人的全基因组数据可能达到数十到上百GB级别,如此大量的测序数据也给生物信息分析工作带来不小的压力,大量人力和硬件的投入也会限制企业的规模化发展。
在生信分析中,从测序下机数据的质量控制、比对到变异检测,都是非常消耗计算资源的步骤,计算复杂度高,相应的耗时也久,也是给很多希望扩大生产规模的生信企业带来困扰的部分。这个环节所需的分析软件和流程基本在行业内形成了共识,所以可以实现将常用的工具搭建成流程化自动化的工作流,不仅降低分析费用和运行时间,同时也是达到生产级分析的前提。
但是,利用本地服务器的传统方式,尽管是工作流,当数据量越大,分析时间也随之增长,同时服务器的硬件投入及维护成本都较高,逐渐无法满足快速增多的数据处理需求。于是越来越多的企业和研究单位选择利用云计算作为解决方案,云分析平台的并行化可以提供更强的序列分析能力,提升效率的同时降低成本,尤其可以解决生产级的全基因组分析模式中多样本大规模分析带来问题,而弹性计算的特点也正好满足测序数据处理的动态需求。
GeneDock HG正是为了解决这一供需的矛盾,帮助基因领域从业者多、快、好、省的完成人全基因组数据分析。
GeneDock HG人全基因组标准化分析服务特征
“目前我们将GeneDock HG的价格降到了99元一次,并可在约5小时 内完成一个样本的标准分析,可支持约 100个样本数据的并行处理。 ”
——GeneDock CEO李厦戎
GeneDock HG人全基因组标准分析服务,包含了BWA、Sentieon等软件,可以对全基因组数据进行从fastq到vcf的标准分析,给出SNV和INDEL等变异检测结果。
Sentieon DNAseq 是一款类似于GATK(The Genome Analysis Toolkit)的软件,主要用于二代测序数据的变异分析,包括SNV和INDEL。GeneDock的生信团队与数据计算团队共同努力,在数据传输优化、分析算法选择、计算资源选型等方面都进行了优化,并对分析关键步骤做了分布式处理,在保证同GATK鉴定结果准确度一致的基础上,大大降低了用户的分析成本,缩短了运行时间。
图 | GeneDock HG 分析服务示意图
“GeneDock与Sentieon双方优势互补,基于云计算平台向行业提供更快速更准确的全基因组数据分析能力,这是非常好的一种合作模式。Sentieon的核心竞争力在于生物信息算法的优化能力,而GeneDock在Sentieon的全基因组分析软件基础上进行了适合云计算场景的分析流程整体优化和高效计算资源调度,并在GeneDock云平台基础架构支撑下,实现了低成本高效率的云端全基因组标准化分析服务GeneDock HG。Sentieon也会与GeneDock继续携手努力,为精准医疗领域提供更好的分析解决方案。”
——Sentieon CEO叶军
该流程整体可分为4个部分:
1、序列比对(Mapping)
2、Bam文件处理(Bam processing)
3、使用Sentieon软件的HaplotypeCaller(hc)或UnifiedGenotyper(ug)对SNV和INDEL同时进行检测(SNV and INDEL calling)
4、变异优化(Callset Refinement
目前已有一批行业内资深的合作伙伴进行了测试,测试反馈此工作流分析结果能够满足要求,并对运行速度表示满意,认为可以提升工作效率。
你之前的工作状态可能是这样的
从今天开始尝试一种新的工作状态
申 请 方 式
GeneDock HG采用邀请注册制,您可以 扫描以下二维码 或发送邮件至 support@genedock.com 申请。
关于GeneDock
GeneDock的目标是成为行业内可靠的基因数据技术伙伴,其核心团队来自阿里,华大基因等知名公司,拥有丰富的实战经验。GeneDock已与国内多家医院、科研机构、基因公司达成了合作,基于领先的数据分析技术,专注于解决基因组数据的上下游协作及整个数据管理的问题。