数据挖掘与应用中心立足于标准化的医学大数据,聚焦于医疗数据的深度挖掘与解读,结合多模态多组学数据,开发数据驱动的复杂疾病防控和诊疗相关的新技术、新方法,并面向全球推广应用。平台面向全院及协同创新联盟成员单位开放共享,拥有临床医学、生物信息学、医学遗传学、计算机科学、统计学等多个专业领域的多学科交叉团队。
中心搭建了拥有50台高性能计算服务器的计算集群,采用主备两中心部署的方式,总内存超过5TB,总存储达3000TB,实现100Gbps互联,并且配置了GPU服务器,为复杂的多模态数据分析与挖掘提供必须的硬件支撑,大幅度提升医学大数据挖掘与应用的能力。
按照同质化建设、异地化部署的思路,搭建了多个专病数据库及分析平台,集成了目前主流的分析挖掘算法和工具,可以为研究者提供统计分析、机器学习、深度学习等硬件和软件支持,通过简单的配置和拖拽,即可生成分析模型,并且可以将模型和数据共享给其他研究者。
中心建立了多个面向全球开放共享的整合临床大数据及基因大数据的数据库及分析平台(如VarCards、GPCards、Gene4Denovo、Gene4PD等),为一站式完成基因大数据和临床大数据的多模态数据挖掘分析提供分析方法和平台支撑,全球97个国家3200余家科研单位累计使用次数超过100万次。该平台支持中心PI团队发表相关SCI研究论文100余篇,其中IF>10的研究论文近20篇。