Language

翼方健数&亚马逊云科技合作解决数据安全与开放应用

翼方健数&亚马逊云科技合作解决数据安全与开放应用


作为全球较早的云服务提供商,亚马逊云科技自2006年初起就开始在云中为各种规模的公司提供技术服务平台。开发人员不仅能够灵活选择任何开发平台或编程环境,还可以使用在全球不同地点运作的相同亚马逊云科技服务技术轻松部署应用程序,这对翼方健数的业务来说大有裨益。

翼方健数致力于为客户打造值得信赖的隐私安全计算服务平台,希望借助亚马逊云科技卓越的产品服务、便捷的开发运维能力、丰富的数据和工具资源,以及完备的合规和安全体系,来打造一个隐私安全计算云服务平台,更好地服务各行业客户的多元化需求。

以翼方健数旗下产品XDP翼数坊为例。XDP为客户提供数据全生命周期治理解决方案,包含医疗大数据平台和科研协作大数据平台。由于XDP产品特性对于数据算力有极高要求,随着业务的拓展,对服务器的需求在日益增加。借由亚马逊云科技云平台,简化了XDP平台的合规性义务,确保平台中各用户的数据隐私安全。同时,XDP还可以实现计算资源调度管理,大大节省了平台用户的计算成本。

2020年8月开始,在亚马逊云科技专业团队的帮助下,翼方健数快速完成了XDP第一方公有云SaaS平台(简称一方平台)的设计开发和上线部署。基于亚马逊云科技的一方平台为用户提供了一个全数据生命周期驱动的数字平台,为客户和合作伙伴极大地降低了隐私安全计算、数字化转型和数据综合治理管理的使用门槛。

分布式文件系统XFS(XDP File System)在一方平台中对数据的安全流转至关重要,它决定了数据究竟存在何处,结构是否清晰,能否支持快速调用。基于Amazon Simple Storage Service (Amazon S3) 的XFS系统提供了一个统一的存储平台,能够支持不同云平台的数据。翼方健数用户的大型公共数据集,还可以通过Amazon S3挂载方式链接到一方平台上,使得数据集不需要复制到平台上就可以共享给他人使用。

同时,Amazon S3 支持通过安全通道进行数据传输,在数据上传完成时自动保护数据,并且用户还可以通过Amazon Identity and Access Management (IAM) 管理对象权限,控制使用者对数据的访问权限,极大地保护了数据所有者的利益。

此外,翼方健数还使用了Amazon Key Management Service (KMS),可以轻松创建和管理加密密钥。Amazon KMS 与亚马逊云科技服务深度集成,所创建的密钥可实现跨计算实例、数据库、存储环境,以及数据分析和机器学习工具一致地定义和实施访问控制。让一方平台从数据连接和获取、数据治理和清洗,到生物信息处理,再到机器学习和数据挖掘,以及数据分级管理和授权分享的全生命周期都具有高度安全保障。

“对于一个新客户,如果我们做本地部署平台约需要几天时间,而使用亚马逊云科技之后,客户短短 1 天时间就可以完成一方平台的开户和使用, 产品上线使用周期缩短了约75%。而且亚马逊云科技提供了多种安全保护,加上翼方健数的隐私安全计算技术栈,让一方平台真正实现了‘原始数据不离开平台,数据在平台内授权使用,平台只输出数据价值’,通过技术手段解决了数据安全和开放应用的矛盾。”翼方健数联合创始人兼首席产品官曹华表示。

亚马逊云科技既有大型公共数据集,也有支持密集型计算场景的高性能计算


在翼方健数看来,一方平台若想受到其用户的青睐,除了有隐私安全计算技术的加持,还需要有可以让用户提取价值的数据。尤其在医疗领域,数据是高价值的生产要素,但医疗数据一直存在严重的数据孤岛问题,共享数据极为稀有,公共数据集就成为了重要的分析资源。

翼方健数与亚马逊云科技合作,在一方平台托管了多个公开数据集,包括GATK测试数据集 (GATK Test Data),亚马逊云科技的常用参考基因组(Amazon iGenomes)、纳米孔人类参考基因组(Nanopore Reference Human Genome)、瓶中基因组(Genome in a Bottle)和博德研究院参考基因组(Broad Genome References)。一方平台的使用者可以直接使用这五个数据集,从中挖掘数据价值,不仅加速了分析过程,而且还减少了因数据线下传输导致的低效和费用。

另外,一方平台客户对计算资源的需求是不定时的,但是一旦需要一定是密集型的计算场景。特别是医药行业常用的新一代高通量测序(NGS)样本数据量大,需要一系列的转换、比对、识别等数据分析过程,对算力要求非常高。翼方健数利用Amazon Elastic Kubernetes Service (Amazon EKS) 基于亚马逊云科技海量算力搭建了弹性可扩展的高性能计算环境,能够随时满足客户不同样本量不同时间的分析需求。同时支持Spark on Amazon EKS直接编程查询,也支持客户直接通过检索界面进行检索,并且具有自动伸缩扩展机制。

基于亚马逊云科技的一方平台,在数据所有方和使用方之间架起安全通道


目前,翼方健数基于亚马逊云科技的一方平台已经帮助医药医疗、金融、政务、营销等多行业的企业解决了数据共享中的安全问题,其中企业A与企业B就是典型的数据持有者和模型持有者客户。 企业A是一家生命科学公司,专注于科研及临床医学领域,致力于面向精准医学的创新性多组学技术的研发及推广。企业A拥有具有自主知识产权的“药物-细胞-基因”数据库DGDB(Drug Gene Data Base),这些数据是公司珍贵的资产,它将数据共享给他人时希望数据可以自己管控,他人对数据只能进行搜索、检索和计算,不能拿走原始数据,一方平台正好满足了它的需求。 企业B是一家致力于运用人工智能和机器学习方法系统性赋能创新生物医药研发的新一代平台型技术公司,它曾在数据中挖掘出价值上亿美元的创新药物,可见数据对其的重要性,而且它也需要大量的数据支持其迭代AI算法,锁定药物靶点等工作。然而,它与合作的数据公司同样面临着数据共享问题,也是一方平台保障了双方的顺利合作。

查看更多亚马逊云科技解决方案https://www.amazonaws.cn
法律声明 | 隐私政策 | Cookie一方平台 | 南京江北平台
版权所有 ©2016-2023 翼健(上海)信息科技有限公司 沪ICP备16013332号-3 沪公网安备 31010502003244号
版权所有 ©2016-2023 翼健(上海)信息科技有限公司
法律公告|隐私保护沪ICP备16013332号
沪公网安备 31010502003244号