“re:Invent,中文可以理解为重塑,是亚马逊云科技一直以来坚持的‘精神内核’,将客户需求作为技术重塑的源泉,赋能各个行业的业务创新同样是亚马逊云科技追求的目标。” 亚马逊云科技大中华区产品部总经理陈晓建日前在re:Invent中国媒体沟通会上表示,今年是亚马逊云科技第11年举办re:Invent,来自全球的5万多客户和合作伙伴参加了在拉斯维加斯举办的线下盛会,超过30万人线上参会。
其中不乏宝马集团、拳头游戏、纳斯达克以及西门子等行业“翘楚”,同时,许多独角兽和初创企业也都在使用亚马逊云科技实现创新。Pitchbook的数据显示,全球有超过1千家独角兽,其中83%都在用亚马逊云科技;Cloud 100榜单上超过90%的初创企业都将他们的业务放在亚马逊云科技上运营。
那么,云是怎样帮助大家在当今不确定环境下保持探索的?亚马逊云科技CEO Adam Selipsky认为,通过思考和总结人类过去的探索方式,将为今天应对不确定性提供宝贵的经验和教训。“人类曾经探索过各种各样的环境,有些浩瀚无垠,有些深不可测,有些充满着极端的挑战,但有些也充满着无限可能。当我们使用正确的工具,人类就可以自信地去战胜各种环境的挑战,不断地发现新的可能性。”
如今,像星空一样广袤的数据“大爆炸”成为现实,分析师判断:未来5年所产生的数据是整个数字时代所产生数据的重量两倍还要多。如何去管理海量数据,挖掘数据的价值,对每个企业来说既是挑战,同样也蕴含无限的价值。
“虽然数据是整个应用程序业务逻辑的核心,但处理数据非常棘手,这也是亚马逊云科技一直致力于建设云原生的数据战略的原因。”陈晓建认为,亚马逊云科技希望提供工具,让客户在整个数据全生命周期从存储到最后的AI,每个环节都能帮助用户把数据利益最大化,通过提供完整全面的数据解决方案,帮助客户更安全、更高效的去挖掘数据价值。
也就是说,亚马逊云科技提供了一个端到端的数据战略,帮助客户从数据的摄入、存储、查询、分析,到可视化展现以及人工智能,在各个方面通过安全、合规的方式帮助客户实现数据的共享和输出。
在陈晓建看来,构建云原生的数据战略有三个关键因素:建立面向未来的云原生数据基础设施;实现高效、跨组织的数据一体化融合以及借助教育和工具,使数据普惠化。
其中,建立面向未来的云原生数据基础设施时需要注意的是:首先,面对不同类型的工作负载,提供合适的工具。从亚马逊云科技的统计数据看,前1,000 名亚马逊云科技客户中有94%使用超过我们的10项数据库和分析服务。
“亚马逊云科技一直致力于来构建专门构建的云原生服务,为了特定场景而定制化开发最合理的工具。”陈晓建透露,亚马逊云科技拥有完整的关系型数据库和专用数据库,为客户的分析负载提供最全面的服务:包括EMR的大数据分析、Amazon OpenSearch的交互式的日志分析等,同时提供了大量人工智能的工具支持深度学习框架可以更轻松建立AI/ML的Amazon SageMaker服务,具备内置机器学习功能的AI服务,例如Amazon Transcribe和Amazon Polly。
此外,亚马逊云科技不仅宣布推出适用于Apache Spark 的 Amazon Athena,让用户使用Athena来调用Spark,在短短一秒内即可开始在Apache Spark运行交互式数据分析任务,用户无需准备基础架构配置。同时,客户还只需为使用的资源付费。
还宣布了针对 Apache Spark 的新 Amazon Redshift 集成预览,通过这一功能,客户可以通过Amazon EMR 或者Amazon Glue这样的Spark引擎来消费Amazon Redshift中的数据。与现有的 Amazon Redshift-Spark连接器相比,这种集成使Spark引擎对Amazon Redshift的数据抽取速度提高了10倍。

除了发布新特性,亚马逊云科技也在持续优化性能,现在,客户在 Amazon EMR、Amazon Glue、Amazon SageMaker、Amazon Redshift和Amazon Athena 上运行经过优化的Spark runtime,可以获得比开源版本 Spark 快 3 倍的性能。

