Informatica将无服务器计算引入至数据集成云之中

Informatica将无服务器计算引入至数据集成云之中

 

作者:Tony Baer

Ovum 大数据研究负责人、专栏作者,原文发表于ZDNET

 

 

Informatica春季产品发布会的亮点在于推出了无服务器计算。另外,新版本还增添了更多采用机器学习技术的服务,以及使用图形计算来帮助企业构建客户主数据的单一视图。

 

 

 

无服务器计算成春季产品发布会最大亮点

 

Informatica在2017年抓住微服务(microservice)的契机,推出了基于微服务架构的第二代智能云服务产品Informatica Intelligent Cloud Services。在最近的春季产品发布会上,Informatica又抓住了无服务器(Serverless)这个热门技术。这只是本次发布增添的众多新特征之一,他们为管理数据管道和集成流处理推出了多个新功能。

 

Informatica将无服务器计算引入至数据集成云之中

 

无服务器计算(Serverless computing)非常适合数据接入和集成流程,因为它们通常都是分批运行,依靠各种不同的数据源,对资源消耗的变动性很大。无服务器的指导思想是无需提供 “以防万一”能力来处理峰值,而是通过系统基于流量自动调节配置。新的无服务器选项可以实现自动扩展,并且嵌入了高可用性和恢复能力。对于那些可预见的长期工作负载,客户仍然可以利用基于服务器的选项进行处理。

 

尽管无服务器架构通过为系统自动配置资源简化了用户的工作,但它的不利方面是成本不可预测。为了解决这个问题,Informatica在其新推出的无服务器选项中提供了一个计算工具,它采用机器学习技术来剖析新的工作负载,根据客户是优先考虑性能(并行处理)还是成本(仔细检查单一节点)来给出成本估算。

 

凭借无服务器计算,Informatica正在云服务方面抢占先机,使无服务器架构成为ETL和数据管道中多个集成产品的标配。

 

应用机器学习技术助力数据管道合理化

 

本次发布会上,Informatica还发布了一个重要的新功能:应用机器学习技术帮助企业实现数据管道合理化。基于云的少代码/无代码工具让构建数据管道变得非常简单,所以客户能够轻易地构建复杂的数据管道。Informatica的新工具可以对已有数据管道进行自动学习,同时扫描数据源、运行和目标,以识别哪些管道使用相似的转换模式,并指导用户建立可配置和复用的模板,使它们更易于配置和维护。

 

在接入数据流方面,Informatica增添了一种可扫描Kafka仓库的新能力来追踪数据沿袭,就如同它之前对数据库和文件源所做的一样。在进行数据准备时,Informatica的云服务可以自动推荐连接。适用于Informatica云ETL服务的视觉集成设计器借鉴了这个连接推荐功能,能够根据扫描到的源和目标推荐转换操作。

 

更多创新功能一一面世

 

在本次发布的众多更新中,还包括为去年推出的云数据质量服务增添的重名剔除能力。尽管重名剔除对于Informatica并不新鲜,但以前只可在本地部署的版本使用,或者以自带许可证(BYOL)的方式在Amazon EC2或其他云基础设施服务上运行Informatica Data Quality。

 

这次还发布了Informatica Enterprise Data Catalog的增强功能:在菜单上为数据工程师、业务分析师和数据科学家提供了不同的视图选项,使得用户可以选择合适的元数据逻辑视图或物理视图。同时,该数据目录产品除了支持从常见的数据库源中爬取元数据,现在扩展至从 Microsoft Power BI、Qlik Sense、AWS Glue、Google Cloud、Snowflake 等云服务以及其他数据源中获取元数据。

 

本次春季发布会还展示了主数据管理的最新功能:利用基于图形的分级导航方式揭示客户主数据,提供了一种更直观的方法来展现示和揭示客户关系,以更好的管理整个数据价值链。

 

想了解更多相信信息,请关注Informatica数据管理(微信号:InformaticaChina)