Informatica将无服务器计算引入至数据集成云之中

作者：Tony Baer

Ovum 大数据研究负责人、专栏作者，原文发表于ZDNET

Informatica春季产品发布会的亮点在于推出了无服务器计算。另外，新版本还增添了更多采用机器学习技术的服务，以及使用图形计算来帮助企业构建客户主数据的单一视图。

无服务器计算成春季产品发布会最大亮点

Informatica在2017年抓住微服务（microservice）的契机，推出了基于微服务架构的第二代智能云服务产品Informatica Intelligent Cloud Services。在最近的春季产品发布会上，Informatica又抓住了无服务器（Serverless）这个热门技术。这只是本次发布增添的众多新特征之一，他们为管理数据管道和集成流处理推出了多个新功能。

Informatica将无服务器计算引入至数据集成云之中

无服务器计算（Serverless computing）非常适合数据接入和集成流程，因为它们通常都是分批运行，依靠各种不同的数据源，对资源消耗的变动性很大。无服务器的指导思想是无需提供 “以防万一”能力来处理峰值，而是通过系统基于流量自动调节配置。新的无服务器选项可以实现自动扩展，并且嵌入了高可用性和恢复能力。对于那些可预见的长期工作负载，客户仍然可以利用基于服务器的选项进行处理。

尽管无服务器架构通过为系统自动配置资源简化了用户的工作，但它的不利方面是成本不可预测。为了解决这个问题，Informatica在其新推出的无服务器选项中提供了一个计算工具，它采用机器学习技术来剖析新的工作负载，根据客户是优先考虑性能（并行处理）还是成本（仔细检查单一节点）来给出成本估算。

凭借无服务器计算，Informatica正在云服务方面抢占先机，使无服务器架构成为ETL和数据管道中多个集成产品的标配。

应用机器学习技术助力数据管道合理化

本次发布会上，Informatica还发布了一个重要的新功能：应用机器学习技术帮助企业实现数据管道合理化。基于云的少代码/无代码工具让构建数据管道变得非常简单，所以客户能够轻易地构建复杂的数据管道。Informatica的新工具可以对已有数据管道进行自动学习，同时扫描数据源、运行和目标，以识别哪些管道使用相似的转换模式，并指导用户建立可配置和复用的模板，使它们更易于配置和维护。

在接入数据流方面，Informatica增添了一种可扫描Kafka仓库的新能力来追踪数据沿袭，就如同它之前对数据库和文件源所做的一样。在进行数据准备时，Informatica的云服务可以自动推荐连接。适用于Informatica云ETL服务的视觉集成设计器借鉴了这个连接推荐功能，能够根据扫描到的源和目标推荐转换操作。

更多创新功能一一面世

在本次发布的众多更新中，还包括为去年推出的云数据质量服务增添的重名剔除能力。尽管重名剔除对于Informatica并不新鲜，但以前只可在本地部署的版本使用，或者以自带许可证（BYOL）的方式在Amazon EC2或其他云基础设施服务上运行Informatica Data Quality。

这次还发布了Informatica Enterprise Data Catalog的增强功能：在菜单上为数据工程师、业务分析师和数据科学家提供了不同的视图选项，使得用户可以选择合适的元数据逻辑视图或物理视图。同时，该数据目录产品除了支持从常见的数据库源中爬取元数据，现在扩展至从 Microsoft Power BI、Qlik Sense、AWS Glue、Google Cloud、Snowflake 等云服务以及其他数据源中获取元数据。

本次春季发布会还展示了主数据管理的最新功能：利用基于图形的分级导航方式揭示客户主数据，提供了一种更直观的方法来展现示和揭示客户关系，以更好的管理整个数据价值链。

想了解更多相信信息，请关注Informatica数据管理（微信号：InformaticaChina）

Informatica将无服务器计算引入至数据集成云之中

相关推荐