上图来自 tapdata (一款优秀的数据集成系统),该图很明显的诠释了数据集成和数据管道的关系。
数据管道: 通过技术手段建立和数据源的通道,用于抽取和加载数据。数据管道中将定义数据的位置、内容、采集方式。
数据集成: 包含了数据管道,最核心的是处理引擎。处理引擎将协调数据管道,通过 Pipeline 方式把数据管道组织起来,对来源数据进行抽取、组合、转换,并加载到目标存储。
数据集成系统,看似简单,其实一点也不简单。目前Flink的生态比较全,有很多CDC Connector,基于 Flink 开发集成系统是个不错的选择。
页面更新:2024-05-20
本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828
© CopyRight 2020-2024 All Rights Reserved. Powered By 71396.com 闽ICP备11008920号-4
闽公网安备35020302034903号