阅读设置
第291章 冬瓜 (1/3)
etl是企业数据仓库构建过程中的一个核心步骤y我们可以借助于etl
工具来高效地完成数据抽取转换和加载工作之所以需要etl工具y
主要有以下几个原因x
?
1?当数据来自不同的物理主机y这时候如果使用sql语句去处理的
话y就显得比较吃力且开销也更大]
?
2?数据来源可以是各种不同的数据库或者文件y这时候需要先把它
们整理成统一的格式后才可以进行数据的处理y这一过程用代码实现
显然有些麻烦]
?
3?在数据库中我们当然可以使用存储过程去处理数据y但是y处理
海量数据的时候y存储过程显然比较吃力y而且会占用较多数据库的
资源y这可能会导致数据库资源不足y进而影响数据库的性能。
。
在选择etl工具时主要考虑如下因素x
?对平台的支持程度]
?抽取和装载的性能是不是较高y且对业务系统的性能影响大不
大,高不高]。
?对数据源的支持程度]。
?是否具有良好的集成性和开放性]。
?数据转换和加工的功能。
?是否具有管理和调度的功能。
cdc解决方案包括变化捕捉代理变化数据服务和变化分发机制三个
组成部分
?
1?变化捕捉代理变化捕捉代理是一个软件组件y它负责确定和捕
捉发生在操作型数据存储源系统中的数据变化可以对变化捕捉代理
进行专门优化y使它适用于特定的源系统y比如使用数据库触发器]
也可以使用通用的方法y比如数据日志比较。
变化数据服务变化数据服务为变化数据捕捉的成功实现提供了
一系列重要的功能y包括过滤排序附加数据生命周期管理和审
计等表6-4给出了每个功能的解释。
变化分发机制变化分发机制负责把变化分发到变化的消费者?通
常是etl程序?那里变化分发机制可以支持一个或多个消费者y并且提
供了灵活的数据分发方式y包括推(push)或拉(pull)的方式pull方式需要
消费者周期性地发送请求y通常采用标准接口实现y比如odbc或jdbc
push方式需要消费者一直监听和等待变化的发生y一旦捕捉到变化y就立
刻转移变化的数据y通常采用消息中间件来实现变化分发机制的另一个
重要功能就是提供动态返回和请求旧的变化的能力y从而满足重复处理和
恢复处理等任务。
变化数据捕捉技术有两个典型的应用场景x面向批处理的cdc
其他最近更新
- 《公子风流世无双》作者:天鬼山的艾晴
- 《这个杀手是赘婿》作者:雨夜徒步
- 《观影:给诸天万界一点点崩铁震撼》作者:沐子休
- 《农家有蓁宝》作者:冰棠要吃松子
- 《快穿之大佬来了,渣渣要倒霉了》作者:微生青烟
- 《四合院:从民国三十年开始!》作者:心雨未霁
- 《四合院:我当兵回来了》作者:搁浅时光
- 《综影视:我不是提线木偶》作者:珈蓝锦年1
- 《小马宝莉之荒原影魔勇闯小马利亚》作者:MYLIMIT
- 《【水官解厄】月麟》作者:月下丝竹
- 《穿越异世之修仙》作者:寂静无诲
- 《斩神,笙笙来也》作者:久啾咪
- 《逆天神鼎》作者:夜郎不大
- 《婚不可待:高冷凤少也折腰》作者:跳楼的可爱多
- 《重生60饥荒年孤女是异能女王》作者:樱挑
- 《娇美人揣崽去逼婚,震惊家属院!》作者:竹苑青青