ETL负责将分布的、异构数据源中的数据如关系数据、平面数据文件等抽取到临时中间层后进行清洗、转换、集成,最后加载到数据仓库或数据集市中,成为联机分析处理、数据挖掘的基础。
如果数据转换的频率或者要求不高可以手动实现ETL的功能;反之,如果对数据转换的要求比较高的话,就需要专门的ETL工具.
其优点如下:
第一:简化了用户的操作。专用ETL通常通过图形化的配置方式,简单,灵活,使得用户无需过分关心数据库的各种内部细节,而专注于功能。 第二:支持各种数据源,特别是平面数据源。ETL除了支持所有常见的数据源,如Oracle,sqlserver,DB2,MysqL,Access,Vf等,还提供了对各种平面数据源,如txt,excel,csv,xml等的支持。 第三:支持更多的硬件和软件平台,软件平台如操作系统,支持windows,linux以及国产操作系统;同时支持各种硬件平台,如x86,龙芯等等 第四:功能更为强大,数据处理组件非常丰富,通用性更强,组件很容易复用 第五:提供灵活的定制规则,更好的控制数据质量 第六:提供强大的管理功能,如权限管理,日志管理
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。