Data Profiling
Data Profiling = 数据剖析 什么是Data Profiling? Wikipedia: “Data profiling is the process of examining the data available in an existing data source (e.g. a database or a file) and collecting statistics and...
View ArticleDataStage Intro
PPT资料下载:http://ishare.iask.sina.com.cn/f/13462262.html 历史:2005年3月因IBM收购Ascential而成为WebSphere家族的一员(WebSphere DataStage);随后在2008年IBM将其重命名为InfoSphere DataStage 用途:知名ETL工具(Extraction – Transformation –...
View ArticleDataStage,DataStage TX与WTX
关于DataStage,可参考之前的一篇DataStage Intro 仅补充参考wikipedia上的DataStage版本信息 Enterprise Edition(Parallel Edition): 支持并行处理体系结构,支持并行ETL job Server Edition: 沿袭自早期DataStage的版本命名,在早期DS中只有Server Job,后续才添加了Sequence Job等...
View Article摘自书中的数据抽取技巧
Kimball的《Data Warehouse ETL toolkit》一书中提到的数据抽取技巧,也可以说是查询技巧 强制列索引:确保源系统在ETL的SQL where语句中的列都有索引,否则可能引起对整个生产数据库的全表扫描。 获取需要的数据:将查询优化,只获取那些需要的数据而非整个数据集 谨慎使用Distinct:效率非常低...
View ArticleInformatica PowerCenter 8.6的下载与安装
关于下载: 主要参考资料:http://gerardnico.com/wiki/powercenter/installation_861 下载是从Oracle E-Delivery网站(https://edelivery.oracle.com/)上免费下载,这方面确实要赞一下Oracle,它的产品以及一些合作伙伴的产品都可以免费下载使用,当然不要违反它的规定,只用于演示与学习的话那就去用吧。...
View Article
More Pages to Explore .....