Quantcast
Channel: 数据仓库 » ETL
Browsing all 5 articles
Browse latest View live

Data Profiling

Data Profiling = 数据剖析 什么是Data Profiling? Wikipedia: “Data profiling is the process of examining the data available in an existing data source (e.g. a database or a file) and collecting statistics and...

View Article



DataStage Intro

PPT资料下载:http://ishare.iask.sina.com.cn/f/13462262.html 历史:2005年3月因IBM收购Ascential而成为WebSphere家族的一员(WebSphere DataStage);随后在2008年IBM将其重命名为InfoSphere DataStage 用途:知名ETL工具(Extraction – Transformation –...

View Article

DataStage,DataStage TX与WTX

关于DataStage,可参考之前的一篇DataStage Intro 仅补充参考wikipedia上的DataStage版本信息 Enterprise Edition(Parallel Edition): 支持并行处理体系结构,支持并行ETL job Server Edition: 沿袭自早期DataStage的版本命名,在早期DS中只有Server Job,后续才添加了Sequence Job等...

View Article

摘自书中的数据抽取技巧

Kimball的《Data Warehouse ETL toolkit》一书中提到的数据抽取技巧,也可以说是查询技巧 强制列索引:确保源系统在ETL的SQL where语句中的列都有索引,否则可能引起对整个生产数据库的全表扫描。 获取需要的数据:将查询优化,只获取那些需要的数据而非整个数据集 谨慎使用Distinct:效率非常低...

View Article

Informatica PowerCenter 8.6的下载与安装

关于下载: 主要参考资料:http://gerardnico.com/wiki/powercenter/installation_861 下载是从Oracle E-Delivery网站(https://edelivery.oracle.com/)上免费下载,这方面确实要赞一下Oracle,它的产品以及一些合作伙伴的产品都可以免费下载使用,当然不要违反它的规定,只用于演示与学习的话那就去用吧。...

View Article

Browsing all 5 articles
Browse latest View live




Latest Images

Vimeo 10.7.0 by Vimeo.com, Inc.

Vimeo 10.7.0 by Vimeo.com, Inc.

HANGAD

HANGAD

MAKAKAALAM

MAKAKAALAM

Doodle Jump 3.11.30 by Lima Sky LLC

Doodle Jump 3.11.30 by Lima Sky LLC