Nesta postagem, falaremos como realizar a leitura de arquivos Excel no no IBM Datastage.
O que é Datastage?
É uma das ferramentas de ETL (Extract - Transform - Load) mais utilizadas no mercado, possui uma grande variedade de componente para realizar cada etapa do ETL.
Inicialmente foi desenvolvida pela Ascential Software e foi adquirida pela IBM em 2005.
Passo a Passo
1. Abra o Designer Client, e faça login no seu projeto:
2. Após o Datastage abrir, selecione o menu: File>New>Parallel Job>Ok:
3. Clique no Unstructured Data da Palette e arraste para o Canvas:
4. Clique no Peek da Palette e arraste para o Canvas:
5. Faça um link entre as stages:
6. Abra o Unstructured Data, clique em Configure:
7. Insira o path + nome do seu arquivo, especifique o intervalo (na planilha) em que os dados vão estar e clique em carregar e depois em OK:
Observação: Atualmente é suportado somente arquivos de extensões XLS e XLSX.
8. Compile (Salve e nomeie) e execute seu job:
9. Aguarde o Job finalizar: