ListGCSBucket

 

Olá, seja bem-vindo a mais uma aula do curso Desenvolvimento com Apache Nifi.

Nesta aula vamos falar sobre o processor ListGCSBucket.

Este processor recupera uma lista de objetos de um bucket do GCS. Para cada objeto listado, cria um FlowFile que representa o objeto para que possa ser buscado em conjunto com FetchGCSObject. Este Processador foi projetado para ser executado no Nó Primário apenas em um cluster. Se o nó primário for alterado, o novo nó primário continuará de onde o nó anterior parou sem duplicar todos os dados.

Abaixo temos uma lista com as suas propriedades:

Listing Strategy: Especifique como determinar entidades novas/atualizadas.


Entity Tracking State Cache: As entidades listadas são armazenadas no armazenamento em cache especificado para que este processador possa retomar a listagem na reinicialização do NiFi ou em caso de alteração do nó primário.


Entity Tracking Initial Listing Target: Especifique como a listagem inicial deve ser tratada. Usado pela estratégia 'Rastreamento de Entidades'.


Entity Tracking Time Window: Especifique por quanto tempo esse processador deve rastrear entidades já listadas.


Bucket: bucket do objeto.


Record Writer: Especifica o gravador de registros a ser usado para criar a listagem. Se não for especificado, um FlowFile será criado para cada entidade listada. Se o Gravador de Registro for especificado, todas as entidades serão gravadas em um único FlowFile em vez de adicionar atributos a FlowFiles individuais.


Project ID: ID do projeto do Google Cloud


GCP Credentials Provider Service: O serviço do controlador usado para obter as credenciais do Google Cloud Platform.


Number of retries: Quantas tentativas de repetição devem ser feitas antes do roteamento para o relacionamento de falha.


Proxy host: IP ou nome do host do proxy a ser usado.


Proxy port: Número da porta proxy


HTTP Proxy Username: Nome de usuário proxy HTTP


HTTP Proxy Password: Senha do proxy HTTP


Proxy Configuration Service: Especifica o serviço do controlador de configuração de proxy para solicitações de rede de proxy. Se definido, ele substitui as configurações de proxy configuradas por componente. Proxies suportados: HTTP + AuthN


Prefix: O prefixo usado para filtrar a lista de objetos. Na maioria dos casos, deve terminar com uma barra ('/').Suporta Expression Language: true (será avaliado usando apenas registro de variável)


Use Generations: Especifica se o GCS Generations deve ser usado, se aplicável. Se false, somente a versão mais recente de cada objeto será retornada.