ListFile

 

Olá, seja bem-vindo a mais uma aula do curso Desenvolvimento com Apache Nifi.

Nesta aula vamos falar sobre o processor ListFile.

Este Processor recupera uma lista de arquivos do sistema de arquivos local.

Para cada arquivo listado é gerado um FlowFile que representa o arquivo para que ele possa ser buscado em conjunto com o FetchFile.

Este processador foi projetado para executar no nó primário apenas em um cluster.

Se o nó primário for alterado, o novo Nó Primário continuará onde o nó anterior parou sem duplicar todos os dados.

Diferentemente do GetFile, esse processador não exclui nenhum dado do sistema de arquivos local.

Ao ser pesquisado, pode aparecer nas seguintes tags:

  • local
  • files
  • filesystem
  • ingest
  • ingress
  • get

Abaixo temos uma lista com as suas propriedades:

  • Input Directory : Representa O diretório de entrada do qual os arquivos serão extraídos. Suporta linguagem de expressão , é uma propriedade obrigatória, mas não existe um valor default nessa propriedade.
  • Recurse Subdirectories : Indica se os arquivos de subdiretórios do diretório devem ser listados , é uma propriedade obrigatória e o valor default dessa propriedade é: VERDADEIRO
  • Input Directory Location : Especifica onde o Diretório de Entrada está localizado. Isso é usado para determinar se o estado deve ser armazenado localmente ou no cluster, é uma propriedade obrigatória e o valor default dessa propriedade é: Local
  • File Filter : Somente os arquivos cujos nomes correspondem à expressão regular fornecida serão selecionados , é uma propriedade obrigatória e o valor default dessa propriedade é: [^\.].*
  • Path Filter : Quando Recurse Subdirectories for true, somente os subdiretórios cujo caminho corresponda à expressão regular fornecida serão verificados , por ser uma propriedade opcional não existe um valor default nessa propriedade.
  • Minimum File Age : A idade mínima que um arquivo deve ter para ser puxado; qualquer arquivo menor que este período de tempo (de acordo com a data da última modificação) será ignorado , é uma propriedade obrigatória e o valor default dessa propriedade é: 0 sec
  • Maximum File Age : A idade máxima que um arquivo deve ter para ser puxado; qualquer arquivo mais antigo que esta quantidade de tempo (de acordo com a data da última modificação) será ignorado , por ser uma propriedade opcional não existe um valor default nessa propriedade.
  • Minimum File Size : O tamanho mínimo que um arquivo deve ter para ser puxado , é uma propriedade obrigatória e o valor default dessa propriedade é: 0 B
  • Maximum File Size : O tamanho máximo que um arquivo pode ter para ser puxado , por ser uma propriedade opcional não existe um valor default nessa propriedade.
  • Ignore Hidden Files : Indica se os arquivos ocultos devem ou não ser ignorados , é uma propriedade obrigatória e o valor default dessa propriedade é: VERDADEIRO
  • Target System Timestamp Precision : Especifica a precisão do carimbo de data/hora no sistema de destino. Como esse processador usa o carimbo de data/hora das entidades para decidir quais devem ser listadas, é crucial usar a precisão do carimbo de data/hora correta.

Os relacionamentos permitidos para direcionar ou terminar um flowfile são:

  • success: Os arquivos que foram gravados com sucesso no diretório de saída são transferidos para este relacionamento.