Como criar um fluxo de dados no Amazon Data Streams


Nesta postagem, falaremos como criar um fluxo de dados no Amazon Data Streams.

O que é o Amazon Kinesis? 

"Colete, processe e analise facilmente streams de vídeo e dados em tempo real” - Amazon Web Services.  

O Amazon Kinesis é um é um serviço de nuvem da AWS que permite coletar, processar e a analisar em tempo real streaming de dados, muitos dizem que ele é uma alternativa ao Apache Kafka podendo ser facilmente integrado com Apache Nifi, Apache Spark e outros componentes da AWS.

Ele possui alguns componentes, são eles:

  • Kinesis Video Streams: Permite que dispositivos conectados a AWS façam de forma segura streaming de vídeos.
  • Kinesis Data Streams: Permite realizar a ingestão de dados em tempo real de forma continua, podendo a chegar a gigabytes por segundo. Por padrão seus dados são armazenados por 24 horas(podendo chegar até 7 dias), ou seja, você tem um período para consumir esses dados e diferentemente de ferramentas semelhantes o dado não é deletado após consumo, assim, é possível reprocessar os dados, desde que esteja dentro do período de armazenamento
  • Kinesis Data Firehose: Permite realizar quase em tempo real(tem latência mínima de 60 segundos) a carga de streaming de dados em datastores da AWS, como o Redshift, Splunk, ElasticSearch ou S3 por exemplo.
  • Kinesis Data Analytics: Permite realizar analises em streaming de dados utilizando a linguagem SQL ou o próprio Apache Flink.

Passo a Passo

1. O primeiro passo a fazer é o login em sua conta da AWS.

2. Na tela inicial, na opção de localizar serviços, procure por Kinesis:

3. Selecione Kinesis Data Streams e clique em Criar fluxo de dados:


4. Defina um nome para seu fluxo:

5. Defina o número de fragmentos em 5 e clique em Criar fluxo de dados:

Referências

  • Amazon Kinesis

https://aws.amazon.com/pt/kinesis/