🔧 Kafka Connect SMT: TimestampRouter Organize seus dados por tempo

Автор: Espetinho de Kafka

Загружено: 2025-09-14

Просмотров: 22

Описание: Inspirado e criado a partir da série do
Robin Moffatt - • 🎄 Twelve Days of SMT 🎄 - Day 1: InsertFiel...

https://github.com/mordp1/espetinhode...

🚀 Organize seus dados por tempo usando o TimestampRouter SMT no Kafka Connect!

Neste tutorial hands-on, será demonstrado como utilizar o TimestampRouter Single Message Transform (SMT) para criar roteamento e particionamento dinâmico de tópicos no Kafka, baseado em timestamp, facilitando a gestão e análise temporal dos dados.

🎯 O que você vai aprender:
✅ Inicialização do ambiente Docker com Kafka Connect e MySQL
✅ Uso do DatagenConnector para geração de mensagens de exemplo
✅ Consumo e análise de tópicos com kcat e Schema Registry
✅ Configuração do JdbcSinkConnector com TimestampRouter SMT
✅ Criação de tabelas dinâmicas no MySQL por data
✅ Consulta aos dados organizados por período

🕒 Por que usar o TimestampRouter SMT?
Organização temporal: Roteie automaticamente dados para tópicos com granularidade diária, mensal ou personalizada.

Gestão simplificada: Facilite retenção, limpeza e arquivamento de dados por períodos.

Compatibilidade com sinks: Refine nomes de tabelas, índices ou diretórios baseados na data, otimizando a integração com bancos, Elasticsearch e S3.

Configuração flexível: Customize formatos de timestamp e tópicos usando placeholders.

Simplicidade: Não é necessário alterar o código produtor — a transformação ocorre diretamente no pipeline de integração.

⚡ Transformação demonstrada:
Antes do TimestampRouter:

json
topic: "transactions"
Depois do TimestampRouter (formato diário):

json
topic: "transactions_2025-09-13"

📋 Stack tecnológica:
Apache Kafka & Kafka Connect
DatagenConnector & JdbcSinkConnector
MySQL Database
Docker & Docker Compose
kcat e Schema Registry

💡 Casos de uso práticos abordados:
SQL: Criação automática de tabelas particionadas por data
Elasticsearch: Índices dinâmicos baseados em período
S3/Data Lake: Separação de dados em pastas por ano/mês/dia
ETL: Facilite cargas incrementais por tempo

💼 Benefícios empresariais:

Melhor organização dos dados históricos
Facilidade em consultas e arquivamento
Escalabilidade em pipelines temporais

Apache Kafka Connect = https://kafka.apache.org/documentatio...
Confluet Hub = https://www.confluent.io/hub/

Instruções de como instalar o Kafka Connect em modo distribuído.
https://docs.confluent.io/platform/cu...

🏷️ Tags:
#KafkaConnect #TimestampRouter #SMT #DataEngineering #ApacheKafka #RoteamentoTemporal #DataPartitioning #JdbcConnector #Elasticsearch #S3 #DataLake #EventDriven #SingleMessageTransform #BigData
#KafkaConnect #DataSecurity #LGPD #GDPR #DataEngineering #Apache Kafka #DataMasking #DataPrivacy #Docker #MySQL #SingleMessageTransform #SMT #DataIntegration #Confluent #datagovernance #PipelinesDeDados #InstField #ETL #BigData #datapipelines

🔔 Se este conteúdo ajudou, deixe seu like e se inscreva para mais tutoriais de Apache Kafka!
👍 Se este conteúdo foi útil, deixe seu like e se inscreva no canal para mais tutoriais de engenharia de dados!
💬 Tem dúvidas? Deixe nos comentários que respondo pessoalmente!

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...

🔧 Kafka Connect SMT: TimestampRouter Organize seus dados por tempo

Доступные форматы для скачивания:

Скачать видео

Информация по загрузке:

Скачать аудио

Похожие видео