🔧 Kafka Connect SMT: TimestampRouter Organize seus dados por tempo
Автор: Espetinho de Kafka
Загружено: 2025-09-14
Просмотров: 22
Описание:
Inspirado e criado a partir da série do
Robin Moffatt - • 🎄 Twelve Days of SMT 🎄 - Day 1: InsertFiel...
https://github.com/mordp1/espetinhode...
🚀 Organize seus dados por tempo usando o TimestampRouter SMT no Kafka Connect!
Neste tutorial hands-on, será demonstrado como utilizar o TimestampRouter Single Message Transform (SMT) para criar roteamento e particionamento dinâmico de tópicos no Kafka, baseado em timestamp, facilitando a gestão e análise temporal dos dados.
🎯 O que você vai aprender:
✅ Inicialização do ambiente Docker com Kafka Connect e MySQL
✅ Uso do DatagenConnector para geração de mensagens de exemplo
✅ Consumo e análise de tópicos com kcat e Schema Registry
✅ Configuração do JdbcSinkConnector com TimestampRouter SMT
✅ Criação de tabelas dinâmicas no MySQL por data
✅ Consulta aos dados organizados por período
🕒 Por que usar o TimestampRouter SMT?
Organização temporal: Roteie automaticamente dados para tópicos com granularidade diária, mensal ou personalizada.
Gestão simplificada: Facilite retenção, limpeza e arquivamento de dados por períodos.
Compatibilidade com sinks: Refine nomes de tabelas, índices ou diretórios baseados na data, otimizando a integração com bancos, Elasticsearch e S3.
Configuração flexível: Customize formatos de timestamp e tópicos usando placeholders.
Simplicidade: Não é necessário alterar o código produtor — a transformação ocorre diretamente no pipeline de integração.
⚡ Transformação demonstrada:
Antes do TimestampRouter:
json
topic: "transactions"
Depois do TimestampRouter (formato diário):
json
topic: "transactions_2025-09-13"
📋 Stack tecnológica:
Apache Kafka & Kafka Connect
DatagenConnector & JdbcSinkConnector
MySQL Database
Docker & Docker Compose
kcat e Schema Registry
💡 Casos de uso práticos abordados:
SQL: Criação automática de tabelas particionadas por data
Elasticsearch: Índices dinâmicos baseados em período
S3/Data Lake: Separação de dados em pastas por ano/mês/dia
ETL: Facilite cargas incrementais por tempo
💼 Benefícios empresariais:
Melhor organização dos dados históricos
Facilidade em consultas e arquivamento
Escalabilidade em pipelines temporais
Apache Kafka Connect = https://kafka.apache.org/documentatio...
Confluet Hub = https://www.confluent.io/hub/
Instruções de como instalar o Kafka Connect em modo distribuído.
https://docs.confluent.io/platform/cu...
🏷️ Tags:
#KafkaConnect #TimestampRouter #SMT #DataEngineering #ApacheKafka #RoteamentoTemporal #DataPartitioning #JdbcConnector #Elasticsearch #S3 #DataLake #EventDriven #SingleMessageTransform #BigData
#KafkaConnect #DataSecurity #LGPD #GDPR #DataEngineering #Apache Kafka #DataMasking #DataPrivacy #Docker #MySQL #SingleMessageTransform #SMT #DataIntegration #Confluent #datagovernance #PipelinesDeDados #InstField #ETL #BigData #datapipelines
🔔 Se este conteúdo ajudou, deixe seu like e se inscreva para mais tutoriais de Apache Kafka!
👍 Se este conteúdo foi útil, deixe seu like e se inscreva no canal para mais tutoriais de engenharia de dados!
💬 Tem dúvidas? Deixe nos comentários que respondo pessoalmente!
Повторяем попытку...
Доступные форматы для скачивания:
Скачать видео
-
Информация по загрузке: