-
Tópicos
- Linux para data engineers
- Git e fluxo de branches
- SQL avançado (window functions, CTEs)
- Modelagem de dados transacional e analítica
- Versionamento de código e de schema de dados
-
Tópicos
- ETL vs ELT
- Orquestração (Airflow, Dagster ou similar)
- Mensageria (Kafka, Pub/Sub, Kinesis)
- Boas práticas de versionamento de dados
- Estratégias de backfill e reprocessamento
- Monitoramento de SLA/SLO de pipelines
- Alertas para falhas e atrasos de jobs
-
Tópicos
- Arquivos colunares (Parquet, ORC)
- Formatos otimizados para lakes
- Processamento batch vs streaming
- Engines como Spark, Flink, Beam
- Particionamento e ordenação de dados
- Layouts de tabelas otimizados para leitura
-
Tópicos
- Data Lake e Data Warehouse
- Data Lakehouse
- Catálogo de dados e governança
- Padrões de arquitetura orientada a dados
- Domínios de dados e malha de dados (data mesh)
- Evolução incremental de arquitetura
- Integração com times de produto e analytics
-
Tópicos
- Testes de schema e qualidade de dados
- Data contracts entre times
- Detectando anomalias e quedas de volume
- Catálogo de datasets críticos
- Reprocessamento seguro em caso de falhas
-
Tópicos
- Serviços de ingestão e mensageria no provedor escolhido
- Serviços de armazenamento (objetos, data lake, warehouses)
- Serviços gerenciados de orquestração e processamento
- Integração com ferramentas de BI
- Boas práticas de custo e segurança em dados
Como usar esta trilha
Esta página não é um curso completo. Ela só organiza, em ordem, temas que fazem sentido estudar
se você quer se aprofundar nesse assunto.
- Use a sequência como um mapa de referência, não como uma obrigação rígida.
- Procure conteúdos (vídeos, artigos, livros, documentações) para cada tópico listado.
- Adapte, pule ou reordene módulos conforme sua experiência e contexto.