Skip to content

harmatiuk/dbt-boticariocase

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

19 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Case

Para a execução deste teste, você pode utilizar as ferramentas que estiver mais familiarizado, seguindo apenas as seguintes premissas:

  1. Os dados necessariamente devem ser armazenados em tabelas de banco de dados (MySQL, PostgreSQL, BigQuery, MS SQL, Oracle etc) e não em arquivos ou planilhas;
  2. Você deve necessariamente utilizar as linguagens SQL e Python nos processos de carga, consulta e transformação dos dados;
  3. Utilizar uma ferramenta que lhe permita criar os processos de ETL ou DAG’s para ingestão e transformação de dados;
  4. Você deve implementar um controle de versionamento para seus códigos

Solução

Resumo

Para realizar a ingestão na camada landing, foi utilizado scripts python (excel_to_gbq). Nas demais camadas (raw, trusted e refnied) foi utilizado o framework DBT (data build tool) para criar os processos de transformação. Optei por essa ferramenta pela facilidade em se criar pipelines de dados de ponta a ponta, sempre visando as boas práticas de Engenharia de software (versionamento de código, DRY (Don't repeat yourself), linhagem de dados) e por orquestrar todo o modelo de dados automaticamente (cuidando das dependências).

Desenho da arquitetura

AAAAA

Linhagem de dados

image

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Contributors 2

  •  
  •