Conteúdo do curso
Módulo 2 – Primeiros Passos
Demonstração prática com uma base sintética Carregando e explorando a base de dados
Módulo 3 – Diagnóstico Inicial
Identificando problemas comuns em bases reais Técnicas de diagnóstico inicial e perfilamento de dados
Módulo 4 – Identificação e Visualização de Problemas
Detecção de dados nulos, duplicados e inconsistentes Visualizando problemas com gráficos e tabelas
Módulo 5 – Tratamento de Dados (Passo a Passo)
5.1 Análise detalhada de dados nulos 5.2 Tratamento de dados nulos 5.3 Análise e tratamento de outliers 5.4 Removendo duplicatas 5.5 Padronizando nomes 5.6 Limpando e validando emails 5.7 Validando CPFs 5.8 Formatando telefones 5.9 Padronizando datas 5.10 Limpando valores numéricos 5.11 Padronizando estados e cidades
Módulo 6 – Consolidando Resultados
Comparação da base antes e depois da limpeza Visualização das melhorias alcançadas
Módulo 7 – Exportação e Aplicações Práticas
Salvando a base de dados limpa Aplicações no mercado de trabalho e próximos passos
Análise de dados
  • Existe um ditado fundamental no mundo dos dados: Garbage In, Garbage Out (GIGO). Em português, significa: se você coloca lixo para dentro, vai obter lixo para fora.

    Em outras palavras, não importa quão sofisticada seja sua análise ou quão avançada seja a ferramenta utilizada. Se os dados de entrada estão errados, incompletos ou duplicados, o resultado será falho.

    📧 Exemplo prático: imagine que um cliente se cadastrou duas vezes, uma vez com o e-mail “joao@gmail.com” e outra com “joaosilva@gmail.com”. Se esses registros não forem tratados, a empresa pode achar que tem dois clientes diferentes e enviar campanhas duplicadas, desperdiçando dinheiro.