Esse repositório contém um projeto de limpeza e tratamento de dados de um arquivo .csv feito em SQL.
Durante a análise de dados, devemos garantir que os dados estejam 'limpos' antes de realizar qualquer análise. Dados 'sujos' podem levar a resultados pouco confiáveis ou enganosos. Para este projeto, segui alguns passos para higienizar e tratar essa tabela.
- Procurei e tratei dados duplicados.
- Removi espaços duplos e caracteres inválidos.
- Separei informações em colunas diferentes.
- Assegurei que os valores numéricos estavam lógicos.
- Procurei e removi outliers.
- Campos vazios foram convertidos para NULL.