Quando se tem um dataset maior, as planilhas podem se tornar inviáveis para encontrar inconsistências. Nesses casos, uma boa maneira de encontrar um outlier é através da plotagem de gráficos. Ao fazer isso, o analista consegue identificar rapidamente que existe algo de diferente na amostragem.
Uma ótima forma de identificar Outliers é plotando um gráfico de BoxPlot dos valores.
A remoção dos cinco outliers inferiores gera um novo desvio padrão bem inferior, de 33,3 páginas, sendo o novo intervalo de confiança entre 27,5 a 42,2 páginas.
O limite de detecção de outliers é construído utilizando o intervalo interquartílico, dado pela distância entre o primeiro e o terceiro quartil. Sendo assim, os limites inferior e superior de detecção de outlier são dados por: Limite Inferior = Primeiro Quartil – 1,5 * (Terceiro Quartil – Primeiro Quartil)
outlier n. estranho sm. Ex. "ator", "menino", etc.
Para encontrar os outliers em um conjunto de dados, usamos as seguintes etapas:
Como fazer um vídeo com fotos e vídeos no iPhone?
Como desejar feliz aniversário para uma amiga que mora longe?
Como fazer montagens de vídeos online?
Como fazer balanço de uma loja?
Como mudar o disquete para o pen drive?
Como se monta uma sequência de aula de step?
Como colocar um HD de um PC em outro?
Quando será depositado o lucro do FGTS?
Como montar uma barraquinha junina?
Como salvar vídeo no editor de vídeo?
Qual é a matéria prima do óleo de soja?
Que horas passar vitamina C no rosto?
Como transferir conta de água para outro nome Copasa?
Como calculamos a população relativa ou densidade demográfica de um local?
Como fazer o procedimento de oxigenoterapia?
Como acessar os arquivos do celular desligado?
Como montar uma bandeja de café da manhã para aniversariante?