Quando se tem um dataset maior, as planilhas podem se tornar inviáveis para encontrar inconsistências. Nesses casos, uma boa maneira de encontrar um outlier é através da plotagem de gráficos. Ao fazer isso, o analista consegue identificar rapidamente que existe algo de diferente na amostragem.
Uma ótima forma de identificar Outliers é plotando um gráfico de BoxPlot dos valores.
A remoção dos cinco outliers inferiores gera um novo desvio padrão bem inferior, de 33,3 páginas, sendo o novo intervalo de confiança entre 27,5 a 42,2 páginas.
O limite de detecção de outliers é construído utilizando o intervalo interquartílico, dado pela distância entre o primeiro e o terceiro quartil. Sendo assim, os limites inferior e superior de detecção de outlier são dados por: Limite Inferior = Primeiro Quartil – 1,5 * (Terceiro Quartil – Primeiro Quartil)
outlier n. estranho sm. Ex. "ator", "menino", etc.
Para encontrar os outliers em um conjunto de dados, usamos as seguintes etapas:
Pode levar as cinzas para casa?
Quais as partes do intestino grosso?
O que fazer para deixar a coluna reta?
Quais são os fatores de qualidade da imagem?
Como identificar aneurisma abdominal?
Qual a diferença entre memória DDR3 e ddr3l?
O que acontece quando uma bactéria entra na corrente sanguínea?
Qual o tamanho ideal do Foliculo para FIV?
Como é dividida a herança entre esposa e filhos?
Qual o valor máximo de boleto para pagar no caixa eletrônico?
Quantas tartarugas morrem por dia?
O que o ketchup disse para a mostarda?
Em que EP Luffy luta contra Crocodile pela segunda vez?
Quantas carretas carrega um vagão de trem?