Quando se tem um dataset maior, as planilhas podem se tornar inviáveis para encontrar inconsistências. Nesses casos, uma boa maneira de encontrar um outlier é através da plotagem de gráficos. Ao fazer isso, o analista consegue identificar rapidamente que existe algo de diferente na amostragem.
Uma ótima forma de identificar Outliers é plotando um gráfico de BoxPlot dos valores.
A remoção dos cinco outliers inferiores gera um novo desvio padrão bem inferior, de 33,3 páginas, sendo o novo intervalo de confiança entre 27,5 a 42,2 páginas.
O limite de detecção de outliers é construído utilizando o intervalo interquartílico, dado pela distância entre o primeiro e o terceiro quartil. Sendo assim, os limites inferior e superior de detecção de outlier são dados por: Limite Inferior = Primeiro Quartil – 1,5 * (Terceiro Quartil – Primeiro Quartil)
outlier n. estranho sm. Ex. "ator", "menino", etc.
Para encontrar os outliers em um conjunto de dados, usamos as seguintes etapas:
Como saber se um ácido e volátil ou não?
Como funciona um revólver calibre 38?
Como deve ser feito o controle de entrada e saída de materiais eficiente?
Como saber se o texto está sendo narrado em primeira ou terceira pessoa?
Como utilizar hidrantes de incêndio?
O que é preciso para montar um hotelzinho infantil?
Como funciona o relé de falta de fase?
Como limpar jaqueta de couro sintético branco?
Como funcionam os escritórios?
Qual a diferença entre infecção de garganta viral e bacteriana?
O que é o Direct no Instagram?
Como saber se uma lente e da marca Crizal?
Quanto custa para mandar estampar uma camiseta?
Como funciona motor elétrico com escovas?
Como pesquisar palavras no PDF Foxit Reader?
Como identificar se uma joia é verdadeira?
Como funciona uma empresa de outdoor?