Como remover outliers no spss

Outliers são valores extremos que podem distorcer os resultados de uma análise estatística e criar conclusões imprecisas.

Outliers em análises estatísticas são valores extremos que não parecem se encaixar com a maioria de um conjunto de dados. Se não for removido, estes valores extremos podem ter um grande efeito sobre quaisquer conclusões que podem ser tiradas a partir dos dados em questão, porque pode distorcer os coeficientes de correlação e linhas de melhor ajuste na direção errada. SPSS é um de um número de programas de software de análise estatística que pode ser utilizada para interpretar um conjunto de dados e identificar e remover valores periféricas.

Anaylsis Exploratória de Dados

  • Clique em "Analisar". Selecione "Estatística Descritiva" seguido de "Explorar".

  • Arraste e solte as colunas que contêm os dados variáveis ​​dependentes na caixa chamada "Lista Dependente." Clique em "OK".

  • Remova os valores atípicos identificados pelo SPSS nas parcelas caule-e-folha ou gráficos de caixas, eliminando os pontos de dados individuais. Alternativamente, você pode configurar um filtro para excluir esses pontos de dados.

  • Selecione "Data" e depois em "casos selecionados" e clique em uma condição que tem de outliers que deseja excluir. Determinar um valor para esta condição que exclui apenas os outliers e nenhum dos pontos de dados não-periféricas.



  • Escolha "Se condição for satisfeita" na caixa "Select" e, em seguida, clique no botão "Se" logo abaixo. Digite a regra para excluir valores atípicos que você determinou na etapa anterior na caixa no canto superior direito. Por exemplo, se você estava excluindo medidas acima de 74,5 polegadas a partir da condição de "altura", você deve digitar "height < = 74.5." Click "Continue" and "OK" to activate the filter.

Análise de regressão

  • No menu "Analisar", selecione "regressão" e "Linear". Selecione as variáveis ​​dependentes e independentes que deseja analisar.

  • Clique em "Salvar" e selecione "Distância de Cook." Os valores calculados para a distância de Cook será guardado no arquivo de dados como variáveis ​​rotulados como "COO-1."

  • Executar um boxplot, selecionando "Gráficos", seguido por "Boxplot." Clique em "simples" e selecione "Resumos de variáveis ​​separadas." Enter "COO-1" na caixa chamada "caixas representam", e depois introduza um ID ou nome pelo qual a identificar os casos nos "Casos rótulo" caixa.

  • Ampliar o boxplot no arquivo de saída, clicando duas vezes nele. Tome nota dos casos que se encontram além das linhas pretas --- estes são os seus valores discrepantes. Você pode optar por remover todos os valores atípicos ou apenas os valores atípicos extremos, que são marcados por um asterisco (*).

  • Volte para o arquivo de dados e localizar os casos que precisam ser apagados. Trabalhar a partir de baixo para cima, realce o número na extrema esquerda, na coluna cinza, por isso a toda a linha é selecionada. Clique em "Editar" e selecione "Limpar". Repita este passo para cada outlier de ter identificado a partir do boxplot.

dicas avisos

  • Ao apagar casos na Seção 2, etapa 5, sempre trabalho a partir do fundo do arquivo de dados se movendo para cima, porque os números de identificação mudar quando você apagar um caso. Se você trabalha de cima para baixo, você vai acabar de apagar os casos erradas.
De esta maneira? Compartilhar em redes sociais:

LiveInternet