Como rejeitar valores extremos nos dados

Os dados recolhidos durante as experiências, pesquisas e outros procedimentos de coleta de informações é geralmente sujeita a uma certa quantidade de aleatoriedade. Em alguns casos, as medições ou respostas individuais pode parecer muito longe do esperado resultando estes são valores atípicos. Quando você se deparar com um outlier, você deve verificá-lo para determinar se você deve rejeitá-la inteiramente.

instruções

  1. Inspecione o outlier para ter certeza de que ele se encaixa qualitativamente com o resto dos dados. Por exemplo, se você perguntar a 20 pessoas para medir a largura de uma moeda de dez centavos, mas um deles realmente mede a largura do quarto, você pode ter um outlier nos dados. Você deve rejeitar este outlier, porque ele não se encaixa qualitativamente com o experimento.

  2. Use Q-teste de Dixon se você não rejeitar o outlier com base no critério no Passo 1. O Q-teste é uma medida quantitativa nas estatísticas do significado de um determinado valor em relação a um conjunto de dados.

  3. Determinar o nível de confiança para o Q-teste. Se você quer ser de 90 por cento de certeza de que o outlier deve ou não ser rejeitado, escolha um nível de confiança de 90 por cento.



  4. Encontre o valor Q crítica (Qcrit) usando uma tabela. Você precisa saber o número de valores no conjunto de dados (por exemplo, N) e o nível de confiança que você escolher no Passo 3.

  5. Organizar o conjunto de dados em ordem crescente. Assim, para cada valor no conjunto, X (i), organizar os dados para que X (1) lt; X (2) lt; ... lt; X (N - 1) lt; X (n).

  6. Calcule o valor Q experimental (Qexp) do outlier. Para valores aberrantes individuais, o outlier é ou X (1) ou X (N) no arranjo de dados a partir do Passo 5. Os respectivos valores de Q para estes dois casos são [X (2) - X (1)] / [X (N ) - X (1)] e [X (N) - X (N - 1)] / [X (N) - X (1)].

  7. Compare o valor Q experimental da Etapa 6 para o valor Q crítica a partir do Passo 4. Se Qexp é maior do que Qcrit, então você deve rejeitar o outlier. Se Qexp é inferior a Qcrit, então você deve manter o outlier nos dados. Sua aceitação ou rejeição do outlier tem um nível de confiança de acordo com o que você escolheu na etapa 3 (por exemplo, você é 90 por cento de certeza que você deve rejeitar o outlier).

dicas & avisos

  • níveis de confiança mais elevados levar a valores de Q superiores críticos. Como resultado, se você quiser ter mais certeza que você deve rejeitar uma outlier particular, que outlier deve ser mais obviamente fora de lugar em relação ao resto dos dados.
  • Q-teste de Dixon funciona melhor para pequenas amostras. amostras maiores podem exigir outros testes estatísticos.
  • Se você tiver vários valores extremos, você deve usar um teste de estatísticas diferente do que o Q-teste.
De esta maneira? Compartilhar em redes sociais:

LiveInternet