Como calcular o coeficiente de correlação de spearman

Calcula-se o coeficiente de correlação de Spearman

O coeficiente de correlação de Spearman é um número entre -1 e 1 que representa a força da relação entre duas variáveis ​​em um conjunto de dados. Um coeficiente de -1 indica que há uma relação inversa entre os dados perfeito. Um coeficiente de 1 indica que existe uma relação positiva entre os dados perfeito. Para calcular o coeficiente, é necessário um conjunto de dados com duas variáveis ​​para o qual você deseja testar o relacionamento. Por exemplo, você pode usar um conjunto de dados de 9 observações de "nível de escolaridade - renda média" para os homens em 2006:


1 - 22,710- 2 - 27,650- 3 - 37,030- 4 - 43,830- 5 - 47,070- 6 - 60,910- 7 - 75,430- 8 - 100.000 9 - 100.000 onde 1 = 9 º ano, 2 = 9 a 12, não graduation- 3 = alta escolaridade 4 = College, sem degree- 5 = do Associado, 6 = bacharelado, 7 = mestrado, 8 = grau Professional, 9 = Ph.D.

  • Organizar os dados em pares em uma tabela para cada linha tem um número de observação, variável independente - renda - e variável dependente - educação. Traça-se a variável independente sobre o eixo y e a variável dependente do eixo x. inspecionar visualmente o gráfico para ver se existe uma relação e você quiser continuar com o cálculo do coeficiente de correlação de Spearman.

  • Adicionar uma coluna na tabela de dados ao lado da variável independente chamada "Posto Independent" e uma coluna ao lado da variável dependente chamada "Posto dependente." Classificar as observações de variáveis ​​independentes de alto a baixo, dando um posto de "1" para a maior observação. Atribuir a classificação média de duas ou mais observações com o mesmo valor. Por exemplo, a maior variável independente é 100000 e verifica-se duas vezes em fileiras 1 e 2. Calcula-se a média (1 + 2 = 3/2 = 1,5) e atribuir a que ambas as observações. Concluir o mesmo processo para a variável dependente. Por exemplo, o nível de educação "9" é posto "1," "8" é posto "2" e assim por diante.

  • Adicionar mais duas colunas para a tabela rotulada "d" e "d ^ 2". Subtrair a variável de classificação independente da variável dependente classificação e colocar esse valor na coluna "d." O quadrado do valor na coluna "d" e colocar isso na coluna "d ^ 2." Somar todos os valores na "d ^ 2" coluna para obter um total- por exemplo, o total é de 7,5 no conjunto de dados de educação / renda.

  • Utilizar a fórmula de Spearman Rank para calcular o coeficiente. A fórmula é:

    (R) = 1 - (6 * soma (d ^ 2)) / (n ^ 3 - N)



    Onde "R" é o coeficiente, "sum (d ^ 2)" é o total do "d ^ 2" e coluna "n" é o número de observações. Por exemplo:

    R = 1 - (6 * 7.5) / (9 ^ 3-9)

    R = 1 - (45) / (729-9)

    R = 1-0,0625

    R = 0,935

  • Calcula-se a "graus de liberdade" subtraindo-2 a partir do número de observations- por exemplo, 9-2 = 7. Procure o coeficiente e graus de liberdade na tabela Posto significado do Spearman para interpretar o resultado. Por exemplo, R = 0,935 com 7 graus de liberdade significa que você pode ser de 99 por cento segura da relação positiva entre as duas variáveis. Estatisticamente, a probabilidade de os dados por acaso é de apenas 1 por cento.

De esta maneira? Compartilhar em redes sociais:

LiveInternet