Como calcular uma matriz de correlação

Como calcular uma matriz de correlação

A correlação (r) é uma medida da relação linear entre duas variáveis. Por exemplo, o comprimento da perna e comprimento do tronco são altura altamente correlated- e peso são menos altamente correlacionados, e altura e comprimento do nome (em letras) não estão correlacionadas.


A correlação perfeita positiva: r = 1. (Quando um sobe o outro sobe)
Uma correlação negativa perfeita: r = -1 (Quando um sobe, o outro desce)
Nenhuma correlação: r = 0 (Não há uma relação linear)


Uma matriz de correlação é uma matriz de muitos correlações.

Coisas que você precisa

  • Computador com R, SAS ou algum outro pacote estatístico

Calculando uma matriz de correlação com R

  • Obter os dados. Se os dados estiverem em Excel, o método mais fácil é para salvá-lo como um arquivo .csv (No Excel 7, clique em "Arquivo", então "Salvar como," então "outros formatos." em seguida, em "Salvar como tipo," desloque-se para CSV (valores separados por vírgulas). Cada linha deve ter dados sobre um assunto, e cada coluna deve ser uma variável.



  • Leia os dados para R usando read.csv. Por exemplo, se os dados estiverem em "c: mydisk mydir data.csv" entrar
    meus dados lt; - read.csv ("C: /mydisk/mydir/data.csv").

  • Calcular a matriz usando cor correlação (). Por exemplo: cor (mydata). Ou, você pode armazenar a matriz de correlação como um objeto para uso posterior, usando: CORMAT lt; - cor (mydata).

Calculando uma matriz de correlação com a SAS

  • Obter os dados. SAS pode ler dados em vários formatos. Se você armazenar seus dados em Excel, tem um assunto em cada linha e uma variável em cada coluna

  • Leia os dados para o SAS. Você pode usar o assistente de importação para obter seus dados. Clique em "Arquivo," então "Importar dados," em seguida, escolher um tipo de dados usando o menu drop-down. Clique "Próximo" e navegue até os seus dados, em seguida, clique "Terminar."

  • Calcular a matriz de correlação. Se os seus dados é salvo no SAS como mydata, com variáveis ​​VAR1, VAR2 e Var3, em seguida, digite: PROC CORR dados = mydata- VAR var1 var2 var3- RUN;

dicas & avisos

  • Em ambos SAS e R, há opções para diferentes tipos de correlações (e, .G Pearson, Spearman).
  • Lembre-se que as correlações só encontra relações lineares. Se a relação entre duas correlações não é linear, correlações não são uma boa escolha.
  • Para obter mais ajuda com R, começar R, em seguida, digite? Cor.
  • Se a segunda referência abaixo (R Help) não funcionar, em seguida, começar R e digite? Cor.
De esta maneira? Compartilhar em redes sociais:

LiveInternet