Calculadora de Correlação e Regressão

Calculadora de Correlação e Regressão

Conteúdo

Conteúdo

Correlação de Pearson

O coeficiente de correlação de Pearson (r) mede a força e a direção da relação linear entre duas variáveis. Varia de -1 a +1, onde:

  • r = 1: Correlação positiva perfeita
  • r = -1: Correlação negativa perfeita
  • r = 0: Sem correlação linear
  • 0 < |r| < 0.3: Correlação fraca
  • 0.3 ≤ |r| < 0.7: Correlação moderada
  • |r| ≥ 0.7: Correlação forte

Regressão Linear

A regressão linear simples modela a relação entre duas variáveis através de uma linha reta. A equação tem a forma:

y = βx + α

Onde:
β (beta) = coeficiente angular (inclinação da reta)
α (alfa) = intercepto (onde a reta cruza o eixo y)

Coeficiente de Determinação (R²)

O R² é o quadrado do coeficiente de correlação de Pearson e indica a proporção da variância em y que é explicada por x.

  • R² = 1: O modelo explica 100% da variabilidade dos dados
  • R² = 0: O modelo não explica nada da variabilidade dos dados
  • R² = 0.5: O modelo explica 50% da variabilidade dos dados

Interpretação dos Resultados

  • Correlação Positiva: Quando uma variável aumenta, a outra tende a aumentar
  • Correlação Negativa: Quando uma variável aumenta, a outra tende a diminuir
  • Coeficiente Angular: Indica quanto y muda para cada unidade de mudança em x
  • Intercepto: Valor de y quando x = 0

FAQs

Qual a diferença entre correlação e causalidade?

Correlação indica apenas que duas variáveis variam juntas, mas não implica que uma causa a outra. Causalidade requer evidências adicionais e análise mais aprofundada do contexto.

Quando devo usar regressão linear?

A regressão linear é apropriada quando você quer prever uma variável contínua com base em outra variável e há uma relação aproximadamente linear entre elas. É importante verificar os pressupostos do modelo antes de aplicá-lo.

O que significa um R² baixo?

Um R² baixo indica que o modelo linear não explica bem a variabilidade dos dados. Isso pode acontecer porque a relação não é linear, há muita variabilidade nos dados, ou outras variáveis importantes não foram consideradas.

Quantos pontos de dados são necessários?

Para uma análise confiável, recomenda-se ter pelo menos 30 pares de observações. No entanto, a calculadora funcionará com um mínimo de 2 pontos, mas os resultados serão menos confiáveis com poucos dados.