Se usa el Coeficiente de correlación de Pearson (medida para el análisis de correlación lineal simple más utilizada).
- ρ (rho) es el coeficiente de Pearson a nivel poblacional (parámetro), en cambio “r” es un estimador de ρ
basado en la muestra de datos ósea a nivel muestral.
Se aplica si son 2 variables cuantitativas/numéricas y si en el diagrama de dispersión de puntos hay una relación
lineal.
Con esta medida vemos que tan fuerte están asociadas o relacionadas las 2 variables y en que sentido se encuentra
la relación lineal.
También se llama “Coeficiente de correlación producto-momento” y tiene la siguiente fórmula:
“r” tiene valores entre -1 ≤ r ≤ 1
• r cercano a 1: fuerte relación lineal positiva
• r cercano a -1: fuerte relación lineal negativa
• r ≈ 0: ausencia de relación lineal
OJO: Si las variables X y Y siguen la distribución normal y ρ = 0,
entonces son independientes.
“r” se basa en la medición de su covarianza (similar a la varianza) que es un número que refleja el grado de cómo
varían juntas dos variables diferentes. Sus valores van de un rango de - a + .
Las pruebas de hipótesis se hacen sobre (ρ), pero para calcular el estadístico de prueba T se hace sobre ( r) para ver si
es significativamente distinto de cero.
𝑛−2
(H₀): ρ = 0 (no hay relación) ------------------------- (H₁): ρ ≠ 0 (sí hay relación) ---------------- 𝑡 = 𝑟√ con gl = n-2
1−𝑟²
El cálculo del coeficiente de correlación de Pearson no requiere supuestos, ya que solo haces una operación
matemática directamente de los datos.
En cambio las pruebas de hipótesis para saber si “r” es estadísticamente más significativo y la estimación de los
intervalos de confianza (IC) para ρ, sí tienen ciertos supuestos para que las conclusiones sean válidas.
1. Las variables X e Y, más su relación conjunta deben seguir una distribución normal (bivariada).
2. Los datos son obtenidos de una muestra aleatoria representativa.
3. Las variables deben estar en escala de razón.
4. No debe haber valores atípicos. Estos disminuyen (mayormente) el valor de un coeficiente de correlación
pero también hay casos donde lo aumentan.
Pueden producir 3 efectos: ------------------------------ Por eso se identifican y se decide si excluirlos o no
- Cambiar la relación y afectar los supuestos
- No cambiar la relación y afectar los supuestos
- Crear una relación falsa y afectar los supuestos.