Método de cálculo del coeficiente de correlación


El coeficiente de correlación simple es un índice de medida de la intensidad de la relación que existe entre dos variables. El coeficiente de correlación puede tomar valores comprendidos entre -1 y +1. Cuando es igual a 0, significa que no hay ningún tipo de vínculo entre ambas variables. Se utiliza generalmente para analizar variables cuantitativas.


Aspectos matemáticos:

El coeficiente de correlación simple es igual a la división entre la covarianza entre X e Y, y el producto de la desviación típica :

Calculer un coefficient de corrélation simple
Caso práctico:

En el caso de una muestra de tamaño « n »:

Calculer un coefficient de corrélation simple depuis un échantillon

r : es el estimador del coeficiente de correlación muestral.


Test de hipótesis:

Siguiendo la ley de Student, calcularemos el estadístico t que nos permitirá testear la hipótesis de nulidad o de no nulidad del coeficiente de correlación :

t = r / Sr

Test de student pour coefficient de corrélation

Rechazamos la hipótesis nula del coeficiente de correlación si:

Test de student


Análisis de varianza (ANOVA Analysis of the Variance)

El análisis de varianza (ANOVA) es un método que permite conocer la variación total de un conjunto de datos dentro de los factores de variación. El objetivo es comparar 3 o más medias de población separadas, con el fin de testear el efecto que pueden tener los factores de separación sobre las medias. Llamamos "error" a la variabilidad dentro de las muestras y "efecto" a la variabilidad entre las diferentes muestras.


Aspectos matemáticos

Tabla de análisis de varianza :

ANOVA de la tabla

1/ Cálculo de la varianza entre grupos :

Cálculo de la varianza entre los grupos

s²e = SCe / (t - 1)


2/ Cálculo de la varianza dentro de los grupos :

Cálculo de la varianza dentro de los grupos

s²i = SCi / (N - t)


3/ Cálculo de la varianza total :

Cálculo de la varianza total

SCt = SCe + SCi


4/ Test de Fisher :

El test de Fisher nos permite verificar si los datos provienen de la misma población y en consecuencia afirmar o negar que el tratamiento tiene efecto.

Para ello calcularemos el ratio F = s²e / s²i.

Si F es superior o igual al valor en tablas de Fisher para t-1 y N-1 grados de libertad, podemos deducir que el tratamiento no se debe al azar sino que hay una verdadera interacción sobre la población estudiada.