Coeficiente de correlação

De duas variáveis, X e Y:

  • 𝜌_XY = Cov(X,Y) / (𝜎_X * 𝜎_Y)

Demonstra-se que -1 <= 𝜌_XY <= 1

E que os valores extremos (1 e -1) se obtém para a relação linear *Y= aX + b com a>0 ou a<0, respectivamente

Se 𝜌_XY = 0 as variáveis dizem-se descorrelacionadas

Independentes => descorrelacionadas

Exemplo

x
y
P(x,Y)

0

0

0.2

1

1

0.1

1

2

0.1

2

1

0.1

2

2

0.1

3

3

0.4

Soma

1,0

x
y
P(x,y)
xy P(x,Y)
x P(x)
y P(y)
x^2 P(x)

0

0

0.2

0

0

0

0

1

1

0.1

0.1

0.1

0.1

0.1

1

2

0.1

0.2

0.1

0.2

0.1

2

1

0.1

0.2

0.2

0.1

0.4

2

2

0.1

0.4

0.2

0.2

0.4

3

3

0.4

3.6

1.2

1.2

3.6

Soma

1.0

4.5

1.8

1.8

4.6

Exemplo cáculo de 𝜌_XY

  • Var(X) = E[X^2] - E[X]^2 = 4.6 - 3.24 = 1.36

  • Var(Y) = Var(X)

  • Cov(X,Y) = E[XY] - E[X] * E[Y] = 4.5 - 1.8 * 1.8 = 1.26

Finalmente:

𝜌_XY = Cov(X,Y) / (𝜎_X * 𝜎_Y) = 1.25 / (sqr(1.36) * sqr(1.36)) = 0.926

Last updated