Respuestas
Respuesta:
Explicación:
Las técnicas de regresión permiten hacer predicciones sobre los valores de cierta variable Y (dependiente), a partir de los de otra X (independiente), entre las que se intuye
que existe una relación. Para ilustrarlo retomemos los ejemplos mencionados al principio
del tema anterior. Si sobre un grupo de personas observamos los valores que toman las
variables
X ≡ Altura medida en cm
Y ≡ Altura medida en metros
es trivial observar que la relación que hay entre ambas es: Y = X
100 .
Obtener esta relación es menos evidente cuando lo que medimos sobre el mismo grupo
de personas es, por ejemplo,
X ≡ Altura medida en cm
Y ≡ Peso en kilos
La razón es que no es cierto que conocida la altura xi de un individuo, podamos
determinar de modo exacto su peso yi (dos personas que miden 1,70 m pueden tener
pesos de 60 y 65 kilos). Sin embargo, alguna relación entre ellas debe existir, pues parece
mucho más probable que un individuo de 2m pese más que otro que mida 1.20m. Es más,
nos puede parecer más o menos aproximado una relación entre ambas variables como la
siguiente
Y = X − 110 ± (error).
A la deducción, a partir de una serie de datos, de este tipo de relaciones entre variables, es lo que denominamos regresión.
1
Mediante las técnicas de regresión de una variable Y sobre una variable X, buscamos
una función que sea una buena aproximación de una nube de puntos (xi, yi), mediante
una curva. Para ello hemos de asegurarnos de que la diferencia entre los valores yi e yˆi
sea tan pequeña como sea posible.
El término que hemos denominado error debe ser tan pequeño como sea posible (ver
figura). El objetivo será buscar la función (también denominada modelo de regresión)
Yˆ = f (X) que minimice dicho error.
2
Bondad de un ajuste
Consideremos un conjunto de observaciones sobre n individuos de una población, en
los que se miden ciertas variables X e Y ,
X /→ x1, x2,...,xn
Y /→ y1, y2,...,yn
Estamos interesamos en hacer una regresión para determinar, de modo aproximado,
los valores de Y conocidos los de X. Así, debemos definir cierta variable Yˆ = f (X), que
debe tomar los valores
yˆ1 = f (x1),
yˆ2 = f (x2),
···
yˆn = f (xn),
3
de modo que:
y1 − yˆ1 ≈ 0,
y2 − yˆ2 ≈ 0,
···
yn − yˆn ≈ 0,
Ello se puede expresar definiendo una nueva variable E = Y − Yˆ que mida las diferencias
entre los auténticos valores de Y y los teóricos suministrados por la regresión,
e1 = y1 − yˆ1,
e2 = y2 − yˆ2,
···