| Title:* | |||
| Colegio
de Ingenieros de Venezuela Sociedad
de Ingeniería de Tasación de Venezuela (SOITAVE) METODOS
ESTADISTICOS APLICADOS A LA VALUACION DE
BIENES INMUEBLES II PARTE:
Análisis de Variables Múltiples Ing. Roberto Piol
Puppio CIV 32.290 SOITAVE 260 I INTRODUCCION 1.0 En la práctica se observa que existe una relación entre dos o más variables, como por ejemplo la relación que existe entre el área de los terrenos y sus respectivos precios unitarios. 2.0 Lo ideal sería expresar esta relación mediante una expresión matemática, es decir hallar una ecuación que ligue las variables. Por lo tanto el problema reside en encontrar un modelo que se ajuste lo mejor posible a la muestra seleccionada. 3.0 Una vez encontrada la ecuación de la curva o modelo que más ajusta los datos obtenidos, se deberá calcular por algún modo una medida que indique la bondad del ajuste de la curva. 4.0 Sin embargo, la decisión del valor más representativo de una muestra de datos, está basada sobre la relación existente entre los valores que se conocen y los valores que se van a estimar, esto se conoce como “Estudio de Correlación”. 5.0 Se define como Regresión al estudio de la fuerza, consistencia o grado de asociación de la correlación de n variables independientes. El Análisis de Regresión determina la naturaleza de la correlación y permite realizar la correspondiente Predicción. II ANALISIS DE REGRESION SIMPLE 1.0 El problema de ajustar una curva a una serie de datos, consiste en primer término determinar la Familia de Curvas que mejor describe el fenómeno. Posteriormente realizada esta decisión se procederá a encontrar los parámetros de la curva correspondiente. 2.0 El Análisis de los Mínimos Cuadrados 2.1 En la siguiente gráfica se ha dibujado una curva (una línea recta en este caso) de una familia de curvas preseleccionadas y un grupo de datos. 2.2 Se han medido la diferencia entre la ordenada de cada punto y la función. 2.3 Una forma de seleccionar la curva que mejor representa el grupo de puntos, es elegir aquella que para la cuál sea menor el promedio de las diferencias de las ordenadas. Otra forma sería en hacer que tenga mínima la suma de las diferencias, tomadas en valor absoluto. 2.4 por lo tanto el Método de Ajuste de los Mínimos Cuadrados consiste en determinar los parámetros de una curva, de manera que la suma de los cuadrados de las diferencias mencionadas sea la menor posible.
3.0 LA RECTA DE REGRESION MINIMO CUADRATICA 3.1 El tipo mas sencillo de curva de aproximación en la línea recta cuya ecuación puede escribirse: Y = a + b*X 3.2 La recta de aproximación por mínimos cuadrados del conjunto de puntos (x1,y1), (x2,y2)...(xn,yn) tienen las ecuaciones normales siguientes:
3.3 Estas ecuaciones representan que la Suma del cuadrado de las desviaciones es mínima y se obtienen haciendo la primera derivada con respecto a A y la primera derivada con respecto a B igual a cero en la ecuación de la curva (recta) de mínimo cuadrado:
3.4 Resolviendo el sistema de ecuaciones anterior se despejan los parámetros A y B de donde se obtienen sus respectivos valores:
EJEMPLO: Se quieren actualizar una serie de valores (Precios Unitarios de Terrenos) en un período de tiempo de 18 meses a fin de calcular (predecir) cuál será el precio unitario (Bs/M2) en el futuro. Para eso se analizaron los libros de Registro del Municipio Autónomo correspondiente y se obtuvieron la siguiente serie de datos:
X: o sea la Variable Independiente, representa el tiempo transcurrido en meses desde la primera operación de compra venta hasta la más reciente (18 meses mas tarde). Y: o sea la Variable Dependiente, representa el precio unitario en Bs/M2 correspondiente a cada operación revisada.
N = 6 (222.50 * 685) - (53 * 2,577.50) a = ----------------------------------------------- = 12.15 (6 * 685) - (53)^2 (6 * 2,577.50) - (53 * 222.50) b = ------------------------------------------------ = 2.82 (6 * 685) - (53)^2 Por lo tanto la ecuación de Correlación de la línea mínimo cuadrática de mejor ajuste será: y = 12.17 + 2.82 * x Ahora se puede predecir cuál será el comportamiento de la Variable Dependiente y (Precio Unitario) en función de la variable independiente x (Tiempo). Si se desea saber cuál será el valor esperado a los 20 meses de haberse hecho la primera observación (o sea la fecha del avalúo), se obtendrá para X = 20 y = 12.17 + 2.82 (20) = 68.57 [Bs/M2] 4.0 LA CURVA DE REGRESION EXPONENCIAL a.1 La familia de rectas (y =a + b x) y las familias de curvas exponenciales (y = a * b^x), son las ecuaciones de correlación simple mas utilizadas en la práctica. 4.2 Sin embargo se verá más adelante, el estudio de los métodos computarizados para la obtención de la familia de curvas de mejor ajuste en otros familias modelos también aplicables. 4.3 En este caso para correlacionar la muestra de datos obtenidas se estudiará una Ecuación Exponencial cuya expresión es:
4.4 Resolviendo el sistema de sus ecuaciones normales se obtienen las siguientes expresiones para los coeficientes a y b:
EJEMPLO En un caso similar al ejemplo anterior; se han obtenido el registro de operaciones de compra-venta de terreno en los últimos 20 meses:
En este caso x (la Variable independiente) seguirá siendo el tiempo (MESES) ý y (la variable dependiente) el Precio Unitario (Bs/M2).
n = 8 (11.8205)*(1,334) - (90)*(148.4355) log A = -------------------------------------------------- = 0.9367 (8) *(1,334) - 90^2 (8)*(148.4355) - 90*(11.8205) log B =-------------------------------------------- = 0.0481 (8) *(1,334) - 90^2 PERO AUN FALTAN CALCULAR LOS ANTILOGARITMOS a = Antlg (0.9367) = 8.6437 b = Antlg (0.0481) = 1.1171 La ecuación de correlación será:
En este ejercicio no solo se podrá predecir el valor unitario del terreno a la fecha del avalúo, sino también se podrá interpolar para meses en que no han existido operaciones de compra-venta o cualquier mes seleccionado: Por ejemplo se podrá obtener el precio unitario para: a) Interpolar el valor unitario a los 12 meses después de la fecha de origen b) ídem para 17 meses c) Predecir el valor unitario a los 22 meses
5.0 EL COEFICIENTE DE DETERMINACION El Coeficiente de Determinación, mide la bondad del ajuste relativo de la curva de regresión. Indica la cantidad de variación en Y que se explica en la ecuación de regresión.
5.2 Desviación Total de Y Es la diferencia entre el valor observado (datos) y el promedio de los valores observados:
5.3 Desviación No Explicada Corresponde al Error o Residual y se define como la diferencia entre el valor observado y el valor calculado:
5.4 Desviación Explicada Corresponde a la diferencia entre el valor calculado y el valor promedio:
5.5 Relación entre los términos anteriores Se cumplirá que: Desviación Total = Desv. No Explicada + Desv. Explicada
5.6 Dentro de la Teoría de los Mínimos Cuadrados que estamos utilizando, considerando que se eleven al cuadrado cada una de las desviaciones y sumando todos los valores correspondientes a los N datos u observaciones, se obtienen los siguientes Estadísticos: a) SCT o Suma de Cuadrados Total
b) SCE o Suma del Cuadrado del Error
c) SCR o Suma del Cuadrado de la Regresión
5.7 De la misma manera anterior, se cumple la relación: SCT
= SCE + SCR 5.8 El Coeficiente de Determinación: Se define como coeficiente de determinación:
DESPEJANDO:
DONDE EL COEFICIENTE DE DETERMINACION TOMA VALORES COMPRENDIDOS EN EL INTERVALO: [0 , 1] 5.9 Interpretación del Coeficiente de Determinación: Un valor de R^2 = 0.75, debe interpretarse que el 75% de las variaciones de y (Muestra), son explicadas por las variables y número de datos utilizados para calcular el modelo. Se preferirá siempre el Modelo cuyo Coeficiente de Determinación sea lo más cercano a la unidad (1.00). 5.10 El Coeficiente de Correlación: Se define como Coeficiente de Correlación r como:
su interpretación es la misma que el Coeficiente de Determinación y sus valores estarán comprendidos en el intervalo: [ -1 , 1 ] EJEMPLO: Sean los siguientes datos correspondientes al ejemplo anterior:
ECUACION DE CORRELACION:
5.11 El Estadístico F (Test de Fischer) El estadístico F corresponde una prueba o hipótesis para rechazar o aceptar la predicción de la correlación y así como el Coeficiente de Determinación nos ayuda a decidir entre varias curvas de regresión, el estadístico F nos dirá si los datos y variables tomadas son significativas o no; y es la forma de validar la ecuación o modelo de correlación. Es precisamente el Estadístico F, quien indica la cantidad de datos o variables mínimas que se requieren para que la Regresión exista.
El Estadístico F, se compara con el valor de “F de prueba” (Fo), el cual se determina en la tabla que se anexa. El valor de F será grande, cuando la regresión es significativa y obligatoriamente deberá ser mayor que Fo para que el modelo sea válido. Si F es menor que Fo, deberán reestudiarse los datos ya que los datos y variables seleccionadas, no son suficientes o significativas para calcular un modelo de regresión que pueda predecir el comportamiento de la variable dependiente con relación a la independiente. Cálculo del Estadístico F:
DONDE: k = Nro. de variables independientes n = Nro. de observaciones EJEMPLO: En el ejemplo anterior, vamos a proceder a validar el modelo, el único dato faltante para calcula el Estadístico F, es SCE, sin embargo es fácilmente deducible partiendo de la relación: SCT = SCE + SCR SCT = 4,846.88 SCR = 4,226.52 SCE = SCT - SCR SCE = 620.36 k = 1 (NRO: DE VARIABLES INDEPENDIENTES) n = 8 (NRO: DE OBSERVACIONES)
EN LA TABLA ANEXA: k = 1 n - (k + 1) = 6 Fo = 5.99 (Para una Confianza del 95%) F > Fo POR LO TANTO SE VALIDA LA REGRESION PARA UNA CONFIANZA DEL 95% 6.0 MULTICOLINEALIDAD: La Matriz de Correlación El problema de Multicolinealidad se presenta cuando entre las Variables Independientes existen relaciones lineales entre algunas de ellas; es decir las Variables Independientes están relacionadas entre sí, unas dependen de las otras. Cuando se presenta el problema de multicolinealidad entre las variables independientes, el sistema de ecuaciones normales (que permitió obtener el valor de los coeficientes a, b, c..., n de la ecuación de regresión mínimo-cuadrática) no permite obtener una solución única para cada uno de los parámetros de la función |