Title:*
 

 

Colegio de Ingenieros de Venezuela

 

Sociedad de Ingeniería de Tasación de Venezuela

(SOITAVE)

 

 

 

 

 

 

 

 

 

 

METODOS ESTADISTICOS

APLICADOS A LA

VALUACION DE BIENES INMUEBLES

 

 

 

II PARTE: Análisis de Variables Múltiples

 

 

 

 

 

 

 

 

Ing. Roberto Piol Puppio

CIV 32.290

SOITAVE 260

 


 

I INTRODUCCION

 

1.0     En la  práctica se observa que  existe una relación entre  dos o más variables, como por ejemplo la relación  que existe entre el área de los terrenos y sus respectivos precios unitarios.

 

 

2.0     Lo  ideal  sería  expresar esta  relación  mediante  una  expresión matemática, es decir  hallar una ecuación que ligue  las variables.  Por lo tanto  el problema  reside en  encontrar un modelo  que se  ajuste lo mejor posible a la muestra seleccionada.

 

 

3.0     Una vez encontrada  la ecuación de la curva o  modelo que más ajusta los datos  obtenidos, se deberá calcular  por algún modo una  medida que indique la bondad del ajuste de la curva.

 

 

4.0     Sin embargo, la decisión del valor más representativo de una muestra de datos, está basada sobre la  relación existente entre los valores que se conocen  y los  valores que  se van  a estimar,  esto se  conoce como “Estudio de Correlación”.

 

 

5.0     Se  define como Regresión al estudio  de la fuerza,  consistencia o grado de asociación de la correlación de n variables independientes.  El Análisis  de  Regresión determina  la  naturaleza  de la  correlación  y permite realizar la correspondiente Predicción.

 

 

II ANALISIS DE REGRESION SIMPLE

 

1.0     El problema de  ajustar una curva a una serie  de datos, consiste en primer término  determinar la  Familia de Curvas  que mejor  describe el fenómeno. Posteriormente  realizada  esta   decisión  se  procederá  a encontrar los parámetros de la curva correspondiente.

 

 


2.0     El Análisis de los Mínimos Cuadrados

 

2.1     En  la siguiente gráfica se  ha dibujado una curva  (una línea recta en este  caso) de una familia  de curvas preseleccionadas y  un grupo de datos.

2.2     Se  han medido la  diferencia entre la ordenada  de cada punto  y la función.

2.3     Una forma  de seleccionar la curva que mejor  representa el grupo de puntos, es elegir aquella que para la  cuál sea menor el promedio de las diferencias  de las  ordenadas.  Otra  forma  sería en  hacer que  tenga mínima la suma de las diferencias, tomadas en valor absoluto.

2.4     por lo  tanto el Método de Ajuste de  los Mínimos Cuadrados consiste en determinar los parámetros de una curva,  de manera que la suma de los cuadrados de las diferencias mencionadas sea la menor posible.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 



3.0     LA RECTA DE REGRESION MINIMO CUADRATICA

 

3.1     El tipo mas sencillo de curva de aproximación en la línea recta cuya ecuación puede escribirse:

 

 

Y = a + b*X

 

 

3.2     La recta  de aproximación  por  mínimos cuadrados  del conjunto  de puntos  (x1,y1),   (x2,y2)...(xn,yn)  tienen  las   ecuaciones  normales siguientes:

 

 

 

 

3.3     Estas  ecuaciones representan  que  la Suma  del cuadrado  de  las desviaciones es  mínima y se  obtienen haciendo la primera  derivada con respecto a A y  la primera derivada con respecto a B igual  a cero en la ecuación de la curva (recta) de mínimo cuadrado:

 

 

 

 

 

 

 

 

3.4     Resolviendo  el sistema  de  ecuaciones  anterior se  despejan  los parámetros A y B de donde se obtienen sus respectivos valores:

 

 

 

 

 

 

 

EJEMPLO:

 

Se quieren  actualizar una serie  de valores (Precios  Unitarios de Terrenos)  en  un período  de  tiempo  de 18  meses  a  fin de  calcular (predecir) cuál será el precio unitario  (Bs/M2) en el futuro.  Para eso se   analizaron  los   libros   de  Registro   del  Municipio   Autónomo correspondiente y se obtuvieron la siguiente serie de datos:

 

 

 

 

X: o sea la Variable Independiente, representa el tiempo transcurrido en meses desde la  primera operación de compra venta hasta  la más reciente (18 meses mas tarde).

 

 

Y: o sea la Variable Dependiente, representa el precio unitario en Bs/M2 correspondiente a cada operación revisada.

 

 

 

 

 

 

 

 

 

 

N = 6

 

 

                                         (222.50 * 685) - (53 * 2,577.50)

a = ----------------------------------------------- = 12.15

(6 * 685) - (53)^2

 

 

 

 

                                            (6 * 2,577.50) - (53 * 222.50)

b = ------------------------------------------------ = 2.82

(6 * 685) - (53)^2

 

 

Por  lo  tanto  la  ecuación  de Correlación  de  la  línea  mínimo cuadrática de mejor ajuste será:

 

 

y = 12.17 + 2.82 * x

 

 

Ahora se puede predecir cuál  será el comportamiento de la Variable Dependiente  y  (Precio Unitario)  en  función  de  la  variable  independiente  x (Tiempo).

 

Si se  desea saber cuál  será el valor esperado  a los 20  meses de haberse  hecho la  primera observación  (o sea  la fecha  del avalúo),  se obtendrá para X = 20

 

 

y = 12.17 + 2.82 (20) = 68.57 [Bs/M2]

 

4.0     LA CURVA DE REGRESION EXPONENCIAL

 

a.1           La familia de rectas (y =a + b x) y las familias de curvas exponenciales

(y = a * b^x), son las ecuaciones de correlación simple mas utilizadas en la práctica.

 

 

4.2     Sin  embargo se  verá  más  adelante,  el  estudio de  los  métodos computarizados para la obtención de la familia de curvas de mejor ajuste en otros familias modelos también aplicables.

 

 

4.3     En  este caso para  correlacionar la  muestra de datos  obtenidas se estudiará una Ecuación Exponencial cuya expresión es:

 

 

 

 

4.4     Resolviendo  el sistema de  sus ecuaciones normales se  obtienen las siguientes expresiones para los coeficientes a y b:

 

 

 

 

 

 


 

EJEMPLO

 

En un caso similar al ejemplo  anterior; se han obtenido el registro de operaciones de compra-venta de terreno en los últimos 20 meses:

 

 

 

 

En este caso x (la Variable independiente) seguirá siendo el tiempo (MESES) ý y (la variable dependiente) el Precio Unitario (Bs/M2).

 

 

 

 

n = 8

 

 

 

(11.8205)*(1,334) - (90)*(148.4355)

log A = -------------------------------------------------- = 0.9367

(8) *(1,334) - 90^2

 

 

(8)*(148.4355) - 90*(11.8205)

log  B =-------------------------------------------- = 0.0481

(8) *(1,334) - 90^2

 

 

 

PERO AUN FALTAN CALCULAR LOS ANTILOGARITMOS

 

 

a = Antlg (0.9367) = 8.6437

 

 

b = Antlg (0.0481) = 1.1171

 

 

La ecuación de correlación será:

 

 

 

En  este ejercicio  no  solo se  podrá predecir  el  valor unitario  del terreno a  la fecha del  avalúo, sino  también se podrá  interpolar para meses en que no han existido operaciones de compra-venta o cualquier mes seleccionado:

Por ejemplo se podrá obtener el precio unitario para:

 

a)       Interpolar el  valor unitario a los  12 meses después de  la fecha de origen

b)       ídem para 17 meses

c)       Predecir el valor unitario a los 22 meses

 

 

 


 

5.0 EL COEFICIENTE DE DETERMINACION

 

El Coeficiente de Determinación,  mide la bondad del ajuste relativo de la curva de  regresión.  Indica la cantidad de variación  en Y que se explica en la ecuación de regresión.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 


5.2     Desviación Total de Y

 

Es la diferencia entre el valor  observado (datos) y el promedio de

los valores observados:

 

 

 


 

5.3     Desviación No Explicada

 

Corresponde  al Error  o Residual  y se  define como  la diferencia entre el valor observado y el valor calculado:

 

 

 

 

5.4     Desviación Explicada

 

Corresponde a  la diferencia  entre el valor  calculado y  el valor promedio:

 

 

 

 

5.5     Relación entre los términos anteriores

 

Se cumplirá que:

 

Desviación Total = Desv. No Explicada + Desv. Explicada

 

 

 

 

5.6     Dentro de la Teoría de los Mínimos Cuadrados que estamos utilizando, considerando que  se eleven al cuadrado  cada una de las  desviaciones y sumando   todos  los   valores  correspondientes   a  los   N  datos   u observaciones, se obtienen los siguientes Estadísticos:

 

 


 

a)       SCT o Suma de Cuadrados Total

 

 

 

b)       SCE o Suma del Cuadrado del Error

 

 

 

c)       SCR o Suma del Cuadrado de la Regresión

 

 

 

5.7     De la misma manera anterior, se cumple la relación:

 

 

SCT  =  SCE  +  SCR

 

 

5.8     El Coeficiente de Determinación:

 

Se define como coeficiente de determinación:

 

 

 

 

DESPEJANDO:

 

 

 

 

 

 

DONDE EL  COEFICIENTE DE DETERMINACION  TOMA VALORES COMPRENDIDOS  EN EL INTERVALO: [0 , 1]

 

 

5.9     Interpretación del Coeficiente de Determinación:

 

Un  valor  de R^2  =  0.75,  debe interpretarse  que  el  75% de  las variaciones de y (Muestra), son explicadas por las variables y número de datos utilizados para calcular el modelo.

 

 

Se preferirá siempre el Modelo cuyo Coeficiente de Determinación sea lo más cercano a la unidad (1.00).

 

 

5.10    El Coeficiente de Correlación:

 

Se define como Coeficiente de Correlación r como:

 

 

 

su interpretación es la misma que  el Coeficiente de Determinación y sus valores estarán comprendidos en el intervalo: [ -1 , 1 ]

 

 

EJEMPLO:

 

Sean los siguientes datos correspondientes al ejemplo anterior:

 

 

 

 

ECUACION DE CORRELACION:

 

 

 

 

 

 

 

 

 

 

 

 

5.11    El Estadístico F (Test de Fischer)

 

El estadístico F corresponde una prueba o hipótesis para rechazar o aceptar la  predicción de la  correlación y  así como el  Coeficiente de Determinación nos ayuda  a decidir entre varias curvas  de regresión, el estadístico F nos dirá si los datos y variables tomadas son significativas o no; y es la forma de validar la ecuación o modelo de correlación.

 

Es  precisamente el  Estadístico  F, quien  indica  la cantidad  de datos  o  variables mínimas  que  se  requieren  para que  la  Regresión exista.

 

El Estadístico F, se  compara con el valor de “F  de prueba” (Fo), el cual se determina en  la tabla que se anexa.

 

El valor  de F será grande, cuando la regresión es significativa y obligatoriamente deberá ser mayor que Fo para que el modelo sea válido.

 

Si F es menor que Fo, deberán reestudiarse los datos ya que los datos y variables seleccionadas, no son suficientes o significativas para calcular un  modelo de regresión que pueda predecir el comportamiento de la variable dependiente con relación a la independiente.

 

 

Cálculo del Estadístico F:

 

 

 

 

DONDE:

 

k = Nro. de variables independientes

n = Nro. de observaciones

 

 

EJEMPLO:

 

En el ejemplo anterior, vamos a proceder a validar el modelo, el único  dato  faltante para calcula el Estadístico F, es  SCE,  sin  embargo  es fácilmente  deducible partiendo de la relación:

 

SCT = SCE + SCR

SCT = 4,846.88

SCR = 4,226.52

SCE = SCT - SCR

SCE = 620.36

 

 

k = 1 (NRO: DE VARIABLES INDEPENDIENTES)

 

n = 8 (NRO: DE OBSERVACIONES)

 

 

 

EN LA TABLA ANEXA:

 

k = 1

 

n - (k + 1) = 6

 

Fo = 5.99  (Para una Confianza del 95%)

 

 

F > Fo POR LO TANTO SE VALIDA LA REGRESION PARA UNA CONFIANZA DEL 95%

 

 

6.0     MULTICOLINEALIDAD: La Matriz de Correlación

 

El  problema de  Multicolinealidad  se  presenta cuando  entre  las Variables Independientes existen relaciones lineales entre algunas de ellas; es decir las Variables Independientes están  relacionadas entre sí, unas dependen de las otras.

 

 

Cuando  se  presenta el  problema  de  multicolinealidad entre  las variables  independientes,  el  sistema   de  ecuaciones  normales  (que permitió  obtener el  valor de  los  coeficientes a,  b, c...,  n de  la ecuación  de  regresión  mínimo-cuadrática)  no  permite  obtener una solución  única  para cada  uno  de  los  parámetros  de la  función