Método de Distancias \(DP2\)

José Bernardo Pena Trapero: Problemas de la medición del bienestar y conceptos afines (1977)

Los métodos de distancias son enfoques utilizados para medir el bienestar o la calidad de vida de las personas a través de la comparación de diferentes dimensiones o indicadores. Estos métodos se basan en la idea de que el bienestar se puede evaluar considerando la distancia o diferencia entre los individuos en términos de ciertos atributos o variables relevantes.
La Distancia \(DP_{2}\), es un indicador sintético, definido por el profesor J. Bernardo Pena Trapero, basado en el concepto de distancia, construido, como su nombre indica para medir distancias entre unidades geográficas, o bien, también se puede aplicar a comparaciones tanto cronológicas como interespaciales.

Definición

Sean:

\(\:\:\circ\:r\), el número de municipios;
\(\:\:\circ\:n\), el número de variables;
\(\:\:\circ\:x_{ij}\), el valor de la variable j en la AGEB \(i\);
\(\:\:\circ\:\sigma_{j}\), La Desviación Típica de la variable \(j\);
\(\:\:\circ\:R^{2}_{i,i-1,...,1}\) el Coeficiente de Determinación en la Regresión de \(X_{i}\) sobre \(X_{i-1},X_{i-2},...,X_{1}\).

Se define la \(Distancia-P_{2}\) de la forma:

\[\begin{align} DP_{2}=\sum^{n}_{i=1}\frac{d_{i}}{\sigma_{i}}(1-R^{2}_{i,i-1,...,1})\:\:;\;\;con \:\:R^{2}_{1}=0 \end{align}\]

Donde:

\(\:\:\circ\:d_{i} = d_{i}(r,*) = |x_{ri}-x_{*i}|\) |: es la distancia de la j-ésima variable del municipio \(r\) con respecto a la base de referencia \(x_{*}=(x_{*1}, x_{*2},..., x_{*n})\). Tomando como punto de referencia el valor mínimo de la variable, siendo esta la peor situación teórica,

\(\:\:\circ\:\sigma_{i}\) : es la desviación estándar de la variable \(𝑗\),

\(\:\:\circ\:R^{2}_{i,i-1,...,1}\): es el coeficiente de determinación de la regresión del indicador parcial \(𝑗\) con respecto a los otros indicadores \((𝑗−1,𝑗−2,…,1)\). Esta expresión es parte de la varianza del indicador parcial \(I_{j}\) que se explica linealmente por el resto de los indicadores parciales,

\(\:\:\circ\:(1-R^{2}_{i,i-1,...,1})\)): es el factor corrector que evita la duplicidad, al eliminar la información parcial de los indicadores ya contenidos en los indicadores precedentes, y

\(\:\:\circ\:R^{2}_{1}=0\); porque la primera componente aporta toda la información y al no existir un componente previo su ponderación es la unidad.

El \(DP_{2}\) cumple con las siguientes propiedades: no negatividad, homogeneidad, conmutatividad, desigualdad triangular, existencia y determinación, monotonía, unicidad, transitividad, no duplicidad de información, invariancia al cambio de origen y/o de escala en las unidades y exhaustividad.

El orden de entrada de las variables

# Se multiplica por -1, debido a que son indicadores de carencia 
for(i in tablas){   
  assign(paste0("DP2_datos_", i), (-1 * get(paste0("tabla_", i))[11:21]))
}

Para asegurar las propiedades del indicador sintético, un aumento en los indicadores simples implica un aumento en la carencia de los servicios, lo que implicaría una disminución de la calidad de vida, por lo que se multiplica cada indicador por -1, de esta forma, un aumento en la variable supone una mejora en la calidad de vida.

Base de referencia

Se define al valor de referencia para cada uno de los indicadores parciales, con la finalidad de hacer comparaciones entre las diferentes unidades espaciales (AGBE’s). Siendo este el valor mínimo de cada indicador simple como referencia, representado como la “situación no deseada”. Como resultado, un valor alto implicaría una distancia alejada con respecto a una situación teórica “situación no deseada”. Por lo tanto \(d_{ij}\) mide la distancia entre el indicador parcial \(j\) en la entidad \(i\) y su valor de referencia.

Se toma como base de referencia el valor del mínimo del 2010 - 2020, ya que este tipo de cambio permite la comparabilidad en el tiempo.

#Base de referencia 2010 - 2020
for(i in tablas){
assign(paste0("minRV_", i), setNames(c(-100, # P6A14NAE
                                       -100, # SBASC
                                       -100, # PSDSS
                                       -100, # OVSDE
                                       -100, # OVSEE
                                       -100, # OVSAE
                                       -100, # OVPT
                                       -98.3739837398374, # OVHAC
                                       -100, # OVSREF
                                       -100, # OVSINT
                                       -100), # OVSCEL
                                     nm = c("P6A14NAE", "SBASC", "PSDSS" ,"OVSDE", "OVSEE", "OVSAE", "OVPT", "OVHAC", "OVSREF", "OVSINT", "OVSCEL")))
}

AÑO	P6A14NAE	SBASC	PSDSS	OVSDE	OVSEE	OVSAE	OVPT	OVHAC	OVSREF	OVSINT	OVSCEL
Base de referencia
2010 - 2020	−100.00	−100.00	−100.00	−100.00	−100.00	−100.00	−100.00	−98.37	−100.00	−100.00	−100.00

Método de Distancia \(DP_{2}\)

require(p2distance)
##Calculo del Método de Distancias DP2
for(i in tablas){
assign(paste0("ind_", i), p2distance(matriz = as.matrix(get(paste0("DP2_datos_", i))), 
                                      reference_vector = get(paste0("minRV_", i)), 
                                       iterations = 50))
}

Total de iteraciones

iteration <- lapply(1:2, function(x) get(paste0("ind_", tablas[x]))[["iteration"]])

AÑO	Iteraciones
Número de iteraciones
2010	3
2020	3

Se anexan los resultados a las bases de datos original

for(i in tablas){
assign(paste0("DP2_", i), cbind(get(paste0("tabla_", i)), get(paste0("ind_", i))[["p2distance"]]))
}

# Se cambian los nombres de las columnas 
for(i in 1:2){
  columns = get(paste0("DP2_", tablas[i]))
  colnames(columns) = c("CVE_AGEB", "ENT", "NOM_ENT", "MUN", "NOM_MUN", "LOC", "NOM_LOC", "AGEB", "POB_TOTAL", "AÑO",
                        "P6A14NAE", "SBASC", "PSDSS", "OVSDE", "OVSEE", "OVSAE", "OVPT", "OVHAC","OVSREF", "OVSINT", "OVSCEL",
                        paste0("IM_", tablas[i]))
  assign(paste0("DP2_", tablas[i]), columns)
  rm(columns)
}

Análisis de correlaciones

Método de estratificación