Validación de datos

Se crea en una lista que contiene el resumen del método DP2 para todos los años

for(i in tablas){
List_DP2 <- mget(paste0("ind_", tablas))
}

Orden de entrada de las variables

Se crea un data.frame de acuerdo al orden de importancia de las variables para todos los años
Dependiendo del proceso, el DP2 adoptará diferentes valores. Por lo tanto, es importante que el método de como resultado un orden de entrada único de los indicadores parciales.

Variables_sort <- NULL
for(i in 1:2){
Variables_sort[i] <- as.data.frame(lapply(List_DP2, function(x) get(paste0("ind_", tablas[i]))$variables_sort))
}

Variables_sort <- do.call(cbind.data.frame, Variables_sort)
colnames(Variables_sort) <- c("2010", "2020")

2010	2020
Variables sort
OVSREF	OVSREF
ANALF	OVPT
OVPT	ANALF
OVSEE	OVSEE
SBASC	OVSDE
OVSDE	SBASC
OVHAC	OVHAC
OVSAE	OVSAE

Coeficiente de correlación

El coeficiente de correlación es una medida que se utiliza para jerarquizar a los indicadores simples de acuerdo con el grado de correlación absoluta con respecto al indicador sintético resultante, es decir, ayuda a visualizar que variable tiene un mejor o peor apego con el fenómeno.

Se crea un data.frame de acuerdo a la correlación de cada variable con el indicador sintético (DP2) para todos los años

cor.coeff <- NULL
cor.coeff <- lapply(1:2, function(i) data.frame(rownames(get(paste0("ind_", tablas[i]))[["cor.coeff"]]),
                                                 get(paste0("ind_", tablas[i]))$cor.coeff))
cor.coeff <- do.call(cbind.data.frame, cor.coeff)
colnames(cor.coeff) <- c("Ind_2010", "2010", "Ind_2020", "2020")

Ind	2010	Ind	2020
Correlation Coefficient
ANALF	0.700	ANALF	0.705
SBASC	0.665	SBASC	0.633
OVSDE	0.627	OVSDE	0.648
OVSEE	0.685	OVSEE	0.665
OVSAE	0.566	OVSAE	0.549
OVPT	0.695	OVPT	0.748
OVHAC	0.600	OVHAC	0.591
OVSREF	0.817	OVSREF	0.818

Factor de corrector

El factor corrector, como se mencionó anteriormente, indica la proporción de información con la que contribuye el indicador simple al nuevo índice sintético, además, evita la duplicidad e incorpora información útil que retiene cada indicador simple.

Se crea un data.frame de acuerdo al factor corrector de cada indicador parcial para todos los años

correction_factors <- NULL
for(i in 1:2){
correction_factors[i] <- as.data.frame(lapply(List_DP2, function(x) get(paste0("ind_", tablas[i]))$correction_factors))
}
###Intetar de pegar el nombre de la columna 
correction_factors <- do.call(cbind.data.frame, c(Variables_sort, correction_factors)) %>%
                        subset(., select = c(1, 3, 2, 4))
colnames(correction_factors) <- c("Ind_2010", "2010", "Ind_2020", "2020")

Ind	2010	Ind	2020
Correction Factors
OVSREF	1.0000	OVSREF	1.0000
ANALF	0.7514	OVPT	0.6602
OVPT	0.7139	ANALF	0.7067
OVSEE	0.5638	OVSEE	0.6476
SBASC	0.6336	OVSDE	0.7063
OVSDE	0.7424	SBASC	0.6141
OVHAC	0.7118	OVHAC	0.7157
OVSAE	0.8195	OVSAE	0.8498

Coeficiente de Discriminación

El coeficiente de discriminación de Ivanovic mide el poder discriminante de la variable \(j\) en el conjunto de observaciones \(i\).

\[CD_{j}=\frac{2}{m\left(m-1\right)}\sum_{i,l>i}^{k_{j}}m_{ij}m_{lj}\left|\frac{x_{ij}-x_{lj}}{{\overline{X}}_{i}}\right|\]

donde:

\(\circ\:m_{ij}\): El número de observaciones de la variable \(x_{j}\)
\(\circ\:k_{j}\): El número de diferentes valores que toma \(x_{i}\) en el conjunto \(j\).

Esta medida está comprendida entre \([0, 2]\). Si una variable toma el mismo valor para todos los estados, el CD vale cero, indicando que posee un valor nulo de poder discriminante. Por el contrario, si una variable toma el valor teórico de máximo poder discriminante, el discriminante de la variable es total.

Se crea un data.frame de acuerdo al Coeficiente de discriminación (CD) de cada indicador parcial para todos los años

discrimination_coefficient <- NULL
discrimination_coefficient <- lapply(1:2, function(i) data.frame(names(get(paste0("ind_", tablas[i]))[["discrimination.coefficient"]]),
                                                                 get(paste0("ind_", tablas[i]))$discrimination.coefficient))

discrimination_coefficient <- do.call(cbind.data.frame, discrimination_coefficient)
colnames(discrimination_coefficient) <- c("Ind_2010", "2010", "Ind_2020", "2020")

Ind	2010	Ind	2020
Discrimination Coefficient
ANALF	0.879	ANALF	0.971
SBASC	0.297	SBASC	0.405
OVSDE	1.404	OVSDE	1.615
OVSEE	1.577	OVSEE	1.757
OVSAE	1.013	OVSAE	1.540
OVPT	1.260	OVPT	1.406
OVHAC	0.544	OVHAC	0.671
OVSREF	0.908	OVSREF	1.099

“Cantidad de Información Global de Ivanovic Pena Relativa Individual”

\[\alpha_{i}=\frac{CD_{i}\left(1-R^{2}_{i,i-1,...,1} \right)}{\sum_{i=1}^{n}CD_{i} \left(1-R^{2}_{i,i-1,...,1} \right)}\] Esta medida, comprendida entre 0 y 1, combina la información útil y el poder discriminante de cada indicador simple y mide la cantidad de información (combinada) relativa que aporta individualmente cada indicador simple, cuando entra de forma ordenada a formar parte del indicador sintético DP2. La suma de todos los valores de \(\alpha_{i}\) es la unidad. [Zarsosa 1996, págs 158-174]

alpha <- NULL
for(i in 1:2){
alpha[[i]] <- sapply(1:length(Indicadores), function(x)(get(paste0("ind_", tablas[i]))[["correction_factors"]][x] * get(paste0("ind_", tablas[i]))[["discrimination.coefficient"]][x]) /                                                         sum(get(paste0("ind_", tablas[i]))[["correction_factors"]] * get(paste0("ind_", tablas[i]))[["discrimination.coefficient"]]))
}

Ind	2010	Ind	2020
Cantidad de Información Global de Ivanovic Pena Relativa Individual
OVSREF	0.154	OVSREF	0.141
ANALF	0.039	OVPT	0.039
OVPT	0.176	ANALF	0.166
OVSEE	0.156	OVSEE	0.165
SBASC	0.113	OVSDE	0.158
OVSDE	0.164	SBASC	0.125
OVHAC	0.068	OVHAC	0.070
OVSAE	0.131	OVSAE	0.136

Índice normalizado

Resumen