Validación de datos

Se crea en una lista que contiene el resumen del método DP2 para todos los años

for(i in tablas){
List_DP2 <- mget(paste0("ind_", tablas))
}

Orden de entrada de las variables

Se crea un data.frame de acuerdo al orden de importancia de las variables para todos los años
Dependiendo del proceso, el DP2 adoptará diferentes valores. Por lo tanto, es importante que el método de como resultado un orden de entrada único de los indicadores parciales.

Variables_sort <- NULL
for(i in 1:2){
Variables_sort[i] <- as.data.frame(lapply(List_DP2, function(x) get(paste0("ind_", tablas[i]))$variables_sort))
}

Variables_sort <- do.call(cbind.data.frame, Variables_sort)
colnames(Variables_sort) <- c("2010", "2020")
Variables sort
2010 2020
OVSREF OVSREF
ANALF OVPT
OVPT ANALF
OVSEE OVSEE
SBASC OVSDE
OVSDE SBASC
OVHAC OVHAC
OVSAE OVSAE

Coeficiente de correlación

El coeficiente de correlación es una medida que se utiliza para jerarquizar a los indicadores simples de acuerdo con el grado de correlación absoluta con respecto al indicador sintético resultante, es decir, ayuda a visualizar que variable tiene un mejor o peor apego con el fenómeno.

Se crea un data.frame de acuerdo a la correlación de cada variable con el indicador sintético (DP2) para todos los años

cor.coeff <- NULL
cor.coeff <- lapply(1:2, function(i) data.frame(rownames(get(paste0("ind_", tablas[i]))[["cor.coeff"]]),
                                                 get(paste0("ind_", tablas[i]))$cor.coeff))
cor.coeff <- do.call(cbind.data.frame, cor.coeff)
colnames(cor.coeff) <- c("Ind_2010", "2010", "Ind_2020", "2020")
Correlation Coefficient
Ind 2010 Ind 2020
ANALF 0.700 ANALF 0.705
SBASC 0.665 SBASC 0.633
OVSDE 0.627 OVSDE 0.648
OVSEE 0.685 OVSEE 0.665
OVSAE 0.566 OVSAE 0.549
OVPT 0.695 OVPT 0.748
OVHAC 0.600 OVHAC 0.591
OVSREF 0.817 OVSREF 0.818

Factor de corrector

El factor corrector, como se mencionó anteriormente, indica la proporción de información con la que contribuye el indicador simple al nuevo índice sintético, además, evita la duplicidad e incorpora información útil que retiene cada indicador simple.

Se crea un data.frame de acuerdo al factor corrector de cada indicador parcial para todos los años

correction_factors <- NULL
for(i in 1:2){
correction_factors[i] <- as.data.frame(lapply(List_DP2, function(x) get(paste0("ind_", tablas[i]))$correction_factors))
}
###Intetar de pegar el nombre de la columna 
correction_factors <- do.call(cbind.data.frame, c(Variables_sort, correction_factors)) %>%
                        subset(., select = c(1, 3, 2, 4))
colnames(correction_factors) <- c("Ind_2010", "2010", "Ind_2020", "2020")
Correction Factors
Ind 2010 Ind 2020
OVSREF 1.0000 OVSREF 1.0000
ANALF 0.7514 OVPT 0.6602
OVPT 0.7139 ANALF 0.7067
OVSEE 0.5638 OVSEE 0.6476
SBASC 0.6336 OVSDE 0.7063
OVSDE 0.7424 SBASC 0.6141
OVHAC 0.7118 OVHAC 0.7157
OVSAE 0.8195 OVSAE 0.8498

Coeficiente de Discriminación

El coeficiente de discriminación de Ivanovic mide el poder discriminante de la variable \(j\) en el conjunto de observaciones \(i\).

\[CD_{j}=\frac{2}{m\left(m-1\right)}\sum_{i,l>i}^{k_{j}}m_{ij}m_{lj}\left|\frac{x_{ij}-x_{lj}}{{\overline{X}}_{i}}\right|\]

donde:

\(\circ\:m_{ij}\): El número de observaciones de la variable \(x_{j}\)
\(\circ\:k_{j}\): El número de diferentes valores que toma \(x_{i}\) en el conjunto \(j\).

Esta medida está comprendida entre \([0, 2]\). Si una variable toma el mismo valor para todos los estados, el CD vale cero, indicando que posee un valor nulo de poder discriminante. Por el contrario, si una variable toma el valor teórico de máximo poder discriminante, el discriminante de la variable es total.

Se crea un data.frame de acuerdo al Coeficiente de discriminación (CD) de cada indicador parcial para todos los años

discrimination_coefficient <- NULL
discrimination_coefficient <- lapply(1:2, function(i) data.frame(names(get(paste0("ind_", tablas[i]))[["discrimination.coefficient"]]),
                                                                 get(paste0("ind_", tablas[i]))$discrimination.coefficient))

discrimination_coefficient <- do.call(cbind.data.frame, discrimination_coefficient)
colnames(discrimination_coefficient) <- c("Ind_2010", "2010", "Ind_2020", "2020")
Discrimination Coefficient
Ind 2010 Ind 2020
ANALF 0.879 ANALF 0.971
SBASC 0.297 SBASC 0.405
OVSDE 1.404 OVSDE 1.615
OVSEE 1.577 OVSEE 1.757
OVSAE 1.013 OVSAE 1.540
OVPT 1.260 OVPT 1.406
OVHAC 0.544 OVHAC 0.671
OVSREF 0.908 OVSREF 1.099

“Cantidad de Información Global de Ivanovic Pena Relativa Individual”

\[\alpha_{i}=\frac{CD_{i}\left(1-R^{2}_{i,i-1,...,1} \right)}{\sum_{i=1}^{n}CD_{i} \left(1-R^{2}_{i,i-1,...,1} \right)}\] Esta medida, comprendida entre 0 y 1, combina la información útil y el poder discriminante de cada indicador simple y mide la cantidad de información (combinada) relativa que aporta individualmente cada indicador simple, cuando entra de forma ordenada a formar parte del indicador sintético DP2. La suma de todos los valores de \(\alpha_{i}\) es la unidad. [Zarsosa 1996, págs 158-174]

alpha <- NULL
for(i in 1:2){
alpha[[i]] <- sapply(1:length(Indicadores), function(x)(get(paste0("ind_", tablas[i]))[["correction_factors"]][x] * get(paste0("ind_", tablas[i]))[["discrimination.coefficient"]][x]) /                                                         sum(get(paste0("ind_", tablas[i]))[["correction_factors"]] * get(paste0("ind_", tablas[i]))[["discrimination.coefficient"]]))
}
Cantidad de Información Global de Ivanovic Pena Relativa Individual
Ind 2010 Ind 2020
OVSREF 0.154 OVSREF 0.141
ANALF 0.039 OVPT 0.039
OVPT 0.176 ANALF 0.166
OVSEE 0.156 OVSEE 0.165
SBASC 0.113 OVSDE 0.158
OVSDE 0.164 SBASC 0.125
OVHAC 0.068 OVHAC 0.070
OVSAE 0.131 OVSAE 0.136