4.2 Análisis multivariado
Considerando los avances presentados en la sección de análisis descriptivo, al aplicar el modelo de regresión se asume que tanto el valor esperado de Y -variable dependiente- como de la relación entre X e Y varían en el tiempo. Debido a que los datos se agrupan como datos agrupados de sección transversal -pooled cross sectional data- y basándonos en la evidencia del manual de Wooldridge (2013), no se aplicarán efectos fijos o efectos aleatorios. En este sentido, para el caso en que observaciones no se repiten en los diferentes años, se recomienda el método de Mínimos Cuadrados Ordinarios (MCO) agrupados -o en inglés ‘pooled OLS’-.
<- clm(pred_atribuciones ~ año_2009*(percep_inteligencia+percep_esfuerzos) + año_2019*(percep_inteligencia+percep_esfuerzos) + pref_responsabilidad + pref_educacion + pref_trabajo + sexo + ESS, data=proc_data) model1
Model 1 | |
---|---|
año_2009 | 0.68* |
(0.34) | |
percep_inteligencia | -0.03 |
(0.06) | |
percep_esfuerzos | -0.03 |
(0.06) | |
año_2019 | 0.88** |
(0.31) | |
pref_responsabilidad | 0.01 |
(0.05) | |
pref_educacion | -0.06 |
(0.04) | |
pref_trabajo | -0.03 |
(0.05) | |
sexo1 | 0.01 |
(0.06) | |
ESS | -0.03 |
(0.02) | |
año_2009:percep_inteligencia | 0.01 |
(0.09) | |
año_2009:percep_esfuerzos | -0.02 |
(0.08) | |
percep_inteligencia:año_2019 | -0.01 |
(0.08) | |
percep_esfuerzos:año_2019 | -0.08 |
(0.08) | |
1|2 | -0.73* |
(0.30) | |
2|3 | 0.80** |
(0.30) | |
AIC | 8745.84 |
BIC | 8840.49 |
Log Likelihood | -4357.92 |
Num. obs. | 4064 |
p < 0.001; p < 0.01; p < 0.05 |
El modelo anterior2 es un primer acercamiento a una regresión ordinal con cambios en el intercepto y en la relación entre variables independientes y dependiente. Debido a que no es el modelo definitivo, la interpretación se ve postergada. Sin embargo, la nula significancia obtenida de los coeficientes de las variables independientes nos indican que por el momento la hipótesis alternativa no se cumple. Por otra parte, existe significancia en las variables correspondientes al tiempo (año 2009 y 2019), lo cual indica una variación de la variable dependiente a lo largo del tiempo.
Se espera una interpretación más sustantiva para el modelo definitivo a utilizar.3
References
Hay una serie de decisiones tomadas tras el modelo que me gustaría discutir. Primero algunas dudas a raíz de que no encontré ejemplos reproducibles de regresiones ordinales con pooled data. Para regresión ordinal conozco las librerías MMCO y ordinal, mientras que la librería que conozco para pooled OLS es plm, la cual da la opción de especificar model = ‘pooling.’ Las dudas son (a) no estoy seguro de si la variación de los coeficientes por año está bien ingresada en el código. Esto lo hice basado en ejemplos reproducibles de pooled OLS con variable dependiente continua -ejemplo en Wooldridge (2010, pág. 451)-. (b) Debido a que en el ejemplo de Wooldridge se trabaja con dos años, no estoy seguro de si es adecuada la operacionalización como dummies de los tres años (es decir, si es correcto simplemente omitir el año 2000 para considerarlo como variable referencia/intercepto cuando 2009 y 2019 son 0).↩︎
La visualización de tablas y gráficos tampoco es la definitiva.↩︎