Los modelos IRT para los que se implementan la calibración y la puntuación de elementos en IRTPRO ™ se basan en versiones unidimensionales y multidimensionales [análisis factorial confirmatorio (AFC) o análisis factorial exploratorio (AFE)] de las siguientes funciones de respuesta ampliamente utilizadas:
- Logística de dos parámetros (2PL) (Birnbaum, 1968) [con las que las restricciones de igualdad incluyen la logística de un parámetro (1PL) (Thissen, 1982)]
- Logística de tres parámetros (3PL) (Birnbaum, 1968)
- Clasificado (Samejima, 1969; 1997)
- Crédito parcial generalizado (Muraki, 1992, 1997)
- Nominal (Bock, 1972, 1997; Thissen, Cai y Bock, 2010)
Estos modelos de respuesta al ítem se pueden mezclar en cualquier combinación dentro de una prueba o escala, y se puede especificar cualquier restricción de igualdad especificada por el usuario (opcional) entre parámetros, o valores fijos para parámetros. IRTPRO ™ actualmente usa modelos IRT para conjuntos de datos multivariados de un solo nivel.
IRTPRO ™ implementa el método de máxima verosimilitud (ML) para la estimación de los parámetros del artículo (calibración del artículo) o calcula las estimaciones máximas a posteriori (MAP) si se especifican distribuciones previas (opcionales) para los parámetros del artículo.
Dicho esto, se pueden utilizar métodos computacionales alternativos, cada uno de los cuales proporciona el mejor rendimiento para algunas combinaciones de dimensionalidad y estructura del modelo:
- Bock-Aitkin (BAEM) (Bock y Aitkin, 1981)
- EM Bifactor (Gibbons y Hedeker, 1992; Gibbons et al., 2007; Cai, Yang y Hansen (2011))
- Reducción de la dimensión EM generalizada (Cai, 2010-a)
- Cuadratura adaptativa (ADQEM) (Schilling & Bock, 2005)
- Metropolis-Hastings Robbins-Monro (MHRM) (Cai, 2010-b, 2010-c)
- Cadena de Markov Monte Carlo (MCMC) Patz-Junker (1999-a, 1999-b)
El cálculo de las puntuaciones de la escala IRT en el IRTPRO ™ se puede realizar mediante cualquiera de los siguientes métodos:
- Máximo a posteriori (MAP) para patrones de respuesta
- Esperado a posteriori (EAP) para patrones de respuesta (Bock y Mislevy, 1982)
- Esperado a posteriori (EAP) para puntuaciones adicionales (Thissen y Orlando, 2001; Thissen, Nelson, Rosa y McLeod, 2001)
Las estructuras de datos en el IRTPRO ™ pueden categorizar los ítems encuestados en grupos, y las medias de las variables latentes de la población y las matrices de varianza-covarianza pueden estimarse para varios grupos (Mislevy, 1984, 1985). [La mayoría de las veces, si solo hay un grupo, la media (s) y la (s) varianza (s) de las variables de población latente se fijan (generalmente en 0 y 1) para especificar la escala; para varios grupos, a menudo se hace referencia a un grupo como el «grupo de referencia» con valores latentes estandarizados.
Para detectar el funcionamiento diferencial del ítem (DIF), IRTPRO ™ utiliza pruebas de Wald, modeladas a partir de una propuesta de Lord (1977), pero con matrices precisas de varianza-covarianza de error de parámetro del ítem calculadas mediante el algoritmo EM Supplemented (SEM) (Cai , 2008).