Teoría Clásica del Test y Teoría de Respuesta al Ítem.
TEORÍA CLÁSICA DEL TEST (TCT)
Las raíces de esta teoría se remontan al principio del siglo XX con los primeros trabajos de Spearman que para 1950 ya se había consolidado y propuesto una síntesis canónica por Gulliksen y más adelante son Lord y Novick (1968) quienes llevan a cabo una reformulación de la teoría clásica y abren paso al nuevo enfoque de la TRI.
Esta teoría supone que el puntaje observado de un sujeto en un test es el resultado de la suma del valor real (puntaje verdadero) y el error de medición.
La TCT consiste en asumir que la puntuación que una persona obtiene en un test, que denominamos su puntuación empírica, y que suele designarse con la letra X, está formada por dos componentes, por un lado, la puntuación verdadera de esa persona en ese test (V), y por otro un error (e), que puede ser debido a muchas causas que no controlamos o que no tomamos en cuenta.
X = V + e
Spearman plantea tres supuestos:
-
Es definir la puntuación verdadera (V) como la esperanza matemática de la puntuación empírica, que formalmente puede escribirse así:
V = E(X).
Lo que esto significa conceptualmente es que se define la puntuación verdadera de una persona en un test como aquella puntuación que obtendría como media si se le pasase infinitas veces el test.
-
Asume que el valor de la puntuación verdadera de una persona no tiene nada que ver con el error que afecta esa puntuación, es decir, puede haber puntuaciones verdaderas altas con errores bajos, o altos, no hay conexión entre el tamaño de la puntuación verdadera y el tamaño de los errores.
r (v,e) = 0.
-
Establece que los errores de medida de las personas en un test no están relacionados con los errores de medida en otro test distinto. Es decir, no hay ninguna razón para pensar que los errores cometidos en una ocasión vayan a covariar sistemáticamente con los cometidos en otra ocasión.
r(ej , ek)=0.
Críticas y limitaciones
Las críticas al modelo y sus supuestos surgieron tempranamente (Thurstone, 1928):
-
El resultado obtenido al medir una variable es inseparable del test usado.
-
Las mediciones no resultan invariantes respecto al instrumento utilizado.
-
Propiedades psicométricas importantes de los tests, tales como la dificultad de los ítems, o la fiabilidad del test están determinadas por las características de los examinados.
-
Cuando se ofrece un coeficiente de fiabilidad de un test en el marco clásico, como el coeficiente alfa de Cronbach (1951), se está presuponiendo que ese test mide con una fiabilidad determinada a todas las personas evaluadas con el test, cuando tenemos evidencia empírica más que suficiente de que los tests no miden con la misma precisión a todas las personas, dependiendo la precisión en gran medida del nivel de la persona en la variable medida.
Estas limitaciones de la TCT fomentaron la aparición de nuevas teorías de medición psicológica. En la década del 60, surgieron los primeros desarrollos de la TRI, un enfoque emergente del campo educativo que se propuso profundizar el estudio de las propiedades psicométricas de los ítems y de los tests.
TEORÍA DE RESPUESTA AL ÍTEM (TRI)
La Teoría de Respuesta al Ítem es un área de desarrollo de la Psicometría que trata de medir rasgos latentes a través de una serie de modelos matemáticos. La Teoría de Respuesta al Ítem (TRI) o Teoría de Rasgo Latente (TRL) asume que entre la respuesta que una persona ofrece a una pregunta o prueba, y el rasgo o habilidad (puede entenderse también la competencia, actitud, aptitud, etc.) de la persona, existe una relación no lineal, que se puede expresar en términos probabilísticos. El conjunto de cálculos que se aplican para ello determina los distintos modelos y resultados de la TRI..
Los supuestos básicos que exige el modelo de rasgo latente son básicamente tres:
-
El principal supuesto es que se asume la existencia de una variable no observada, latente, que explicaría las respuestas de las personas a una prueba o ítem.
-
Unidimensionalidad, es decir, el ítem o prueba, mide un solo rasgo.
-
Por otro lado debe cumplirse la independencia local, es decir, que la respuesta a un ítem no influye en la respuesta dada a ningún otro. Esto permite afirmar que la probabilidad de responder correctamente a un conjunto de ítemes es el producto de las probabilidades de contestar correctamente a cada ítem por separado.
En la TRI se suelen distinguir tres modelos distintos en función del número de parámetros que se estiman:
-
Modelo de un parámetro, también llamado modelo de Rasch. Se estima la dificultad del ítem (b).
-
Modelo de dos parámetros. Se estima la dificultad (b) y la discriminación del ítem (a).
-
Modelo de tres parámetros, o modelo de Birnbaum. Este modelo se incluye en la TRI aunque en esencia puede considerarse como un enfoque alternativo a la TRI. El modelo de Birnbaum estima la dificultad (b), la discriminación (a) y el pseudoazar o adivinación (c).
Resultados
La TRI genera una serie de resultados de especial interés:
Parámetros. Como se ha comentado anteriormente, tanto la dificultad, como la discriminación son dos elementos esenciales en la valoración de un ítem. Lo mismo puede decirse sobre el pseudoazar. Estos elementos tienen implicaciones directas en la construcción de test y pruebas académicas.
Curva característica del ítem. Es un elemento fundamental en la TRI porque, por un lado, ofrece una representación gráfica de las características del ítem, y por otra parte muestra la relación entre el nivel de habilidad y la repuesta al ítem, en términos probabilísticos.
Puntuación verdadera en el test. Se identifica con la suma de las probabilidades estimadas con relación al nivel de habilidad, para el total de ítems del test.
Curva características del test. Permite ver de manera gráfica, la relación entre puntuación verdadera y habilidades. La Curva Característica del Test (CCT) muestra la relación existente entre la puntuación total en un test (no solamente en un ítem como sucede con la CCI) y el nivel de habilidad de una persona.
Nivel de información. Es un indicador de la precisión de la estimación.
Parámetros del ítem
Como se ha indicado, los parámetros son tres: dificultad, discriminación y pseudo-azar.
-
El índice de dificultad se suele indicar con la letra “b” y se define como el punto de la escala de habilidad donde la probabilidad de responder correctamente el ítem es igual a 0,5. Es decir, que coincide con el grado de habilidad donde la curva “señala” una probabilidad de 0,5. Dicho de otra forma, con ese nivel de habilidad, la persona tiene una probabilidad del 50% de contestar correctamente al ítem.
-
El índice de discriminación indica hasta qué punto la pregunta puede discriminar entre sujetos que tienen un nivel alto de habilidad de aquellos que tienen un nivel bajo. El índice de discriminación se suele representar con la letra “a”. Esta propiedad se refleja en la pendiente de la curva, así, una mayor pendiente indicará una mayor discriminación y viceversa.
-
El coeficiente de azar o pseudoazar, se representa con la letra “c” e indica la probabilidad de contestar correctamente un ítem sin tener el nivel de habilidad exigido. Este parámetro trata de representar el efecto del azar.
Procedimiento para el análisis.
De forma esquemática los pasos a seguir para analizar las características de un test según la TRI, y estimar los niveles de rasgo de las personas que contesten al test son los siguientes:
-
Preparar los datos para su análisis.
-
Analizar si los datos cumplen los supuestos básicos de la TRI.
-
Estimar los parámetros del modelo elegido (uno, dos o tres parámetros). Elaborar los resúmenes y gráficas correspondientes.
-
Analizar el ajuste del modelo a los datos. Si el ajuste no es adecuado volver a la fase anterior recurriendo a otro modelo.
-
Estimar los niveles de habilidad de los participantes.