Théories des tests TCT et TRI
Les tests sont utilisés en psychologie comme instruments de mesure. Pour approcher un peu le concept et sans être complètement précis, tout comme nous utilisons le mètre pour mesurer la longueur, nous pourrions utiliser un test pour mesurer l'intelligence, la mémoire, l'attention ... Une des différences entre l'une et l'autre action serait que les tests ne sont pas si faciles à construire, en plus du fait qu'ils sont si faciles à appliquer.
De plus, tout comme une seule mesure ne nous permet pas de parler du volume d'un objet, l'administration d'un seul test ne nous permet pas de poser un diagnostic ou de proposer une intervention. Donc, les tests sont importants pour l'évaluation, mais ils n'en sont pas un déterminant.
C’est là que le psychologue joue le rôle le plus important: d’une manière ou d’une autre, il doit utiliser les informations obtenues à partir du test et d’autres sources pour: donner forme à une évaluation cohérente qui cède la place à la planification de l'intervention. En d’autres termes, c’est au moment de l’intégration des résultats de différentes sources que la qualité du professionnel est la plus perceptible. Nous parlons d'une compétence qui s'acquiert avec la connaissance, mais aussi avec des années d'expérience.
Bref historique des théories des tests
L'origine des tests est généralement citée dans des tests menés par des empereurs chinois. dans les années 3000 avant Jésus-Christ. Celles-ci visaient donc à évaluer la compétence professionnelle des officiers qui allaient entrer en service. (1)
Les tests actuels ont leur origine la plus proche dans les tests effectués par Galton (1822-1911) dans son laboratoire. Cependant, c'est James Cattell qui a utilisé le terme le plus souvent test mental, en 1890. Ces premiers tests n'étant pas trop prédictifs de la capacité cognitive de l'être humain, des chercheurs comme Binet et Simon (1905) introduisent dans leur nouvelle échelle des tâches cognitives permettant d'évaluer des aspects tels que le jugement, la compréhension et le raisonnement.
La balance de Binet ouvre une tradition de gammes individuelles. En plus des tests cognitifs, de grands progrès sont réalisés dans les tests de personnalité.
Pourquoi les théories des tests sont-elles nécessaires??
Avant toutes les avancées produites, elles commencent à développer tour à tour des théories de mesure (théories des tests) qui affectent directement les tests en tant qu'instruments qui sont. Avec le souci de générer des instruments qui mesurent ce que nous voulons, et le font avec le moins d’erreur possible, la psychométrie apparaît. Une psychométrie qui nécessitera chaque test ou instrument de mesure, qui prétend être, qui est valide et qui est fiable,
Rappelons que le la fiabilité il est entendu que la stabilité ou la cohérence des mesures lorsque le processus de mesure est répété. En d’autres termes, plus le test est fiable, plus il reproduit les résultats lorsqu’on mesure deux sujets - ou le même sujet à différentes occasions - qui ont le même niveau dans la mesure. Pour sa part, la validité fait référence au degré auquel les preuves empiriques et la théorie appuient l'interprétation des scores des tests. (2)
Ainsi, il existe deux grandes théories des tests ou approches quand on parle d'analyser et de construire ce type d'instruments: la théorie classique des tests (TCT) et la théorie de la réponse aux items (TRI).
La théorie classique des tests (TCT)
C’est la théorie dominante dans la construction et l’analyse des tests. Le bol: il est relativement facile de construire des tests qui répondent aux exigences minimales de ce paradigme. L'évaluation du test lui-même en fonction des paramètres mentionnés est également relativement simple: fiabilité et validité.
Il a son origine dans les travaux de Spearman au début du 20ème siècle. Puis, en 1968, les chercheurs de Lord et Novick procèdent à une reformulation de cette théorie et ouvrent la voie à la nouvelle approche du TRI..
Cette théorie est basée sur le modèle linéaire classique. Ce modèle a été proposé par Spearman et consiste à supposer que le score qu'une personne obtient dans un test, que nous appelons son score empirique, et qui est généralement désigné par la lettre X, est composé de deux composantes. (2)
D'une part, nous trouvons le score réel du sujet dans le test (V), et d'autre part, l'erreur (e). Il s’exprime comme suit: X = V + e.
Spearman ajoute trois hypothèses à cette théorie:
- Tout d’abord, définissez le score vrai (V) comme la espoir mathématique de la Score empirique: C'est le score qu'une personne aurait dans un test s'il le faisait un nombre infini de fois.
- Non il y a relation entre quantité de vrais scores et le taille des erreurs qui affectent ces scores.
- Enfin, le Erreurs de mesure dans un test ils sont liés avec les erreurs de mesure dans un autre test différent.
Pour compléter cette théorie, Spearman définit la tests parallèles comme ces tests qui mesurent la même chose mais avec des objets différents.
Limites de l'approche classique
La première limite est que, dans cette théorie, les mesures ne sont pas invariantes par rapport à l'instrument utilisé. Cela signifie que si un psychologue évalue l'intelligence de trois personnes avec un test différent pour chacune, les résultats ne sont pas comparables. Mais pourquoi cela se produit-il??
Eh bien, les résultats des trois instruments de mesure ne sont pas sur la même échelle: chaque test a sa propre échelle. Pour pouvoir comparer, par exemple, l'intelligence de X personnes qui ont été évaluées avec différents tests d'intelligence, il est nécessaire transformer les scores obtenus directement du test dans d'autres échelles.
Le problème, c’est qu’en transformant les partitions en baremadas, nous supposons que les groupes normatifs dans lesquels elles ont été élaborées les échelles des différents tests sont comparable - même moyenne, même écart-type-, ce qui est difficile à garantir dans la pratique. (1) Ainsi, la nouvelle approche du TRI supposait un grand progrès par rapport à ce fait. Le TRI réalisera ainsi que les résultats obtenus en utilisant différents instruments sont à la même échelle.
La deuxième limite de cette approche est le manque d’invariance des propriétés de test. en ce qui concerne les personnes utilisées pour l'estimer. Ainsi, dans le cadre du TCT, les propriétés psychométriques importantes des tests dépendent du type d’échantillon utilisé pour les calculer. C’est un fait qui trouve aussi une solution, au moins partielle, dans l’approche du TRI.
La théorie de la réponse à l'item (TRI)
La théorie de la réponse aux items (TRI) est née en complément de la théorie des tests classiques. En d'autres termes, le TCT et le TRI pourraient évaluer le même test et établir un score ou une pertinence pour chacun des éléments, ce qui pourrait nous donner un résultat différent pour chaque personne. Par ailleurs, pour indiquer que le TRI nous donnerait un instrument beaucoup mieux calibré, le problème est que ce paradigme a un coût beaucoup plus élevé et la participation de professionnels spécialisés..
Le TRI repose sur plusieurs hypothèses, mais la plus importante peut-être nous indique que tout instrument de mesure doit être conforme à une idée: il y a une relation fonctionnelle entre les valeurs de la variable qui mesurent les items et la probabilité de les toucher. Cette fonction s'appelle Courbe caractéristique de l'article (CCI). Que supposons-nous alors??
Eh bien, quelque chose qui de l’extérieur peut sembler très logique et que le TCT n’évalue pas. Par exemple, les éléments les plus difficiles sont ceux auxquels seules les personnes les plus intelligentes répondent. En revanche, un élément auquel toutes les personnes répondent bien ne nous serait pas utile car il n’aurait aucun pouvoir de discrimination. En d'autres termes, cela ne donnerait aucun type d'information. Ceci est juste un petit aperçu de la révolution proposée par le TRI.
Pour voir un peu mieux les différences entre un modèle de mesure et un autre, prenons comme référence le tableau de José Muñiz (2010):
Tableau 1. Différences entre le TCT et le TRI (Muñiz, 2010)
Aspects | TCT | TRI |
Modèle | Linéaire | Non linéaire |
Hypothèses | Faible (facile à rencontrer pour les données) | Fort (difficile à atteindre par les données) |
Invariance de mesure | Non | Oui |
Invariance des propriétés de test | Non | Oui |
Échelle de scores | Entre 0 et le maximum dans le test | L'infini |
Accent sur | Test | Article |
Relation article-test | Indéterminé | Courbe caractéristique de l'article |
Description des articles | Indices de difficulté et de discrimination | Paramètres a, b, c |
Erreurs de mesure | Erreur de mesure typique commune à l'ensemble de l'échantillon | Fonctions d'information (varie selon le niveau d'aptitude) |
Taille de l'échantillon | Cela fonctionne bien avec des échantillons entre 200 et 500 sujets environ | Plus de 500 sujets sont recommandés |
C'est ainsi que les deux théories des tests sont liées. Bien que presque contemporain, il semble clair que TRI est né en réponse aux limitations ou aux problèmes que TCT peut développer. Cependant, il semble clair que la recherche a encore beaucoup à faire dans ce domaine de la psychométrie..
Les tests psychologiques: caractéristiques et fonctionnement Les tests psychologiques sont les instruments utilisés en psychologie pour mesurer les variables que le savoir intéresse. Lire plus "