I. La psychométrie
L’apparition et le terme psychométrie remonte à Galton 1889 mais les idées datent de WOLF 1932 à mesurer les aptitudes humaines.
Définition opérationnelle : « la psychométrie concerne toutes les méthodes quantitatives utilisées en psychologie ».
I.1>Les objectifs : Mesurer les caractéristiques mentales
• En élaborer les techniques de mesure
• Concevoir les lois mathématiques reliant ces caractéristiques au comportement. Aujourd’hui la psychométrie désigne principalement les méthodes employées dans la conception et construction des tests mentaux.
I.2>Psychométrie et évaluation : Diagnostic et pronostic (et conseils !)
L’objectif de la psychométrie est de réaliser une évaluation des caractéristiques individuelles sur le plan intellectuel et de la personnalité. Le test permet d’évaluer la position d’un individu en comparaison d’un groupe de référence. (la population d’étalonnage, qui va permettre d’étalonner le test).Mais il demeure une difficulté de construire une unité de mesure d’une variable psychologique (intelligence ou aptitude déterminée). On va donc situer la performance du sujet par rapport aux performances obtenues par la population d’étalonnage.
II. Test mental
II.1>Qu’est ce qu’un test mental ?
• Pichot:« Un test mental ressemble à une situation expérimentale standardisée servant de stimulus à un comportement. Ce comportement est évalué par une comparaison statistique avec celui d’autres individus placés dans la même situation permettant ainsi de classer le sujet examiné soit quantitativement soit typologiquement. » .
• Zazzo: « Une épreuve strictement définie dans ses conditions d’application et dans son mode de notation qui permet de situer un sujet par rapport à une population elle-même bien définie (biologiquement et socialement).
Un test n’est pas une situation expérimentale à proprement parler, car on ne manipule pas de variable!
II.2>La question de la comparaison statistique
• La passation doit être standardisée : consignes, exemples, matériel, temps alloué, modalité de réponses, correction.
• La comparaison du comportement d’un individu doit se faire en référence à une norme (population d’étalonnage).
Constituer la norme= étalonner le test.
II.3>De la performance à l’évaluation des caractéristiques psychologiques
• Evaluation d’un caractère psychologique à l’aide d’un indicateur comportemental (mot, indicateur moteur, langagier etc) qui est la réponse du sujet.
• L’adéquation entre indicateur et le caractère psychologique pose le problème de la validité de ce qui est mesuré.
III.Le principe de la comparaison statistique : l’étalonnage
• Test : comparaison de la performance d’un individu à une norme.
• Cette norme est constitué par le groupe/population d’étalonnage. Ce groupe doit être clairement définit en fonction de critères (sexe, age, CSP…) correspondant à la population visée par le test (échantillon suffisamment grand de 100 à 1000).
III.1>Loi de Laplace-Gauss
• Fonction statistique caractérisée par la concentration des observations autour de la moyenne arithmétique (tendance centrale) des valeurs de la variable.
• Elle est symétrique et définie par deux paramètres: moyenne arithmétique et écart type (écarts des valeurs de dispersion à la moyenne).
• L'écart type caractérise l'aplatissement de la courbe et donne une idée de la dispersion des valeurs autour de la valeur autour de la moyenne (courbe aplatie c'est une dispersion importante, grande variance);
Exemple avec le QI:
III.2>La loi normale
• Toute fonction de Gauss peut être ramenée à un modèle standard: celui de la loi normale
• Moyenne= 0; SD (écart-type)=1
• La procédure d'étalonnage normalisée est fondée sur les propriétés de la loi normale
• En ramenant une distribution quelconque à la loi normale, on pourra ainsi comparer des populations avec des M et des SD différents.
• L'étalonnage consiste à décrire la distribution du caractère psychologique mesuré dans la population d'étalonnage et à la répartir en un certain nombre de classes.
Exemple avec la loi normale centrée-réduite:
III.3>L'étalonnage en classes d'effectifs égaux: décilage et centilag
• Décilage: division de l'effectif de la population d'étalonnage en 10 classes égales comportant chacune 10% de l'effectif (si la population d'étalonnage comporte 100 sujets, chaque décile comprendra 10 sujets).
• Centilage: division de l'effectif de la population d'étalonnage en 100 classes égales comportant chacune 1% de l'effectif.
Chaque décile est défini par une note minimale et une note maximale (les limites de la classe). En raison de la forme de la distribution, l'intervalle de classe (écart entre note minimale et maximale) n'est pas constant: le décilage ne discrimine pas de façon égale les sujets ayant des notes faibles ou fortes et ceux qui obtiennent des notes moyennes.
III.3>L'étalonnage en classes normalisée: effectifs inégaux.
• Effectif divisé en un nombre impair de classes (9 classes par exemple) mais les effectifs de chaque classe ne devront pas être égaux
• La classe centrale est centrée sur la note moyenne de la distribution
• Par construction les classes ont une largeur égale, mais leurs effectifs ne sont plus identiques: ils suivent les fréquences théoriques: ils suivent les fréquences théoriques d'une distribution Gaussienne (on utilise alors le modèle de la loi normale).
III.4>Importance de l'étalonnage pour l'utilisation des tes mentaux
• L'exploitation des résultats d'un test n'a de sens que par référence à l'étalonnage (on peut alors situer la position d'un sujet quelconque par rapport à cette norme).
• Chaque sujet examiné doit être comparé au groupe d'étalonnage qui correspond à ses propres caractéristiques (âge, sexe...).
• Nécessité de réactualiser les étalonnages et souvent le contenu des tests pour que l'évaluation demeure cohérente et efficace. Les test bougent selon l'époque, la culture, il faut remplacer des items, reconceptualiser les tests.
Distribution statistique des valeurs d'un caractère dans un échantillon de population.
On définit ainsi la fréquence des différentes valeurs que peut prendre le caractère dans un échantillon de la population (sous ensemble extrait au hasard de cette population).
Paramètres d'une distribution de Gauss:
Situer la performance d'un sujet donné par rapport à la population de référence (une courbe par test).
La loi normale
• Modèle standard de moyenne 0 et écart type 1 (données centrées réduites)
IV. Caractéristiques des test et biais d'évaluation: quelles caractéristiques pour un bon test?
• Les tests ont trois propriétés essentielles en tant qu'instruments de mesure:
- Sensibilité ( ou finesse de discrimination): capacité du test à distinguer deux valeurs proches du paramètre mesuré. Dépend du mode d'étalonnage (nombre en classes d'étalonnage), du contenu et du nombre des items.
- Fidélité: définit la stabilité du test lors de mesures répétées. Un test doit donner le même résultat, lors de passations successives, si le caractère mesuré n'a pas varié. Méthode test/retest (les résultats obtenus doivent être sensiblement les mêmes).
- Validité: on distingue la validité de contenu (ce que mesure le test, exemple: richesse du lexique mental) et la validité prédictive (ce qu'il permet de prédire, un pronostic donc à court terme, moyen terme ou long terme).
IV.1>Contrôle des caractéristiques: comment vérifier ces trois critères?
• La sensibilité est définie à priori par le nombre d'échelons (ici le nombre de classes) que comporte l'échelle de mesure. Utiliser un grand nombre de classes ne donne cependant qu'une sensibilité souvent illusoire en regard des erreurs de mesures.
• La fidélité est contrôlée par plusieurs méthodes, la plus courante étant le test-retest, qui nécessite deux administrations successives du même test aux mêmes sujets. On étudie alors la corrélation entre les deux tests.
• La validité prédictive (pronostic): est estimée par la corrélation entre les
résultats au test et un ou plusieurs critères externes (CSP, niveau scolaire, jugement clinique) donnés à
postériori.
La validité prédictive est généralement modérée, d'autant plus que les critères externes sont fournis longtemps après le test.
• Validité de contenu: difficile à apprécier. Des items sont satisfaisant, d'autres sont défectueux (ils ne mesurent pas ce qu'ils doivent mesurer comme par exemple quand personne ne sait répondre à l'item).Elle est généralement évaluée par la corrélation entre les résultats au testet les résultats obtenus par les mêmes sujets à d'autres test censés mesurer les mêmes caractéristiques.
IV.2>Deux types d'erreurs
• Erreur aléatoire ("le hasard a fait que"):
- Affecte de manière aléatoire la performance du sujet
- Estimation de l'étendue des fluctuations aléatoires attendue dans le score obtenu par le sujet. Donc pas en lien avec la validité.
• Erreur systématique
- Affecte de façon non aléatoire la performance du sujet
- En lien avec la validité: source de variation s'appuyant sur un construct psychologique autre que celui qui est mesuré.
IV.2.1>Les origines de l'erreur de mesure
• Facteurs personnels stables:
- Intelligence
- Niveau éducation
- CSP
- Facteurs personnels transitoires (quelqu'un d'intelligent peut échouer à un test d'intelligence voilà pourquoi on préfère les appeler « tests d'efficience intellectuelle »)
- Vigilance
- Fatigue
- Motivation
- Etat de santé
- Prise de médicament
• Situation d'évaluation (bruits, température, contexte) pouvant être source de variables parasites
• Procédure d'évaluation (situation de passation non standardisée)
• Nature du test (items formant le contenu du test).
• Biais de représentativité
- Un signe isolé n'est pas une preuve de pathologie
• Biais de confirmation
- Recherche de la validation de nos hypothèses (le résultat obtenu ne dois pas être pris pour argent comptant, et tout ne doit pas se baser sur un seul test).
• Biais de récence: on ne doit pas associer le résultat au test à :
- Motif de consultation
- Dossier médical
- avis de l'entourage
• Biais MDT
• Nombreuses informations soumises à la primauté et à la récence
• B iais Rosenthal
• Nos caractéristiques conditionnent notre objectivité (sexe, âge, race, compétence).
IV.3>Les caractéristiques du test: rappel
• Validité Un test mesure ce qu'il est censé mesurer
• Sensibilité
- intra-individuelle: différences au sein d'un même individu au cours de mesures répétées
- inter-individuelle: discrimination de deux individus proches 'effets plafonds, plancher, nombre d'items, leur contenus)
• Fidélité
CONCLUSION:
Mesurer c'est quantifier, ni comprendre ni expliquer.
Le psychologue doit interpréter les résultats au regard de nombreuses variables (cf intelligence).
EXERCICE
Découper les notes en dix déciles.
Voir feuille ICI
Derniers Commentaires