Introduction aux Modèles de Réponse à l'Item (MRI)

Séminaire ANR-EEC / 29 janvier 2019

Yvonnick Noël

LP3C, Université de Rennes

qrcode logoANR

http://yvonnick.noel.free.fr/papiers/rasch

Sommaire

  1. L'analyse factorielle des réponses aux questionnaires
  2. Le problème des données bornées Notion de courbe principale

  3. Les modèles de réponse à l'item
  4. Le scalogramme de Guttman Le modèle de Rasch

  5. Applications
  6. Mesure de la dépendance au tabac chez les ados Mesure de la compréhension de texte chez les enfants

Annexe

Le modèle factoriel linéaire

  • La mesure d'une compétence nécessite une hypothèse sur la forme fonctionnelle de la relation entre compétence et réponse observée.
  • En ce sens, mesurer est toujours modéliser.
  • Le plus simple de ces modèles est le modèle de réponse linéaire (Mellenberg, 1994), qui décrit la réponse du sujet comme simplement proportionnelle à sa compétence.
  • Formellement, on s'attend sur la réponse $X$ à un item à la réponse moyenne : \[ E(X)=\alpha(\theta-\delta) \] où $\theta$ et $\delta$ sont des paramètres inconnus de personne et d'item.

L'effet de borne

Paramètres
-0.10
0.10
-3.00
3.00
Transformation

Conséquences pratiques

  • Les facteurs ne sont pas des dimensions : on peut avoir une seule dimension et plusieurs facteurs (Davison, 1977; Van Schuur & Kiers, 1996).
  • Facteurs et dimensions ne sont la même chose que dans le cas linéaire (non réaliste).
  • Dans le cas non-linéaire, les analyses factorielles extraient en général trop de facteurs.
  • Cela ne veut pas dire qu'ils ne sont pas interprétables.

Sommaire

  1. L'analyse factorielle des réponses aux questionnaires
  2. Le problème des données bornées Notion de courbe principale

  3. Les modèles de réponse à l'item
  4. Le scalogramme de Guttman Le modèle de Rasch

  5. Applications
  6. Mesure de la dépendance au tabac chez les ados Mesure de la compréhension de texte chez les enfants

Annexe

Notion de courbe principale

Paramètres
0.00
0.00
0.00
-4.00
Rechargez la page au besoin pour voir
apparaître le graphique 3D interactif.

Conclusions

  • Dans une situation réellement unidimensionnelle à $p$ items, on peut se retrouver avec une, deux, ou jusqu'à $p$ composantes en ACP.
  • Dans cette situation, c'est l'analyse en courbes principales qui est appropriée (Hastie & Stuetzle, 1989; Tibshirani, 1992).
  • Sous certaines conditions, la relation entre la position d'un point sur la courbe et le score vrai sera croissante.
  • Si les fonctions de réponse sont les mêmes, la relation sera asymptotiquement linéaire (Noël, 2017).

Sommaire

  1. L'analyse factorielle des réponses aux questionnaires
  2. Le problème des données bornées Notion de courbe principale

  3. Les modèles de réponse à l'item
  4. Le scalogramme de Guttman Le modèle de Rasch

  5. Applications
  6. Mesure de la dépendance au tabac chez les ados Mesure de la compréhension de texte chez les enfants

Annexe

Une structure de données typique

  • On étudie comment un ensemble de sujets $\{S_{i}\}$ répond à un ensemble d'items $\{I_{j}\}$ relevant d'une compétence cognitive identifiée.
  • On enregistre la réponse $x_{ij}$ du sujet $i$ à l'item $j$ en termes binaires (réussite 1, échec 0).
  • Certains items sont plus difficiles que d'autres : quand on réussit un difficile, on réussit les plus faciles (structure cumulative).

Représentation graphique

  • Les items sont rangés par difficulté croissante (l'item 3, facile, est réussi par 4 sujets sur 5).
  • Les sujets sont rangés par compétence croissante (seul le sujet 5 réussit l'item difficile 1).

Limites du scalogramme

  • Dans sa forme première, le scalogramme de Guttmann est une technique purement ordinale, et déterministe.
  • On peut de manière descriptive définir des indices d'ajustement à la structure cumulative parfaite (Loevinger, 1948).
  • Mais les déviations au modèle ne sont pas modélisées statistiquement par un modèle d'échantillonnage.

Sommaire

  1. L'analyse factorielle des réponses aux questionnaires
  2. Le problème des données bornées Notion de courbe principale

  3. Les modèles de réponse à l'item
  4. Le scalogramme de Guttman Le modèle de Rasch

  5. Applications
  6. Mesure de la dépendance au tabac chez les ados Mesure de la compréhension de texte chez les enfants

Annexe

Le passage au continu

  • On note que cette structure cumulative, ou d'emboitement des items, rend les analyses exploratoires traditionnelles mal appropriées (AFC par exemple).
  • Rasch (1960) propose une représentation numérique des niveaux de compétence de sujets et de difficulté d'items.
  • Chaque sujet est caractérisé par un niveau $\theta_{i}$ d'aptitude ($i=1,...,N$) sur un continuum numérique latent.
  • Chaque item est caractérisé par un niveau $\delta_{j}$ de difficulté ($j=1,...,p$) sur le même continuum.

Le modèle probabiliste de Rasch

  • En projetant sujets et items dans le même espace, il devient possible de les comparer directement sur la même dimension.
  • On considère que plus $\theta_{i}$ est grand devant $\delta_{j}$, plus le sujet a de chances de réussir l'item.
  • On dit que la probabilité de réussir l'item est une fonction croissante de la différence $\theta_{i}-\delta_{j}$.
  • Rasch (1960) propose comme candidat possible la fonction logistique : \[ P(X_{ij}=1|\theta_{i})=\pi_{ij}=\frac{\exp\left[\alpha\left(\theta_{i}-\delta_{j}\right)\right]}{1+\exp\left[\alpha\left(\theta_{i}-\delta_{j}\right)\right]} \]

Le modèle de Rasch

Paramètres
-3.00
-0.10
3.00
0.10
-5.00
Afficher

Représentation graphique

  • Les positions des sujets sont désormais définies par des coordonnées numériques.
  • Les items sont caractérisés par une position correspondant à la probabilité $\frac{1}{2}$ de le réussir.
  • Les positions de sujets et d'items sont directement comparables (métrique commune).

Propriétés

  • Les nombres de réussites par sujet sont une statistique suffisante de la compétence vraie du sujet.
  • On peut estimer valablement les difficultés d'item indépendamment des compétences des sujets de l'échantillon : c'est l'objectivité spécifique du modèle.
  • On peut estimer la compétence des sujets indépendamment de la difficulté des items : cela permet d'obtenir des scores comparables avec des tests différents issus de la même base.
  • Une version pour données multicatégorielles (le Modèle du Crédit Partiel, Wright & Masters, 1982) existe avec les mêmes propriétés.

Sommaire

  1. L'analyse factorielle des réponses aux questionnaires
  2. Le problème des données bornées Notion de courbe principale

  3. Les modèles de réponse à l'item
  4. Le scalogramme de Guttman Le modèle de Rasch

  5. Applications
  6. Mesure de la dépendance au tabac chez les ados Mesure de la compréhension de texte chez les enfants

Annexe

Mesure de la dépendance au tabac chez les adolescents

  • Noël & Cracosky (2007) ont soumis un ensemble de 32 items portant sur des symptômes de dépendance au tabac (sociale ou physique) à 350 adolescents de collèges et lycées de la région rennaise.
  • Exemples d'items : J'ai besoin de fumer quand je suis à une soirée, J'aime fumer après avoir mangé, J'ai besoin de fumer entre les cours, Je peux mieux me concentrer après une cigarette, Je fume pour éviter des sensations physiques déplaisantes ou désagréables, Je planifie mes activités autour de mon tabagisme.
  • Le format de réponse est en OUI/NON.

Courbes de réponse pour 6 items exemples

Estimation du score de dépendance

Sommaire

  1. L'analyse factorielle des réponses aux questionnaires
  2. Le problème des données bornées Notion de courbe principale

  3. Les modèles de réponse à l'item
  4. Le scalogramme de Guttman Le modèle de Rasch

  5. Applications
  6. Mesure de la dépendance au tabac chez les ados Mesure de la compréhension de texte chez les enfants

Annexe

Plate-forme en ligne TACIT

Evaluations par le modèle de Rasch

Construction de groupes de niveaux

Merci

Merci de votre attention.

Sommaire

  1. L'analyse factorielle des réponses aux questionnaires
  2. Le problème des données bornées Notion de courbe principale

  3. Les modèles de réponse à l'item
  4. Le scalogramme de Guttman Le modèle de Rasch

  5. Applications
  6. Mesure de la dépendance au tabac chez les ados Mesure de la compréhension de texte chez les enfants

Annexe

Propriétés

  • On note $r_{i}$ et $s_{j}$ les sommes marginales du tableau de données binaires (nombre d'items réussis par le sujet $i$ et nombre de sujets ayant réussi l'item $j$).
  • On montre que la fonction logvraisemblance du tableau de données complet $\mathbf{X}$ s'écrit : \[ \ln L(\mathbf{X}|\mathbf{\theta},\mathbf{\delta}) =\sum_{i}r_{i}\theta_{i}-\sum_{j}s_{j}\delta_{j} -\sum_{i}\sum_{j}\ln\left[1+\exp(\theta_{i}-\delta_{j})\right] \]
  • Autrement dit : les données observées n'apparaissent que sous la forme des totaux marginaux, qui sont des statistiques conjointement suffisantes pour les paramètres inconnus.

Qualité d'ajustement

  • Si on note $x_{ij}$ la réponse du sujet $i$ ($1,...,N$) à l'item $j$, la probabilité de succès estimée est : \[ \hat{\pi}_{ij}=\frac{\exp(\hat{\theta_{i}}-\hat{\delta}_{j})}{1+\exp(\hat{\theta_{i}}-\hat{\delta}_{j})} \]
  • On définit le résidu standardisé : \[ z_{ij}=\frac{x_{ij}-\pi_{ij}}{\sqrt{\pi_{ij}(1-\pi_{ij})}} \]
  • Il est usuel de calculer la statistique dite OUTFIT sous la forme : \[ u_{j}=\frac{1}{N}\sum_{i=1}^{N}z_{ij}^{2} \]
  • Une valeur comprise entre 0.5 et 1.5 est retenue comme acceptable.