Choix de test paramétrique VS non paramétrique dans une comparaison de type ANOVA


#1

Cette demande provient de Leonardo Coen, doctorant rattaché au LPL sous la direction de Noël Nguyen qui fait sa thèse sur la convergence rythmique au cours d’une conversation en espagnol.

Nous avons une variable indépendante [VI] catégorielle avec quatre niveaux, chacun avec 16 stimuli (phrases) (64 stimuli au total):
(1) pied régulier [PR]
(2) groupe accentuel régulier [GR]
(3) pied irrégulier [PI]
(4) groupe accentuel irrégulier [GI]
Nous comptons analyser l’influence de cette variable sur trois variables dépendantes [VD] quantitatives:
(1) accommodation rythmique [AR]
(2) accommodation de débit de parole [ADP]
(3) latence de réponse [LR]
Les trois VD correspondent à des nombres positifs entre 0 et 2. Nous espérons que les niveaux réguliers de la VI [PR et GR] vont générer scores inférieurs dans les trois VD, par rapport aux niveaux irréguliers [PR et GR]. J’ai testé 24 personnes, divisées en 3 groupes (femme - femme, femme - homme. et homme - homme) de 4 dyades chacun, en utilisant un plan à mesures répétées. J’ai fait une analyse de variance à mesures répétées pour chaque VD. Le test de Mauchly a montré l’absence de sphéricité, et les corrections de Greenhouse-Geisser et Huynt-Feldt ont signalé l’existence de différences significatives. Puis, j’ai fait un pairwise.t.test en appliquant la méthode de Holm–Bonferroni, en trouvant certains résultats positifs.
En revanche, j’ai appliqué le test de Shapiro–Wilk à chaque résultat des quatre niveaux de la VI sur chaque VD (12 tests de Shapiro–Wilk au total), en trouvant l’absence de normalité dans tous les cas. J’ai donc essayé de transformer les VD avec des racines carrées, des racines cubiques, et du log10. J’ai trouvé que pour l’AR, les racines carrées ont normalisé la distribution, et pour l’ADP les racines cubiques l’ont fait aussi. Mais aucune d’entre ces transformations n’a pu normaliser la LR. Après avoir appliqué les normalisations j’ai refait les ANOVA pour l’AR et l’ADP, et les résultats sont très similaires à ceux de la première application. Finalement, je compte aussi faire des régressions linéaires multiples pour comparer avec les résultats des ANOVA.
Ce que je me permets de vous consulter c’est
(1) suis-je sur le bon chemin avec l’analyse ?
(2) est-ce que l’on peut se fier des résultats de l’ANOVA avec les transformations de données ou serait-il plutôt mieux d’utiliser un test no paramétrique ? (Dans le cas qu’on se fie à l’ANOVA, que pourrais-je faire avec la VD qui n’est pas normale et qui ne répond pas aux transformations ?)


#2

Réponse de Valérie Chanoine (ILCB):

Bonjour,

Pour répondre très brièvement, je dirais que les conditions d’application de l’ANOVA ne sont pas respectées car les échantillons ne suivent pas une distribution normale.
Vous pouvez effectivement faire des tests de permutation qui s’apparentent à des ANOVAs non paramétriques.
Par exemple, sur matlab, j’utilise la fonction ‘statcond’…

A bientôt,
Valérie