Dernière projection maison avant les élections (du moins une des dernières, Too Close To Call espère faire son agrégation dans la nuit). Ici sur la base de l'agrégation de Qc125:
Encore une fois ma matrice favorise les libéraux...
Sinon, beaucoup on partagé sur Twitter (dont moi) le billet de la professeur de l'UdeM Claire Durand sur les électeurs discrets qui seraient des libéraux cachés, je me suis dit qu'en cette fin de campagne ça méritait une petite réflexion.
-Prime à l’urne ?-
J’ai parlé dans un billet précédent d’une tendance à sous-estimer le vote libéral et à surestimer les appuis solidaires. J’y étais allé au pif et je voulais en avoir le cœur net. Certains appellent cette tendance la « prime à l’urne ». On parle de prime à l’urne quand la part du vote exprimé est plus élevée que ce que prévoyait les sondages. J’ai donc passé mon anniversaire refaire l’agrégation des sondages des élections générales au Québec de 2008, 2012, 2014 (oui, je sais, ça commence à ressembler à de la maladie mentale).
Voyons donc à quoi ça ressemble, avec une agrégation des sondages de la dernière semaine de campagne (6 sondages, toutes les données sont disponibles sur Wikipedia) pondérés en vertu de leur échantillon ça donne le tableau suivant :
2014
| ||||||
CAQ
|
PLQ
|
PQ
|
QS
|
Erreur
|
Part.
| |
Moyennes
|
21,90
|
40,91
|
25,80
|
8,44
|
2,97
|
-
|
Résultats
|
23,05
|
41,52
|
25,38
|
7,63
|
-
|
71,44
|
Différences
|
1,15
|
0,61
|
-0,42
|
-0,81
|
-
|
-
|
Vous devez donc lire le tableau comme suit : à la ligne « différences », si le résultat est positif, c’est le nombre que vous auriez dû ajouter à l’agrégation des sondages pour arriver exactement aux résultats de l’élection, si c’est négatif, c’est ce que vous auriez dû enlever de résultats agrégés de sondage. Si on compare avec la marge d’erreur, on voit que la différence reste dans une estimation statistiquement exacte des résultats de l’élection. Les sondages ne se sont donc pas trompés.Toutefois, on peut voir d’une part une tendance, modeste, mais présente, à sous-estimer le vote libéral… et caquiste, d’autre part, une surestimation du vote solidaire et péquiste.
Regardons ensuite les résultats de 2012, 5 sondages :
2012
| ||||||
CAQ
|
PLQ
|
PQ
|
QS
|
Erreur
|
Part.
| |
Moyennes
|
26,94
|
27,54
|
33,65
|
7,16
|
2,24
|
-
|
Résultats
|
27,05
|
31,20
|
31,95
|
6,03
|
-
|
74,6
|
Différences
|
0,11
|
3,66
|
-1,70
|
-1,13
|
-
|
-
|
Dans ce cas, les sondages ont manqué un élément, le vote libéral était sous-estimé en moyenne de 3,66 points de pourcentage, en dehors de la marge d’erreur de 2,24. En 2012, les sondages se sont donc trompés sur le vote libéral et l’ont sous-estimé de manière statistiquement signifiante.
Voyons ensuite l’élection de 2008 (5 sondages), à noter que la CAQ n’ayant été fondée qu’en 2011, nous avons ici l'ADQ :
2008
| ||||||
ADQ
|
PLQ
|
PQ
|
QS
|
Erreur
|
Part.
| |
Moyennes
|
12,67
|
44,72
|
34,29
|
4,38
|
2,65
|
-
|
Résultats
|
16,37
|
42,08
|
35,17
|
3,78
|
-
|
57,43
|
Différences
|
3,70
|
-2,64
|
0,88
|
-0,60
|
-
|
-
|
Dans ce cas, c’est le vote adéquiste qui a été sous-évalué de manière statistiquement signifiante, d’autre part, le vote libéral lui était surévalué de 2,64 %, à l’intérieur de la marge d’erreur… mais de peu ! Petite note toutefois, cette élection suit un gouvernement minoritaire, celui de Jean Charest élu en 2007, et qui avait vu élire comme opposition officielle l’ADQ de Mario Dumont. De 2007 à 2008, le taux de participation s’était effondré passant de 71,23 % à 57,43 %. Seule l’ADQ avait souffert de cet effondrement. En effet, si le PLQ et le PQ avaient fait de légers gains en termes de nombre d’électeurs, le nombre d’électeurs perdus par l’ADQ représentait 96 % du nombre de personnes qui n’étaient pas allés voter par rapport à 2007… (oui cette phrase mériterait d’être travaillé… vous comprenez ce que je veux dire.)
Comment expliquer que les sondages puissent ainsi se tromper ? Il y a bien sûr les « résultats aberrants », une malchance pure et simple de tomber sur un mauvais échantillon… ce qui est toutefois statistiquement improbable.
Comme le faisait remarquer Claire Durand, il y a aussi un possible problème méthodologique dans la répartition des indécis. Les indécis auraient plutôt tendance à être libéraux plutôt que caquistes, péquistes ou solidaires. C’est une tendance qui avait été observée dès la fin des années 1980 par le regretté professeur de sociologie de l’UQAM Pierre Drouilly. On peut expliquer cette tendance par le fait, pour QS ou le PQ, que leur électorat soit plus militant et soit plus enclin à afficher leurs couleurs que les électeurs libéraux. On peut aussi l’expliquer par un biais de désirabilité, un biais qui nous incite à répondre ce que notre interlocuteur veut entendre. En 2012, par exemple, en pleine crise étudiante, il est assez plausible que les électeurs aient été moins chauds à révéler leur préférence politique.
Pour pallier ce problème, Claire Durand propose de répartir les indécis en donnant 50 % au PLQ et 25 % au PQ et à la CAQ (elle ne parle pas de QS). Pierre Drouilly lui suggérait de répartir les indécis en fonction du principal déterminant social des intentions de vote, la langue maternelle. Ceci dit, ce problème méthodologique ne règle ni n’explique la tendance à sous-estimer le vote caquiste et à surestimer le vote PQ/QS.
L’autre élément qui semble parfois pouvoir faire obstacle à une évaluation juste par les sondages des intentions de vote est le taux de participation. J’ai déjà mentionné plus haut le cas des élections générales de 2012, mais plus généralement la stabilité du vote libérale fait en sorte que sa valeur varie justement plus en fonction du taux de participation qu’en fonction d’une variation de l’humeur de l’électorat. Le vote brut libéral en 2008 était de 1 366 046 électeurs-trices, en 2012 de 1 360 968 et en 2014 de1 757 071. 2008 représente un plancher dans le vote libéral depuis le début des années 1990 et 2014 un vote plafond (qu'ils peuvent probablement dépasser). Sachant que fondamentalement les sondages n’évaluent pas la participation et fonctionnent au fond sur un hypothétique taux de participation de 100 %, on comprend qu’une variation radicale de la participation peut limiter la capacité prédictive de sondages.
Sur ce mes ami-e-s, bonne journée électorale !

Aucun commentaire:
Enregistrer un commentaire