Quels sont les mots caractéristiques des partis dans les campagnes antérieures?

Avant d’analyser le discours des partis politiques pour la campagne en cours, nous désirons d’abord regarder ce qui a été dit dans les campagnes précédentes. À partir des plateformes des cinq principaux partis en 2006, 2008 et 2011, nous avons dressé la liste des termes caractéristiques des formations politiques à l’aide du calcul des spécificités.

Pour consulter notre analyse des résultats, cliquez ici.
Pour en apprendre plus sur le calcul des spécificités et la méthodologie utilisée, cliquez ici.

Résultats

Le calcul des spécificités nous donne un score. S’il est positif, le mot est surreprésenté dans la plateforme du parti. S’il est négatif, le mot est sous-représenté dans la plateforme du parti. Plus il s’éloigne de 0, plus la surreprésentation ou la sous-représentation du mot est significative.

Pour filtrer les résultats du tableau en ordre croissant ou décroissant par parti, cliquez sur l’entête des colonnes.

Mots Bloc québécois Nouveau Parti démocratique Parti conservateur Parti libéral Parti vert
agricole 15 -3 -4 -3 -1
aider -35 2 28 7 -7
aller -42 -24 57 43 -35
améliorer -26 5 10 3 0
apprentissage -15 0 -3 34 -7
assurer -4 0 21 -3 0
bien-être -7 0 0 -3 15
Bloc 1000 -55 -21 -140 -100
Canada -47 1 2 25 2
canadien -143 4 13 34 7
carbonique -8 -2 -2 -2 23
coalition -5 -3 39 -7 -3
collaboration -17 12 -1 2 0
collaborer -27 -6 1 3 14
collectivité -34 0 -11 4 27
combustible -5 -1 -1 -2 16
comprendre -17 11 0 1 2
conservateur 0 -6 63 -3 -31
créer -18 1 26 0 0
crime -3 1 22 -9 -1
criminel -2 0 21 -4 -3
déchet -3 -1 -2 -2 15
défi -3 -3 -2 21 -5
demander 32 -5 -2 -10 -5
dénoncer 17 -2 -2 -4 -3
déposer 19 1 -5 -6 -5
député -4 0 -7 -18 44
déséquilibre 17 -3 -3 -9 -1
diriger -24 -6 90 -4 -6
dollar -18 -12 1 54 -5
eau -35 2 -2 1 27
émission -9 0 -8 -1 27
emploi -6 5 19 -1 -9
enfant -32 3 12 2 1
engager -13 122 -3 -7 -21
famille -32 10 11 5 -3
fédéral 89 0 -17 -36 -10
forcer -1 -2 15 -2 -3
forêt -4 1 -4 -3 16
formation -5 19 -1 0 -2
former -4 0 16 -3 0
français 15 -2 -1 -3 -7
garde -16 3 3 2 1
gouvernement 5 -33 8 20 -40
grâce -21 2 -3 16 0
Harper -21 -6 121 -2 -23
Ignatieff -1 -2 21 -3 -5
innovation -10 0 0 23 -7
inutile -5 -1 25 -5 -1
Jack -21 112 -6 -14 -10
Layton -21 112 -6 -14 -10
libéral -42 -2 -7 196 -76
libération -1 -2 17 -5 -3
loi 6 1 1 -19 0
maladie -15 0 0 8 2
maritime 16 -3 0 -6 -4
médecin -15 6 -1 5 0
mesure -7 -1 16 2 -2
meuble 17 -2 -2 -5 -3
milliard 0 -5 -2 15 -5
mondial -15 -4 6 13 -1
nouveau -36 4 5 26 -6
NPD -69 263 0 -45 -27
nucléaire -5 -2 -2 -4 25
offrir -20 -1 24 1 1
opportuniste -6 -2 31 -4 -3
opposer 0 -1 23 -12 -3
Ottawa 81 -3 -6 -30 -19
part 15 -1 -5 -3 -4
parti -15 -4 -10 -32 132
pauvreté -7 2 -9 0 15
peine -2 -1 18 -2 -2
politique 14 -2 -5 -15 4
préférer -1 -2 18 -5 -1
producteur 36 -3 -4 -8 -9
projet 15 -1 -1 -3 -6
proposer 24 -1 -6 -7 -4
protéger -15 1 15 0 1
province -15 2 4 3 1
provincial -21 8 1 1 1
Québec 1000 -51 -37 -150 -102
québécois 1000 -88 -49 -223 -157
réclamer 16 -3 -2 -4 -2
réduire -18 3 2 1 5
réélire -24 -5 98 -6 -11
relève 16 -2 -2 -4 -3
renforcer -17 2 11 1
rural -9 -4 1 17 -2
Saint-Laurent 21 -3 -3 -4 -5
santé -52 7 -4 8 18
sexuel -4 0 15 -3 -1
soin -50 31 -5 14 -1
solution -7 0 -7 -6 36
soutenir -3 -4 31 -6 1
soutien -1 -1 17 -3 -1
souverain 47 -6 -6 -13 -7
Stephen -21 -5 158 -15 -27
stratégie -21 6 0 10 -1
taxe -4 -1 1 -6 18
tenue -5 0 21 -3 -2
travailler -9 15 2 1 -4
vert -94 -20 -26 -10 254
victime -1 -1 18 -8 -2
vision -13 -4 -3 -3 45

Analyse

Observons maintenant quels mots sont caractéristiques de chaque parti. Comme l’objectif de ce billet est de vous donner un aperçu des possibilités de cette approche, nous vous présentons seulement les spécificités positives ayant un score de 30 et plus. Le tableau complet est disponible plus haut afin que vous puissiez vous-mêmes consulter les résultats.

Bloc québécois

figure1_bloc
Le nom du parti est largement surreprésenté dans le sous-corpus, mais il est également sous-représenté de façon particulière chez les libéraux et chez les verts. Il est curieux de trouver des termes qui se rattachent au fédéralisme au milieu de termes associés à la thématique souverainiste. On peut possiblement en déduire que le discours des bloquistes tourne beaucoup autour de cette dualité. En avant-dernière position, le terme « producteur » est principalement employé au sens de producteur agricole. Nous soulignons que les autres partis en parlent également, car leur score est près de 0. Finalement, la présence de « demander » est due à une formulation récurrente dans les plateformes du Bloc québécois : « Le Bloc québécois demande… ».

Nouveau Parti démocratique

figure2_npd
Ici aussi, le nom du parti est spécifique pour le sous-corpus. On peut voir que le  Bloc québécois, le Parti libéral et le Parti vert parlent statistiquement moins souvent du NPD, alors que le Parti conservateur en parle de façon normale. La surreprésentation du verbe « engager » chez les néo-démocrates est due à des formulations récurrentes utilisées dans leurs plateformes :

  • « Jack Layton et le NPD s’engagent à… » en 2006 et 2008;
  • « Le NPD s’engage à… » en 2011.

Ce motif explique également la grande présence des termes « Jack » et « Layton ». Finalement, le terme « soin », utilisé dans le sens de « soins de santé » et « soins médicaux », est spécifique au NPD. Modérons ici la sous-représentation du terme pour le Bloc québécois : le score signifie que ce mot est moins employé chez les bloquistes, pas que la thématique de la santé est moins présente dans leur plateforme.

Parti conservateur

figure3_conservateur
Contrairement aux deux cas précédents, le nom du parti ne se trouve ici pas en tête de liste chez les conservateurs. Le nom du chef est toutefois très populaire. Comme chez les néo-démocrates, cette surreprésentation est causée par une formule récurrente dans les plateformes :

  • « Un gouvernement conservateur réélu dirigé par Stephen Harper » en 2008;
  • « le gouvernement de Stephen Harper » en 2011.

La formule de 2008 explique du même coup la présence de « réélire », de « diriger » et de « conservateur » dans les spécificités. De plus, soulignons que ce dernier mot n’est pas sous-représenté chez trois des autres partis. Le fait que le Parti conservateur était au pouvoir avant les campagnes explique que d’autres partis mentionnent son nom dans leurs plateformes. Par ailleurs, le score plus élevé de « Stephen » par rapport à « Harper » s’explique par la sous-représentation de « Stephen » chez les autres partis. En effet, ils utilisent plus fréquemment « Harper », sans son prénom. La différence est surtout marquée chez les libéraux. De son côté, la spécificité du verbe « aller » est due à l’emploi de la formulation « Nous allons » pour présenter leurs engagements électoraux.
La présence des mots « coalition » et « opportuniste » fait ressortir une phrase caractéristique de la plateforme de 2011 : « La coalition dirigée par Ignatieff et formée du NPD et du Bloc Québécois s’est opposée à cette mesure visant à […] quand elle s’est opposée au budget de Stephen Harper le mois dernier, préférant forcer la tenue d’élections inutiles et opportunistes. » La stratégie de la campagne conservatrice de 2011 est claire. Finalement, le verbe « soutenir » est utilisé de façon plus significative chez les conservateurs, sans être toutefois sous-représenté dans les autres partis.

Parti libéral

figure4_liberal
Le nom du parti reprend la tête du palmarès. On revient aussi à une sous-représentation du nom du parti chez quelques adversaires. Notons que le NPD et le Parti conservateur l’utilisent de façon statistiquement normale. La surreprésentation du mot « dollar » est largement due à la plateforme de 2006, où la thématique économique était très présente. Le verbe « aller » se retrouve souvent dans la formulation « Nous allons », tout comme chez les conservateurs. Le mot « apprentissage » est particulièrement utilisé dans les plateformes de 2006 et de 2011. Finalement, le mot « canadien » est utilisé autant dans les trois plateformes. Notons sa représentation normale chez les autres partis, sauf chez le Bloc québécois où il est sous-représenté.

Parti vert

figure5_vert
La prédominance du terme « vert » n’est pas étonnante ici. En effet, le nom du parti est également une thématique centrale dans la plateforme de la formation. La sous-représentation du terme chez les autres partis est plus difficile à analyser, étant donné la polysémie du mot, soit la thématique environnementale ou le nom du parti. Il peut d’ailleurs être étonnant de voir « parti » comme une spécificité des verts, alors que trois autres partis comptent ce mot dans leur nom. Dans le cas du Nouveau Parti démocratique, l’abréviation NPD est fréquemment utilisée. Pour le Parti conservateur et le Parti libéral, cette utilisation plus faible s’explique ainsi : ils utilisent plus fréquemment l’expression « gouvernement conservateur » ou « gouvernement libéral » que le nom complet du parti. Le terme « vision » est utilisé de façon plus significative par le Parti vert, dans des formulations différentes. Finalement, les deux derniers termes se retrouvent particulièrement dans la plateforme de 2008 avec la formule « Solutions vertes : les députés du Parti vert », suivie d’une liste d’engagements.

Synthèse

Cette brève analyse nous a permis de faire ressortir des formules récurrentes des plateformes électorales. Soulignons ici le choix du verbe dans la formule du Bloc québécois, « demander », qui reflète bien son statut de parti d’opposition. De façon convenue, le nom d’un parti fait partie de ses spécificités. Ce qui est intéressant de regarder, dans ce cas, est la représentation du nom d’un parti chez ses adversaires. Pour le NPD, par exemple, notons que le score du Parti conservateur est à zéro, alors qu’il est significativement négatif pour les trois autres. La plateforme conservatrice traite donc du NPD de façon normale du point de vue statistique. De plus, l’analyse des spécificités fait également ressortir des formules standards d’engagements électoraux. Elles peuvent être générales (« Nous allons ») ou très ancrées dans l’actualité de la campagne (formule du Parti conservateur sur la « Coalition »).

Retour aux résultats

Calcul des spécificités

Le score de spécificités permet de comparer des sous-corpus entre eux, même si leur taille est différente. Par exemple, dans notre cas, les documents du Bloc québécois que nous avons repérés totalisent 172 899 termes, alors que ceux du Nouveau Parti démocratique totalisent 51 399 termes. Le calcul de la fréquence relative (la fréquence d’un terme chez un parti par rapport au nombre total de termes dans le corpus) avantagerait le Bloc québécois, car son bassin de mots est plus grand. Le calcul des spécificités permet de pondérer la différence de taille des sous-corpus pour pouvoir les comparer.

Il repose sur un modèle statistique. On calcule si la fréquence d’un terme dans une partie donnée est supérieure, inférieure ou égale à une répartition aléatoire des mots entre les parties. Quand le score obtenu :

  • tourne autour de 0, on considère que la fréquence à laquelle un mot apparaît dans un sous-corpus est sensiblement la même que si l’on avait séparé les mots au hasard entre les différentes parties;
  • est positif, on considère que le mot est surreprésenté dans la partie;
  • est négatif, on considère que le mot est sous-représenté dans la partie.

Dans les deux derniers cas, on obtient alors les spécificités d’un sous-corpus, qui peuvent être positives ou négatives. Plus le score s’éloigne de 0, plus la spécificité est grande.

Méthodologie

Pour créer notre liste de mots, nous avons retenu les noms communs, les noms propres, les adjectifs et les verbes. La forme lemmatisée des termes a été utilisée afin d’obtenir une vue plus générale. Pour limiter le nombre de résultats, nous avons éliminé les termes qui avaient un indice de spécificité se situant entre 15 et -15. Ainsi, les mots qui se trouvent à l’intérieur de cette zone ne sont pas considérés comme spécifiques dans le cas qui nous occupe.

Retour aux résultats