L’accueil des réfugiés dans les mots des partis

Les migrants du conflit syrien ont pris une place importante dans le débat public suite à la diffusion de l’image du corps d’un enfant syrien, noyé, retrouvé sur les plages de Bodrum en Turquie.

Compte tenu de la place accordée à cette tragédie humaine par les médias, nous avons décidé d’interroger le corpus d’élection 2015 pour y analyser le thème de l’accueil de réfugiés au Canada dans le discours officiel des différents partis depuis le début de la campagne électorale. Pour ce faire, nous utilisons les documents officiels publiés sur les sites Web des différents partis, comme les communiqués de presse et les documents d’information sur certains enjeux.

Pour de plus amples informations sur la méthodologie, cliquez ici.

Résultats

Le thème des réfugiés est détecté automatiquement par l’algorithme. Il est caractérisé par les mots clés accélérer, attente, crise, demande, humanitaire, immédiatement, immigration, réfugier (forme lemmatisée de réfugié(e/s)), syrie (les mots clés, tels qu’ils apparaissent dans les résultats de classification automatique, sont écrits en lettres minuscules) et syrien. Les mots associés démontrent un lien étroit entre le thème et la crise syrienne actuelle. Des mots comme crise et humanitaire réfèrent fort probablement à l’arrivée massive de réfugiés en Europe de l’Ouest. D’autre part, les mots syrie et syrien ne laissent aucun doute sur le conflit auxquels les documents renvoient. Ainsi, il est peu probable que le thème repéré provienne d’éléments de plateforme portant sur les politiques d’accueil; il s’est plutôt dégagé de documents traitant de l’actualité.

La figure 1 montre l’apparition du thème en fonction de la date de publication pour l’ensemble des documents du corpus. Par les communiqués officiels des différents partis, il est possible de voir que ceux-ci ont réagi à l’image choc du 2 septembre 2015. Nous observons que le sujet n’est d’ailleurs pas complètement évacué dans les journées qui suivent l’évènement.

figure_1

Figure 1. Présence et évolution du thème des réfugiés, pondérées par 10 000 mots

La figure 2 présente les résultats par parti, pondérés par 10 000 mots. Il est possible d’y voir que la question des réfugiés occupe une plus grande place dans le discours des partis d’opposition que dans celui du parti au pouvoir. Cela dit, la pondération sur 10 000 mots teinte les résultats en fonction de la quantité et de la taille des documents publiés par les partis. Ainsi, le Bloc québécois est surreprésenté dans les résultats par rapport aux quatre autres partis, qui publient tous une plus grande quantité de documents. En nombre absolu de documents où le thème des réfugiés est présent, ce sont le Parti libéral, le Nouveau Parti démocratique et le Parti vert qui mènent, comme le démontre la figure 3.

figure_2

Figure 2. Présence du thème des réfugiés dans les documents des cinq principaux partis, pondérée par 10 000 mots

figure_3

Figure 3. Présence du thème des réfugiés dans les documents des cinq principaux partis, par nombre de documents

À partir des résultats, nous avons créé un sous-corpus spécifique, c’est-à-dire un ensemble de documents sur la thématique des réfugiés. L’analyse du sous-corpus permet d’apprécier la place accordée à la question des réfugiés dans le discours des différents partis politiques fédéraux. Pour le constituer, nous avons cherché tous les documents ayant le mot réfugier (forme lemmatisée de réfugié(e/s)). Cette requête nous a donné 23 documents : un pour le Bloc québécois, huit pour le Nouveau Parti démocratique, deux pour le Parti conservateur, neuf pour le Parti libéral et trois pour le Parti vert.

La figure 5 présente une analyse de la correspondance entre les mots représentatifs du thème sélectionné par fréquence et leurs relations avec les différents partis. Elle offre plusieurs niveaux d’analyse possible. Premièrement, les mots qui sont près de la jonction centrale sont étroitement liés à l’ensemble du contenu des documents du corpus. Plus ils s’éloignent de la jonction, plus il s’agit de des termes singuliers. On voit, par exemple, que les mots aider, canadiens, politique, prendre, réfugier et syrien sont très près de la jonction centrale et sont des mots prépondérants dans l’ensemble des documents. Quant à eux, les mots menace et terroriste qui sont très éloignés de la jonction sont des mots spécifiques à deux documents du corpus.

Deuxièmement, il est possible d’avoir trois approches face à la figure 5 :

  • comparer les mots entre eux;
  • comparer les partis entre eux;
  • comparer les mots avec les partis.

Il faut évaluer la figure 5 avec grand soin, car la similarité entre deux points n’est pas mesurée par la distance qui les sépare, mais par la mesure de l’angle du vecteur créé à partir de la jonction centrale (voir figure 4).

figure_4

Figure 4. Mesure de l’angle des vecteurs

Un angle aigu démontre une corrélation entre deux termes ou entre un mot et un parti, tandis qu’un angle plat (180 degrés) signifierait une corrélation négative. On observe par exemple un angle aigu entre le Parti vert et les mots accueillir, demande et immigration, ce qui démontre une corrélation entre eux. De plus, nous observons un angle plat, donc une corrélation négative, entre le Parti conservateur et les mots aider, politique et réfugier.

Pour voir plus grand, cliquez sur la figure.

figure_5

Figure 5. Portrait des mots utilisés par les partis en lien avec les réfugiés.

En conclusion, la fouille de textes et la visualisation de l’information nous permettent d’avoir un regard nouveau et objectif sur la façon dont un thème est abordé par les partis politiques dans leurs communiqués de presse.

Méthodologie

Corpus général

En date du 17 septembre 2015, le corpus général en français est composé de documents moissonnés manuellement à partir des sites web de partis. Le Tableau 1 présente les données statistiques du corpus :

Tableau 1. Statistiques descriptives du corpus général en date du 17 septembre 2015

tableau_1

Chacun des documents est étiqueté avec le nom du parti duquel il émane, ainsi qu’avec sa date de diffusion sur le site web. Cela nous permet de faire la distinction et la comparaison entre les différents partis et de suivre l’évolution thématique dans le temps.

Le traitement linguistique implique la lemmatisation des mots et l’utilisation d’un anti-dictionnaire pour éliminer les mots fonctionnels. Nous avons utilisé des techniques de classification automatique (clustering) pour extraire la thématique des réfugiés.

Retour aux résultats