Analyse thématique des plateformes 2015

La plus longue campagne électorale de l’histoire du Canada a pris fin la semaine dernière. Pour clore l’aventure, nous identifions dans ce billet les thèmes des plateformes électorales de cette année et les comparons avec les thèmes issus des plateformes des années antérieures, faisant ainsi suite au billet traitant de ce sujet. Nous voyons ainsi quels sont les thèmes qui s’inscrivent dans la continuité et quels sont les nouveaux thèmes qui ont fait leur apparition cette année. De plus, nous observons quels sont les thèmes qui reviennent le plus souvent dans la plateforme de chaque parti.

Continuer la lecture de « Analyse thématique des plateformes 2015 »

Des machines et des mots : les partis sont-ils cohérents?

L’une des tâches que la fouille nous permet d’effectuer est la catégorisation automatique. Par exemple il nous est possible en utilisant ce type de processus de prédire de quel parti politique provient un document. Ce qui est particulièrement intéressant dans ce type d’analyse, ce sont les erreurs, c’est-à-dire les documents dont le système a incorrectement prédit l’appartenance. Ces erreurs sont aussi parlantes, voire plus, que les documents pour lesquels le parti a été correctement prédit. En effectuant la catégorisation automatique des documents produits par les partis politiques, on peut obtenir un portrait révélateur de certaines tendances lexicales des partis ainsi que de leur proximité.

La catégorisation automatique se fait en deux temps : l’apprentissage et le test. Lors de la phase d’apprentissage, on donne à la machine une partie du corpus, associée aux catégories qu’elle doit apprendre. Par exemple, dans ce cas-ci, l’outil de fouille connaît le nom du parti qui a publié le communiqué et il doit s’entraîner à reconnaître ce qui distingue un parti d’un autre. Ensuite, nous fournissons à la machine le corpus de test. Cette fois, le nom du parti n’est pas lié aux communiqués. Sur la base de ce qu’il a appris dans la phase de test, l’outil doit associer un document à un parti.

Si vous voulez en savoir plus sur la méthodologie, cliquez ici.

Pour voir tout de suite l’analyse des résultats, cliquez ici.

Continuer la lecture de « Des machines et des mots : les partis sont-ils cohérents? »

Environnement : qu’en disent les partis?

Dans la conjoncture sociale actuelle, l’environnement est devenu un thème récurrent que les partis ne peuvent plus éluder lors des élections. Dans le cadre des élections fédérales 2015, nous avons donc décidé d’analyser dans quelle mesure les partis accordent de l’importance à ce thème en analysant les communiqués officiels des différents partis politiques. Ce portrait est établi selon plusieurs aspects, tant par l’analyse de l’ensemble des plateformes électorales que par l’analyse du poids de ce thème pour chacun des partis.

Continuer la lecture de « Environnement : qu’en disent les partis? »

Les sujets abordés par les partis : quelques observations à moins de trois semaines du scrutin

Généralement, on considère qu’il existe un clivage clair entre le Parti conservateur et tous les autres partis politiques ; le Parti conservateur serait le seul parti de droite, tandis que le Parti libéral, le Nouveau Parti démocratique, le Bloc québécois et le Parti vert seraient tous, à divers degré, de gauche. Or, pour savoir si ce positionnement a une influence sur les sujets traités par chacun des partis, il s’avère intéressant de comparer leur proximité thématique dans la campagne électorale actuelle. Par proximité thématique, nous tentons de savoir si les partis traitent ou non des mêmes sujets. Par contre, aucune analyse du positionnement des partis par rapport à ces thèmes n’est effectuée; même si deux partis abordent des thèmes similaires, rien ne garantit qu’ils traitent les thèmes de manière identique. Le portrait ainsi brossé permet néanmoins de représenter une dimension importante des distances idéologiques qui peuvent exister entre les différents partis politiques.

Continuer la lecture de « Les sujets abordés par les partis : quelques observations à moins de trois semaines du scrutin »

L’accueil des réfugiés dans les mots des partis

Les migrants du conflit syrien ont pris une place importante dans le débat public suite à la diffusion de l’image du corps d’un enfant syrien, noyé, retrouvé sur les plages de Bodrum en Turquie.

Compte tenu de la place accordée à cette tragédie humaine par les médias, nous avons décidé d’interroger le corpus d’élection 2015 pour y analyser le thème de l’accueil de réfugiés au Canada dans le discours officiel des différents partis depuis le début de la campagne électorale. Pour ce faire, nous utilisons les documents officiels publiés sur les sites Web des différents partis, comme les communiqués de presse et les documents d’information sur certains enjeux.

Continuer la lecture de « L’accueil des réfugiés dans les mots des partis »

Quels sont les mots caractéristiques des partis dans les campagnes antérieures?

Avant d’analyser le discours des partis politiques pour la campagne en cours, nous désirons d’abord regarder ce qui a été dit dans les campagnes précédentes. À partir des plateformes des cinq principaux partis en 2006, 2008 et 2011, nous avons dressé la liste des termes caractéristiques des formations politiques à l’aide du calcul des spécificités.

Continuer la lecture de « Quels sont les mots caractéristiques des partis dans les campagnes antérieures? »

Analyse thématique des plateformes de 2006, 2008 et 2011

En date du 15 septembre, les plateformes des élections 2015 des partis ne sont pas encore disponibles dans leur intégralité. Pour nous permettre de bien comprendre les particularités des thèmes de l’année 2015 lorsque ceux-ci seront disponibles, nous avons décidé de repérer les thèmes les plus fréquents des années antérieures. Pour obtenir un portrait plus fidèle de la réalité, nous avons procédé à une analyse séparée en anglais et en français, pour montrer les différences thématiques entre les deux langues.

Le repérage des thèmes les plus fréquents a été effectué par l’analyse des plateformes électorales officielles des principaux partis fédéraux (le Bloc québécois, le  Parti Conservateur, le Parti Libéral, le Nouveau Parti démocratique et le Parti Vert) lors des élections de 2006, 2008 et 2011. Les résultats de l’analyse sont présentés en anglais dans le tableau 1 et en français dans le tableau 2. Les thèmes sont présentés en ordre décroissant selon la fréquence moyenne d’apparition des mots clés individuels dans les documents.

Continuer la lecture de « Analyse thématique des plateformes de 2006, 2008 et 2011 »

Les mots de la campagne : comment et pourquoi

L’intérêt pour les données massives (Big data) est indéniable. Du milieu académique aux dirigeants d’entreprise, en passant par les élus et les fonctionnaires, tous souhaitent trouver la façon innovante pour tirer profit de la grande quantité de données dont nous disposons.

Les données massives sont l’incommensurable et toujours grandissante masse d’information que produit l’humanité à chaque instant. Elles prennent la forme de traces laissées notamment par les appareils intelligents, sur les réseaux sociaux ou avec des cartes fidélité. Les données massives sont la somme des données créées sans arrêt sur les faits et gestes des humains de toute la planète.

Or, que ce soit au service de la ville intelligente ou pour maximiser les profits, l’utilisation des données massives se traduit par une nouvelle forme de lecture utilisant des outils informatiques pour analyser une masse de données qui serait trop importante pour l’analyse humaine. On nomme Data Mining, ou fouille de données, certaines des activités d’analyse entourant les données massives.

La fouille de textes est une sous-discipline de la fouille de données. Cette activité consiste en l’analyse de corpus textuels, comme des discours, des articles ou des tweets, par exemple. Seulement, cette analyse ne tente pas de saisir le sens véhiculé par chaque texte, mais plutôt de découvrir des informations nouvelles, des tendances ou des constantes présentes dans le corpus. Un nouveau niveau de connaissance émane du corpus, que la lecture humaine de chacun des textes n’aurait pas pu permettre aussi rapidement et avec une perspective aussi globale.

La démarche implique :

  1.    La création du corpus
  2.    Le nettoyage des données
  3.    Le traitement des données
  4.    La visualisation et la présentation des données

En période électorale, les partis diffusent une masse d’information sur de multiples plateformes. Ces informations nous apparaissent comme un produit riche en potentiel d’analyse. Notre démarche vise à comparer tout au long de la campagne les mots des cinq principaux partis politiques fédéraux, d’une part entre eux et d’autre part avec les mots qu’ils ont utilisés lors des trois dernières élections fédérales. Notre processus est empreint de sérendipité; nous adaptons nos recherches en fonction du pouls de la campagne.