Quels sont les mots caractéristiques des partis dans les campagnes antérieures?

Avant d’analyser le discours des partis politiques pour la campagne en cours, nous désirons d’abord regarder ce qui a été dit dans les campagnes précédentes. À partir des plateformes des cinq principaux partis en 2006, 2008 et 2011, nous avons dressé la liste des termes caractéristiques des formations politiques à l’aide du calcul des spécificités.

Continuer la lecture de « Quels sont les mots caractéristiques des partis dans les campagnes antérieures? »

Analyse thématique des plateformes de 2006, 2008 et 2011

En date du 15 septembre, les plateformes des élections 2015 des partis ne sont pas encore disponibles dans leur intégralité. Pour nous permettre de bien comprendre les particularités des thèmes de l’année 2015 lorsque ceux-ci seront disponibles, nous avons décidé de repérer les thèmes les plus fréquents des années antérieures. Pour obtenir un portrait plus fidèle de la réalité, nous avons procédé à une analyse séparée en anglais et en français, pour montrer les différences thématiques entre les deux langues.

Le repérage des thèmes les plus fréquents a été effectué par l’analyse des plateformes électorales officielles des principaux partis fédéraux (le Bloc québécois, le  Parti Conservateur, le Parti Libéral, le Nouveau Parti démocratique et le Parti Vert) lors des élections de 2006, 2008 et 2011. Les résultats de l’analyse sont présentés en anglais dans le tableau 1 et en français dans le tableau 2. Les thèmes sont présentés en ordre décroissant selon la fréquence moyenne d’apparition des mots clés individuels dans les documents.

Continuer la lecture de « Analyse thématique des plateformes de 2006, 2008 et 2011 »

Les mots de la campagne : comment et pourquoi

L’intérêt pour les données massives (Big data) est indéniable. Du milieu académique aux dirigeants d’entreprise, en passant par les élus et les fonctionnaires, tous souhaitent trouver la façon innovante pour tirer profit de la grande quantité de données dont nous disposons.

Les données massives sont l’incommensurable et toujours grandissante masse d’information que produit l’humanité à chaque instant. Elles prennent la forme de traces laissées notamment par les appareils intelligents, sur les réseaux sociaux ou avec des cartes fidélité. Les données massives sont la somme des données créées sans arrêt sur les faits et gestes des humains de toute la planète.

Or, que ce soit au service de la ville intelligente ou pour maximiser les profits, l’utilisation des données massives se traduit par une nouvelle forme de lecture utilisant des outils informatiques pour analyser une masse de données qui serait trop importante pour l’analyse humaine. On nomme Data Mining, ou fouille de données, certaines des activités d’analyse entourant les données massives.

La fouille de textes est une sous-discipline de la fouille de données. Cette activité consiste en l’analyse de corpus textuels, comme des discours, des articles ou des tweets, par exemple. Seulement, cette analyse ne tente pas de saisir le sens véhiculé par chaque texte, mais plutôt de découvrir des informations nouvelles, des tendances ou des constantes présentes dans le corpus. Un nouveau niveau de connaissance émane du corpus, que la lecture humaine de chacun des textes n’aurait pas pu permettre aussi rapidement et avec une perspective aussi globale.

La démarche implique :

  1.    La création du corpus
  2.    Le nettoyage des données
  3.    Le traitement des données
  4.    La visualisation et la présentation des données

En période électorale, les partis diffusent une masse d’information sur de multiples plateformes. Ces informations nous apparaissent comme un produit riche en potentiel d’analyse. Notre démarche vise à comparer tout au long de la campagne les mots des cinq principaux partis politiques fédéraux, d’une part entre eux et d’autre part avec les mots qu’ils ont utilisés lors des trois dernières élections fédérales. Notre processus est empreint de sérendipité; nous adaptons nos recherches en fonction du pouls de la campagne.