{"id":54,"date":"2015-09-08T19:41:21","date_gmt":"2015-09-08T19:41:21","guid":{"rendered":"http:\/\/dominicforest.me\/fed2015\/?p=54"},"modified":"2016-06-01T16:04:54","modified_gmt":"2016-06-01T20:04:54","slug":"les-mots-de-la-campagne-comment-et-pourquoi","status":"publish","type":"post","link":"http:\/\/dominicforest.me\/fed2015\/2015\/09\/08\/les-mots-de-la-campagne-comment-et-pourquoi\/","title":{"rendered":"Les mots de la campagne : comment et pourquoi"},"content":{"rendered":"<p>L&rsquo;int\u00e9r\u00eat pour les donn\u00e9es massives (<i>Big data<\/i>) est ind\u00e9niable.\u00a0Du milieu acad\u00e9mique aux dirigeants d\u2019entreprise, en passant par les \u00e9lus et les fonctionnaires, tous souhaitent trouver la fa\u00e7on innovante pour tirer profit de la grande quantit\u00e9 de donn\u00e9es dont nous disposons.<\/p>\n<p>Les donn\u00e9es massives sont l\u2019incommensurable et toujours grandissante masse d\u2019information que produit l\u2019humanit\u00e9 \u00e0 chaque instant. Elles prennent la forme de traces laiss\u00e9es notamment par les appareils intelligents, sur les r\u00e9seaux sociaux ou avec des cartes fid\u00e9lit\u00e9. Les donn\u00e9es massives sont la somme des donn\u00e9es cr\u00e9\u00e9es sans arr\u00eat sur les faits et gestes des humains de toute la plan\u00e8te.<\/p>\n<p>Or, que ce soit au service de la ville intelligente ou pour maximiser les profits, l\u2019utilisation des donn\u00e9es massives se traduit par une nouvelle forme de lecture utilisant des outils informatiques pour analyser une masse de donn\u00e9es qui serait trop importante pour l\u2019analyse humaine. On nomme <i>Data Mining<\/i>, ou fouille de donn\u00e9es, certaines des activit\u00e9s d\u2019analyse entourant les donn\u00e9es massives.<\/p>\n<p>La fouille de textes est une sous-discipline de la fouille de donn\u00e9es<i>.<\/i> Cette activit\u00e9 consiste en l\u2019analyse de corpus textuels, comme des discours, des articles ou des tweets, par exemple. Seulement, cette analyse ne tente pas de saisir le sens v\u00e9hicul\u00e9 par chaque texte, mais plut\u00f4t de d\u00e9couvrir des informations nouvelles, des tendances ou des constantes pr\u00e9sentes dans le corpus. Un nouveau niveau de connaissance \u00e9mane du corpus, que la lecture humaine de chacun des textes n&rsquo;aurait pas pu permettre aussi rapidement et avec une perspective aussi globale.<\/p>\n<p>La d\u00e9marche implique :<\/p>\n<ol>\n<li><b> \u00a0\u00a0 La cr\u00e9ation du corpus<\/b><\/li>\n<li><b> \u00a0\u00a0 Le nettoyage des donn\u00e9es<\/b><\/li>\n<li><b> \u00a0\u00a0 Le traitement des donn\u00e9es<\/b><\/li>\n<li><b>\u00a0\u00a0 La visualisation et la pr\u00e9sentation des donn\u00e9es<\/b><\/li>\n<\/ol>\n<p>En p\u00e9riode \u00e9lectorale, les partis diffusent une masse d\u2019information sur de multiples plateformes. Ces informations nous apparaissent comme un produit riche en potentiel d\u2019analyse. Notre d\u00e9marche vise \u00e0 comparer tout au long de la campagne les mots des cinq principaux partis politiques f\u00e9d\u00e9raux, d&rsquo;une part entre eux et d&rsquo;autre part avec les mots qu&rsquo;ils ont utilis\u00e9s lors des trois derni\u00e8res \u00e9lections f\u00e9d\u00e9rales. Notre processus est empreint de s\u00e9rendipit\u00e9; nous adaptons nos recherches en fonction du pouls de la campagne.<\/p>\n<p>&nbsp;<\/p>\n","protected":false},"excerpt":{"rendered":"<p>L&rsquo;int\u00e9r\u00eat pour les donn\u00e9es massives (Big data) est ind\u00e9niable.\u00a0Du milieu acad\u00e9mique aux dirigeants d\u2019entreprise, en passant par les \u00e9lus et les fonctionnaires, tous souhaitent trouver la fa\u00e7on innovante pour tirer profit de la grande quantit\u00e9 de donn\u00e9es dont nous disposons. Les donn\u00e9es massives sont l\u2019incommensurable et toujours grandissante masse d\u2019information que produit l\u2019humanit\u00e9 \u00e0 chaque &hellip; <a href=\"http:\/\/dominicforest.me\/fed2015\/2015\/09\/08\/les-mots-de-la-campagne-comment-et-pourquoi\/\" class=\"more-link\">Continuer la lecture<span class=\"screen-reader-text\"> de &laquo;&nbsp;Les mots de la campagne : comment et pourquoi&nbsp;&raquo;<\/span><\/a><\/p>\n","protected":false},"author":5,"featured_media":0,"comment_status":"closed","ping_status":"open","sticky":false,"template":"","format":"standard","meta":[],"categories":[1],"tags":[5,8,10,7,4],"_links":{"self":[{"href":"http:\/\/dominicforest.me\/fed2015\/wp-json\/wp\/v2\/posts\/54"}],"collection":[{"href":"http:\/\/dominicforest.me\/fed2015\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"http:\/\/dominicforest.me\/fed2015\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"http:\/\/dominicforest.me\/fed2015\/wp-json\/wp\/v2\/users\/5"}],"replies":[{"embeddable":true,"href":"http:\/\/dominicforest.me\/fed2015\/wp-json\/wp\/v2\/comments?post=54"}],"version-history":[{"count":9,"href":"http:\/\/dominicforest.me\/fed2015\/wp-json\/wp\/v2\/posts\/54\/revisions"}],"predecessor-version":[{"id":99,"href":"http:\/\/dominicforest.me\/fed2015\/wp-json\/wp\/v2\/posts\/54\/revisions\/99"}],"wp:attachment":[{"href":"http:\/\/dominicforest.me\/fed2015\/wp-json\/wp\/v2\/media?parent=54"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"http:\/\/dominicforest.me\/fed2015\/wp-json\/wp\/v2\/categories?post=54"},{"taxonomy":"post_tag","embeddable":true,"href":"http:\/\/dominicforest.me\/fed2015\/wp-json\/wp\/v2\/tags?post=54"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}