Description
Concepts et techniques de l’analyse de données textuelles. Fouille de textes. Extraction et organisation automatiques. Méthodes descriptives et prédictives pour l’analyse de corpus documentaires. Applications d’algorithmes d’intelligence artificielle en science de l’information.
À titre d’objectif général, ce cours entend développer chez les étudiants les habiletés intellectuelles et techniques nécessaires à l’utilisation réfléchie de certains outils de fouille de documents dans le domaine des sciences de l’information. La réalisation de cet objectif implique que l’étudiant soit en mesure, au terme du cours, de témoigner de ses habilités à réaliser de manière concrète un certain nombre de tâches et d’opérations.
Documents (espace sécurisé)
- Notes de cours du 14 septembre 2017 - Introduction à la fouille de données [438 Ko]
- Notes de cours du 21 septembre 2017 - Les corpus [63 Ko]
- Notes de cours du 29 septembre 2017 - La segmentation [65 Ko]
- Notes de cours du 5 octobre 2017 - L'extraction et le filtrage du lexique [197 Ko]
- Notes de cours du 12 octobre 2017 - L'extraction de termes complexes [113 Ko]
- Notes de cours du 19 octobre 2017 - La classification automatique des documents [1,6 Mo]
- Nature.com. English communication for scientists. Unit 2: writing scientific papers.
- SARA (Service d’Aide à la Rédaction d’Articles) (ETS) 2.Rédiger son article.
- Fayyad, U., G. Piatetsky-Shapiro et P. Smyth. 1996. From data mining to knowledge discovery in Databases. AI magazine, vol. 1, pp. 37-54. [350 Ko]
- Memmi, D. 2000. Le modèle vectoriel pour le traitement de documents Cahiers du laboratoire Leibniz, no 2000-14. [302 Ko]
- Blei, D. M. 2012. Probabilistic topic models Communication of the ACM, vol. 55, no 4, pp. 77-84 [1 Mo]
- Sokolova, M. et Lapalme, G. 2009. A systematic analysis of performance measures for classification tasks Information processing and management, vol. 45, pp. 427-437 [246 Ko]