• Francúzsky jazyk

Catégorisation automatique de textes et cooccurrence de mots

Autor: Simon Réhel

Ayant pour objectif de rendre un programme informatique capable d'assigner de façon autonome des documents textuels à leur classe d'appartenance, la catégorisation automatique de textes est rendue possible grâce à l'apprentissage supervisé. Un entraînement... Viac o knihe

Na objednávku, dodanie 2-4 týždne

59.66 €

bežná cena: 67.80 €

O knihe

Ayant pour objectif de rendre un programme informatique capable d'assigner de façon autonome des documents textuels à leur classe d'appartenance, la catégorisation automatique de textes est rendue possible grâce à l'apprentissage supervisé. Un entraînement du programme est effectué sur un ensemble de documents auxquels des étiquettes de catégorie ont déjà été assignées par des humains. Or, la constitution de cet ensemble d'entraînement se révèle un processus long et coûteux. Ce mémoire propose une façon d'améliorer la capacité d'un classificateur à bien accomplir sa tâche dans des situations où un entraînement sur un nombre suffisant de textes n'aura pas été possible. L'approche suggérée consiste à étudier une forme d'association, la cooccurrence, entre les mots provenant d'un ensemble de textes libellés et ceux provenant d'un ensemble de textes non libellés, plus volumineux. On espère ainsi augmenter à faible coût le vocabulaire utile à la classification de textes, en minimisant le nombre de documents à étiqueter.

  • Vydavateľstvo: Éditions universitaires européennes
  • Rok vydania: 2011
  • Formát: Paperback
  • Rozmer: 220 x 150 mm
  • Jazyk: Francúzsky jazyk
  • ISBN: 9786131585333

Generuje redakčný systém BUXUS CMS spoločnosti ui42.