Construction d'une interface graphique pour l'exploration d'un corpus de documents multiclasses. L'apprentissage peut être supervisé ou non.

Switcher de vue globale

  • affichage sous forme de :
    • graphe
    • tableau
  • affichage entier/partiel (portion de graph)
  • réorganisation du graphe

Switcher la vue des clusters

  • mots fréquents
  • mots discriminants
  • exemple de documents cliquables
  • indicateur statistique sur les clusters: vraisemblance/entropie...

Switcher la vue des documents dans l'interface

  • nom de fichiers
  • titre
  • première phrase
  • résumé "à la Google"

Switcher la représentation d'un document

  • texte surligné
  • histogramme des poids
  • projection en proba sur les clusters

Modification dynamique des modèles

  • drag/drop de documents
  • modification clustering/classification linéaire
    • suppression des clusters
    • passage d'un document d'une classe à l'autre & modification