LL_NE v1 développé par Mohamed Hatmi 05/02/2014

Des détails sont donnés dans le chapître 4 de la thèse de Mohamed Hatmi.

D'abord, il faut installer les outils suivants (attention, on travaille en isolatin1)

Ensuite, il faut definir les variables d'environnement suivantes :

export LIA_TAGG=/home/hatmim/Bureau/lia_tag
export LD_LIBRARY_PATH=/usr/lib:/usr/local/lib/
export LIA_TAGG_LANG=french

Consignes pour réaliser l'étiquetage en EN d'un texte

Utiliser la commande suivante pour annoter un nouveau texte dont les EN sont capitalisées :
sh tagTextMaj.sh nom_fichier

et la commande suivante pour annoter un nouveau texte dont les EN ne sont pas capitalisées :
sh tagTextMin.sh nom_fichier

un exemple d'un étiquetage effectué est donné dans le fichier nommé datatest/test, le résultat obtenu est nommé datatest/test.ne

Commentaire de Christine Jacquin le 20/05/2014

Apprentissage des modèles pour LL_NE

Le fichier de template utilisé est modeles/train/template.

Il faut faire 3 apprentissages: niveau catégorie, niveau composant, niveau imbrication en structurant les corpus d'apprentissage comme décrit dans la thèse de Mohamed (chapître 4).
Un outil est disponible pour transformer les annotations au format BIO => outil/ConvertToBio.java

Les modèles générés par Mohamed lors de l'apprentissage et qui sont utilisés lors de la phase d'étiquetage sont dans modeles/majuscule ou modeles/minuscule

Le code est disponible sur le serveur SVN du LINA => https://forge.lina.univ-nantes.fr/talnsvn/projets/ dans le projet DEPART pour les membres de l'équipe TALN du LINA. Pour les autres, veuillez contacter