TAL et RNP, TP 4: étiquetage de séquences avec RNN

Table of Contents

1. Étiquetage en parties du discours

Dans ce TP, vous implémenterez un étiqueteur qui extrait des caractéristiques de chaque mots par RNN, par CNN, et directement à partir des vecteurs de mots. Comme la dernière fois, la principale difficulté est la construction des batches constitués de phrases de longueurs différentes. Pour les RNN, vous utiliserez les packs de pytorch pour les construire. Pour les CNN, vous construirez le batch comme lors du TP précédent, manuellement.

1.1. Prise en main

Pour tous les TP, vous suivrez la même procédure, détaillée ci-dessous:

  1. Téléchargez le carnet ici
  2. Ouvrez une fenêtre de votre navigateur sur colab
  3. Chargez le carnet (FileOpen Notebook …)
  4. Lisez/évaluez/complétez le notebook
  5. Sauvegardez le carnet, et téléchargez-le (FileDownload .ipynb)
  6. Connectez-vous à l'ENT, et à la page du cours de TAL
  7. Soumettez votre carnet sur l'interface de rendu pour la semaine concernée

1.1.1. Remarques

Vous pouvez installer jupyter notebook sur votre ordinateur personnel et travailler en local. Il vous faudra dans ce cas veiller à installer jupyter et les bibliothèques nécessaires.

Author: Joseph Le Roux

Created: 2025-01-30 Jeu 16:37