TAL et RNP, TP 4: étiquetage de séquences avec RNN
Table of Contents
1. Étiquetage en parties du discours
Dans ce TP, vous implémenterez un étiqueteur qui extrait des caractéristiques de chaque mots par RNN, par CNN, et directement à partir des vecteurs de mots. Comme la dernière fois, la principale difficulté est la construction des batches constitués de phrases de longueurs différentes. Pour les RNN, vous utiliserez les packs de pytorch pour les construire. Pour les CNN, vous construirez le batch comme lors du TP précédent, manuellement.
1.1. Prise en main
Pour tous les TP, vous suivrez la même procédure, détaillée ci-dessous:
- Téléchargez le carnet ici
- Ouvrez une fenêtre de votre navigateur sur colab
- Chargez le carnet (File → Open Notebook …)
- Lisez/évaluez/complétez le notebook
- Sauvegardez le carnet, et téléchargez-le (File → Download .ipynb)
- Connectez-vous à l'ENT, et à la page du cours de TAL
- Soumettez votre carnet sur l'interface de rendu pour la semaine concernée
1.1.1. Remarques
Vous pouvez installer jupyter notebook sur votre ordinateur personnel et travailler en local. Il vous faudra dans ce cas veiller à installer jupyter et les bibliothèques nécessaires.