TAL et RNP, TP 2: vecteurs de mots

Table of Contents

1. Implémentations de Word2vec

Dans ce TP, vous implémenterez deux méthodes d'apprentissage pour les vecteurs de mots:

  1. Par maximum de vraisemblance classique
  2. Par échantillonnage négatif

Dans l'évaluation de ce TP, on fera très attention à l'efficacité du code rendu !

1.1. Prise en main

Pour tous les TP, vous suivrez la même procédure, détaillée ci-dessous:

  1. Téléchargez le carnet ici
  2. Ouvrez une fenêtre de votre navigateur sur colab
  3. Chargez le carnet (FileOpen Notebook …)
  4. Lisez/évaluez/complétez le notebook
  5. Sauvegardez le carnet, et téléchargez-le (FileDownload .ipynb)
  6. Pour les TP évalués, connectez-vous à l'ENT, et à la page du cours de TAL
  7. Pour les TP évalués, soumettez votre carnet sur l'interface de rendu pour la semaine concernée

1.1.1. Remarques

Vous pouvez installer jupyter notebook sur votre ordinateur personnel et travailler en local. Il vous faudra dans ce cas veiller à installer jupyter et les bibliothèques nécessaires.

Author: Joseph Le Roux

Created: 2025-01-30 Jeu 16:37