The Thought Process
A place to think - By Judicaël Poumay (Ph.D.)
Sélection pour vous

Artificial IntelligenceMachine Learning
RLHF et LLMs : Comment ca fonctionne? Une analyse approfondie
A deep dive into Reinforcement Learning with Human Feedback (RLHF) for LLMs. The key to make LLMs practical and aligned with human values.
11 min de lecture

Mathematics & Science
Les branches des mathématiques
Les maths au final c'est quoi? Quelles sont les grands domaines des mathématiques? Et surtout, ca sert a quoi?
5 min

Artificial IntelligenceMachine Learning
La distillation de modèles IA : principe, méthodes, avantages et limites
La distillation de connaissances (ou distillation de modèles) est une technique de compression de l'IA où un modèle plus petit et plus rapide, appelé 'élève' (Student Model), est entraîné à reproduire le comportement d'un modèle plus complexe, appelé 'professeur' (Teacher Model).
8 min








