Meta dévoile un nouveau modèle de langage étendu qui peut fonctionner sur un seul GPU
-
WarezienduJambon Pastafariste Rebellea écrit sur 27 févr. 2023, 07:29 dernière édition par duJambon
Vendredi, Meta a annoncé un nouveau modèle de langage étendu (LLM) alimenté par l’IA appelé LLaMA-13B qui, selon lui, peut surpasser GPT-3 bien qu’il soit “10 fois plus petit”. Des modèles d’IA de plus petite taille pourraient conduire à l’exécution locale d’assistants linguistiques de type ChatGPT sur des appareils tels que des PC et des smartphones. Il fait partie d’une nouvelle famille de modèles de langage appelée “Large Language Model Meta AI”, ou LLAMA en abrégé.
Actuellement, une version simplifiée de LLaMA est disponible sur GitHub . Pour recevoir le code complet et les pondérations (les données d’entraînement « apprises » dans un réseau de neurones), Meta fournit un formulaire auquel les chercheurs intéressés peuvent demander l’accès. Meta n’a pas annoncé de plans pour une version plus large du modèle et des poids pour le moment.
1/1