La société d’intelligence artificielle OpenAI a dévoilé une nouvelle puce IA conçue en partenariat avec le fabricant de semi-conducteurs Broadcom, dans le cadre de sa stratégie de renforcement de ses infrastructures de calcul.
Cette puce, baptisée “Jalapeño”, est destinée à optimiser les opérations d’inférence, c’est-à-dire le traitement des requêtes des utilisateurs sur des modèles de langage comme ChatGPT.
Une réponse à la pénurie de puissance de calcul
Face à la forte demande mondiale en puissance de calcul pour l’intelligence artificielle, OpenAI cherche à réduire sa dépendance aux solutions dominées par Nvidia.
Les laboratoires d’IA multiplient ainsi les initiatives pour concevoir leurs propres puces afin de mieux contrôler les coûts et les performances, dans un marché où la demande dépasse largement l’offre.
Une puce conçue pour l’inférence IA
La puce “Jalapeño” est spécifiquement optimisée pour les tâches d’inférence, qui consistent à répondre en temps réel aux requêtes des utilisateurs.
Selon les informations communiquées, elle serait comparable en performances aux architectures avancées de Nvidia et aux processeurs spécialisés développés par Google pour l’intelligence artificielle.
Un déploiement prévu dès cette année
OpenAI prévoit de commencer le déploiement de cette nouvelle puce d’ici la fin de l’année, dans le cadre d’un plan de développement multi-générationnel.
Le projet a été conçu en environ neuf mois, une rapidité rendue possible par l’utilisation d’outils d’IA dans le processus de conception des semi-conducteurs.
Une tendance lourde dans l’industrie de l’IA
De plus en plus d’acteurs majeurs de la technologie, dont Meta et Amazon, investissent dans la conception de puces sur mesure pour leurs infrastructures IA.
Cette stratégie reflète une tendance structurelle : la montée en puissance des modèles d’intelligence artificielle impose une course mondiale à la puissance de calcul et à l’optimisation des coûts.
Cette puce, baptisée “Jalapeño”, est destinée à optimiser les opérations d’inférence, c’est-à-dire le traitement des requêtes des utilisateurs sur des modèles de langage comme ChatGPT.
Une réponse à la pénurie de puissance de calcul
Face à la forte demande mondiale en puissance de calcul pour l’intelligence artificielle, OpenAI cherche à réduire sa dépendance aux solutions dominées par Nvidia.
Les laboratoires d’IA multiplient ainsi les initiatives pour concevoir leurs propres puces afin de mieux contrôler les coûts et les performances, dans un marché où la demande dépasse largement l’offre.
Une puce conçue pour l’inférence IA
La puce “Jalapeño” est spécifiquement optimisée pour les tâches d’inférence, qui consistent à répondre en temps réel aux requêtes des utilisateurs.
Selon les informations communiquées, elle serait comparable en performances aux architectures avancées de Nvidia et aux processeurs spécialisés développés par Google pour l’intelligence artificielle.
Un déploiement prévu dès cette année
OpenAI prévoit de commencer le déploiement de cette nouvelle puce d’ici la fin de l’année, dans le cadre d’un plan de développement multi-générationnel.
Le projet a été conçu en environ neuf mois, une rapidité rendue possible par l’utilisation d’outils d’IA dans le processus de conception des semi-conducteurs.
Une tendance lourde dans l’industrie de l’IA
De plus en plus d’acteurs majeurs de la technologie, dont Meta et Amazon, investissent dans la conception de puces sur mesure pour leurs infrastructures IA.
Cette stratégie reflète une tendance structurelle : la montée en puissance des modèles d’intelligence artificielle impose une course mondiale à la puissance de calcul et à l’optimisation des coûts.