AWS améliore son service Bedrock LLM avec routage et caching

Home - Technologies et Avenirs - Intelligence Artificielle - AWS améliore son service Bedrock LLM avec routage et caching
AWS améliore son service Bedrock LLM avec routage et caching   Innovationsfr
décembre 4, 2024

AWS améliore son service Bedrock LLM avec routage et caching

Alors que de plus en plus d'entreprises passent des prototypes limités d'IA générative à une mise en production à grande échelle, la question des coûts devient cruciale. L'utilisation de grands modèles de langage (LLM) a en effet un prix. Lors de sa conférence re:Invent à Las Vegas, AWS a dévoilé deux nouvelles fonctionnalités pour son service d'hébergement de LLM Bedrock afin d'aider ses clients à optimiser leurs dépenses : le routage intelligent des requêtes et le caching.

Le caching pour éviter un travail redondant aux modèles

Avec le caching, plus besoin de payer le modèle pour retraiter encore et encore des requêtes similaires. "Imaginez qu'il y ait un document, et que plusieurs personnes posent des questions sur ce même document. À chaque fois, vous payez", explique Atul Deo, directeur produit de Bedrock. Grâce au caching, AWS assure pouvoir réduire les coûts jusqu'à 90%, mais aussi diminuer la latence pour obtenir une réponse du modèle de 85%. Adobe, qui a testé le caching sur Bedrock, a constaté un temps de réponse réduit de 72%.

Un routage intelligent des requêtes

L'autre grande nouveauté est le routage intelligent des requêtes. Bedrock peut désormais aiguiller automatiquement les prompts vers différents modèles d'une même famille, en fonction de leur complexité. Un petit modèle de langage prédit les performances de chaque modèle pour une requête donnée. Cela permet aux entreprises de trouver le bon équilibre entre performance et coût.

Parfois, ma requête peut être très simple. Ai-je vraiment besoin de l'envoyer au modèle le plus puissant, qui est extrêmement cher et lent ? Probablement pas.

– Atul Deo, directeur produit de Bedrock

Pour l'instant, le routage est limité aux modèles d'une même famille. Mais à terme, AWS compte étendre ce système et laisser plus de flexibilité aux utilisateurs.

Un marketplace pour les modèles spécialisés

Enfin, AWS lance un nouveau marketplace pour Bedrock. L'idée est de pouvoir héberger les centaines de modèles spécialisés qui émergent, même s'ils n'ont que quelques utilisateurs dédiés. Au total, une centaine de ces modèles "de niche" seront proposés dans un premier temps. La principale différence est que les clients devront provisionner et gérer eux-mêmes la capacité de leur infrastructure, là où Bedrock s'en charge normalement de façon automatique.

Avec ces annonces, AWS consolide sa position sur le marché très concurrentiel des services d'hébergement et d'optimisation de modèles de langage. Des fonctionnalités qui tombent à pic, à l'heure où les entreprises cherchent à industrialiser l'IA générative de la façon la plus rentable possible.

Share:

Ajouter Un Commentaire

Chercher

Catégories

Étiquettes

abus technologie Accord OpenAI Apple accélérateur innovation santé accélérateur startup accélérateur startups acquisition stratégique Amazon addiction réseaux sociaux adoption IA générative adoption intelligence artificielle all4pack emballages durables innovations packaging écoconception économie circulaire Andreessen Horowitz Twitter influence réseaux sociaux capital risque autonomie véhicules électriques avenir IA générative avenir intelligence artificielle barquettes inox consigne réduction déchets Berny transition écologique BoJ politique monétaire relance économique achats d'obligations transition monétaire campus cybersécurité chiffres inflation cloud computing commissaires vie privée compétitivité industrie automobile européenne conduite autonome confiance intelligence artificielle controverse Elon Musk crise financement startups données personnelles défis véhicules autonomes expansion internationale expérience utilisateur FinTech canadienne Géotechnique Décarbonation industrie Empreinte carbone Transition énergétique Prototype innovant IA conversationnelle IA industrie 4.0 Imagino levée de fonds marketing digital données clients expansion internationale Industrie du futur Relocalisation industrielle Transition écologique Startups deeptech Souveraineté technologique marchés financiers mobilité durable mobilité urbaine souveraineté numérique startup innovante startups innovantes transformation numérique transition énergétique économie circulaire énergies renouvelables

Beauty and lifestyle influencer

Follow my journey on all Social Media channels

Alienum phaedrum torquatos nec eu, vis detraxit periculis ex, nihilmei. Mei an pericula euripidis, hinc partem ei est.
facebook
5M+
Facebook followers
Follow Me
youtube
4.6M+
Youtube Subscribers
Subscribe Me
tiktok
7M+
Tiktok Followers
Follow Me
instagram
3.4M+
Instagram Followers
Follow Me