Fireworks AI et MongoDB : les applications d'IA les plus rapides avec les meilleurs modèles, alimentées par vos données

Mat Keep and Angela Lee

Nous sommes heureux d'annoncer que Fireworks AI et MongoDB s'associent désormais pour rendre l'innovation avec l'IA générative plus rapide, plus efficace et plus sûre. Fireworks AI a été fondée fin 2022 par des experts de l'équipe PyTorch de Meta, qui se sont concentrés sur l'optimisation des performances, l'amélioration de l'expérience des développeurs et l'exécution d'applications d'IA à grande échelle.

C'est cette expertise que Fireworks AI apporte à sa plateforme d'IA de production, en conservant et en optimisant les principaux modèles ouverts du secteur. Les analyses comparatives réalisées par l'entreprise révèlent que les modèles d'IA générative fonctionnant sur Fireworks AI offrent des vitesses d'inférence jusqu'à quatre fois supérieures à celles des plateformes alternatives, avec un débit et une échelle jusqu'à huit fois plus élevés.

Les modèles constituent une partie de la pile d'applications. Mais pour que les développeurs puissent exploiter la puissance de l'IA générique, ils doivent également intégrer les données de l'entreprise à ces modèles. C'est pourquoi Fireworks AI s'est associé à MongoDB pour relever l'un des plus grands défis de l'adoption de l'IA. Avec MongoDB Atlas, les développeurs peuvent unifier en toute sécurité les données opérationnelles, les données non structurées et les données vectorielles pour créer des applications et des expériences d'IA cohérentes, précises et différenciées.

Ensemble, Fireworks AI et MongoDB offrent une solution aux développeurs qui souhaitent exploiter des modèles open source hautement spécialisés et optimisés, et les combiner avec les données propriétaires de leur organisation, le tout avec une rapidité et une sécurité inégalées.

Modèles ultra-rapides de Fireworks AI : alliant rapidité, efficacité et valeur

Grâce à sa plateforme d’inférence ultra-rapide, Fireworks AI organise, optimise et déploie plus de 40 modèles d’IA différents. Ces optimisations peuvent simultanément entraîner des économies de coûts significatives, une latence réduite et un débit amélioré. Leur plateforme offre cela via :

  • Des modèles prêts à l'emploi, des modèles optimisés et des modules complémentaires : Fireworks AI propose une collection de modèles de qualité supérieure pour le texte, l'intégration et les fondations d'images. Les développeurs peuvent exploiter ces modèles ou affiner et déployer les leurs, en les associant à leurs propres données à l'aide de MongoDB Atlas.

  • Des capacités d'affinage : pour améliorer encore la précision et la rapidité des modèles, Fireworks AI propose également un service d'affinage utilisant son CLI pour ingérer des objets au format JSON à partir de bases de données telles que MongoDB Atlas.

  • Des interfaces et des API simples pour le développement et la production : Fireworks AI permet aux développeurs d'interagir avec les modèles directement dans un navigateur. Il est également accessible par programme via une API REST pratique. Elle est compatible avec l'API OpenAI et interagit donc avec l'écosystème LLM plus large.

  • Un livre de cuisine : un livre de recettes simple et facile à utiliser fournit un ensemble complet de recettes prêtes à l'emploi qui peuvent être adaptées à différents cas d'utilisation, y compris l'affinage, la génération et l'évaluation.

Fireworks AI et MongoDB : établir la norme pour l'IA avec des modèles organisés, optimisés et rapides

Avec Fireworks AI et MongoDB Atlas, les applications s'exécutent dans des environnements isolés garantissant la disponibilité et la confidentialité, protégées par des contrôles de sécurité sophistiqués qui répondent aux normes réglementaires les plus strictes :

  • Fireworks AI est l'un des principaux fournisseurs d'API de modèles open source et gère 66 milliards de jetons par jour (et ce chiffre ne cesse de croître).

  • Avec Atlas, vous exécutez vos applications sur une plateforme éprouvée qui sert des dizaines de milliers de clients, des startups à forte croissance aux plus grandes entreprises et gouvernements.

Ensemble, la solution conjointe Fireworks AI et MongoDB offre :

  • Une génération augmentée de récupération (RAG) ou des questions-réponses à partir d'un vaste ensemble de documents : l'ingestion d'un grand nombre de documents permet de produire des résumés et des données structurées qui peuvent ensuite alimenter l'IA conversationnelle.

  • Une classification grâce à la recherche sémantique/de similarité : classifie et analyse les concepts et les émotions issus des appels de vente, des vidéoconférences, etc. afin d'améliorer les informations et les stratégies. Ou encore, organise et classe un catalogue de produits à l'aide d'images et de textes.

  • Une extraction de données structurées à partir d'images : extrait le sens des images pour produire des données structurées qui peuvent être traitées et recherchées dans une gamme d'applications visuelles. Des photos de stock à la mode, en passant par la détection d'objets et les diagnostics médicaux.

  • Une alerte intelligente : traite de grandes quantités de données en temps réel pour détecter et alerter automatiquement les cas de fraude, les menaces de cybersécurité, etc.

Figure 1 : le tutoriel Fireworks montre comment apporter vos propres données aux LLM avec la génération augmentée de récupération (RAG) et Atlas MongoDB.

Prise en main de Fireworks AI et MongoDB Atlas

Pour vous aider à vous lancer, découvrez le tutoriel Optimiser la RAG avec MongoDB Atlas et Fireworks AI, qui vous montre comment créer une application de recommandation de films et implique

  • la base de données MongoDB Atlas qui indexe les films à l'aide d'intégrations. (Vector Store)

  • Système de génération d'intégration de documents. Nous utiliserons l'API Fireworks pour créer des intégrations à partir de données textuelles. (Vectorisation)

  • MongoDB Atlas Vector Search répond aux requêtes des utilisateurs en convertissant la requête en une image et en récupérant les films correspondants. (Moteur de récupération)

  • Le modèle Mixtral utilise l'API d'inférence Fireworks pour générer les recommandations. Vous pouvez également utiliser Llama, Gemma et d'autres grands modèles OSS si vous le souhaitez. (LLM)

  • Chargement de la base de données MongoDB Atlas Sample Mflix Dataset pour générer des intégrations (Dataset)

Nous pouvons également vous aider à concevoir l'architecture la mieux adaptée aux besoins de votre organisation. N'hésitez pas à contacter votre équipe ou à nous contacter ici pour planifier une session de collaboration et découvrir comment Fireworks AI et MongoDB peuvent optimiser votre processus de développement de l'IA.