Planifier la gestion des coûts pour l'inférence de modèles dans Azure AI Services

Article
02/20/2025

Cet article décrit comment planifier et gérer les coûts de l'inférence de modèle dans Azure AI Services. Après avoir commencé à utiliser l'inférence de modèle dans les ressources Azure AI Services, utilisez les fonctions Cost Management pour définir des budgets et surveiller les coûts.

Bien que cet article traite de la planification et de la gestion des coûts de l'inférence de modèles dans Azure AI Services, vous êtes facturé pour tous les services et ressources Azure utilisés dans le cadre de votre abonnement Azure.

Prérequis

Analyse des coûts dans Cost Management prend en charge la plupart des types de compte Azure, mais pas tous. Pour accéder à la liste complète des types de comptes pris en charge, voir Comprendre les données de Cost Management.
Pour afficher les données de coût, vous avez au minimum besoin d’un accès en lecture pour un compte Azure. Pour plus d’informations sur l’attribution de l’accès aux données Cost Management, consultez Assigner l’accès aux données.

Comprendre le modèle de facturation d’inférence du modèle

Les modèles déployés dans Azure AI Services sont facturés par 1 000 jetons. Les modèles de langage comprennent et traitent le texte en le divisant en jetons. Pour référence, chaque jeton correspond à environ quatre caractères pour un texte typique en anglais. Les coûts par jeton varient selon la série de modèles que vous choisissez. Les modèles qui peuvent traiter les images décomposent également les images dans des jetons. Le nombre de jetons par image dépend du modèle et de la résolution de l’image d’entrée.

Les coûts des jetons englobent à la fois l’entrée et la sortie. Par exemple, supposons que vous avez un échantillon de code JavaScript de 1 000 jetons et que vous demandez à un modèle de le convertir en Python. Vous serez facturé environ 1 000 jetons pour la demande d’entrée initiale envoyée, et 1 000 autres jetons pour la sortie reçue en réponse, ce qui fait un total de 2 000 jetons.

En pratique, pour ce type d’appel de complétion, l’entrée/sortie de jetons ne serait pas une correspondance parfaite 1:1. La conversion d’un langage de programmation en un autre pourrait entraîner une sortie plus longue ou plus courte en fonction d’un grand nombre de facteurs. L’un de ces facteurs est la valeur affectée au paramètre max_tokens.

Répartition des coûts

Pour comprendre la répartition de ce qui constitue le coût, il peut être utile d’utiliser Analyse des coûts dans le portail Azure. Procédez comme suit pour comprendre le coût de l’inférence :

Accédez au Portail Azure AI Foundry.
Dans le coin supérieur droit de l’écran, sélectionnez le nom de votre ressource Azure AI Services, ou si vous travaillez sur un projet IA, sur le nom du projet.
Sélectionnez le nom du projet. Le portail Azure s'ouvre dans une nouvelle fenêtre.
Sous Gestion des coûts, sélectionnez Analyse des coûts.
Par défaut, l'analyse des coûts est limitée au groupe de ressources sélectionné.

Important

Il est important d'étendre l'analyse des coûts au groupe de ressources dans lequel la ressource Azure AI Services est déployée. Les compteurs de coûts associés à certains fournisseurs de modèles, tels que Mistral AI ou Cohere, sont affichés sous le groupe de ressources au lieu de la ressource Azure AI Services.
Modifiez Grouper par à Compteur. Vous pouvez maintenant voir que pour ce groupe de ressources particulier, la source des coûts provient de différentes séries de modèles.

Les sections suivantes expliquent les entrées en détail.

Modèles Azure OpenAI et Microsoft

Azure OpenAI et la famille de modèles Microsoft (comme Phi) sont facturés directement et ils s’affichent en tant que compteurs de facturation sous chaque ressource de services Azure AI. Cette facturation se produit directement via Microsoft. Lorsque vous inspectez votre facture, vous remarquez que les compteurs de facturation représentent les entrées et les sorties pour chaque modèle consommé.

Modèles de fournisseur

Les modèles fournis par un autre fournisseur, comme Mistral AI, Cohere, Meta AI ou AI21 Labs, sont facturés à l’aide de la Place de marché Azure. Contrairement aux compteurs de facturation Microsoft, ces entrées sont associées au groupe de ressources où vos services Azure AI sont déployés au lieu de la ressource Azure AI Services elle-même. Vous voyez les entrées sous le nom de serviceSaaS la comptabilité des entrées et des sorties pour chaque modèle consommé.

Utilisation du paiement anticipé Azure

Vous pouvez payer Azure OpenAI et les frais de modèles de Microsoft avec votre crédit de prépaiement Azure. Toutefois, vous ne pouvez pas utiliser le crédit de paiement anticipé Azure pour payer des frais pour d’autres modèles de fournisseur, étant donné qu’ils sont facturés via la Place de marché Azure.

Code de réponse d’erreur HTTP et état de facturation

Si le service effectue le traitement, vous êtes facturé(e) même si le code d’état n’est pas réussi (pas l’erreur 200). Par exemple, une erreur 400 en raison d’un filtre de contenu ou d’une limite d’entrée, ou d’une erreur 408 en raison d’un délai d’expiration.

Si le service n’effectue pas de traitement, vous n’êtes pas facturé(e). Par exemple, une erreur 401 en raison de l’authentification ou d’une erreur 429 en raison d’un dépassement de la limite de débit.

Autres coûts

L’activation de fonctionnalités telles que l’envoi de données aux journaux Azure Monitor et la génération d’alertes entraîne des coûts supplémentaires pour ces services. Ces coûts sont visibles sous ces autres services et au niveau de l’abonnement, mais ne sont pas visibles lorsqu’ils sont limités à votre ressource Azure AI Services.

Superviser les coûts

Les coûts unitaires d’utilisation des ressources Azure varient selon des intervalles de temps (secondes, minutes, heures et jours) ou selon l’utilisation d’unités (octets, mégaoctets, etc.). Dès que l’utilisation d’Azure AI Services démarre, des coûts sont occasionnés, que vous pouvez voir dans l’analyse des coûts.

Vous pouvez obtenir des informations de facturation plus détaillées à l’aide d’Analyse des coûts :

Pour comprendre la répartition de ce qui constitue ce coût, il peut être utile d’utiliser Analyse des coûts dans le portail Azure.

Accédez au Portail Azure AI Foundry.
Dans le coin supérieur droit de l’écran, sélectionnez le nom de votre ressource Azure AI Services, ou si vous travaillez sur un projet IA, sur le nom du projet.
Sélectionnez le nom du projet. Le portail Azure s'ouvre dans une nouvelle fenêtre.
Sous Gestion des coûts, sélectionnez Analyse des coûts.
Par défaut, l'analyse des coûts est limitée au groupe de ressources que vous avez sélectionné.
Étant donné que nous voyons le coût de tous les groupes de ressources, il est utile de voir le coût par ressource. Dans ce cas, sélectionnez Afficher>Coût par ressource.
Vous pouvez maintenant voir les ressources qui génèrent chacun des compteurs de facturation.
Les modèles Azure OpenAI et les modèles Microsoft, comme expliqué précédemment, sont affichés sous chaque ressource azure AI Services :
Certains modèles de fournisseurs sont affichés sous forme de compteurs sous ressources globales. Notez que le mot Globaln’est pas lié à la référence SKU du déploiement de modèle (par exemple, standard global). Si vous avez plusieurs ressources de services Azure AI, votre facture contient une entrée pour chaque modèle pour chaque ressource Azure AI Services. Les compteurs de ressources ont le format [nom_modèle]-[GUID] où [GUID] est un identificateur unique associé à une ressource Azure AI Services donnée. Vous constatez que les compteurs de facturation comptabilisent les entrées et les sorties pour chaque modèle que vous avez consommé.

Il est important de comprendre l’étendue lors de l’évaluation des coûts associés à Azure AI services. Si vos ressources font partie du même groupe de ressources, vous pouvez étendre l’analyse des coûts à ce niveau pour comprendre l’effet sur les coûts. Si vos ressources sont réparties entre plusieurs groupes de ressources, vous pouvez définir l’étendue au niveau de l’abonnement.

Créer des budgets

Vous pouvez créer des budgets pour gérer les coûts, et des alertes permettant d’avertir les parties prenantes en cas d’anomalies de dépenses et de risques de dépenses excessives. Les alertes sont basées sur les dépenses par rapport aux seuils de budget et de coût. Vous créez des budgets et des alertes pour les abonnements et groupes de ressources Azure. Ils sont utiles dans le cadre d’une stratégie globale de surveillance des coûts.

Vous pouvez créer des budgets avec des filtres pour des ressources ou des services spécifiques dans Azure si vous souhaitez disposer d’une plus grande granularité dans votre surveillance. Les filtres vous permettent de vous assurer que vous ne créez pas accidentellement de nouvelles ressources entraînant un surcoût. Pour plus d’informations sur les options de filtre disponibles lorsque vous créez un budget, consultez Options de regroupement et de filtre.

Exporter des données de coûts

Vous pouvez également exporter vos données de coût vers un compte de stockage, ce qui est utile lorsque vous avez besoin d’autres personnes pour effectuer une analyse supplémentaire des données de coûts. Par exemple, une équipe Finance peut analyser les données avec Excel ou Power BI. Vous pouvez exporter vos coûts selon une planification quotidienne, hebdomadaire ou mensuelle, et définir une plage de dates personnalisée. Nous vous recommandons d’exporter les données de coût comme moyen de récupérer les jeux de données des coûts.

Étapes suivantes

Découvrez comment optimiser votre investissement cloud avec Cost Management.
Apprenez-en davantage sur la gestion des coûts avec l’analyse du coût.
Découvrez comment éviter des coûts imprévus.
Suivez le cours d’apprentissage guidé Cost Management.

Partager via