Lenguajes de programación compatibles con Azure OpenAI

La biblioteca cliente de Azure OpenAI para .NET es un complemento de la Biblioteca cliente oficial de OpenAI para .NET. La biblioteca de Azure OpenAI configura un cliente para su uso con Azure OpenAI y proporciona compatibilidad adicional con extensiones fuertemente tipadas para los modelos de solicitud y respuesta específicos de escenarios de Azure OpenAI.

Versión estable:

Código fuente | Paquete (NuGet) | Documentación de referencia de la API | Muestras

Versión preliminar:

La versión preliminar tiene acceso a las características más recientes.

Código fuente | Paquete (NuGet) | Documentación de referencia de la API | Muestras

Compatibilidad con la versión de la API de Azure OpenAI

A diferencia de las bibliotecas cliente de Azure OpenAI para Python y JavaScript, el paquete .NET de Azure OpenAI se limita a tener como destino un subconjunto específico de las versiones de la API de Azure OpenAI. Por lo general, cada paquete .NET de Azure OpenAI desbloquea el acceso a las características de versión más recientes de la API de Azure OpenAI. Tener acceso a las versiones más recientes de la API afecta a la disponibilidad de las características.

La selección de versión se controla mediante la enumeración AzureOpenAIClientOptions.ServiceVersion.

La versión estable actualmente tiene como objetivo:


La versión preliminar puede dirigirse actualmente:

  • 2024-06-01
  • 2024-08-01-preview
  • 2024-09-01-preview
  • 2024-10-01-preview


dotnet add package Azure.AI.OpenAI --prerelease

El Azure.AI.OpenAI paquete se basa en el paquete oficial de OpenAI, que se incluye como dependencia.


Para interactuar con Azure OpenAI o OpenAI, cree una instancia de AzureOpenAIClient con uno de los enfoques siguientes:

Un enfoque de autenticación seguro y sin claves es usar Microsoft Entra ID (anteriormente Azure Active Directory) a través de la Biblioteca de identidades de Azure. Para usar la biblioteca:

dotnet add package Azure.Identity

Use el tipo de credencial deseado de la biblioteca. Por ejemplo, DefaultAzureCredential:

AzureOpenAIClient openAIClient = new(
    new Uri(""),
    new DefaultAzureCredential());
ChatClient chatClient = openAIClient.GetChatClient("my-gpt-4o-mini-deployment");

Para obtener más información sobre la autenticación sin claves de Azure OpenAI, consulte el artículo de inicio rápido "Introducción al bloque de creación de seguridad de Azure OpenAI".




AzureOpenAIClient openAIClient = new(
    new Uri(""),
    new DefaultAzureCredential());

AudioClient client = openAIClient.GetAudioClient("whisper");

string audioFilePath = Path.Combine("Assets", "speech.mp3");

AudioTranscriptionOptions options = new()
    ResponseFormat = AudioTranscriptionFormat.Verbose,
    TimestampGranularities = AudioTimestampGranularities.Word | AudioTimestampGranularities.Segment,

AudioTranscription transcription = client.TranscribeAudio(audioFilePath, options);


foreach (TranscribedWord word in transcription.Words)
    Console.WriteLine($"  {word.Word,15} : {word.StartTime.TotalMilliseconds,5:0} - {word.EndTime.TotalMilliseconds,5:0}");

foreach (TranscribedSegment segment in transcription.Segments)
    Console.WriteLine($"  {segment.Text,90} : {segment.StartTime.TotalMilliseconds,5:0} - {segment.EndTime.TotalMilliseconds,5:0}");

Texto a voz (TTS)

using Azure.AI.OpenAI;
using Azure.Identity;
using OpenAI.Audio;

AzureOpenAIClient openAIClient = new(
    new Uri(""),
    new DefaultAzureCredential());

AudioClient client = openAIClient.GetAudioClient("tts-hd"); //Replace with your Azure OpenAI model deployment

string input = "Testing, testing, 1, 2, 3";

BinaryData speech = client.GenerateSpeech(input, GeneratedSpeechVoice.Alloy);

using FileStream stream = File.OpenWrite($"{Guid.NewGuid()}.mp3");



AzureOpenAIClient openAIClient = new(
    new Uri(""),
    new DefaultAzureCredential());
ChatClient chatClient = openAIClient.GetChatClient("my-gpt-4o-deployment");

ChatCompletion completion = chatClient.CompleteChat(
        // System messages represent instructions or other guidance about how the assistant should behave
        new SystemChatMessage("You are a helpful assistant that talks like a pirate."),
        // User messages represent user input, whether historical or the most recent input
        new UserChatMessage("Hi, can you help me?"),
        // Assistant messages in a request represent conversation history for responses
        new AssistantChatMessage("Arrr! Of course, me hearty! What can I do for ye?"),
        new UserChatMessage("What's the best way to train a parrot?"),

Console.WriteLine($"{completion.Role}: {completion.Content[0].Text}");

Transmisión de mensajes de chat

Las finalizaciones de chat en streaming usan el método CompleteChatStreaming y CompleteChatStreamingAsync, que devuelven un ResultCollection<StreamingChatCompletionUpdate> o AsyncCollectionResult<StreamingChatCompletionUpdate> en lugar de un ClientResult<ChatCompletion>.

Estas colecciones de resultados se pueden iterar mediante foreach o await foreach, con cada actualización que llega a medida que hay nuevos datos disponibles en la respuesta transmitida.

AzureOpenAIClient openAIClient = new(
    new Uri(""),
    new DefaultAzureCredential());
ChatClient chatClient = openAIClient.GetChatClient("my-gpt-4o-deployment");

CollectionResult<StreamingChatCompletionUpdate> completionUpdates = chatClient.CompleteChatStreaming(
        new SystemChatMessage("You are a helpful assistant that talks like a pirate."),
        new UserChatMessage("Hi, can you help me?"),
        new AssistantChatMessage("Arrr! Of course, me hearty! What can I do for ye?"),
        new UserChatMessage("What's the best way to train a parrot?"),

foreach (StreamingChatCompletionUpdate completionUpdate in completionUpdates)
    foreach (ChatMessageContentPart contentPart in completionUpdate.ContentUpdate)



using Azure.AI.OpenAI;
using Azure.Identity;
using OpenAI.Embeddings;

AzureOpenAIClient openAIClient = new(
    new Uri(""),
    new DefaultAzureCredential());

EmbeddingClient client = openAIClient.GetEmbeddingClient("text-embedding-3-large"); //Replace with your model deployment name

string description = "This is a test embedding";

OpenAIEmbedding embedding = client.GenerateEmbedding(description);
ReadOnlyMemory<float> vector = embedding.ToFloats();

Console.WriteLine(string.Join(", ", vector.ToArray()));

Ajuste preciso

Actualmente no se admite con los paquetes .NET de Azure OpenAI.


Actualmente no se admite con los paquetes .NET de Azure OpenAI.



using Azure.AI.OpenAI;
using Azure.Identity;
using OpenAI.Images;

AzureOpenAIClient openAIClient = new(
    new Uri(""),
    new DefaultAzureCredential());

ImageClient client = openAIClient.GetImageClient("dall-e-3"); // replace with your model deployment name.

string prompt = "A rabbit eating pancakes.";

ImageGenerationOptions options = new()
     Quality = GeneratedImageQuality.High,
     Size = GeneratedImageSize.W1792xH1024,
     Style = GeneratedImageStyle.Vivid,
     ResponseFormat = GeneratedImageFormat.Bytes

GeneratedImage image = client.GenerateImage(prompt, options);
BinaryData bytes = image.ImageBytes;

using FileStream stream = File.OpenWrite($"{Guid.NewGuid()}.png");

Finalizaciones (heredado)

No se admite con los paquetes .NET de Azure OpenAI.

Control de errores

Códigos de error

Código de estado Tipo de error
400 Bad Request Error
401 Authentication Error
403 Permission Denied Error
404 Not Found Error
422 Unprocessable Entity Error
429 Rate Limit Error
500 Internal Server Error
503 Service Unavailable
504 Gateway Timeout


Las clases de cliente reintentarán automáticamente los errores siguientes hasta tres veces más mediante retroceso exponencial:

  • Tiempo de espera de solicitud 408
  • 429 Demasiadas solicitudes
  • Error de servidor interno 500
  • Puerta de enlace incorrecta 502
  • Servicio no disponible 503
  • Tiempo de espera de puerta de enlace 504

Código fuente | Paquete ( | Documentación de referencia de la API | Muestras

Compatibilidad con la versión de la API de Azure OpenAI

A diferencia de las bibliotecas cliente de Azure OpenAI para Python y JavaScript, la biblioteca de Azure OpenAI Go está destinada a una versión específica de la API de Azure OpenAI. Tener acceso a las versiones más recientes de la API afecta a la disponibilidad de las características.

Destino actual de la versión de la API de Azure OpenAI: 2024-10-01-preview

Esto se define en el archivo custom_client.go.


Instale los módulos azopenai y azidentity con go get:

go get

# optional
go get


El móduloazidentity se usa para la autenticación de Azure Active Directory con Azure OpenAI.

package main

import (


func main() {
	dac, err := azidentity.NewDefaultAzureCredential(nil)

	if err != nil {
		// TODO: Update the following line with your application specific error handling logic
		log.Printf("ERROR: %s", err)

	// NOTE: this constructor creates a client that connects to an Azure OpenAI endpoint.
	// To connect to the public OpenAI endpoint, use azopenai.NewClientForOpenAI
	client, err := azopenai.NewClient("https://<your-azure-openai-host>", dac, nil)

	if err != nil {
		// TODO: Update the following line with your application specific error handling logic
		log.Printf("ERROR: %s", err)

	_ = client

Para obtener más información sobre la autenticación sin claves de Azure OpenAI, consulte Uso de Azure OpenAI sin claves.



ackage main

import (


func main() {
	openAIKey := os.Getenv("OPENAI_API_KEY")

	// Ex: ""
	openAIEndpoint := os.Getenv("OPENAI_ENDPOINT")

	modelDeploymentID := "tts-1"

	if openAIKey == "" || openAIEndpoint == "" || modelDeploymentID == "" {
		fmt.Fprintf(os.Stderr, "Skipping example, environment variables missing\n")

	keyCredential := azcore.NewKeyCredential(openAIKey)

	client, err := azopenai.NewClientForOpenAI(openAIEndpoint, keyCredential, nil)

	if err != nil {
		// TODO: Update the following line with your application specific error handling logic
		log.Printf("ERROR: %s", err)

	audioResp, err := client.GenerateSpeechFromText(context.Background(), azopenai.SpeechGenerationOptions{
		Input:          to.Ptr("i am a computer"),
		Voice:          to.Ptr(azopenai.SpeechVoiceAlloy),
		ResponseFormat: to.Ptr(azopenai.SpeechGenerationResponseFormatFlac),
		DeploymentName: to.Ptr("tts-1"),
	}, nil)

	if err != nil {
		// TODO: Update the following line with your application specific error handling logic
		log.Printf("ERROR: %s", err)

	defer audioResp.Body.Close()

	audioBytes, err := io.ReadAll(audioResp.Body)

	if err != nil {
		// TODO: Update the following line with your application specific error handling logic
		log.Printf("ERROR: %s", err)

	fmt.Fprintf(os.Stderr, "Got %d bytes of FLAC audio\n", len(audioBytes))



package main

import (


func main() {
	azureOpenAIKey := os.Getenv("AOAI_WHISPER_API_KEY")

	// Ex: "https://<your-azure-openai-host>"
	azureOpenAIEndpoint := os.Getenv("AOAI_WHISPER_ENDPOINT")

	modelDeploymentID := os.Getenv("AOAI_WHISPER_MODEL")

	if azureOpenAIKey == "" || azureOpenAIEndpoint == "" || modelDeploymentID == "" {
		fmt.Fprintf(os.Stderr, "Skipping example, environment variables missing\n")

	keyCredential := azcore.NewKeyCredential(azureOpenAIKey)

	client, err := azopenai.NewClientWithKeyCredential(azureOpenAIEndpoint, keyCredential, nil)

	if err != nil {
		// TODO: Update the following line with your application specific error handling logic
		log.Printf("ERROR: %s", err)

	mp3Bytes, err := os.ReadFile("testdata/sampledata_audiofiles_myVoiceIsMyPassportVerifyMe01.mp3")

	if err != nil {
		// TODO: Update the following line with your application specific error handling logic
		log.Printf("ERROR: %s", err)

	resp, err := client.GetAudioTranscription(context.TODO(), azopenai.AudioTranscriptionOptions{
		File: mp3Bytes,

		// this will return _just_ the translated text. Other formats are available, which return
		// different or additional metadata. See [azopenai.AudioTranscriptionFormat] for more examples.
		ResponseFormat: to.Ptr(azopenai.AudioTranscriptionFormatText),

		DeploymentName: &modelDeploymentID,
	}, nil)

	if err != nil {
		// TODO: Update the following line with your application specific error handling logic
		log.Printf("ERROR: %s", err)

	fmt.Fprintf(os.Stderr, "Transcribed text: %s\n", *resp.Text)




package main

import (


func main() {
	azureOpenAIKey := os.Getenv("AOAI_CHAT_COMPLETIONS_API_KEY")
	modelDeploymentID := os.Getenv("AOAI_CHAT_COMPLETIONS_MODEL")

	// Ex: "https://<your-azure-openai-host>"
	azureOpenAIEndpoint := os.Getenv("AOAI_CHAT_COMPLETIONS_ENDPOINT")

	if azureOpenAIKey == "" || modelDeploymentID == "" || azureOpenAIEndpoint == "" {
		fmt.Fprintf(os.Stderr, "Skipping example, environment variables missing\n")

	keyCredential := azcore.NewKeyCredential(azureOpenAIKey)

	// In Azure OpenAI you must deploy a model before you can use it in your client. For more information
	// see here:
	client, err := azopenai.NewClientWithKeyCredential(azureOpenAIEndpoint, keyCredential, nil)

	if err != nil {
		// TODO: Update the following line with your application specific error handling logic
		log.Printf("ERROR: %s", err)

	// This is a conversation in progress.
	// NOTE: all messages, regardless of role, count against token usage for this API.
	messages := []azopenai.ChatRequestMessageClassification{
		// You set the tone and rules of the conversation with a prompt as the system role.
		&azopenai.ChatRequestSystemMessage{Content: azopenai.NewChatRequestSystemMessageContent("You are a helpful assistant. You will talk like a pirate.")},

		// The user asks a question
		&azopenai.ChatRequestUserMessage{Content: azopenai.NewChatRequestUserMessageContent("Can you help me?")},

		// The reply would come back from the ChatGPT. You'd add it to the conversation so we can maintain context.
		&azopenai.ChatRequestAssistantMessage{Content: azopenai.NewChatRequestAssistantMessageContent("Arrrr! Of course, me hearty! What can I do for ye?")},

		// The user answers the question based on the latest reply.
		&azopenai.ChatRequestUserMessage{Content: azopenai.NewChatRequestUserMessageContent("What's the best way to train a parrot?")},

		// from here you'd keep iterating, sending responses back from ChatGPT

	gotReply := false

	resp, err := client.GetChatCompletions(context.TODO(), azopenai.ChatCompletionsOptions{
		// This is a conversation in progress.
		// NOTE: all messages count against token usage for this API.
		Messages:       messages,
		DeploymentName: &modelDeploymentID,
	}, nil)

	if err != nil {
		// TODO: Update the following line with your application specific error handling logic
		log.Printf("ERROR: %s", err)

	for _, choice := range resp.Choices {
		gotReply = true

		if choice.ContentFilterResults != nil {
			fmt.Fprintf(os.Stderr, "Content filter results\n")

			if choice.ContentFilterResults.Error != nil {
				fmt.Fprintf(os.Stderr, "  Error:%v\n", choice.ContentFilterResults.Error)

			fmt.Fprintf(os.Stderr, "  Hate: sev: %v, filtered: %v\n", *choice.ContentFilterResults.Hate.Severity, *choice.ContentFilterResults.Hate.Filtered)
			fmt.Fprintf(os.Stderr, "  SelfHarm: sev: %v, filtered: %v\n", *choice.ContentFilterResults.SelfHarm.Severity, *choice.ContentFilterResults.SelfHarm.Filtered)
			fmt.Fprintf(os.Stderr, "  Sexual: sev: %v, filtered: %v\n", *choice.ContentFilterResults.Sexual.Severity, *choice.ContentFilterResults.Sexual.Filtered)
			fmt.Fprintf(os.Stderr, "  Violence: sev: %v, filtered: %v\n", *choice.ContentFilterResults.Violence.Severity, *choice.ContentFilterResults.Violence.Filtered)

		if choice.Message != nil && choice.Message.Content != nil {
			fmt.Fprintf(os.Stderr, "Content[%d]: %s\n", *choice.Index, *choice.Message.Content)

		if choice.FinishReason != nil {
			// this choice's conversation is complete.
			fmt.Fprintf(os.Stderr, "Finish reason[%d]: %s\n", *choice.Index, *choice.FinishReason)

	if gotReply {
		fmt.Fprintf(os.Stderr, "Got chat completions reply\n")



package main

import (


func main() {
	azureOpenAIKey := os.Getenv("AOAI_CHAT_COMPLETIONS_API_KEY")
	modelDeploymentID := os.Getenv("AOAI_CHAT_COMPLETIONS_MODEL")

	// Ex: "https://<your-azure-openai-host>"
	azureOpenAIEndpoint := os.Getenv("AOAI_CHAT_COMPLETIONS_ENDPOINT")

	if azureOpenAIKey == "" || modelDeploymentID == "" || azureOpenAIEndpoint == "" {
		fmt.Fprintf(os.Stderr, "Skipping example, environment variables missing\n")

	keyCredential := azcore.NewKeyCredential(azureOpenAIKey)

	// In Azure OpenAI you must deploy a model before you can use it in your client. For more information
	// see here:
	client, err := azopenai.NewClientWithKeyCredential(azureOpenAIEndpoint, keyCredential, nil)

	if err != nil {
		// TODO: Update the following line with your application specific error handling logic
		log.Printf("ERROR: %s", err)

	// This is a conversation in progress.
	// NOTE: all messages, regardless of role, count against token usage for this API.
	messages := []azopenai.ChatRequestMessageClassification{
		// You set the tone and rules of the conversation with a prompt as the system role.
		&azopenai.ChatRequestSystemMessage{Content: azopenai.NewChatRequestSystemMessageContent("You are a helpful assistant. You will talk like a pirate and limit your responses to 20 words or less.")},

		// The user asks a question
		&azopenai.ChatRequestUserMessage{Content: azopenai.NewChatRequestUserMessageContent("Can you help me?")},

		// The reply would come back from the ChatGPT. You'd add it to the conversation so we can maintain context.
		&azopenai.ChatRequestAssistantMessage{Content: azopenai.NewChatRequestAssistantMessageContent("Arrrr! Of course, me hearty! What can I do for ye?")},

		// The user answers the question based on the latest reply.
		&azopenai.ChatRequestUserMessage{Content: azopenai.NewChatRequestUserMessageContent("What's the best way to train a parrot?")},

		// from here you'd keep iterating, sending responses back from ChatGPT

	resp, err := client.GetChatCompletionsStream(context.TODO(), azopenai.ChatCompletionsStreamOptions{
		// This is a conversation in progress.
		// NOTE: all messages count against token usage for this API.
		Messages:       messages,
		N:              to.Ptr[int32](1),
		DeploymentName: &modelDeploymentID,
	}, nil)

	if err != nil {
		// TODO: Update the following line with your application specific error handling logic
		log.Printf("ERROR: %s", err)

	defer resp.ChatCompletionsStream.Close()

	gotReply := false

	for {
		chatCompletions, err := resp.ChatCompletionsStream.Read()

		if errors.Is(err, io.EOF) {

		if err != nil {
			//  TODO: Update the following line with your application specific error handling logic
			log.Printf("ERROR: %s", err)

		for _, choice := range chatCompletions.Choices {
			gotReply = true

			text := ""

			if choice.Delta.Content != nil {
				text = *choice.Delta.Content

			role := ""

			if choice.Delta.Role != nil {
				role = string(*choice.Delta.Role)

			fmt.Fprintf(os.Stderr, "Content[%d], role %q: %q\n", *choice.Index, role, text)

	if gotReply {
		fmt.Fprintf(os.Stderr, "Got chat completions streaming reply\n")




package main

import (


func main() {
	azureOpenAIKey := os.Getenv("AOAI_EMBEDDINGS_API_KEY")
	modelDeploymentID := os.Getenv("AOAI_EMBEDDINGS_MODEL")

	// Ex: "https://<your-azure-openai-host>"
	azureOpenAIEndpoint := os.Getenv("AOAI_EMBEDDINGS_ENDPOINT")

	if azureOpenAIKey == "" || modelDeploymentID == "" || azureOpenAIEndpoint == "" {
		fmt.Fprintf(os.Stderr, "Skipping example, environment variables missing\n")

	keyCredential := azcore.NewKeyCredential(azureOpenAIKey)

	// In Azure OpenAI you must deploy a model before you can use it in your client. For more information
	// see here:
	client, err := azopenai.NewClientWithKeyCredential(azureOpenAIEndpoint, keyCredential, nil)

	if err != nil {
		// TODO: Update the following line with your application specific error handling logic
		log.Printf("ERROR: %s", err)

	resp, err := client.GetEmbeddings(context.TODO(), azopenai.EmbeddingsOptions{
		Input:          []string{"Testing, testing, 1,2,3."},
		DeploymentName: &modelDeploymentID,
	}, nil)

	if err != nil {
		// TODO: Update the following line with your application specific error handling logic
		log.Printf("ERROR: %s", err)

	for _, embed := range resp.Data {
		// embed.Embedding contains the embeddings for this input index.
		fmt.Fprintf(os.Stderr, "Got embeddings for input %d\n", *embed.Index)


Generación de imágenes


package main

import (


func main() {
	azureOpenAIKey := os.Getenv("AOAI_DALLE_API_KEY")

	// Ex: "https://<your-azure-openai-host>"
	azureOpenAIEndpoint := os.Getenv("AOAI_DALLE_ENDPOINT")

	azureDeployment := os.Getenv("AOAI_DALLE_MODEL")

	if azureOpenAIKey == "" || azureOpenAIEndpoint == "" || azureDeployment == "" {
		fmt.Fprintf(os.Stderr, "Skipping example, environment variables missing\n")

	keyCredential := azcore.NewKeyCredential(azureOpenAIKey)

	client, err := azopenai.NewClientWithKeyCredential(azureOpenAIEndpoint, keyCredential, nil)

	if err != nil {
		// TODO: Update the following line with your application specific error handling logic
		log.Printf("ERROR: %s", err)

	resp, err := client.GetImageGenerations(context.TODO(), azopenai.ImageGenerationOptions{
		Prompt:         to.Ptr("a cat"),
		ResponseFormat: to.Ptr(azopenai.ImageGenerationResponseFormatURL),
		DeploymentName: &azureDeployment,
	}, nil)

	if err != nil {
		// TODO: Update the following line with your application specific error handling logic
		log.Printf("ERROR: %s", err)

	for _, generatedImage := range resp.Data {
		// the underlying type for the generatedImage is dictated by the value of
		// ImageGenerationOptions.ResponseFormat. In this example we used `azopenai.ImageGenerationResponseFormatURL`,
		// so the underlying type will be ImageLocation.

		resp, err := http.Head(*generatedImage.URL)

		if err != nil {
			// TODO: Update the following line with your application specific error handling logic
			log.Printf("ERROR: %s", err)

		_ = resp.Body.Close()
		fmt.Fprintf(os.Stderr, "Image generated, HEAD request on URL returned %d\n", resp.StatusCode)


Finalizaciones (heredado)


package main

import (


func main() {
	azureOpenAIKey := os.Getenv("AOAI_COMPLETIONS_API_KEY")
	modelDeployment := os.Getenv("AOAI_COMPLETIONS_MODEL")

	// Ex: "https://<your-azure-openai-host>"
	azureOpenAIEndpoint := os.Getenv("AOAI_COMPLETIONS_ENDPOINT")

	if azureOpenAIKey == "" || modelDeployment == "" || azureOpenAIEndpoint == "" {
		fmt.Fprintf(os.Stderr, "Skipping example, environment variables missing\n")

	keyCredential := azcore.NewKeyCredential(azureOpenAIKey)

	// In Azure OpenAI you must deploy a model before you can use it in your client. For more information
	// see here:
	client, err := azopenai.NewClientWithKeyCredential(azureOpenAIEndpoint, keyCredential, nil)

	if err != nil {
		// TODO: Update the following line with your application specific error handling logic
		log.Printf("ERROR: %s", err)

	resp, err := client.GetCompletions(context.TODO(), azopenai.CompletionsOptions{
		Prompt:         []string{"What is Azure OpenAI, in 20 words or less"},
		MaxTokens:      to.Ptr(int32(2048)),
		Temperature:    to.Ptr(float32(0.0)),
		DeploymentName: &modelDeployment,
	}, nil)

	if err != nil {
		// TODO: Update the following line with your application specific error handling logic
		log.Printf("ERROR: %s", err)

	for _, choice := range resp.Choices {
		fmt.Fprintf(os.Stderr, "Result: %s\n", *choice.Text)


Control de errores

Todos los métodos que envían solicitudes HTTP devuelven *azcore.ResponseError cuando se produce un error en estas solicitudes. ResponseError tiene detalles de error y la respuesta sin procesar del servicio.


En este módulo se usa la implementación de registro en azcore. Para activar el registro de todos los módulos del SDK de Azure, establezca AZURE_SDK_GO_LOGGING en todos. De forma predeterminada, el registrador escribe en stderr. Use el paquete azcore/log para controlar la salida del registro. Por ejemplo, registrar solo eventos de solicitud y respuesta HTTP e imprimirlos en stdout:

import azlog ""

// Print log events to stdout
azlog.SetListener(func(cls azlog.Event, msg string) {

// Includes only requests and responses in credential logs
azlog.SetEvents(azlog.EventRequest, azlog.EventResponse)

Código fuente | Paquete (Maven) | Documentación de referencia de la API | Muestras

Compatibilidad con la versión de la API de Azure OpenAI

A diferencia de las bibliotecas cliente de Azure OpenAI para Python y JavaScript, para garantizar la compatibilidad del paquete java de Azure OpenAI se limita a tener como destino un subconjunto específico de las versiones de API de Azure OpenAI. Por lo general, cada paquete de Java de Azure OpenAI desbloquea el acceso a las características más recientes de la versión de la API de Azure OpenAI. Tener acceso a las versiones más recientes de la API afecta a la disponibilidad de las características.

La selección de versión se controla mediante la enumeración OpenAIServiceVersion.

La API de versión preliminar de Azure OpenAI más reciente admitida es:


La versión estable (GA) más reciente admitida es:



Detalles del paquete



Para interactuar con el Azure OpenAI Service, deberá crear una instancia de la clase de cliente, OpenAIAsyncClient o OpenAIClient mediante OpenAIClientBuilder. Para configurar un cliente para su uso con Azure OpenAI, proporcione un URI de punto de conexión válido a un recurso de Azure OpenAI junto con una credencial de clave correspondiente, una credencial de token o una credencial de identidad de Azure autorizada para usar el recurso de Azure OpenAI.

La autenticación con Microsoft Entra ID requiere una configuración inicial:

Agregue el paquete de identidad de Azure:


Después de la instalación, puede elegir el tipo de credencial que se azure.identity va a usar. Por ejemplo, DefaultAzureCredential se puede usar para autenticar al cliente: establezca los valores del identificador de cliente, el identificador de inquilino y el secreto de cliente de la aplicación Microsoft Entra ID como variables de entorno: AZURE_CLIENT_ID, AZURE_TENANT_ID, AZURE_CLIENT_SECRET.

La autorización es más fácil mediante DefaultAzureCredential. Encuentra la mejor credencial para usar en su entorno en ejecución.

TokenCredential defaultCredential = new DefaultAzureCredentialBuilder().build();
OpenAIClient client = new OpenAIClientBuilder()

Para obtener más información sobre la autenticación sin claves de Azure OpenAI, consulte Uso de Azure OpenAI sin claves.



String fileName = "{your-file-name}";
Path filePath = Paths.get("{your-file-path}" + fileName);

byte[] file = BinaryData.fromFile(filePath).toBytes();
AudioTranscriptionOptions transcriptionOptions = new AudioTranscriptionOptions(file)

AudioTranscription transcription = client.getAudioTranscription("{deploymentOrModelName}", fileName, transcriptionOptions);

System.out.println("Transcription: " + transcription.getText());


Texto a voz (TTS)

String deploymentOrModelId = "{azure-open-ai-deployment-model-id}";
SpeechGenerationOptions options = new SpeechGenerationOptions(
        "Today is a wonderful day to build something people love!",
BinaryData speech = client.generateSpeechFromText(deploymentOrModelId, options);
// Checkout your generated speech in the file system.
Path path = Paths.get("{your-local-file-path}/speech.wav");
Files.write(path, speech.toBytes());



List<ChatRequestMessage> chatMessages = new ArrayList<>();
chatMessages.add(new ChatRequestSystemMessage("You are a helpful assistant. You will talk like a pirate."));
chatMessages.add(new ChatRequestUserMessage("Can you help me?"));
chatMessages.add(new ChatRequestAssistantMessage("Of course, me hearty! What can I do for ye?"));
chatMessages.add(new ChatRequestUserMessage("What's the best way to train a parrot?"));

ChatCompletions chatCompletions = client.getChatCompletions("{deploymentOrModelName}",
    new ChatCompletionsOptions(chatMessages));

System.out.printf("Model ID=%s is created at %s.%n", chatCompletions.getId(), chatCompletions.getCreatedAt());
for (ChatChoice choice : chatCompletions.getChoices()) {
    ChatResponseMessage message = choice.getMessage();
    System.out.printf("Index: %d, Chat Role: %s.%n", choice.getIndex(), message.getRole());


List<ChatRequestMessage> chatMessages = new ArrayList<>();
chatMessages.add(new ChatRequestSystemMessage("You are a helpful assistant. You will talk like a pirate."));
chatMessages.add(new ChatRequestUserMessage("Can you help me?"));
chatMessages.add(new ChatRequestAssistantMessage("Of course, me hearty! What can I do for ye?"));
chatMessages.add(new ChatRequestUserMessage("What's the best way to train a parrot?"));

ChatCompletions chatCompletions = client.getChatCompletions("{deploymentOrModelName}",
    new ChatCompletionsOptions(chatMessages));

System.out.printf("Model ID=%s is created at %s.%n", chatCompletions.getId(), chatCompletions.getCreatedAt());
for (ChatChoice choice : chatCompletions.getChoices()) {
    ChatResponseMessage message = choice.getMessage();
    System.out.printf("Index: %d, Chat Role: %s.%n", choice.getIndex(), message.getRole());

Finalizaciones de chat con imágenes

List<ChatRequestMessage> chatMessages = new ArrayList<>();
chatMessages.add(new ChatRequestSystemMessage("You are a helpful assistant that describes images"));
chatMessages.add(new ChatRequestUserMessage(Arrays.asList(
        new ChatMessageTextContentItem("Please describe this image"),
        new ChatMessageImageContentItem(
                new ChatMessageImageUrl(""))

ChatCompletionsOptions chatCompletionsOptions = new ChatCompletionsOptions(chatMessages);
ChatCompletions chatCompletions = client.getChatCompletions("{deploymentOrModelName}", chatCompletionsOptions);

System.out.println("Chat completion: " + chatCompletions.getChoices().get(0).getMessage().getContent());



EmbeddingsOptions embeddingsOptions = new EmbeddingsOptions(
    Arrays.asList("Your text string goes here"));

Embeddings embeddings = client.getEmbeddings("{deploymentOrModelName}", embeddingsOptions);

for (EmbeddingItem item : embeddings.getData()) {
    System.out.printf("Index: %d.%n", item.getPromptIndex());
    for (Float embedding : item.getEmbedding()) {
        System.out.printf("%f;", embedding);

Imagen y generación

ImageGenerationOptions imageGenerationOptions = new ImageGenerationOptions(
    "A drawing of the Seattle skyline in the style of Van Gogh");
ImageGenerations images = client.getImageGenerations("{deploymentOrModelName}", imageGenerationOptions);

for (ImageGenerationData imageGenerationData : images.getData()) {
        "Image location URL that provides temporary access to download the generated image is %s.%n",

Control de errores

Habilitación del registro de cliente

Para solucionar problemas con la biblioteca de Azure OpenAI, es importante habilitar primero el registro para supervisar el comportamiento de la aplicación. Los errores y advertencias de los registros suelen proporcionar información útil sobre lo que ha ido mal y, a veces, incluyen acciones correctivas para corregir problemas. Las bibliotecas cliente de Azure para Java tienen dos opciones de registro:

  • Plataforma de registro integrada.
  • Compatibilidad con el registro mediante la interfaz SLF4J

Consulte las instrucciones de este documento de referencia sobre cómo [configurar el registro en Azure SDK para Java][logging_overview].

Habilitar el registro de solicitud y respuesta HTTP

Revisar la solicitud HTTP enviada o la respuesta recibida a través de la conexión hacia o desde el servicio Azure OpenAI puede resultar útil para solucionar problemas. Para habilitar el registro de la carga de solicitud y respuesta HTTP, se puede configurar [OpenAIClient][openai_client] como se muestra a continuación. Si no hay ningún SLF4J Logger en la ruta de acceso de clase, establezca una variable de entorno [AZURE_LOG_LEVEL][azure_log_level] en el equipo para habilitar el registro.

OpenAIClient openAIClient = new OpenAIClientBuilder()
        .credential(new AzureKeyCredential("{key}"))
        .httpLogOptions(new HttpLogOptions().setLogLevel(HttpLogDetailLevel.BODY_AND_HEADERS))
// or
DefaultAzureCredential credential = new DefaultAzureCredentialBuilder().build();
OpenAIClient configurationClientAad = new OpenAIClientBuilder()
        .httpLogOptions(new HttpLogOptions().setLogLevel(HttpLogDetailLevel.BODY_AND_HEADERS))

Como alternativa, puede configurar el registro de solicitudes HTTP y respuestas para toda la aplicación estableciendo la siguiente variable de entorno. Tenga en cuenta que este cambio habilitará el registro para cada cliente de Azure que admita el registro de solicitudes y respuestas HTTP.

Nombre de la variable de entorno: AZURE_HTTP_LOG_DETAIL_LEVEL

Valor Nivel de registro
None El registro de solicitud/respuesta HTTP está deshabilitado
basic Registra solo direcciones URL, métodos HTTP y el tiempo para finalizar la solicitud.
headers Registra todo en BÁSICO, además de todos los encabezados de solicitud y respuesta.
body Registra todo en BÁSICO, además de todo el cuerpo de solicitud y respuesta.
body_and_headers Registra todo en ENCABEZADOS y CUERPO.


Al registrar el cuerpo de la solicitud y la respuesta, asegúrese de que no contienen información confidencial. Al registrar encabezados, la biblioteca cliente tiene un conjunto predeterminado de encabezados que se consideran seguros para registrar, pero este conjunto se puede actualizar actualizando las opciones de registro en el generador, como se muestra a continuación.

clientBuilder.httpLogOptions(new HttpLogOptions().addAllowedHeaderName("safe-to-log-header-name"))

Solución de problemas de excepciones

Los métodos del servicio Azure OpenAI inician una[HttpResponseException o su subclase en caso de error. La HttpResponseException biblioteca cliente de OpenAI producida por la biblioteca cliente de OpenAI incluye un objeto de error de respuesta detallado que proporciona información útil específica sobre lo que salió mal e incluye acciones correctivas para corregir problemas comunes. Esta información de error se puede encontrar dentro de la propiedad del mensaje del objeto HttpResponseException.

Este es el ejemplo de cómo capturarlo con el cliente sincrónico

List<ChatRequestMessage> chatMessages = new ArrayList<>();
chatMessages.add(new ChatRequestSystemMessage("You are a helpful assistant. You will talk like a pirate."));
chatMessages.add(new ChatRequestUserMessage("Can you help me?"));
chatMessages.add(new ChatRequestAssistantMessage("Of course, me hearty! What can I do for ye?"));
chatMessages.add(new ChatRequestUserMessage("What's the best way to train a parrot?"));

try {
    ChatCompletions chatCompletions = client.getChatCompletions("{deploymentOrModelName}",
            new ChatCompletionsOptions(chatMessages));
} catch (HttpResponseException e) {
    // Do something with the exception

Con los clientes asincrónicos, puede detectar y controlar excepciones en las devoluciones de llamada de error:

asyncClient.getChatCompletions("{deploymentOrModelName}", new ChatCompletionsOptions(chatMessages))
        .doOnSuccess(ignored -> System.out.println("Success!"))
                error -> error instanceof ResourceNotFoundException,
                error -> System.out.println("Exception: 'getChatCompletions' could not be performed."));

Errores de autenticación

Azure OpenAI admite la autenticación de Microsoft Entra ID. OpenAIClientBuilder tiene el método para establecer credential. Para proporcionar una credencial válida, puede usar azure-identity dependencias.

Código fuente | Paquete (npm) | Referencia

Compatibilidad con la versión de la API de Azure OpenAI

La disponibilidad de características en Azure OpenAI depende de la versión de la API de REST que tiene como destino. Para las características más recientes, tiene como destino la API de versión preliminar más reciente.

API de disponibilidad general más reciente API de versión preliminar más reciente
2024-10-21 2025-01-01-preview


npm install openai


Hay varias maneras de autenticarse con el servicio Azure OpenAI mediante tokens de Microsoft Entra ID. La manera predeterminada es usar la clase DefaultAzureCredential del paquete @azure/identity.

import { DefaultAzureCredential } from "@azure/identity";
const credential = new DefaultAzureCredential();

A continuación, este objeto se pasa como parte del objeto AzureClientOptions a los constructores de cliente AzureOpenAI y AssistantsClient.

Sin embargo, para autenticar el cliente AzureOpenAI, es necesario usar la función getBearerTokenProvider desde el paquete @azure/identity. Esta función crea un proveedor de tokens que AzureOpenAI usa internamente para obtener tokens para cada solicitud. El proveedor de tokens se crea de la siguiente manera:

import { AzureOpenAI } from 'openai';
import { DefaultAzureCredential, getBearerTokenProvider } from "@azure/identity";
const credential = new DefaultAzureCredential();
const endpoint = "";
const apiVersion = "2024-10-21"
const scope = "";
const azureADTokenProvider = getBearerTokenProvider(credential, scope);
const deployment = "gpt-35-turbo";

const client = new AzureOpenAI({ 

Para obtener más información sobre la autenticación sin claves de Azure OpenAI, consulte el artículo de inicio rápido "Introducción al bloque de creación de seguridad de Azure OpenAI".


El objeto AzureClientOptions extiende el objeto ClientOptions de OpenAI. Este objeto de cliente específico de Azure se usa para configurar la conexión y el comportamiento del cliente de Azure OpenAI. Incluye propiedades para especificar las propiedades únicas de Azure.

Propiedad Detalles
apiVersion: string Especifica la versión de la API que se va a usar.
azureADTokenProvider: (() => Promise<string>) Función que devuelve un token de acceso para Microsoft Entra (anteriormente conocido como Azure Active Directory), invocado en cada solicitud.
deployment: string Una implementación de modelos. Si se proporciona, establece la dirección URL base del cliente para que incluya /deployments/{deployment}. No se pueden usar puntos de conexión que no sean de implementación (no se admiten con las API de asistentes).
endpoint: string El punto de conexión de Azure OpenAI con el siguiente formato:



import { createReadStream } from "fs";

const result = await{
  model: '',
  file: createReadStream(audioFilePath),



const result = await{ messages, model: '', max_tokens: 100 });


const stream = await{ model: '', messages, max_tokens: 100, stream: true });


const embeddings = await client.embeddings.create({ input, model: '' });

Imagen y generación

  const results = await client.images.generate({ prompt, model: '', n, size });

Control de errores

Códigos de error

Código de estado Tipo de error
400 Bad Request Error
401 Authentication Error
403 Permission Denied Error
404 Not Found Error
422 Unprocessable Entity Error
429 Rate Limit Error
500 Internal Server Error
503 Service Unavailable
504 Gateway Timeout


Los errores siguientes se retiran automáticamente dos veces de manera predeterminada con un breve retroceso exponencial:

  • Errores de conexión
  • Tiempo de espera de solicitud 408
  • 429 Límite de velocidad
  • errores internos de>=500

Use maxRetries para establecer o deshabilitar el comportamiento de reintento:

// Configure the default for all requests:
const client = new AzureOpenAI({
  maxRetries: 0, // default is 2

// Or, configure per-request:
await{ messages: [{ role: 'user', content: 'How can I get the name of the current day in Node.js?' }], model: '' }, {
  maxRetries: 5,

Código fuente de la biblioteca | Package (PyPi) | Referencia


OpenAI mantiene esta biblioteca. Consulte el historial de versiones para realizar el seguimiento de las actualizaciones más recientes de la biblioteca.

Compatibilidad con la versión de la API de Azure OpenAI

La disponibilidad de características en Azure OpenAI depende de la versión de la API de REST que tiene como destino. Para las características más recientes, tiene como destino la API de versión preliminar más reciente.

API de disponibilidad general más reciente API de versión preliminar más reciente
2024-10-21 2025-01-01-preview


pip install openai

En la versión más reciente:

pip install openai --upgrade


import os
from openai import AzureOpenAI
from azure.identity import DefaultAzureCredential, get_bearer_token_provider

token_provider = get_bearer_token_provider(
    DefaultAzureCredential(), ""

client = AzureOpenAI(
  azure_endpoint = os.getenv("AZURE_OPENAI_ENDPOINT"), 

Para obtener más información sobre la autenticación sin claves de Azure OpenAI, consulte el artículo de inicio rápido "Introducción al bloque de creación de seguridad de Azure OpenAI".



Actualmente, esta función requiere una versión preliminar de la API.

Establezca api_version="2024-10-01-preview" para usar esta función.

# from openai import AzureOpenAI
# client = AzureOpenAI()

from pathlib import Path
import os

speech_file_path = Path("speech.mp3")

response =
  model="tts-hd", #Replace with model deployment name
  input="Testing, testing, 1,2,3."


# from openai import AzureOpenAI
# client = AzureOpenAI()

audio_file = open("speech1.mp3", "rb")
transcript =
  model="whisper", # Replace with model deployment name




# from openai import AzureOpenAI
# client = AzureOpenAI()

completion =
  model="gpt-4o", # Replace with your model dpeloyment name.
    {"role": "system", "content": "You are a helpful assistant."},
    {"role": "user", "content": "When was Microsoft founded?"}


chat.completions.create(): streaming

# from openai import AzureOpenAI
# client = AzureOpenAI()

completion =
  model="gpt-4o", # Replace with your model dpeloyment name.
    {"role": "system", "content": "You are a helpful assistant."},
    {"role": "user", "content": "When was Microsoft founded?"}

for chunk in completion:
    if chunk.choices and chunk.choices[0].delta.content is not None:
        print(chunk.choices[0].delta.content, end='',)

chat.completions.create(): entrada de imagen

completion =
            "role": "user",
            "content": [
                {"type": "text", "text": "What's in this image?"},
                    "type": "image_url",
                    "image_url": {
                        "url": "",




# from openai import AzureOpenAI
# client = AzureOpenAI()

embedding = client.embeddings.create(
  model="text-embedding-3-large", # Replace with your model deployment name
  input="Attenion is all you need",


Ajuste preciso

Ajuste preciso del artículo de procedimientos de Python


Artículo paso a paso de Batch con Python



# from openai import AzureOpenAI
# client = AzureOpenAI()

generate_image = client.images.generate(
  model="dall-e-3", #replace with your model deployment name
  prompt="A rabbit eating pancakes",
  quality = "hd",
  response_format = "url",
  style = "vivid"


Finalizaciones (heredado)


# from openai import AzureOpenAI
# client = AzureOpenAI()

legacy_completion = client.completions.create(
  model="gpt-35-turbo-instruct", # Replace with model deployment name
  prompt="Hello World!",


Control de errores

# from openai import AzureOpenAI
# client = AzureOpenAI()

import openai

except openai.APIConnectionError as e:
    print("The server could not be reached")
    print(e.__cause__)  # an underlying Exception, likely raised within httpx.
except openai.RateLimitError as e:
    print("A 429 status code was received; we should back off a bit.")
except openai.APIStatusError as e:
    print("Another non-200-range status code was received")

Códigos de error

Código de estado Tipo de error
400 BadRequestError
401 AuthenticationError
403 PermissionDeniedError
404 NotFoundError
422 UnprocessableEntityError
429 RateLimitError
>=500 InternalServerError
N/D APIConnectionError

Identificadores de solicitud

Para recuperar el identificador de la solicitud, puede usar la propiedad _request_id que corresponde al encabezado de respuesta x-request-id.



Los errores siguientes se retiran automáticamente dos veces de manera predeterminada con un breve retroceso exponencial:

  • Errores de conexión
  • Tiempo de espera de solicitud 408
  • 429 Límite de velocidad
  • errores internos de>=500

Use max_retries para establecer o deshabilitar el comportamiento de reintento:

# For all requests

from openai import AzureOpenAI
client = AzureOpenAI(
# max retires for specific requests

            "role": "user",
            "content": "When was Microsoft founded?",

Pasos siguientes