Bagikan melalui


Model yang tersedia dalam inferensi model Azure AI

Inferensi model Azure AI di Azure AI Foundry memberi Anda akses ke model unggulan di Azure AI untuk menggunakannya sebagai API tanpa menghostingnya di infrastruktur Anda.

Animasi yang memperlihatkan bagian katalog model studio Azure AI dan model yang tersedia.

Ketersediaan model bervariasi menurut penyedia model, SKU penyebaran, dan cloud. Semua model yang tersedia di Azure AI Model Inference mendukung jenis penyebaran standar Global yang menggunakan kapasitas global untuk menjamin throughput. Model Azure OpenAI juga mendukung penyebaran regional dan sovereign cloud—Azure Government, Azure Jerman, dan Azure Tiongkok 21Vianet.

Pelajari selengkapnya tentang kemampuan penyebaran tertentu untuk Azure OpenAI di ketersediaan Azure OpenAI Model.

Tip

Katalog model Azure AI menawarkan pilihan model yang lebih besar, dari berbagai penyedia yang lebih besar. Namun, model tersebut mungkin mengharuskan Anda untuk menghostingnya di infrastruktur Anda, termasuk pembuatan hub dan proyek AI. Layanan model Azure AI menyediakan cara untuk menggunakan model sebagai API tanpa menghostingnya di infrastruktur Anda, dengan penagihan prabayar. Pelajari selengkapnya tentang katalog model Azure AI.

Anda dapat melihat semua model yang tersedia untuk Anda di katalog model untuk portal Azure AI Foundry.

Lab AI21

Model keluarga Jamba adalah model bahasa besar berbasis Mamba (LLM) berbasis produksi AI21 yang menggunakan arsitektur Mamba-Transformer hibrid AI21. Ini adalah versi yang disetel instruksi dari model Jamba transformator model ruang status terstruktur hibrid (SSM) AI21. Model keluarga Jamba dibangun untuk penggunaan komersial yang andal sehubungan dengan kualitas dan performa.

Model Jenis Tingkat Kemampuan
AI21-Jamba-1.5-Mini penyelesaian obrolan Standar global - Input: teks (262.144 token)
- Output: (4.096 token)
- Bahasa:en, , fres, pt, de, , ardanhe
- Panggilan alat: Ya
- Format respons: Teks, JSON, output terstruktur
AI21-Jamba-1.5-Large penyelesaian obrolan Standar global - Input: teks (262.144 token)
- Output: (4.096 token)
- Bahasa:en, , fres, pt, de, , ardanhe
- Panggilan alat: Ya
- Format respons: Teks, JSON, output terstruktur

Lihat koleksi model ini di portal Azure AI Foundry.

Azure OpenAI

Layanan Azure OpenAI menawarkan serangkaian model yang beragam dengan kemampuan dan titik harga yang berbeda. Model-model ini meliputi:

  • Model canggih yang dirancang untuk mengatasi tugas penalaran dan pemecahan masalah dengan peningkatan fokus dan kemampuan
  • Model yang dapat memahami dan menghasilkan bahasa dan kode alami
  • Model yang dapat mentranskripsikan dan menerjemahkan ucapan ke teks
Model Jenis Tingkat Kemampuan
o3-mini penyelesaian obrolan Standar global - Input: teks dan gambar (200.000 token)
- Output: teks (100.000 token)
- Bahasa: , , it, afes, de, fr, id, ru, pl, eluk, , , lvarjatrzh, , cysw, , ko, is, bnur, , ne, th, pa, , mrdan .teen
- Panggilan alat: Ya
- Format respons: Teks, JSON, output terstruktur
o1 penyelesaian obrolan Standar global - Input: teks dan gambar (200.000 token)
- Output: teks (100.000 token)
- Bahasa: , , it, afes, de, fr, id, ru, pl, eluk, , , lvarjatrzh, , cysw, , ko, is, bnur, , ne, th, pa, , mrdan .teen
- Panggilan alat: Ya
- Format respons: Teks, JSON, output terstruktur
pratinjau o1 penyelesaian obrolan Standar global
Standard
- Input: teks (128.000 token)
- Output: (32.768 token)
- Bahasa: , , it, afes, de, fr, id, ru, pl, eluk, , , lvarjatrzh, , cysw, , ko, is, bnur, , ne, th, pa, , mrdan .teen
- Panggilan alat: Ya
- Format respons: Teks, JSON, output terstruktur
o1-mini penyelesaian obrolan Standar global
Standard
- Input: teks (128.000 token)
- Output: (65.536 token)
- Bahasa: , , it, afes, de, fr, id, ru, pl, eluk, , , lvarjatrzh, , cysw, , ko, is, bnur, , ne, th, pa, , mrdan .teen
- Panggilan alat: Tidak
- Format respons: Teks
gpt-4o-realtime-preview Real-time Standar global - Input: kontrol, teks, dan audio (131.072 token)
- Output: teks dan audio (16.384 token)
- Bahasa: en
- Panggilan alat: Ya
- Format respons: Teks, JSON
gpt-4o penyelesaian obrolan Standar global
Standard
Batch
Tersedia
Penyediaan global
Zona Data
- Input: teks dan gambar (131.072 token)
- Output: teks (16.384 token)
- Bahasa: , , it, afes, de, fr, id, ru, pl, eluk, , , lvarjatrzh, , cysw, , ko, is, bnur, , ne, th, pa, , mrdan .teen
- Panggilan alat: Ya
- Format respons: Teks, JSON, output terstruktur
gpt-4o-mini penyelesaian obrolan Standar global
Standard
Batch
Tersedia
Penyediaan global
Zona Data
- Input: teks, gambar, dan audio (131.072 token)
- Output: (16.384 token)
- Bahasa: , , it, afes, de, fr, id, ru, pl, eluk, , , lvarjatrzh, , cysw, , ko, is, bnur, , ne, th, pa, , mrdan .teen
- Panggilan alat: Ya
- Format respons: Teks, JSON, output terstruktur
text-embedding-3-large penyematan Standar global
Standard
Tersedia
Penyediaan global
- Input: teks (8.191 token)
- Output: Vektor (3.072 dim.)
- Bahasa:en
text-embedding-3-small penyematan Standar global
Standard
Tersedia
Penyediaan global
- Input: teks (8.191 token)
- Output: Vektor (1.536 redup.)
- Bahasa:en

Lihat koleksi model ini di portal Azure AI Foundry.

Cohere

Keluarga model Cohere mencakup berbagai model yang dioptimalkan untuk kasus penggunaan yang berbeda, termasuk penyelesaian obrolan dan penyematan. Model Cohere dioptimalkan untuk berbagai kasus penggunaan yang mencakup penalaran, ringkasan, dan jawaban atas pertanyaan.

Model Jenis Tingkat Kemampuan
Cohere-embed-v3-english penyematan
penyematan gambar
Standar global - Input: teks (512 token)
- Output: Vektor (1.024 dim.)
- Bahasa: en
Cohere-embed-v3-multilingual penyematan
penyematan gambar
Standar global - Input: teks (512 token)
- Output: Vektor (1.024 dim.)
- Bahasa: en, fr, es, it, de, pt-br, ja, ko, zh-cn, dan ar
Cohere-command-r-plus-08-2024 penyelesaian obrolan Standar global - Input: teks (131.072 token)
- Output: (4.096 token)
- Bahasa: en, fr, es, it, de, pt-br, ja, ko, zh-cn, dan ar
- Panggilan alat: Ya
- Format respons: Teks, JSON
Kohere-command-r-08-2024 penyelesaian obrolan Standar global - Input: teks (131.072 token)
- Output: (4.096 token)
- Bahasa: en, fr, es, it, de, pt-br, ja, ko, zh-cn, dan ar
- Panggilan alat: Ya
- Format respons: Teks, JSON
Cohere-command-r-plus penyelesaian obrolan Standar global - Input: teks (131.072 token)
- Output: (4.096 token)
- Bahasa: en, fr, es, it, de, pt-br, ja, ko, zh-cn, dan ar
- Panggilan alat: Ya
- Format respons: Teks, JSON
Cohere-command-r penyelesaian obrolan Standar global - Input: teks (131.072 token)
- Output: (4.096 token)
- Bahasa: en, fr, es, it, de, pt-br, ja, ko, zh-cn, dan ar
- Panggilan alat: Ya
- Format respons: Teks, JSON

Lihat koleksi model ini di portal Azure AI Foundry.

Core42

Core42 mencakup LLM dua bahasa otomatis untuk bahasa Arab & Inggris dengan kemampuan canggih dalam bahasa Arab.

Model Jenis Tingkat Kemampuan
jais-30b-chat penyelesaian obrolan Standar global - Input: teks (8.192 token)
- Output: (4.096 token)
- Bahasa: en dan ar
- Panggilan alat: Ya
- Format respons: Teks, JSON

Lihat koleksi model ini di portal Azure AI Foundry.

DeepSeek

Keluarga model DeepSeek termasuk DeepSeek-R1, yang unggul dalam tugas penalaran menggunakan proses pelatihan langkah demi langkah, seperti bahasa, penalaran ilmiah, dan tugas pengkodan.

Model Jenis Tingkat Kemampuan
DeekSeek-R1 penyelesaian obrolan
(dengan konten penalaran)
Standar global - Input: teks (16.384 token)
- Output: (163.840 token)
- Bahasa:en dan zh
- Panggilan alat: Tidak
- Format respons: Teks.

Lihat koleksi model ini di portal Azure AI Foundry.

$meta

Model dan alat Meta Llama adalah kumpulan teks AI dan model penalaran gambar generatif yang telah dilatih dan disempurnakan. Rentang model meta diskalakan untuk menyertakan:

  • Model bahasa kecil (SLM) seperti Basis 1B dan 3B dan Menginstruksikan model untuk inferensi di perangkat dan tepi
  • Model bahasa besar ukuran menengah (LLM) seperti model Dasar 7B, 8B, dan 70B dan Instruksi
  • Model berperforma tinggi seperti Meta Llama 3.1-405B Instruksikan untuk pembuatan data sintetis dan kasus penggunaan penyulingan.
Model Jenis Tingkat Kemampuan
Llama-3.3-70B-Instruct penyelesaian obrolan Standar global - Input: teks (128.000 token)
- Output: teks (8.192 token)
- Bahasa: en, de, fr, it, pt, hi, es, dan th
- Panggilan alat: Tidak*
- Format respons: Teks
Llama-3.2-11B-Vision-Instruct penyelesaian obrolan Standar global - Input: teks dan gambar (128.000 token)
- Output: (8.192 token)
- Bahasa: en
- Panggilan alat: Tidak*
- Format respons: Teks
Llama-3.2-90B-Vision-Instruct penyelesaian obrolan Standar global - Input: teks dan gambar (128.000 token)
- Output: (8.192 token)
- Bahasa: en
- Panggilan alat: Tidak*
- Format respons: Teks
Meta-Llama-3.1-405B-Instruct penyelesaian obrolan Standar global - Input: teks (131.072 token)
- Output: (8.192 token)
- Bahasa: en, de, fr, it, pt, hi, es, dan th
- Panggilan alat: Tidak*
- Format respons: Teks
Meta-Llama-3-8B-Instruct penyelesaian obrolan Standar global - Input: teks (8.192 token)
- Output: (8.192 token)
- Bahasa: en
- Panggilan alat: Tidak*
- Format respons: Teks
Meta-Llama-3.1-70B-Instruct penyelesaian obrolan Standar global - Input: teks (131.072 token)
- Output: (8.192 token)
- Bahasa: en, de, fr, it, pt, hi, es, dan th
- Panggilan alat: Tidak*
- Format respons: Teks
Meta-Llama-3.1-8B-Instruct penyelesaian obrolan Standar global - Input: teks (131.072 token)
- Output: (8.192 token)
- Bahasa: en, de, fr, it, pt, hi, es, dan th
- Panggilan alat: Tidak*
- Format respons: Teks
Meta-Llama-3-70B-Instruct penyelesaian obrolan Standar global - Input: teks (8.192 token)
- Output: (8.192 token)
- Bahasa: en
- Panggilan alat: Tidak*
- Format respons: Teks

Lihat koleksi model ini di portal Azure AI Foundry.

Microsoft

Phi adalah keluarga model terbuka yang ringan dan canggih. Model-model ini dilatih dengan himpunan data Phi-3. Himpunan data mencakup data sintetis dan data situs web yang difilter dan tersedia untuk umum, dengan fokus pada properti berkualitas tinggi dan padat penalaran. Model-model ini menjalani proses peningkatan yang ketat, menggabungkan penyempurnaan yang diawasi, pengoptimalan kebijakan proksimal, dan pengoptimalan preferensi langsung untuk memastikan kepatuhan instruksi yang tepat dan langkah-langkah keamanan yang kuat.

Model Jenis Tingkat Kemampuan
Phi-3-mini-128k-instruct penyelesaian obrolan Standar global - Input: teks (131.072 token)
- Output: (4.096 token)
- Bahasa: en
- Panggilan alat: Tidak
- Format respons: Teks
Phi-3-mini-4k-instruct penyelesaian obrolan Standar global - Input: teks (4.096 token)
- Output: (4.096 token)
- Bahasa: en
- Panggilan alat: Tidak
- Format respons: Teks
Phi-3-small-8k-instruct penyelesaian obrolan Standar global - Input: teks (131.072 token)
- Output: (4.096 token)
- Bahasa: en
- Panggilan alat: Tidak
- Format respons: Teks
Phi-3-medium-128k-instruct penyelesaian obrolan Standar global - Input: teks (131.072 token)
- Output: (4.096 token)
- Bahasa: en
- Panggilan alat: Tidak
- Format respons: Teks
Phi-3-medium-4k-instruct penyelesaian obrolan Standar global - Input: teks (4.096 token)
- Output: (4.096 token)
- Bahasa: en
- Panggilan alat: Tidak
- Format respons: Teks
Phi-3.5-vision-instruct penyelesaian obrolan Standar global - Input: teks dan gambar (131.072 token)
- Output: (4.096 token)
- Bahasa: en
- Panggilan alat: Tidak
- Format respons: Teks
Phi-3.5-MoE-instruct penyelesaian obrolan Standar global - Input: teks (131.072 token)
- Output: teks (4.096 token)
- Bahasa: en, ar, zh, cs, da, nl, fi, fr, de, he, hu, it, ja, ko, no, pl, pt, ru, es, sv, th, tr, dan uk
- Panggilan alat: Tidak
- Format respons: Teks
Phi-3-small-128k-instruct penyelesaian obrolan Standar global - Input: teks (131.072 token)
- Output: (4.096 token)
- Bahasa: en
- Panggilan alat: Tidak
- Format respons: Teks
Phi-3.5-mini-instruct penyelesaian obrolan Standar global - Input: teks (131.072 token)
- Output: (4.096 token)
- Bahasa: en, ar, zh, cs, da, nl, fi, fr, de, he, hu, it, ja, ko, no, pl, pt, ru, es, sv, th, tr, dan uk
- Panggilan alat: Tidak
- Format respons: Teks
Phi-4 penyelesaian obrolan Standar global - Input: teks (16.384 token)
- Output: (16.384 token)
- Bahasa: en, ar, bn, cs, da, de, el, es, fa, fi, fr, gu, ha, he, hi, hu, id, it, ja, jv, kn, ko, ml, mr, nl, no, atau, pa, pl, ps, pt, ro, ru, sv, sw, ta, te, th, tl, tr, uk, Anda, vi, yo, dan zh - Alat memanggil: Tidak
- Format respons: Teks

Lihat koleksi model ini di portal Azure AI Foundry.

Mistral AI

Mistral AI menawarkan dua kategori model: model premium termasuk Mistral Large dan Mistral Small dan model terbuka termasuk Mistral Nemo.

Model Jenis Tingkat Kemampuan
Ministral-3B penyelesaian obrolan Standar global - Input: teks (131.072 token)
- Output: teks (4.096 token)
- Bahasa: fr, de, es, it, dan en
- Panggilan alat: Ya
- Format respons: Teks, JSON
Mistral-large
(tidak digunakan lagi)
penyelesaian obrolan Standar global - Input: teks (32.768 token)
- Output: (4.096 token)
- Bahasa: fr, de, es, it, dan en
- Panggilan alat: Ya
- Format respons: Teks, JSON
Mistral-small penyelesaian obrolan Standar global - Input: teks (32.768 token)
- Output: teks (4.096 token)
- Bahasa: fr, de, es, it, dan en
- Panggilan alat: Ya
- Format respons: Teks, JSON
Mistral-Nemo penyelesaian obrolan Standar global - Input: teks (131.072 token)
- Output: teks (4.096 token)
- Bahasa: en, fr, de, es, it, zh, ja, ko, pt, nl, dan pl
- Panggilan alat: Ya
- Format respons: Teks, JSON
Mistral-large-2407
(warisan)
penyelesaian obrolan Standar global - Input: teks (131.072 token)
- Output: (4.096 token)
- Bahasa: en, fr, de, es, it, zh, ja, ko, pt, nl, dan pl
- Panggilan alat: Ya
- Format respons: Teks, JSON
Mistral-Large-2411 penyelesaian obrolan Standar global - Input: teks (128.000 token)
- Output: teks (4.096 token)
- Bahasa: en, fr, de, es, it, zh, ja, ko, pt, nl, dan pl
- Panggilan alat: Ya
- Format respons: Teks, JSON
Codestral-2501 penyelesaian obrolan Standar global - Input: teks (262.144 token)
- Output: teks (4.096 token)
- Bahasa: en
- Panggilan alat: Tidak
- Format respons: Teks

Lihat koleksi model ini di portal Azure AI Foundry.

NTT Data

Tsuzumi adalah transformator yang dioptimalkan bahasa otomatis. Versi yang disetel menggunakan penyempurnaan yang diawasi (SFT). Tsuzumi menangani bahasa Jepang dan Inggris dengan efisiensi tinggi.

Model Jenis Tingkat Kemampuan
Tsuzumi-7b penyelesaian obrolan Standar global - Input: teks (8.192 token)
- Output: teks (8.192 token)
- Bahasa: en dan jp
- Panggilan alat: Tidak
- Format respons: Teks

Langkah berikutnya