A DALL-E modellek használata
Az OpenAI DALL-E modelljei a felhasználó által megadott szöveges kérések alapján hoznak létre képeket. Ez az útmutató bemutatja, hogyan használhatja a DALL-E modelleket, és hogyan konfigurálhatja a beállításokat REST API-hívásokon keresztül.
Előfeltételek
- Azure-előfizetés. Ingyenesen létrehozhat egyet.
- Egy támogatott régióban létrehozott Azure OpenAI-erőforrás. Lásd a régió rendelkezésre állását.
-
- Üzembe helyezhet egy dall-e-3 modellt az Azure OpenAI-erőforrással.
A képgenerálási API-k meghívása
Az alábbi parancs a DALL-E kóddal való használatának legalapvetőbb módját mutatja be. Ha ez az első alkalom, hogy programozott módon használja ezeket a modelleket, javasoljuk, hogy kezdje a DALL-E rövid útmutatóval.
POST-kérés küldése a következő címre:
https://<your_resource_name>.openai.azure.com/openai/deployments/<your_deployment_name>/images/generations?api-version=<api_version>
Cserélje le a következő helyőrzőket:
-
<your_resource_name>
Az Azure OpenAI-erőforrás neve. -
<your_deployment_name>
A DALL-E 3 modell üzembe helyezésének neve. -
<api_version>
A használni kívánt API-verzió. Például:2024-02-01
.
Szükséges fejlécek:
-
Content-Type
:application/json
-
api-key
:<your_API_key>
Törzs:
Az alábbiakban egy mintakérés törzse található. A későbbi szakaszokban definiált beállítások közül választhat.
{
"prompt": "A multi-colored umbrella on the beach, disposable camera",
"size": "1024x1024",
"n": 1,
"quality": "hd",
"style": "vivid"
}
Hozam
A sikeres képgenerálási API-hívás kimenete az alábbi példához hasonlóan néz ki. A url
mező egy URL-címet tartalmaz, ahová letöltheti a létrehozott lemezképet. Az URL-cím 24 órán át aktív marad.
{
"created": 1698116662,
"data": [
{
"url": "<URL_to_generated_image>",
"revised_prompt": "<prompt_that_was_used>"
}
]
}
API-hívás elutasítása
A rendszer a kéréseket és képeket a tartalomszabályzatunk alapján szűri, és hibaüzenetet ad vissza, ha egy üzenet vagy kép meg van jelölve.
Ha a rendszer megjelöli a kérést, az error.code
üzenet értéke a következőre contentFilter
van állítva: . Példa:
{
"created": 1698435368,
"error":
{
"code": "contentFilter",
"message": "Your task failed as a result of our safety system."
}
}
Előfordulhat, hogy maga a létrehozott rendszerkép is szűrve van. Ebben az esetben a hibaüzenet generált rendszerképre van állítva , amelyet a biztonsági rendszerünk szűrt. Példa:
{
"created": 1698435368,
"error":
{
"code": "contentFilter",
"message": "Generated image was filtered as a result of our safety system."
}
}
Képírási kérések
A képkéréseknek le kell írniuk a képben megjeleníteni kívánt tartalmat és a kép vizuális stílusát.
Amikor kéréseket ír, vegye figyelembe, hogy a képgenerálási API-k con sátormód ration szűrővel érkeznek. Ha a szolgáltatás a kérést káros tartalomként ismeri fel, nem hoz létre képet. További információ: Tartalomszűrés.
Tipp.
A szövegkérések különböző típusú képek létrehozására való finomhangolásának részletes megismeréséhez tekintse meg az Image prompt mérnöki útmutatóját.
API-beállítások megadása
A DALL-E képgeneráláshoz az alábbi API-törzsparaméterek érhetők el.
Méret
Adja meg a létrehozott képek méretét. A DALL-E 3 modellek egyikének 1024x1024
1792x1024
kell 1024x1792
lennie. A négyzetes képek gyorsabban generálódnak.
Stílus
A DALL-E 3 két stíluslehetőséget kínál: natural
és vivid
. A természetes stílus jobban hasonlít a régebbi modellek alapértelmezett stílusához, míg az élénk stílus több hiper-valós és filmszerű képet hoz létre.
A természetes stílus akkor hasznos, ha a DALL-E 3 túltúlozza vagy összezavar egy témát, amelynek egyszerűbbnek, visszafogottabbnak vagy reálisabbnak kell lennie.
Az alapértelmezett érték vivid
.
Minőség
A képminőségnek két lehetősége van: hd
és standard
. A hd beállítás finomabb részletekkel és nagyobb konzisztenciával hozza létre a képeket. A standard rendszerképek gyorsabban hozhatók létre.
Az alapértelmezett érték standard
.
Szám
A DALL-E 3 használatával egyetlen API-hívásban nem hozhat létre egynél több képet: a n
paramétert 1 értékre kell állítani. Ha egyszerre több képet kell létrehoznia, párhuzamos kéréseket kell végeznie.
Válaszformátum
A létrehozott képek visszaadott formátuma. Az egyiknek url
(a képre mutató URL-címnek) vagy b64_json
(az alap 64 bájtos kódnak JSON formátumban) kell lennie. Az alapértelmezett érték url
.