استجابات ذاكرة التخزين المؤقت لطلبات واجهة برمجة تطبيقات نموذج اللغة الكبيرة

مقالة
12/13/2024

ينطبق على: جميع مستويات إدارة واجهة برمجة التطبيقات

يقوم llm-semantic-cache-store النهج بتخزين الاستجابات مؤقتا لواجهة برمجة تطبيقات إكمال الدردشة وإكمال طلبات واجهة برمجة التطبيقات إلى ذاكرة تخزين مؤقت خارجية تم تكوينها. يقلل التخزين المؤقت للاستجابة من متطلبات النطاق الترددي والمعالجة المفروضة على واجهة برمجة تطبيقات Azure OpenAI الخلفية ويقلل من زمن الانتقال الذي يراه مستهلكو واجهة برمجة التطبيقات.

إشعار

يجب أن يكون لهذا النهج نهج الحصول على استجابات مخزنة مؤقتا مقابل لنهج طلبات واجهة برمجة التطبيقات لنموذج اللغة الكبيرة.
للحصول على المتطلبات الأساسية والخطوات لتمكين التخزين المؤقت الدلالي، راجع تمكين التخزين المؤقت الدلالي لواجهات برمجة تطبيقات Azure OpenAI في Azure API Management.
حاليا، هذا النهج قيد المعاينة.

إشعار

تعيين عناصر النهج والعناصر التابعة بالترتيب الوارد في بيان النهج. تعلم كيفية إعداد نُهج APIM أو تعديلها.

النماذج المدعومة

استخدم النهج مع واجهات برمجة تطبيقات LLM المضافة إلى Azure API Management المتوفرة من خلال Azure الذكاء الاصطناعي Model Inference API.

نهج السياسة

<llm-semantic-cache-store duration="seconds"/>

سمات

السمة	‏‏الوصف	مطلوبة	افتراضي
المدة	مدة بقاء الإدخالات المخزنة مؤقتًا، محددة بالثواني. يتم السماح بتعبيرات النهج.	‏‏نعم‬	غير متوفر

الاستخدام

أقسام النهج:الواردة
نطاقات النهج: العمومية، والمنتج، وواجهة برمجة التطبيقات، والتشغيل
البوابات: الكلاسيكية، الإصدار 2، الاستهلاك

ملاحظات الاستخدام

يمكن استخدام هذا النهج مرة واحدة فقط في قسم النهج.
إذا فشل البحث عن ذاكرة التخزين المؤقت، فإن استدعاء API الذي يستخدم العملية المتعلقة بذاكرة التخزين المؤقت لا يثير خطأ، وتكتمل عملية ذاكرة التخزين المؤقت بنجاح.

الأمثلة

مثال مع نهج بحث llm-semantic-cache-lookup المطابق

<policies>
    <inbound>
        <base />
        <llm-semantic-cache-lookup
            score-threshold="0.05"
            embeddings-backend-id ="llm-backend"
            embeddings-backend-auth ="system-assigned" >
            <vary-by>@(context.Subscription.Id)</vary-by>
        </llm-semantic-cache-lookup>
    </inbound>
    <outbound>
        <llm-semantic-cache-store duration="60" />
        <base />
    </outbound>
</policies>

لمزيد من المعلومات حول العمل مع النُهج، راجع:

البرنامج التعليمي: تحويل واجهة برمجة التطبيقات الخاصة بك وحمايتها
Policy reference لقائمة كاملة من بيانات النُهج وإعداداتها
تعبيرات النهج
تعيين النهج أو تحريرها
إعادة استخدام التكوينات الخاصة بالنهج
مستودع القصاصات البرمجية للنهج
مجموعة أدوات نهج إدارة واجهة برمجة تطبيقات Azure
نهج المؤلف باستخدام Microsoft Copilot في Azure

مشاركة عبر

استجابات ذاكرة التخزين المؤقت لطلبات واجهة برمجة تطبيقات نموذج اللغة الكبيرة

النماذج المدعومة

نهج السياسة

سمات

الاستخدام

ملاحظات الاستخدام

الأمثلة

مثال مع نهج بحث llm-semantic-cache-lookup المطابق

الملاحظات

الموارد الإضافية

مشاركة عبر

استجابات ذاكرة التخزين المؤقت لطلبات واجهة برمجة تطبيقات نموذج اللغة الكبيرة

النماذج المدعومة

نهج السياسة

سمات

الاستخدام

ملاحظات الاستخدام

الأمثلة

مثال مع نهج بحث llm-semantic-cache-lookup المطابق

النهج ذات الصلة

المحتوى ذو الصلة

الملاحظات

الموارد الإضافية