تحسين مجموعة البيانات والتخزين المؤقت
تعد لوحات معلومات الذكاء الاصطناعي/BI أدوات قيمة لتحليل البيانات واتخاذ القرارات، ويمكن أن تؤدي أوقات التحميل الفعالة إلى تحسين تجربة المستخدم بشكل كبير. توضح هذه المقالة كيفية جعل التخزين المؤقت وتحسينات مجموعة البيانات لوحات المعلومات أكثر أداء وكفاءة.
أداء الاستعلام
يمكنك فحص الاستعلامات وأدائها في محفوظات استعلام مساحة العمل. تعرض محفوظات الاستعلام استعلامات SQL التي تم إجراؤها باستخدام مستودعات SQL. انقر فوق محفوظات الاستعلام في الشريط الجانبي لعرض محفوظات الاستعلام. راجع محفوظات الاستعلام.
بالنسبة لمجموعات بيانات لوحة المعلومات، يطبق Azure Databricks تحسينات الأداء اعتمادا على حجم نتيجة مجموعة البيانات.
تحسينات مجموعة البيانات
تتضمن مجموعات بيانات لوحة معلومات الذكاء الاصطناعي/BI تحسينات الأداء التالية:
- إذا كان حجم نتيجة مجموعة البيانات صغيرا (أقل من أو يساوي 100 ألف صف أو 100 ميغابايت، أيهما أصغر)، يتم سحب نتيجة مجموعة البيانات إلى العميل، ويتم إجراء التصفية والتجميع الخاصين بالتصور في المستعرض. تعد تصفية البيانات وتجميعها لمجموعات البيانات الصغيرة سريعة جدا، ويمكن أن يساعدك ضمان أن مجموعة البيانات صغيرة على تحسين أداء لوحة المعلومات. مع مجموعات البيانات الصغيرة، يظهر استعلام مجموعة البيانات فقط في محفوظات الاستعلام.
- إذا كان حجم نتيجة مجموعة البيانات كبيرا (أكبر من 100 ألف صف أو 100 ميغابايت)، يتم التفاف نص استعلام مجموعة البيانات في عبارة SQL
WITH
، ويتم إجراء التصفية والتجميع الخاصين بالتصور في استعلام على الخلفية بدلا من المستعرض. مع مجموعات البيانات الكبيرة، يظهر استعلام المرئيات في محفوظات الاستعلام. - بالنسبة لاستعلامات المرئيات المرسلة إلى الخلفية، يتم دمج استعلامات المرئيات المنفصلة مقابل نفس مجموعة البيانات التي تشترك في نفس
GROUP BY
العبارات وتصفية دالات التقييم في استعلام واحد للمعالجة. في هذه الحالة، قد يرى المستخدمون استعلاما مدمجا واحدا في محفوظات الاستعلام الذي يجلب نتائج لتصورات متعددة.
التخزين المؤقت ونضارة البيانات
تحتفظ لوحات المعلومات بذاكرة تخزين مؤقت للنتيجة على مدار 24 ساعة لتحسين أوقات التحميل الأولية، وتعمل على أساس أفضل جهد. وهذا يعني أنه بينما يحاول النظام دائما استخدام نتائج الاستعلام التاريخي المرتبطة ببيانات اعتماد لوحة المعلومات لتحسين الأداء، هناك بعض الحالات التي لا يمكن فيها إنشاء النتائج المخزنة مؤقتا أو الاحتفاظ بها. لا تحتوي البيانات المخزنة مؤقتا على حد ذاكرة محدد أو عدد استعلام ثابت.
بالنسبة للوحات المعلومات متعددة الصفحات، ينطبق ما يلي:
- تحرير لوحة معلومات مسودة يقوم بتحميل وتخزين جميع مجموعات البيانات مؤقتا.
- عندما يفتح المشاهدون لوحة معلومات منشورة، يتم تشغيل مجموعات البيانات التي تدعم الصفحة النشطة فقط وتخزينها مؤقتا.
- إذا تم تعيين جدول زمني، يتم تحديث جميع مجموعات البيانات وفقا للجدول الزمني، ويتم تخزين هذه النتائج مؤقتا.
يوضح الجدول التالي كيفية اختلاف التخزين المؤقت حسب حالة لوحة المعلومات وبيانات الاعتماد:
نوع لوحة المعلومات | نوع التخزين المؤقت |
---|---|
لوحة معلومات منشورة مع بيانات اعتماد مضمنة | ذاكرة التخزين المؤقت المشتركة. يرى جميع المشاهدين النتائج نفسها. |
لوحة معلومات المسودة أو لوحة المعلومات المنشورة دون بيانات اعتماد مضمنة | ذاكرة التخزين المؤقت لكل مستخدم. يرى المشاهدون النتائج استنادا إلى أذونات البيانات الخاصة بهم. |
تستخدم لوحات المعلومات نتائج الاستعلام المخزنة مؤقتا تلقائيا إذا ظلت البيانات الأساسية دون تغيير بعد الاستعلام الأخير أو إذا تم استرداد النتائج قبل أقل من 24 ساعة. إذا كانت هناك نتائج قديمة وتم تطبيق المعلمات على لوحة المعلومات، إعادة تشغيل الاستعلامات ما لم يتم استخدام نفس المعلمات في ال 24 ساعة الماضية. وبالمثل، فإن تطبيق عوامل التصفية على مجموعات البيانات التي تتجاوز 100,000 صف يطالب الاستعلامات بإعادة التشغيل ما لم يتم تطبيق نفس عوامل التصفية مسبقا في آخر 24 ساعة.
الاستعلامات المجدولة
يمكن أن تؤدي إضافة جدول إلى لوحة معلومات منشورة مع بيانات اعتماد مضمنة إلى تسريع عملية التحميل الأولية بشكل كبير لجميع عارضي لوحة المعلومات.
لكل تحديث مجدول للوحة المعلومات، يحدث ما يلي:
- يتم تشغيل جميع منطق SQL الذي يحدد مجموعات البيانات على الفاصل الزمني المعين.
- تملأ النتائج ذاكرة التخزين المؤقت لنتائج الاستعلام وتساعد على تحسين وقت تحميل لوحة المعلومات الأولية.