مشاركة عبر


الوصول إلى Azure Cosmos DB لبيانات Apache Cassandra من Azure Databricks

ينطبق على: كاساندرا

توضح هذه المقالة بالتفصيل كيفية العمل مع Azure Cosmos DB ل Apache Cassandra من Spark على Azure Databricks.

المتطلبات الأساسية

تثبيت التبعيات المطلوبة

  • موصل Cassandra Spark: - لدمج Azure Cosmos DB ل Apache Cassandra مع Spark، يجب إرفاق موصل Cassandra بمجموعة Azure Databricks. لإرفاق وحدة التحكم:

    • مراجعة إصدار وقت تشغيل Databricks وإصدار Spark. ثم ابحث عن إحداثيات maven المتوافقة مع موصل Cassandra Spark، ثم قم بإرفاقها بالمجموعة. راجع مقالة «تحميل حزمة Maven أو حزمة Spark» لإرفاق مكتبة الموصل بالمُجمع. نوصي باختيار وقت تشغيل Databricks الإصدار 10.4 LTS، والذي يدعم Spark 3.2.1. لإضافة موصل Apache Spark Cassandra ومجموعة أجهزة الكمبيوتر الخاصة بك، حدد Libraries>Install new>Maven، ثم أضف com.datastax.spark:spark-cassandra-connector-assembly_2.12:3.2.0 في إحداثيات Maven. إذا كنت تستخدم Spark 2.x، نوصي باستخدام بيئة مع إصدار Spark 2.4.5، تستخدم موصل على إحداثيات maven com.datastax.spark:spark-cassandra-connector_2.11:2.4.3.
  • Azure Cosmos DB لمكتبة Apache Cassandra الخاصة: - إذا كنت تستخدم Spark 2.x، مطلوب مصنع اتصال مخصص لتكوين نهج إعادة المحاولة من موصل Cassandra Spark إلى Azure Cosmos DB ل Apache Cassandra. أضف com.microsoft.azure.cosmosdb:azure-cosmos-cassandra-spark-helper:1.2.0إحداثيات maven لإرفاق المكتبة بمجموعة أجهزة الكمبيوتر.

إشعار

إذا كنت تستخدم Spark 3.x، فلن تحتاج إلى تثبيت Azure Cosmos DB لمكتبة Apache Cassandra الخاصة المذكورة أعلاه.

تحذير

جرى اختبار عينات Spark 3 الموضحة في هذه المقالة باستخدام الإصدار 3.2.1 من Spark، وموصل Cassandra Spark المُكافئ com.datastax.spark:spark-cassandra-connector-assembly_2.12:3.2.0. قد لا تعمل الإصدارات اللاحقة من Spark و/ أو موصل Cassandra كما هو متوقع.

دفاتر ملاحظات العينة

تتوفر قائمة بـ عينات دفاتر ملاحظات Azure Databricks في مستودع GitHub لتنزيلها. تتضمن هذه العينات كيفية الاتصال ب Azure Cosmos DB ل Apache Cassandra من Spark وتنفيذ عمليات CRUD مختلفة على البيانات. يمكنك أيضًا استيراد كافة دفاتر الملاحظات إلى مساحة عمل مجموعة Databricks وتشغيلها.

الوصول إلى Azure Cosmos DB ل Apache Cassandra من برامج Spark Scala

يتم إرسال برامج Spark ليتم تشغيلها كعمليات تلقائية على Azure Databricks إلى مجموعة أجهزة الكمبيوتر باستخدام spark-submit) ومن المقرر تشغيلها خلال مهام Azure Databricks.

فيما يلي ارتباطات لمساعدتك على البدء في إنشاء برامج Spark Scala للتفاعل مع Azure Cosmos DB ل Apache Cassandra.

الخطوات التالية

ابدأ بإنشاء واجهة برمجة تطبيقات لحساب Cassandra وقاعدة بيانات وجدول باستخدام تطبيق Java.