Databricks Runtime 5.3 ML (EoS)
إشعار
انتهى دعم إصدار وقت تشغيل Databricks هذا. للحصول على تاريخ انتهاء الدعم، راجع محفوظات انتهاء الدعم. لجميع إصدارات وقت تشغيل Databricks المدعومة، راجع إصدارات ملاحظات إصدار Databricks Runtime والتوافق.
أصدرت Databricks هذا الإصدار في أبريل 2019.
يوفر Databricks Runtime 5.3 ML بيئة جاهزة للتعلم الآلي وعلوم البيانات استنادا إلى Databricks Runtime 5.3 (EoS). يحتوي Databricks Runtime for ML على العديد من مكتبات التعلم الآلي الشائعة، بما في ذلك TensorFlow وPyTorch وKeras وXGBoost. كما يدعم التدريب على التعلم العميق الموزع باستخدام Horovod.
لمزيد من المعلومات، بما في ذلك إرشادات إنشاء مجموعة التعلم الآلي من Databricks Runtime، راجع الذكاء الاصطناعي والتعلم الآلي على Databricks.
الميزات الجديدة
تم إنشاء Databricks Runtime 5.3 ML أعلى Databricks Runtime 5.3. للحصول على معلومات حول الجديد في Databricks Runtime 5.3، راجع ملاحظات إصدار Databricks Runtime 5.3 (EoS ). بالإضافة إلى تحديثات المكتبة، يقدم Databricks Runtime 5.3 ML الميزات الجديدة التالية:
تكامل MLflow Apache Spark MLlib: يدعم Databricks Runtime 5.3 ML التسجيل التلقائي لتشغيلات MLflow للنماذج المناسبة باستخدام خوارزميات
CrossValidator
ضبط PySpark وTrainValidationSplit
. +ترقية المكتبات التالية إلى أحدث إصدار:
- PyArrow من 0.8.0 إلى 0.12.1:
BinaryType
مدعوم من قبل التحويل المستند إلى الأسهم ويمكن استخدامه في PandasUDF. - Horovod من 0.15.2 إلى 0.16.0.
- TensorboardX من 1.4 إلى 1.6.
- PyArrow من 0.8.0 إلى 0.12.1:
تم إهمال واجهة برمجة تطبيقات تصدير نموذج Databricks ML. توصي Azure Databricks باستخدام MLeap بدلا من ذلك، والذي يوفر تغطية أوسع بأنواع نماذج MLlib. تعرف على المزيد في تصدير نموذج MLeap ML.
إشعار
بالإضافة إلى ذلك، يحتوي Databricks Runtime 5.3 على تحميل FUSE جديد محسن لتحميل البيانات ونقاط التحقق النموذجية وتسجيل الدخول من كل عامل إلى موقع file:/dbfs/ml
تخزين مشترك ، والذي يوفر إدخال/إخراج عالي الأداء لأحمال عمل التعلم العميق. راجع تحميل البيانات للتعلم الآلي والتعلم العميق.
تحديثات الصيانة
راجع تحديثات صيانة Databricks Runtime 5.4 ML.
بيئة النظام
تختلف بيئة النظام في Databricks Runtime 5.3 ML عن Databricks Runtime 5.3 كما يلي:
- Python: 2.7.15 لمجموعات Python 2 و3.6.5 لمجموعات Python 3.
- DBUtils: لا يحتوي Databricks Runtime 5.3 ML على الأداة المساعدة للمكتبة (dbutils.library) (قديم).
- بالنسبة لمجموعات GPU، مكتبات NVIDIA GPU التالية:
- Tesla driver 396.44
- CUDA 9.2
- CUDNN 7.2.1
مكتبات
تسرد الأقسام التالية المكتبات المضمنة في Databricks Runtime 5.3 ML التي تختلف عن تلك المضمنة في Databricks Runtime 5.3.
مكتبات من المستوى الأعلى
يتضمن Databricks Runtime 5.3 ML مكتبات المستوى الأعلى التالية:
مكتبات Python
يستخدم Databricks Runtime 5.3 ML Conda لإدارة حزمة Python. ونتيجة لذلك، هناك اختلافات كبيرة في مكتبات Python المثبتة مسبقا مقارنة بوقت تشغيل Databricks. فيما يلي قائمة كاملة بحزم Python المتوفرة والإصدارات المثبتة باستخدام إدارة حزم Conda.
مكتبة | إصدار | مكتبة | إصدار | مكتبة | إصدار |
---|---|---|---|---|---|
absl-py | 0.7.0 | argparse | 1.4.0 | asn1crypto | 0.24.0 |
استور | 0.7.1 | backports-abc | 0.5 | backports.functools-lru-cache | 1.5 |
backports.weakref | 1.0.post1 | bcrypt | 3.1.6 | بيض | 2.1.3 |
boto | 2.48.0 | boto3 | 1.7.62 | روبوت الدردشة | 1.10.62 |
شهادة | 2018.04.16 | cffi | 1.11.5 | تجزئة | 3.0.4 |
cloudpickle | 0.5.3 | سمة ملونة | 0.3.9 | configparser | 3.5.0 |
التشفير | 2.2.2 | دورة | 0.10.0 | Cython | 0.28.2 |
ديكور | 4.3.0 | docutils | 0.14 | نقاط الإدخال | 0.2.3 |
قائمة تعداد 34 | 1.1.6 | et-xmlfile | 1.0.1 | funcsigs | 1.0.2 |
functools32 | 3.2.3-2 | صمام مدمج | 2.0.4 | العقود الاجله | 3.2.0 |
غاست | 0.2.2 | grpcio | 1.12.1 | h5py | 2.8.0 |
horovod | 0.16.0 | html5lib | 1.0.1 | idna | 2.6 |
عنوان ipaddress | 1.0.22 | ipython | 5.7.0 | ipython_genutils | 0.2.0 |
jdcal | 1.4 | جينجا 2 | 2.10 | مسار jmespath | 0.9.3 |
jsonschema | 2.6.0 | jupyter-client | 5.2.3 | jupyter-core | 4.4.0 |
Keras | 2.2.4 | Keras-Applications | 1.0.6 | Keras-Preprocessing | 1.0.5 |
kiwisolver | 1.0.1 | linecache2 | 1.0.0 | llvmlite | 0.23.1 |
lxml | 4.2.1 | Markdown | 3.0.1 | MarkupSafe | 1.0 |
matplotlib | 2.2.2 | سوء الحظ | 0.8.3 | mleap | 0.8.1 |
استهزأ | 2.0.0 | msgpack | 0.5.6 | nbconvert | 5.3.1 |
تنسيق nbformat | 4.4.0 | nose | 1.3.7 | استبعاد الأنف | 0.5.0 |
numba | 0.38.0+0.g2a2b772fc.dirty | numpy | 1.14.3 | olefile | 0.45.1 |
openpyxl | 2.5.3 | pandas | 0.23.0 | عوامل تصفية pandocfilter | 1.4.2 |
باراميكو | 2.4.1 | pathlib2 | 2.3.2 | بتسي | 0.5.0 |
pbr | 5.1.1 | pexpect | 4.5.0 | pickleshare | 0.7.4 |
مخدة | 5.1.0 | pip | 10.0.1 | رقائق | 3.11 |
مجموعة أدوات المطالبة | 1.0.15 | protobuf | 3.6.1 | psutil | 5.6.0 |
psycopg2 | 2.7.5 | عملية ptyprocess | 0.5.2 | pyarrow | 0.12.1 |
pyasn1 | 0.4.5 | pycparser | 2.18 | Pygments | 2.2.0 |
PyNaCl | 1.3.0 | pyOpenSSL | 18.0.0 | pyparsing | 2.2.0 |
PySocks | 1.6.8 | Python | 2.7.15 | python-dateutil | 2.7.3 |
pytz | 2018.4 | PyYAML | 3.12 | pyzmq | 17.0.0 |
الطلبات | 2.18.4 | s3transfer | 0.1.13 | scandir | 1.7 |
scikit-learn | 0.19.1 | شفرة | 1.1.0 | بحر محمول | 0.8.1 |
أدوات الإعداد | 39.1.0 | إنشاء بسيط | 0.8.1 | أحادي الموضع | 3.4.0.3 |
ستة | 1.11.0 | نماذج الإحصائيات | 0.9.0 | العملية الفرعية32 | 3.5.3 |
لوحة العشرات | 1.12.2 | tensorboardX | 1.6 | تدفق العشرات | 1.12.0 |
لون المصطلحات | 1.1.0 | مسار الاختبار | 0.3.1 | مشعل | 0.4.1 |
شعلة الشعلة | 0.2.1 | اعصار | 5.0.2 | traceback2 | 1.4.0 |
سمات السمات | 4.3.2 | unittest2 | 1.1.0 | urllib3 | 1.22 |
virtualenv | 16.0.0 | wcwidth | 0.1.7 | ترميزات الويب | 0.5.1 |
ويركزيوغ | 0.14.1 | دولاب | 0.31.1 | ملف التفافي | 1.10.11 |
wsgiref | 0.1.2 |
بالإضافة إلى ذلك، تتضمن حزم Spark التالية وحدات Python النمطية:
حزمة Spark | وحدة Python النمطية | إصدار |
---|---|---|
إطارات الرسم البياني | إطارات الرسم البياني | 0.7.0-db1-spark2.4 |
spark-deep-learning | sparkdl | 1.5.0-db1-spark2.4 |
إطارات العشرات | إطارات العشرات | 0.6.0-s_2.11 |
مكتبات R
مكتبات R مطابقة لمكتبات R في Databricks Runtime 5.3.
مكتبات Java وScala (مجموعة Scala 2.11)
بالإضافة إلى مكتبات Java و Scala في Databricks Runtime 5.3، يحتوي Databricks Runtime 5.3 ML على JARs التالية:
معرف مجموعة | معرف البيانات الاصطناعية | إصدار |
---|---|---|
com.databricks | spark-deep-learning | 1.5.0-db1-spark2.4 |
com.typesafe.akka | akka-actor_2.11 | 2.3.11 |
ml.combust.mleap | mleap-databricks-runtime_2.11 | 0.13.0 |
ml.dmlc | xgboost4j | 0.81 |
ml.dmlc | xgboost4j-spark | 0.81 |
org.graphframes | graphframes_2.11 | 0.7.0-db1-spark2.4 |
org.tensorflow | تدفق libtensor | 1.12.0 |
org.tensorflow | libtensorflow_jni | 1.12.0 |
org.tensorflow | spark-tensorflow-connector_2.11 | 1.12.0 |
org.tensorflow | تدفق العشرات | 1.12.0 |
org.tensorframes | إطارات العشرات | 0.6.0-s_2.11 |