تحويل عمود مشتق في تعيين تدفق البيانات
ينطبق على: Azure Data Factory
Azure Synapse Analytics
تلميح
جرب Data Factory في Microsoft Fabric، وهو حل تحليلي متكامل للمؤسسات. يغطي Microsoft Fabric كل شيء بدءا من حركة البيانات إلى علم البيانات والتحليلات في الوقت الحقيقي والمعلومات المهنية وإعداد التقارير. تعرف على كيفية بدء إصدار تجريبي جديد مجانا!
تتوفر تدفقات البيانات في كل من Azure Data Factory وخطوط أنابيب Azure Synapse. تنطبق هذه المقالة على تعيين تدفقات البيانات. إذا كنت جديداً في مجال التحويلات، فيرجى الرجوع إلى المقالة التمهيدية تحويل البيانات باستخدام تدفق بيانات التعيين.
استخدم تحويل العمود المشتق لإنشاء أعمدة جديدة في تدفق البيانات أو لتعديل الحقول الموجودة.
إنشاء أعمدة وتحديثها
عند إنشاء عمود مشتق، يمكنك إما إنشاء عمود جديد أو تحديث عمود موجود. في مربع نص Column، أدخِل العمود الذي تنشئه. لمنع عمود موجود في المخطط، يمكنك استخدام القائمة المنسدلة للعمود. لإنشاء تعبير العمود المشتق، انقر فوق مربع النص Enter expression. يمكنك إما البدء في كتابة التعبير أو فتح منشيء التعبير لإنشاء منطقك.
لإضافة المزيد من الأعمدة المشتقة، انقر فوق Add أعلى قائمة الأعمدة أو أيقونة علامة زائد (+) بجوار عمود مشتق موجود. اختر إما Add column أو إضافة Add column pattern.
أنماط الأعمدة
في الحالات التي لا يتم فيها تعريف مخططك تعريفًا صريحًا أو إذا كنت تريد تحديث مجموعة من الأعمدة بشكل مجمّع، فستحتاج إلى إنشاء أنماط أعمدة. تسمح لك أنماط الأعمدة بمطابقة الأعمدة باستخدام قواعد تستند إلى بيانات تعريف العمود وإنشاء أعمدة مشتقة لكل عمود مطابق. للحصول على مزيدٍ من المعلومات، تعرّف على كيفية إنشاء أنماط أعمدة في تحويل العمود المشتق.
بناء المخططات باستخدام منشيء التعبير
عند استخدام منشيء التعبير في تعيين تدفق البيانات، يمكنك إنشاء الأعمدة المشتقة في القسم Derived Columns وتحريرها وإدارتها. تُدرج جميع الأعمدة التي تم إنشاؤها أو تغييرها في التحويل. اختر بشكل تفاعلي أي عمود أو نمط تعمل على تحريره بالنقر على اسم العمود. لإضافة عمود آخر، حدد Create new، واختر ما إذا كنت تريد إضافة عمود أو نمط واحد.
عند العمل باستخدام أعمدة معقدة، يمكنك إنشاء subcolumns. لإجراء ذلك، انقر فوق أيقونة علامة زائد (+) بجانب أي عمود وحدد Add subcolumn. للحصول على مزيدٍ من المعلومات حول معالجة الأنواع المعقدة في تدفق البيانات، راجع معالجة JSON في تعيين تدفق البيانات.
للحصول على مزيدٍ من المعلومات حول معالجة الأنواع المعقدة في تدفق البيانات، راجع معالجة JSON في تعيين تدفق البيانات.
البرنامج النصي لتدفق البيانات
بناء الجملة
<incomingStream>
derive(
<columnName1> = <expression1>,
<columnName2> = <expression2>,
each(
match(matchExpression),
<metadataColumn1> = <metadataExpression1>,
<metadataColumn2> = <metadataExpression2>
)
) ~> <deriveTransformationName>
مثال
المثال أدناه هو عمود مشتق اسمه CleanData
يأخذ دفق بيانات MoviesYear
وارد وينشئ عمودين مشتقين. يحل العمود الأول المشتق محل العمود Rating
بقيمة التقييم كنوع عدد صحيح. العمود الثاني المشتق هو نمط يطابق كل عمود يبدأ اسمه بكلمة «movies». بالنسبة إلى كل عمود متطابق، فهو ينشئ عمود movie
يساوي قيمة العمود المطابق المثبت مسبوقاً بكلمة «movie_».
في واجهة المستخدم، يبدو هذا التحول مثل الصورة أدناه:
يوجد البرنامج النصي لتدفق البيانات لهذا التحويل في الجزء أدناه:
MoviesYear derive(
Rating = toInteger(Rating),
each(
match(startsWith(name,'movies')),
'movie' = 'movie_' + toString($$)
)
) ~> CleanData
المحتوى ذو الصلة
- تعرّف على مزيدٍ من المعلومات حول لغة تعبير تعيين تدفق البيانات.