أطلق العنان لقوة لغة بايثون لتحويل البيانات باستخدام تابلو بريب بيلدر

Blog-01-550x550

تابلو بريب بيلدر هو إحدى منتجات تابلو وقد تم تصميمه بطريقة مرنة لمساعدة أي شخص على دمج البيانات وتشكيلها وتنظيفها بسرعة وثقة لتحليلها. لهذا ، يمكنك البدء بالاتصال ببياناتك من مجموعة متنوعة من الملفات أو الخوادم أو مقتطفات من تابلو؛ يمكن دمج البيانات من مصادر بيانات متعددة. يمكنك إحضار الجداول الخاصة بك إلى جزء التدفق عن طريق السحب والإفلات أو النقر المزدوج ، ثم تنظيف البيانات وتشكيلها باستخدام عمليات مثل التصفية والتقسيم وإعادة التسمية والتمحور الدمج والتوحيد. 

يتم تمثيل كل خطوة في العملية بشكل مرئي في مخطط انسيابي يمكن إنشاؤه والتحكم فيه. يمكنك التحقق من عملك وإجراء التغييرات في أي نقطة في التدفق وسيتحقق تابلو بريب بيلدر من كل عملية. 

قبل الإصدار الحالي من تابلو بريب، كانت هناك طلبات واقتراحات متعددة من المستخدمين فيما يتعلق باستخدام لغة البرمجة النصية لتحويل البيانات ، والبحث عن معلومات إضافية في المصادر المحدودة بالإضافة إلى تشغيل خوارزميات التعلم الآلي المعقدة على المدخلات. كما كان الحال دومًا، نظر تابلو في متطلبات المستخدم وابتكر ميزة جديدة. مع أحدث إصدار من Tableau Prep Builder 2019.3.1 ، طرح تابلو ميزة تكامل Python و R والتي يمكن أن تضيف سيناريوهات متقدمة إلى تابلو بريب. باستخدام هذه الميزة ، يمكن للمستخدمين توصيل البرامج النصية الخاصة بهم في أي نقطة أو خطوة في التدفق واستخدام القوة الكاملة للغة البرمجة النصية الخاصة بهم وفقًا لمتطلباتهم. 

 

إعداد تاب باي 

تاب باي هي أداة مفتوحة المصدر، تستخدمها تابلو بريب بيلدر لتنفيذ كود بايثون.  تاب باي ، اختصار لـ خادم تابلو بايثون، وهو الأداة التي يتم من خلالها تكامل بايثون. يعد تنفيذ البرنامج النصي ميزة متقدمة ، لذلك يحتاج تاب باي إلى الإعداد. يمكنك النقر فوق تثبيت تاب باي لعملية التثبيت التفصيلية. 

الآن إذا تم اتباع كل شيء ووضعه معًا كما هو متوقع ، فستجد رقم المنفذ مطلوبًا في الجزء السفلي للاتصال بخادم تاب باي. بشكل افتراضي ، قيمة المنفذ هي “9004” واسم الخادم “localhost. 

 

تنفيذ مصنف SVM  

يعد مصنف آلة فيكتور للدعم أحد أكثر خوارزميات تصنيف التعلم الآلي شيوعًا. يستخدم في الغالب في معالجة مشاكل التصنيف المتعدد. فمثلا: 

  • بالنظر إلى سمات الفاكهة مثل اللون والحجم والطعم والوزن والشكل يمكم التنبؤ بنوع الفاكهة. 
  • من خلال تحليل الجلد يمكن التنبؤ بأمراض الجلد المختلفة. 
  • بالنظر إلى مقالات أخبار جوجل، يمكن التنبؤ بموضوع المقالة. فقد يكون هذا مقالًا متعلقًا بالرياضة، الأفلام، الأخبار التقنية، إلخ. 
  • تصنيف ردود تويتر لفئات مختلفة لتحليل المشاعر. 

سنستخدم مجموعة بيانات آيريس لتنفيذ مصنف  SVMتم استخدام مجموعة بيانات آيريس لأول مرة في بحث فيشر الكلاسيكية لعام 1936، استخدام القياسات المتعددة في المشكلات التصنيفية. تحتوي مجموعة البيانات هذه على أربع ميزات لزهرة السوسن وفئة مستهدفة واحدة. الميزات الأربعة هي طول سيبال سم، عرض سيبال سم، طول البتلة سم وعرض البتلة سم. نوع الزهرة هو الصنف المستهدف ، وله ثلاثة أنواع: سيتوسا ، فيرسيكولور وفيرجينيكا. 

يتم تنفيذ مصنف SVM بشكل أساسي بحيث يمكن استخدام ميزات آيريس لتدريب مصنف SVM ، ويمكن استخدام نموذج SVM المدرب هذا للتنبؤ بنوع زهرة السوسن. الآن دعونا نرى كيف يمكن القيام بذلك. 

يمكنك القيام بذلك عن طريق توصيل البيانات بـ Prep Builder وإضافة نص بايثون المكتوب مسبقًا إلى التدفق. سيقرأ البرنامج النصي البيانات من Tableau Prep وسيقوم بتشغيل مصنف SVM. 

تُستخدم “بيانات القطار” لتدريب نموذج SVM ويتم توقع أنواع الزهور من أجل “بيانات الاختبار”. يتم إرسال نتيجة ذلك مرة أخرى إلى Prep Builder الذي يمكننا بعد ذلك استخدامه لمزيد من التحليل. 

مع دعم البرمجة النصية الجديد هذا في Prep Builder ، أصبح من السهل الآن أكثر من أي وقت مضى تنفيذ سيناريوهات تحويل البيانات المعقدة التي يمكن أن تتجاوز الإمكانات المضمنة في Prep. يمكن استخدام ميزة البرمجة النصية هذه من العمليات الحسابية البسيطة إلى نماذج التعلم الآلي المعقدة وجلب البيانات من الإنترنت. 

X