التحلیل العاملي (Factor Analysis) والتنفیذ في البایثون

التحلیل العاملي والتنفيذ في البايثون

التحلیل العاملي

التحلیل العاملي (Factor Analysis) هو جزء من عملية تحليل البيانات الاستكشافية التي تستخدم عادة لطريقة تخفیض الأبعاد. يتم استخدامه لتقليل عدد كبير من المتغيرات إلى عدد أقل من المتغيرات. كما أن لها استخدامات أخرى مثل الإسقاط المتواز الخطي وعوامل المصفوفة. لكن اليوم سأعرض عليكم لمحة عامة.

التحلیل العاملي (Factor Analysis) هو نموذج خطي ويستخدم لشرح المتغيرات في المتغيرات المرصودة والمترابطة ويكثف المتغيرات إلى مجموعة أصغر تسمى العوامل. العامل هو متغير كامن (latent variable) يصف العلاقة بين المتغيرات المترصدة (observed variables). يصف كل عامل تباينًا معينًا في المتغيرات المرصودة.

التحلیل العاملي (Factor Analysis)

الهدف الأساسي لتحليل العواملی (Factor Analysis) هو تقليل عدد المتغيرات والعثور على متغيرات غیر المترصدة. على سبيل المثال، يمكن أن يعكس التباين في 6 متغيرات المترصدة (observed variables) بشكل أساسي التباين في متغيرين المترصدة (unobserved variables). يمكن استخدام هذا كاستنتاج للمسوقين لأبحاثهم. المتغير الكامن هو متغير لا يتم ملاحظته بشكل مباشر بل يتم استنتاجه.

أنواع التحلیل العاملي (Factor Analysis)

التحليل العاملي الاستكشافي (Exploratory factor analysis): يكون مفيدًا عندما لا تعرف بنية بياناتك أو أبعادها.

التحليل العاملي التوكيدي (Confirmatory Factor Analysis): مفيد عندما تعرف عدد الأبعاد في مجموعة من المتغيرات.

من أجل تحويل المتغيرات المترصدة (observed variables) إلى متغيرات غير المترصدة (unobserved variables)، هناك خطوتان.

الخطوات الرئیسیة لتبدیل المتغیرات المترصدة (observed variables) إلی متغیرات غیرالمترصدة (unobserved variables)

الخطوة الاولی: الاستخراج العامل (Factor Extraction)

في هذه الخطوة، یتم تحديد عدد العوامل وطريقة الاستخراج باستخدام طرق تقسيم التباين مثل تحليل العناصر الرئيسية (principal components analysis) وتحليل العوامل المشتركة (common factor analysis).

الخطوة الثانیة: دوران العامل (Factor Rotation)

في هذه الخطوة، يحاول التدویر تحويل العوامل إلى عوامل غير مرتبطة – الهدف الرئيسي من هذه الخطوة هو تحسين التفسير العام.

المصطلحات الرئیسیة في التحلیل العاملي

ما هو العامل؟

العامل هو متغير كامن (latent variable) يصف الارتباط بين عدد المتغيرات المترصده. الحد الأقصى لعدد العوامل يساوي عددًا من المتغيرات المترصده. يفسر كل عامل تباينًا معينًا في المتغيرات المرصودة. تم إسقاط العوامل ذات أقل قدر من التباين. تُعرف العوامل أيضًا بالمتغيرات الكامنة أو المتغيرات المخفية أو المتغيرات غير المترصده أو المتغيرات الافتراضية.

ما هي عوامل التشبع (factor loadings)؟

عامل التشبع (factor loading) عبارة عن مصفوفة توضح علاقة كل متغير بالعامل الأساسي. يوضح معامل الارتباط للمتغير المرصود والعامل. یعرض التباين الذي أوضحه من طریق المتغيرات المترصده.

ما هو الشیوع (Communalities)؟

الشیوع (Communalities) هو مجموع التحميلات التربيعية لكل متغير. إنه يمثل التباين المشترك. يتراوح من 0 إلى 1 وتمثل القيمة القريبة من 1 تباينًا أكبر.

ما هو عامل التدویر (Rotation)؟

التدویر (Rotation) هو أداة لتحسين تفسير تحليل العاملی (factor analysis). يمكن أن يكون الدوران متعامدًا أو مائلاً. أعادت توزيع القواسم الشیوعیه بنمط واضح من التشبع.

اختيار عدد العوامل

معيار كايزر هو نهج تحليلي، يعتمد على نسبة التباين الأكثر أهمية التي يتم شرحها بواسطة العامل الذي سيتم اختياره. تعد قيمة الذاتیه (eigenvalue) معيارًا جيدًا لتحديد عدد العوامل. بشكل عام، سيتم اعتبار القيمة الذاتية الأكبر من 1 معايير اختيار للخصیصه.

تنفیذ تقنیه التحلیل العاملي (Factor analysis) في البایثون

في هذا المثال، نحاول تحويل البيانات إلى سبع بيانات مثالية باستخدام بيانات load_digits مع الأخذ في الاعتبار تقنية تحلیل العاملی، وفي هذه الحالة ستكون البيانات أكثر قابلية للفهم وأنظف للخوارزمية المرغوبة.

کود:

from sklearn.datasets import load_digits
from sklearn.decomposition import FactorAnalysis
X, _ = load_digits(return_X_y=True)
transformer = FactorAnalysis(n_components=7, random_state=0)
X_transformed = transformer.fit_transform(X)
X_transformed.shape

الاخراج سیکون کما یلی:

(1797, 7)

المصادر

الاول

الثانی

الثالث

منشور ذات صلة

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

السلة