معامل ارتباط بيرسون – مقدمة سريعة Pearson Correlations
ما هو معامل ارتباط بيرسون؟
معامل ارتباط بيرسون هو رقم يقع بين -1 و +1 يشير ذلك إلى أي مدى ارتباط متغيران خطيًا.
يُعرف معامل ارتباط بيرسون أيضًا باسم “معامل الارتباط اللحظي للمنتج” (PMCC) أو ببساطة “الارتباط”. ويعتبر معامل ارتباط بيرسون مناسباً فقط للمتغيرات الكمية (بما في ذلك المتغيرات ثنائية التفرع).
- بالنسبة للمتغيرات الترتيبية ordinal variables ، استخدم ارتباط سبيرمان Spearman أو تاو كيندال Kendall’s tau .
- للمتغيرات الاسمية nominal ، استخدم V من Cramér.
أمثلة على معامل ارتباط بيرسون
سألنا 40 شخصا يعملون في الاعمال الحرة ( فريلانسيرز ) عن دخلهم السنوي خلال عام 2010 حتى عام 2014. ويرد أدناه جزء من البيانات الأولية.
سؤال اليوم هو :
|
حسنًا ، هناك طريقة رائعة لمعرفة ذلك وهي فحص مخطط التشتت لهذين المتغيرين: سنمثل كل عامل مستقل بنقطة. تشير المواضع الأفقية والعمودية لكل نقطة إلى دخل العامل المستقل خلال عامي 2010 و 2011. والنتيجة معروضة أدناه.
مخطط التشتت scatterplot الخاص بنا علاقة قوية بين الدخل خلال عامي 2010 و 2011: المستقلون الذين لديهم دخل منخفض خلال عام 2010 (النقاط في أقصى اليسار) عادةً ما يكون لديهم دخل منخفض مقارنة بعام 2011 أيضًا (نقاط أقل) والعكس صحيح. علاوة على ذلك ، هذه العلاقة خطية تقريبًا ؛ النمط الرئيسي في النقاط هو خط مستقيم.
يشير مدى تواجد نقاطنا على خط مستقيم إلى قوة العلاقة. ارتباط بيرسون هو رقم يشير إلى القوة الدقيقة لهذه العلاقة.
معاملات الارتباط ومخططات التشتت Correlation Coefficients and Scatterplots
يشير معامل الارتباط correlation coefficient إلى مدى تواجد النقاط في مخطط التشتت scatterplot على خط مستقيم. هذا يعني أنه يمكننا عادة تقدير الارتباطات بدقة كبيرة من لا شيء أكثر من مخططات التشتت. يوضح الشكل أدناه هذه النقطة بشكل جيد.
أساسيات معامل الارتباط Correlation Coefficient – Basics
تم توضيح بعض النقاط الأساسية المتعلقة بمعاملات الارتباط بشكل جيد في الشكل السابق. أقل ما يجب أن تعرفه هو ذلك
- الارتباطات Correlations لا تقل أبدًا عن -1. يشير الارتباط -1 إلى أن نقاط البيانات في مخطط التبعثر تقع بالضبط على خط تنازلي مستقيم ؛ المتغيرين يرتبطان سلبيا خطيا تماما.
- يعني الارتباط 0 أن متغيرين ليس لهما أي علاقة خطية على الإطلاق. ومع ذلك ، قد توجد بعض العلاقات غير الخطية بين المتغيرين.
- معاملات الارتباط Correlation coefficients لا تزيد أبدًا عن 1. معامل الارتباط 1 يعني أن متغيرين يرتبطان ارتباطًا إيجابيًا خطيًا ؛ تقع النقاط في مخطط التبعثر بالضبط على خط تصاعدي مستقيم.
معامل ارتباط بيرسون – تحذيرات التفسير Correlation Coefficient – Interpretation Caveats
عند تفسير الارتباطات ، يجب أن تضع بعض الأشياء في الاعتبار. تستحق المناقشة التفصيلية درسًا تعليميًا منفصلاً ، لكننا سنذكر بإيجاز نقطتين رئيسيتين.
- قد تشير الارتباطات أو لا تشير إلى العلاقات السببية. بشكل عكسي ، العلاقات السببية من متغير إلى متغير آخر قد تؤدي أو لا تؤدي إلى ارتباط بين المتغيرين.
- الارتباطات حساسة للغاية للقيم المتطرفة ؛ قد يكون لملاحظة واحدة غير عادية تأثير كبير على الارتباط. يتم اكتشاف هذه القيم المتطرفة بسهولة عن طريق فحص سريع لمخطط مبعثر.
معامل ارتباط بيرسون – مصفوفة الارتباط Correlation Coefficient – Correlation Matrix
ضع في اعتبارك أن الارتباطات تنطبق على أزواج من المتغيرات. إذا كنت مهتمًا بأكثر من متغيرين ، فربما ترغب في إلقاء نظرة على الارتباطات بين جميع أزواج المتغيرات المختلفة. تظهر هذه الارتباطات عادةً في جدول مربع يُعرف بمصفوفة الارتباط.
تقوم حزم البرامج الإحصائية مثل SPSS بإنشاء مصفوفات الارتباطات قبل أن تتمكن من غمض عينيك. ويرد أدناه مثال على ذلك.
لاحظ أن العناصر القطرية (باللون الأحمر) هي الارتباطات بين كل متغير ونفسه. هذا هو السبب في أنهم دائمًا 1.
لاحظ أيضًا أن الارتباطات الموجودة أسفل القطر (باللون الرمادي) زائدة عن الحاجة لأنها مطابقة للارتباطات الموجودة فوق القطر. من الناحية الفنية ، نقول إن هذه مصفوفة متماثلة.
أخيرًا ، لاحظ أن نمط الارتباطات منطقي تمامًا: فالارتباطات بين الدخول السنوية تصبح أقل بقدر ما تكون هذه السنوات متباعدة.
معامل ارتباط بيرسون – الصيغة ( المعادلة ) Pearson Correlation – Formula
إذا أردنا فحص الارتباطات ، سيكون لدينا جهاز كمبيوتر يحسبها لنا. نادرًا ما تحتاج (على الأرجح أبدًا) إلى الصيغة الفعلية. ومع ذلك يتم حساب ارتباط بيرسون بين المتغيرين X و Y بواسطة معادلة
تنحصر الصيغة في الأساس في قسمة التغاير على حاصل ضرب الانحرافات المعيارية. نظرًا لأن المعامل هو رقم مقسومًا على رقم آخر ، فإن صيغتنا توضح سبب حديثنا عن معامل الارتباط.
معامل ارتباط بيرسون – الدلالة الإحصائية Correlation – Statistical Significance
غالبًا ما تكون البيانات المتاحة – عينة صغيرة من مجموعة سكانية أكبر بكثير.
قد نجد علاقة غير صفرية في عينتنا
حتى لو كان صفرًا في عدد السكان.
يوضح الشكل أدناه كيف يمكن أن يحدث هذا.
إذا تجاهلنا الألوان لثانية واحدة ، فإن كل 1000 نقطة في مخطط التشتت هذا تصور بعض السكان. الارتباط السكاني – الذي تم تحديده بواسطة ρ- هو صفر بين الاختبار 1 والاختبار 2.
الآن ، يمكننا رسم عينة من N = 20 من هذه المجموعة التي يكون الارتباط r = 0.95 لها. بشكل عكسي ، هذا يعني أن عينة الارتباط 0.95 لا تثبت على وجه اليقين أن هناك علاقة غير صفرية في المجتمع بأكمله. ومع ذلك ، فإن إيجاد r = 0.95 مع N = 20 أمر مستبعد للغاية إذا كانت = 0. ولكن ما مدى احتمال حدوث ذلك تحديدًا؟ وكيف لنا أن نعرف؟
الارتباط – اختبار الإحصاء Correlation – Test Statistic
إذا كانت ρ – ارتباط سكاني – صفرًا ، فإن احتمال ارتباط عينة معينة – دلالة إحصائية لها – يعتمد على حجم العينة. لذلك نقوم بدمج حجم العينة و r في رقم واحد ، إحصائية الاختبار الخاصة بنا t:
الآن ، تي نفسها ليست مثيرة للاهتمام. ومع ذلك ، فنحن نحتاجها لإيجاد مستوى الأهمية لبعض الارتباط. يتبع T توزيع t مع ν = n – درجتان من الحرية ولكن فقط إذا تم استيفاء بعض الافتراضات.
اختبار الارتباط – الافتراضات Correlation Test – Assumptions
يتطلب اختبار الدلالة الإحصائية لارتباط بيرسون 3 افتراضات:
- ملاحظات مستقلة independent observations
- الارتباط السكاني ، ρ = 0 ,, population correlation
- الحالة الطبيعية normality : يتم توزيع المتغيرين المعنيين بشكل طبيعي بين السكان. ومع ذلك ، هذا ليس ضروريًا لحجم عينة معقول – لنقل N 20 أو نحو ذلك.
معامل ارتباط بيرسون – توزيع العينات Pearson Correlation – Sampling Distribution
في المثال السابق كان حجم العينة N هو 20. لذا إذا استوفينا افتراضاتنا ، فإن T يتبع توزيع t مع df = 18 كما هو موضح أدناه.
يخبرنا هذا التوزيع أن هناك احتمال 95٪ بأن -2.1 <t <2.1 ، يقابل -0.44 <r <0.44. الملخص:
إذا كان N = 20 ، فهناك احتمال 95٪ لإيجاد -0.44 <r <0.44.
هناك احتمال 5٪ فقط لإيجاد ارتباط خارج هذا النطاق. أي أن مثل هذه الارتباطات ذات دلالة إحصائية عند α = 0.05 أو أقل: فهي غير محتملة (بدرجة كبيرة) وبالتالي تدحض الفرضية الصفرية لعلاقة سكانية صفرية.
أخيرًا ، يحتوي ارتباط العينة لدينا البالغ 0.95 على قيمة p من 1.55e-10 إلى 6،467،334،654. يمكننا أن نستنتج بأمان أن هناك علاقة غير صفرية في مجموع سكاننا.
عودة إلى فهرس دليل استخدام SPSS