تحليل التباين الأحادي SPSS
تحليل التباين الأحادي (بالإنجليزية: one-way analysis of variance) ويرمز له اختصار بـ ANOVA. وهو أسلوب إحصائي لاختبار ما إذا كانت 3 (+) متوسطات المجتمع متساوية.
أبسط مثالين على تحليل التباين الأحادي SPSS
- ANOVA أحادي الاتجاه لمقارنة 3 مجموعات (+) على متغير واحد: هل جميع الأطفال من المدرسة A و B و C لديهم متوسط درجات ذكاء متساوٍ؟ *
- مقاييس متكررة ANOVA لمقارنة 3 متغيرات (+) في مجموعة واحدة: هل متوسط تصنيف البيرة A و B و C متساوٍ لجميع الأشخاص؟
يوضح الشكل أدناه السؤال الأساسي لـ ANOVA أحادي الاتجاه.
مثال بسيط – تحليل التباين الأحادي SPSS
يريد أحد العلماء معرفة ما إذا كان جميع الأطفال في المدارس “أ” و “ب” و “ج” لديهم متوسط درجات ذكاء متساوٍ. كل مدرسة لديها 1000 طفل. يستغرق اختبار جميع الأطفال البالغ عددهم 3000 طفل الكثير من الوقت والمال. لذلك يتم اختبار عينة عشوائية بسيطة من n = 10 أطفال من كل مدرسة.
يتم عرض جزء من هذه البيانات المتوفرة من ورقة Google هذه أدناه.
جدول الوصف (تحليل التباين الأحادي SPSS)
حسنًا ، تحتوي بياناتنا على 3 عينات من 10 أطفال لكل منهم درجات ذكاء , و يخبرنا تشغيل جدول وصف بسيط على الفور بمتوسط درجات معدل الذكاء لهذه العينات , و النتيجة مبينة أدناه.
لتوضيح الأمور ، دعنا نتخيل متوسط درجات معدل الذكاء لكل مدرسة في مخطط شريطي بسيط.
من الواضح أن عيّنتنا من المدرسة (ب) لديها أعلى متوسط ذكاء – ما يقرب من 113 نقطة.
أدنى متوسط معدل ذكاء هو 93 نقطة و يُرى للمدرسة C.
الآن ، ها هي المشكلة: متوسط درجات الذكاء لدينا تعتمد فقط على عينات صغيرة من 10 أطفال لكل مدرسة.
إذن ، ألا يمكن أن يكون كل الأطفال البالغ عددهم 1000 طفل في المدرسة لديهم نفس متوسط معدل الذكاء؟
ربما صادفنا عينة من أذكى الأطفال من المدرسة “ب” وأغبى الأطفال من المدرسة “ج”؟ هل هذا واقعي؟ سنحاول إظهار أن هذا البيان – فرضيتنا الصفرية – غير موثوق به نظرًا لبياناتنا.
الفرضية الصفرية او فرضية العدم لـ تحليل التباين الأحادي SPSS
الفرضية الصفرية لـ أي تحليل التباين الأحادي SPSS هي أن جميع وسائل المحتوى متساوية تمامًا.
إذا كان هذا صحيحًا ، فمن المحتمل أن تختلف الوسائل النموذجية لدينا قليلاً. بعد كل شيء ، تختلف العينات دائمًا قليلاً عن المجموعات السكانية التي تمثلها. ومع ذلك ، فإن العينة تعني أنه ربما لا ينبغي أن تختلف كثيرًا. مثل هذه النتيجة لن تكون محتملة في ظل فرضيتنا الصفرية عن الوسائل السكانية المتساوية. لذا إذا وجدنا هذا ، فربما لن نعتقد بعد الآن أن الوسائل السكانية لدينا متساوية حقًا.
المجموع بين المربعات – تحليل التباين الأحادي SPSS
إذن ما مدى اختلاف وسائل العينة الثلاثة بالضبط؟ إلى أي مدى تتباعد هذه الأرقام؟ رقم يخبرنا بالضبط أن هذا هو التباين. لذلك سنحسب بشكل أساسي التباين بين وسائل العينة الثلاثة.
كما قد تفهم (أو لا تفهمه) من معادلات تحليل التباين الأحادي SPSS ، يبدأ هذا بمجموع الانحرافات التربيعية بين متوسطات العينة الثلاثة والمتوسط العام. تُعرف النتيجة باسم “مجموع المربعات بين” أو SS between.
وبالتالي فان مجاميع بين المربعات يعبر عن المبلغ الإجمالي للتشتت بين وسائل العينة.
كل شيء آخر متساوٍ ، يشير SS between الأكبر إلى أن العينة تعني اختلافًا أكبر. وكلما كانت عينتنا أكثر اختلافًا ، زادت احتمالية اختلاف الوسائل السكانية لدينا أيضًا.
درجات الحرية ومتوسط المربعات بينها
عند حساب التباين “العادي” ، نقسم مجموع المربعات على درجات الحرية (df). عند مقارنة يعني k ، درجات الحرية (df) هي (k – 1).
ينتج عن قسمة SS بين على (k – 1) مربعات متوسطة بين: MS between. بالمختصر،
متوسط المربعات بين هو أساسًا التباين بين متوسطات العينة.
وبالتالي يشير MSbetween إلى مدى اختلاف الوسائل التي نستخدمها في العينة (أو التباعد). كلما زاد هذا التباين بين الوسائل ، زاد احتمال اختلاف الوسائل السكانية لدينا أيضًا.
تحليل التباين الأحادي SPSS – مجموع المربعات بالداخل
إذا كانت الوسائل السكانية لدينا متساوية حقًا ، فما الفرق بين متوسطات العينة – بين متوسطين – الذي يمكن أن نتوقعه بشكل معقول؟ حسنًا ، هذا يعتمد على التباين داخل المجموعات السكانية الفرعية. يوضح الشكل أدناه هذا لثلاثة سيناريوهات.
تظهر الرسوم البيانية الثلاثة الموجودة في أقصى اليسار توزيعات السكان لمعدل الذكاء في المدارس أ و ب وج أو A و B و C.
يشير ضيقها إلى تباين بسيط داخل كل مدرسة. إذا أخذنا عينة من n = 10 طلاب من كل مدرسة ، فهل نتوقع وسائل عينة مختلفة جدًا؟
على الاغلب لا. لماذا ا؟ حسنًا ، نظرًا للاختلاف الصغير داخل كل مدرسة ، فإن متوسط العينة سيكون قريبًا من متوسط عدد السكان (المتساوي). لا تترك هذه الرسوم البيانية الضيقة مساحة كبيرة لأن تتقلب عيّناتها وبالتالي تختلف.
تظهر الرسوم البيانية الثلاثة الموجودة في أقصى اليمين السيناريو المعاكس: الرسوم البيانية واسعة ، مما يشير إلى تباين كبير داخل كل مدرسة.
إذا أخذنا عينة من n = 10 طلاب من كل مدرسة ، فقد تختلف الوسائل في هذه العينات كثيرًا بسهولة. باختصار ، قد تؤدي الفروق الأكبر داخل المدارس إلى تباين أكبر بين متوسطات العينة لكل مدرسة.
نحن نقدر أساسًا الفروق السكانية داخل المجموعات من تباينات العينة داخل المجموعات , الحسابات الدقيقة موجودة في صيغ تحليل التباين الأحادي SPSS وورقة Googlesheet هذه.
باختصار:
- تشير مجاميع المربعات بالداخل (SS within) إلى إجمالي مقدار التشتت داخل المجموعات ؛
- درجات الحرية بالداخل (DF within) هي (n – k) لملاحظات n ومجموعات k
- متوسط المربعات بالداخل (MS داخل) – بشكل أساسي التباين داخل المجموعات – هو SS داخل / DF داخل.
تحليل التباين الأحادي SPSS – اختبار الاحصاء – F
إذن ما مدى احتمالية أن يكون السكان متساوون؟ هذا يعتمد على 3 أجزاء من المعلومات من عيناتنا:
- التباين بين متوسطات العينة (MS between) ؛
- التباين داخل عيناتنا (MS داخل)
- أحجام العينة.
نقوم بشكل أساسي بدمج كل هذه المعلومات في رقم واحد: إحصائية الاختبار الخاصة بنا. يوضح الرسم البياني أدناه كيف يؤثر كل دليل على F.
الآن ، F نفسها ليست مثيرة للاهتمام على الإطلاق. ومع ذلك ، يمكننا الحصول على الأهمية الإحصائية من F إذا كان يتبع توزيع F , سيفعل ذلك بالضبط إذا تم استيفاء 3 افتراضات.
الافتراضات في تحليل التباين الأحادي SPSS
افتراضات تحليل التباين الأحادي SPSS هي :
- ملاحظات مستقلة .
- الحالة الطبيعية: يجب أن يتبع متغير النتيجة التوزيع الطبيعي في كل مجموعة سكانية فرعية. هناك حاجة إلى الوضع الطبيعي فقط لأحجام العينات الصغيرة ، على سبيل المثال n <20 لكل مجموعة.
- التجانس: يجب أن تكون الفروق داخل جميع المجموعات السكانية الفرعية متساوية. التجانس مطلوب فقط إذا كانت أحجام العينات غير متكافئة للغاية. في هذه الحالة ، يشير اختبار ليفين إلى ما إذا كان قد تم الوفاء به.
إذا استمرت هذه الافتراضات ، فإن F يتبع توزيع F مع DFbetween و DF داخل درجات الحرية. في مثالنا -3 مجموعات من n = 10 لكل منها ستكون F (2،27).
الدلالة الإحصائية لـ تحليل التباين الأحادي SPSS
في مثالنا ، F (2،27) = 6.15. هذه القيمة الضخمة لـ F هي دليل قوي على أن فرضيتنا الصفرية – كل المدارس لديها متوسط درجات معدل ذكاء متساوٍ – غير صحيحة. إذا تم استيفاء جميع الافتراضات ، فإن F يتبع التوزيع F الموضح أدناه.
بالنظر إلى هذا التوزيع ، يمكننا البحث عن الدلالة الإحصائية و عادة ما تبلغ: F (2،27) = 6.15 ، p = 0.006.
إذا كان لدى مدارسنا متوسطات ذكاء متساوية ، فهناك فرصة 0.006 فقط للعثور على اختلافات متوسط العينة أو الاختلافات الأكبر. نقول عادة أن شيئًا ما “ذو دلالة إحصائية” إذا كانت p <0.05.
الملخص: سكاننا يعني أنه من غير المرجح أن يكونوا متساوين.
يوضح الشكل أدناه كيف يقدم SPSS نتائج ومخرجات هذا المثال.
تحليل التباين الأحادي SPSS
حجم التأثير – (جزئي) مربع إيتا Effect Size – (Partial) Eta Squared
حتى الآن ، استنتاجنا هو أن المتوسطات السكانية ليست كلها متساوية تمامًا , الآن ، “لا يساوي” لا يعني الكثير , ما أود أن أعرفه بالضبط هو مدى اختلاف المتوسطات؟
الرقم الذي له تقدير هو حجم التأثير فقط , مقياس حجم التأثير لـ ANOVA هو مربع ايتا eta الجزئي ، مكتوبًا كـ η2. * بالنسبة إلى ANOVA أحادي الاتجاه ، فإن مربع eta الجزئي يساوي ببساطة مربع eta.
من الناحية الفنية ، مربع ايتا eta-squared هي نسبة التباين التي يفسرها العامل.
بعض القواعد الأساسية:
η2> 0.01 يشير إلى تأثير صغير ؛
η2> 0.06 يشير إلى تأثير متوسط ؛
η2> 0.14 يشير إلى تأثير كبير.
يظهر الحساب الدقيق لـ eta-squared في قسم الصيغ. في الوقت الحالي ، يكفي أن نقول أن η2 = 0.31 لمثالنا. يفسر حجم التأثير الضخم هذا سبب أهمية اختبار F الخاص بنا من الناحية الإحصائية على الرغم من أحجام عيناتنا الصغيرة جدًا التي تبلغ n = 10 لكل مدرسة.
الاختبارات اللاحقة – HSD لـ Tukey
اختبار نطاق Tukey ، والمعروف أيضًا باسم اختبار Tukey ، وطريقة Tukey ، واختبار الدلالة الصادقة لـ Tukey ، أو اختبار HSD لـ Tukey ، هو إجراء مقارنة متعددة من خطوة واحدة واختبار إحصائي.
حتى الآن ، خلصنا من اختبار F إلى أن تعدادنا السكاني يعني أنه من غير المرجح أن يكون (الكل) متساويين. أخبرنا حجم التأثير ، 2 ، أن الفرق كبير. ومع ذلك ، فإن السؤال الذي لم تتم الإجابة عليه هو بالضبط ما هي الوسائل المختلفة؟
قد ينتج عن الأنماط المختلفة لمتوسطات العينة نفس قيمة F بالضبط , يوضح الشكل أدناه هذه النقطة مع بعض السيناريوهات المحتملة.
تحليل التباين الأحادي SPSS
يتمثل أحد الأساليب في إجراء اختبارات t لعينات مستقلة على جميع أزواج الوسائل الممكنة. ل 3 يعني ، سيكون A-B و A-C و B-C. ومع ذلك ، كلما زاد عدد الوسائل التي نقارنها ، يزداد عدد جميع الأزواج الممكنة بسرعة. ولكل اختبار ت فرصته في الوصول إلى نتيجة خاطئة
كلما زاد عدد اختبارات t التي أجريناها ، زادت مخاطر استخلاص نتيجة خاطئة واحدة على الأقل.
الحل الأكثر شيوعًا لهذه المشكلة هو استخدام إجراء Tukey’s HSD (اختصار لـ “فرق مهم بصراحة”). يمكنك التفكير في الأمر على أنه إجراء جميع اختبارات t الممكنة التي تم تصحيح نتائجها بنوع من تصحيح Bonferroni ولكن أقل تحفظًا. يوضح الشكل أدناه بعض المخرجات من Tukey’s HSD في SPSS.
تحليل التباين الأحادي SPSS
يُعرف اختبار HSD الخاص بـ Tukey بأنه اختبار لاحق. كلمة “Post hoc” هي كلمة لاتينية وتعني حرفياً “بعد ذلك”.
هذا لأنه لا يتم تشغيلها إلا بعد أن يشير اختبار F الرئيسي إلى أنه ليست كل الوسائل متساوية. لا أتفق تمامًا مع هذه القناعة للاسباب التالية :
- قد لا تشير الاختبارات اللاحقة إلى الاختلافات بينما يشير اختبار F الرئيسي ؛
- قد تشير الاختبارات اللاحقة إلى وجود اختلافات بينما لا يشير اختبار F الرئيسي.
لنفترض أنني أقارن 5 يعني: A و B و C و D متساوون لكن E أكبر بكثير من الآخرين. في هذه الحالة ، سيتم تخفيف الاختلاف الكبير بين E والمتوسطات الأخرى بشدة عند الاختبار إذا كانت جميع المتوسطات متساوية. لذلك في هذه الحالة ، قد لا يشير اختبار F الشامل إلى أي اختلافات بينما تشير الاختبارات اللاحقة إلى ذلك.
أخيرًا وليس آخرًا ، هناك العديد من الاختبارات اللاحقة أيضًا. يتطلب البعض افتراض التجانس والبعض الآخر لا. يوضح الشكل أدناه بعض الأمثلة.
تحليل التباين الأحادي SPSS
المعادلات والصيغ الأساسية لـ تحليل التباين الأحادي SPSS
من أجل الاكتمال ، سنقوم بإدراج الصيغ الرئيسية المستخدمة لـ تحليل التباين الأحادي SPSS في مثالنا. يمكنك رؤيتها أثناء العمل في ورقة Google هذه. سنبدأ بالتباين بين المجموعات:
حيث أن:
XJ هي مجموعة من المتوسطات
X هو المتوسط الكلي ( للكل )
nJ حجم العينة للمجموعة
على سبيل المثال لدينا ، ينتج عن هذا
لمجموعة m سيكون الشكل كالتالي
المتوسط بين المربعات سكون بالشكل اعلاه
على سبيل المثال
اما داخل المجموعات فسيكون مثل المعادلة الثانية اعلاه
عودة إلى فهرس دليل استخدام SPSS