اختبار الفرضيات: التعريف والأمثلة

تذكر أن الإحصائيات تهدف غالبًا إلى التوصل إلى استنتاجات حول المعلمات السكانية غير المعروفة بناءً على المعلومات الواردة في بيانات العينة. وقد صيغت هذه الاستدلالات بطريقتين؛

كتقديرات للمعلمات المعنية أو
كاختبارات للفرضيات حول قيمها.

في كثير من النواحي، يشبه الإجراء الرسمي لاختبار الفرضيات الطريقة العلمية. يراقب العالم الطبيعة، ويصوغ نظرية، ثم يختبر هذه النظرية مقابل الملاحظات.

تعلم اختبار الفرضيات.

في سياق اختبار الفرضيات، يقوم الباحث بإعداد فرضية تتعلق بواحد أو أكثر من المعلمات السكانية - وهي أنها تساوي بعض القيم المحددة.

ثم يقوم بعد ذلك بأخذ عينات من السكان ويقارن ملاحظاته بالفرضية. فإذا تعارضت الملاحظات مع الفرضية رفضها الباحث.

إذا لم يكن الأمر كذلك، يستنتج الباحث أن الفرضية صحيحة أو أن العينة فشلت في اكتشاف الفروق بين القيمة الحقيقية والقيمة المفترضة لمعلمات المجتمع.

فحص الحالات التالية:

قد يرغب عالم الكيمياء الحيوية في تحديد مدى حساسية اختبار جديد لتشخيص السرطان؛
يؤكد مدير الإنتاج أن متوسط عدد التجميعات المعيبة (التي لا تلبي معايير الجودة) التي يتم إنتاجها كل يوم هو 25؛
قد يحتاج خادم الإنترنت إلى التحقق مما إذا كان مستخدمو الكمبيوتر في الدولة يقضون، في المتوسط، أكثر من 20 ساعة في التصفح؛
قد يفترض الباحث الطبي أن دواءً جديدًا أكثر فعالية من دواء آخر في مكافحة المرض؛
قد يشك مهندس كهربائي في أن انقطاع التيار الكهربائي في المناطق الحضرية أكثر شيوعًا في المناطق الريفية منه في المناطق الحضرية.

يعالج اختبار الفرضيات الإحصائية المشكلات المذكورة أعلاه مع البيانات التي تم الحصول عليها. يمكننا الآن طرح التعريف التالي للفرضية الإحصائية.

معنى الفرضية

الفرضية الإحصائية هي عبارة أو افتراض يتعلق بواحد أو أكثر من المعلمات السكانية. هدفنا في اختبار الفرضيات هو التحقق مما إذا كانت الفرضية صحيحة أم لا بناءً على بيانات العينة.

إن النهج التقليدي لاختبار الفرضيات لا يتمثل في بناء فرضية واحدة، بل في صياغة فرضيتين مختلفتين ومتعارضتين.

ويجب بناء هذه الفرضيات بحيث أنه في حالة رفض إحدى الفرضيات يتم قبول الأخرى والعكس صحيح. ويشار عادة إلى هاتين الفرضيتين في الاختبار الإحصائي باسم الفرضيات الصفرية والبديلة.

الفرضية الصفرية، التي أشار إليها H_س، هي الفرضية التي سيتم اختبارها. الفرضية البديلة التي يرمز لها ح₁ هي الفرضية التي تتعارض، إلى حد ما، مع فرضية العدم.

مثال 1

مجال الاهتمام البحثي الحالي هو التجميع العائلي لعوامل الخطر القلبية الوعائية بشكل عام ومستويات الدهون بشكل خاص. لنفترض أنه من المعروف أن متوسط مستوى الكوليسترول عند الأطفال هو 175 ملجم/ديسيلتر. تم تحديد مجموعة من الرجال الذين توفوا بسبب أمراض القلب خلال العام الماضي، وقياس مستويات الكوليسترول في نسلهم.

نريد التحقق مما إذا

متوسط مستوى الكوليسترول لدى هؤلاء الأطفال هو 175 ملجم/ديسيلتر.
متوسط مستوى الكوليسترول لدى هؤلاء الأطفال أكبر من 175 ملجم/ديسيلتر.

تتم صياغة هذا النوع من الأسئلة في إطار اختبار الفرضيات من خلال تحديد الفرضيات الصفرية والبديلة. في المثال أعلاه، الفرضية الصفرية هي أن متوسط مستوى الكوليسترول لدى هؤلاء الأطفال هو 175 ملجم/ديسيلتر.

هذه هي الفرضية التي نريد اختبارها. الفرضية البديلة هي أن متوسط مستوى الكوليسترول لدى هؤلاء الأطفال أكبر من 175 ملغم/ديسيلتر. ويمكن صياغة الفرضيات الأساسية على النحو التالي؛

فرضية العدم	ح₀ : μ = 175
فرضية بديلة	ح₁ : μ > 175

ونفترض أيضًا أن التوزيع الأساسي طبيعي في ظل أي من الفرضيتين. ويمكن كتابة هذه الفرضيات بعبارات أكثر عمومية على النحو التالي:

فرضية العدم	ح₀ : μ = μ₀
فرضية بديلة	ح₁ : μ> μ₁

قد نواجه نوعين من الخطأ في قبول أو رفض الفرضية الصفرية. قد نرفض بشكل خاطئ فرضية العدم الحقيقية. وهذا يؤدي إلى خطأ، وهو ما نسميه أ خطأ في النوع الأول.

النوع الثاني من الخطأ يسمى خطأ من النوع الثانييحدث عندما نقبل فرضية صفرية عندما تكون خاطئة، أي عندما يكون البديل صحيحًا.

عندما لا يتم ارتكاب أي خطأ، نصل إلى القرار الصحيح. يمكن التوصل إلى القرار الصحيح عن طريق قبول فرضية صفرية صحيحة أو رفض فرضية صفرية خاطئة. يتم عرض أربع نتائج محتملة مع أنواع الأخطاء المرتبطة التي نرتكبها في قرارنا في الجدول المرفق:

قرار	هو صحيح	أهلاً صحيح
يرفض ح_س	خطأ من النوع الأول P(خطأ من النوع الأول) = α	القرار الصحيح P(القرار الصحيح) = 1 – ß
يقبل ح_س	القرار الصحيح ف(القرار الصحيح) = 1-ألفا	خطأ من النوع الثاني P(خطأ من النوع الثاني) = ß

يُشار عادةً إلى احتمال ارتكاب خطأ من النوع الأول بالرمز a ويشار إليه عادةً بمستوى أهمية الاختبار:

α = P (خطأ من النوع الأول) = P (رفض H₀عندما ح₀ صحيح )

يُشار عادةً إلى احتمال ارتكاب خطأ من النوع الثاني بالرمز ß:

ß = P (خطأ من النوع الثاني) = P (قبول H₀ متى يكون ح₁ حقيقي )

يُعرف مكمل ß، أي 1- ß عمومًا باسم قوة من الاختبار.

1- ß = 1 – P = P (رفض H₀ عندما ح₁ صحيح )

ما هي الأخطاء من النوع الأول والنوع الثاني للبيانات الموجودة في المثال #1؟

سيتم ارتكاب الخطأ من النوع الأول إذا قررنا أن ذرية الرجال الذين ماتوا بسبب أمراض القلب لديهم متوسط كوليسترول أكبر من 170 ملجم / ديسيلتر عندما يكون متوسط مستوى الكولسترول لديهم 175 ملجم / ديسيلتر.

سيتم ارتكاب الخطأ من النوع الثاني إذا قررنا أن النسل لديه مستويات كوليسترول طبيعية في حين أن مستويات الكولسترول لديهم في الواقع أعلى من المتوسط.

مستوى الأهمية

مستوى الأهمية هو الاحتمال الحاسم في الاختيار بين الفرضيات الصفرية والبديلة. مستوى الاحتمال منخفض جدًا بحيث لا يضمن دعم الفرضية الصفرية.

يتم التعبير عن مستوى الأهمية عادة كنسبة مئوية، مثل 5% أو 1%. مستوى الأهمية، على سبيل المثال، 5% هو احتمال رفض الفرضية الصفرية إذا كانت صحيحة.

عندما يتم قبول الفرضية المعنية عند مستوى 5%، فإن الإحصائي يخاطر بأنه، على المدى الطويل، سوف يتخذ قرارًا خاطئًا بشأن 5% في ذلك الوقت.

اختبار الإحصائية

ال اختبار الإحصائية (مثل المقدر) هي دالة لملاحظات العينة التي سيستند إليها القرار الإحصائي. ال منطقة الرفض (RR) يحدد قيم إحصائية الاختبار التي تكون لها الفرضية الصفرية مرفوض لصالح الفرضية البديلة .

إذا كانت القيمة المحسوبة لإحصائية الاختبار، بالنسبة لعينة معينة، تقع في RR، فإننا نرفض فرضية العدم ح_س وقبول الفرضية البديلة ح₁.

إذا كانت قيمة إحصائية الاختبار لا تقع في منطقة الرفض (الحرجة)، فإننا نقبل Ho. المنطقة الأخرى غير منطقة الرفض هي منطقة القبول.

اتخاذ القرار

القرار الإحصائي هو إما رفض أو قبول الفرضية الصفرية. وسيعتمد القرار على ما إذا كانت القيمة المحسوبة لإحصائية الاختبار تقع في منطقة الرفض أو منطقة القبول.

لنفترض أنه تم اختبار الفرضية عند مستوى أهمية 5%، وكانت النتائج المرصودة لها احتمالات أقل من 5%. وفي هذه الحالة، فإننا نعتبر الفرق بين إحصائيات العينة والمعلمة غير المعروفة أمرًا مهمًا.

وبعبارة أخرى، نعتقد أن نتيجة العينة نادرة جدًا لدرجة أنه لا يمكن تفسيرها عن طريق التباين الصدفي وحده. ثم نرفض الفرضية الصفرية ونشير إلى أن ملاحظات العينة لا تتفق مع الفرضية الصفرية.

من ناحية أخرى، إذا كان مستوى الأهمية 5%، فإن مجموعة القيم المرصودة لديها احتمالية تزيد عن 5%، فإننا نعطي سببًا بأن الفرق بين نتيجة العينة وقيمة المعلمة غير المعروفة يمكن تفسيره من خلال تباين الصدفة وبالتالي ليست ذات دلالة إحصائية.

وبالتالي، فإننا نقرر عدم رفض الفرضية الصفرية ونشير إلى أن ملاحظات العينة لا تتعارض مع الفرضية الصفرية.

اختبار ذو الذيل الواحد والثنائي الذيل

الاختبار أحادي الطرف هو اختبار يُسمح فيه لقيم المعلمة التي تتم دراستها (في مثالنا السابق، متوسط مستوى الكوليسترول) في ظل الفرضية البديلة أن تكون إما أكبر من أو أقل من قيم المعلمة تحت القيمة الخالية فرضية، ولكن ليس كلاهما.

أي أننا نقوم بصياغة الفرضيات الصفرية والبديلة للاختبار أحادي الطرف على النحو التالي:

فرضية العدم	ح₀ : μ = μ₀
فرضية بديلة	ح₁ : μ < μ₀ أو μ> μ₀

الاختبار ثنائي الذيل هو اختبار يُسمح فيه لقيم المعلمة التي تتم دراستها بموجب الفرضية البديلة بأن تكون أكبر أو أقل من قيم المعلمة تحت الفرضية الصفرية.

نقوم بصياغة الفرضيات تحت الاختبار الثنائي على النحو التالي:

فرضية العدم	ح₀ : μ = μ₀
فرضية بديلة	ح₁ : μ ≠ μ₁

من المهم جدًا أن ندرك ما إذا كنا مهتمين باختبار أحادي الطرف أم ثنائي الطرف في تطبيق معين.

ع-القيمة وتفسيرها

هناك طريقتان لاختبار الفرضية الإحصائية: طريقة القيمة الحرجة وطريقة 72 قيمة.

يُطلق على النهج العام الذي نحسب فيه إحصائية الاختبار ونحدد نتيجة الاختبار من خلال مقارنة إحصائية الاختبار بقيمة حرجة يحددها الخطأ من النوع الأول طريقة القيمة الحرجة لاختبار الفرضيات.

القيمة p لأي اختبار فرضية هي مستوى ألفا (أ) الذي سنكون فيه غير مبالين بين قبول ورفض الفرضية الصفرية في ضوء بيانات العينة المتوفرة.

أي أن القيمة هي المستوى الذي تكون فيه القيمة المعطاة لإحصائية الاختبار (مثل t وF ومربع كاي) على الحد الفاصل بين منطقتي القبول والرفض.

يمكن أيضًا اعتبار القيمة p على أنها احتمالية الحصول على إحصائية اختبار متطرفة أو أكثر تطرفًا من إحصائية الاختبار الفعلية التي تم الحصول عليها، نظرًا لأن الفرضية الصفرية صحيحة.

عادةً ما تقوم برامج تحليل البيانات الإحصائية بحساب القيم الاحتمالية أثناء تنفيذ اختبار الفرضية. أما قواعد القرار التي يتبعها معظم الباحثين في بيان نتائجهم فهي كما يلي:

إذا ع-القيمة أقل من .01، وكانت النتائج هامة للغاية.
إذا كانت القيمة p بين .01 و.05، تعتبر النتائج ذات دلالة إحصائية.
إذا كانت القيمة p بين .05 و.10، فإن النتائج تميل فقط نحو الأهمية الإحصائية.
إذا كانت القيمة p أكبر من .10، تعتبر النتائج غير مهمة.

خطوات الاختبار الإحصائي

أي اختبار إحصائي للفرضيات يعمل بشكل مشابه ويتكون من نفس العناصر الأساسية. الإجراء العام للاختبار الإحصائي هو كما يلي:

قم بإعداد الفرضية الصفرية (H_س) وبديله (ح_ر). وهو اختبار ذو ذيل واحد إذا كانت الفرضية البديلة تشير إلى اتجاه الفرق. إذا لم يتم تحديد اتجاه الاختلاف، فهو اختبار ذو طرفين.
اختر المستوى المطلوب من الأهمية. في حين أن α=0.05 و α=0.01 هما الأكثر شيوعًا، إلا أنه يتم استخدام العديد من العناصر الأخرى أيضًا.
حساب إحصائية الاختبار المناسبة لبيانات العينة (عادي، t).
ابحث عن القيمة (القيم) الحرجة باستخدام جداول التكامل العادية المقابلة للمنطقة الحرجة المحددة.
مع القيم الحرجة المحددة في الخطوة 4، قم بمقارنة إحصائية الاختبار المحسوبة في الخطوة 3.
اتخذ القرار: ارفض الفرضية الصفرية إذا كانت إحصائية الاختبار المحسوبة تقع في المنطقة الحرجة واقبل البديل (أو احجب القرار)

بعض اختبارات الأهمية شائعة الاستخدام

يقدم هذا القسم لمحة عامة عن بعض الاختبارات الإحصائية التي تمثل المجموعة الواسعة المتاحة للباحثين.

يتعرف هذا القسم على فئتين عامتين من اختبارات الأهمية: البارامترية وغير البارامترية.

يشار إلى الإجراءات الإحصائية التي تتطلب تحديد التوزيع الاحتمالي للسكان بالاختبارات البارامترية.

في المقابل، فإن الإجراءات غير البارامترية هي مناهج خالية من التوزيع ولا تتطلب أي تحديد للتوزيع السكاني الأساسي.

تعتبر الاختبارات البارامترية أكثر قوة لأن بياناتها مستمدة من قياسات الفاصل والنسبة.

تُستخدم الاختبارات اللامعلمية لاختبار الفرضيات باستخدام البيانات الاسمية والترتيبية. هدفنا في هذا النص هو مناقشة الاختبارات البارامترية شائعة الاستخدام في المقام الأول.

تتضمن افتراضات الاختبارات البارامترية ما يلي:

يجب أن تكون الملاحظات مستقلة.
الملاحظات مستمدة من السكان العاديين.
يجب أن يكون لدى السكان فروق متساوية.
يجب أن تكون مستويات القياس على الأقل الفاصلة.

عند محاولة اختيار اختبار أهمية معين، ينبغي للمرء أن يأخذ في الاعتبار ثلاث نقاط على الأقل:

هل يشمل الاختبار عينة واحدة أم عينتين أم ك-عينات؟
هل الحالات الفردية في العينات مستقلة أم تابعة؟
ما هي مستويات القياس التي تشير إليها البيانات الاسمية، أو الترتيبية، أو الفاصلة، أو النسبة؟

بالنظر إلى الاستفسارات المذكورة أعلاه، سنناقش بعض الاختبارات الشائعة ذات الأهمية. وتشمل هذه، من بين أمور أخرى.

الاختبارات العادية
اختبارات t
اختبار مربع كاي
اختبار F

ما هو الهدف الأساسي لاختبار الفرضيات في الإحصاء؟

الهدف الأساسي من اختبار الفرضيات في الإحصائيات هو عمل استنتاجات حول المعلمات السكانية غير المعروفة بناءً على المعلومات الواردة في بيانات العينة. يمكن صياغة هذه الاستدلالات كتقديرات للمعلمات أو كاختبارات لفرضيات حول قيمها.

ما هي الفرضيتين الرئيسيتين المستخدمة في الاختبار الإحصائي؟

الفرضيتان الرئيسيتان المستخدمتان في الاختبار الإحصائي هما الفرضية الصفرية (Ho) والفرضية البديلة (H1). الفرضية الصفرية هي الفرضية التي سيتم اختبارها، في حين أن الفرضية البديلة تتعارض مع الفرضية الصفرية إلى حد ما.

كيف يختلف الاختبار أحادي الطرف عن الاختبار ثنائي الطرف؟

اختبار الطرف الواحد هو اختبار يُسمح فيه لقيم المعلمة التي تتم دراستها بموجب الفرضية البديلة بأن تكون إما أكبر أو أقل من قيم المعلمة تحت الفرضية الصفرية، ولكن ليس كليهما. يتيح الاختبار ثنائي الذيل أن تكون قيم المعلمة تحت الفرضية البديلة أكبر من القيم الموجودة تحت الفرضية الصفرية وأقل منها.

ما هو مستوى الأهمية في اختبار الفرضيات؟

مستوى الأهمية هو الاحتمال الحاسم في الاختيار بين الفرضيات الصفرية والبديلة. إنه يمثل مستوى الاحتمال منخفض جدًا بحيث لا يضمن دعم الفرضية الصفرية. تتضمن مستويات الأهمية الشائعة 5% أو 1%.

ما هي الأخطاء من النوع الأول والنوع الثاني في اختبار الفرضيات؟

يحدث خطأ من النوع الأول عندما يتم رفض فرضية العدم الحقيقية بشكل خاطئ. يحدث خطأ من النوع الثاني عندما يتم قبول الفرضية الصفرية الخاطئة بشكل خاطئ. يُشار إلى احتمال ارتكاب خطأ من النوع الأول بالرمز α، ويُشار إلى احتمال ارتكاب الخطأ من النوع الثاني بالرمز ß.

كيف يتم استخدام القيمة p في اختبار الفرضيات؟

القيمة p هي احتمالية الحصول على إحصائية اختبار متطرفة أو أكثر تطرفًا من إحصائية الاختبار الفعلية التي تم الحصول عليها، نظرًا لأن الفرضية الصفرية صحيحة. يساعد في تحديد أهمية النتائج. إذا كانت القيمة p أقل من مستوى الأهمية المختار، فسيتم رفض فرضية العدم.

ما هي بعض الاختبارات الشائعة ذات الأهمية في الإحصاء؟

تتضمن بعض الاختبارات الشائعة ذات الأهمية الاختبارات العادية، واختبارات t، واختبار مربع كاي، واختبار F. يعتمد اختيار الاختبار على عوامل مثل عدد العينات واستقلالية الحالات ومستوى قياس البيانات.