أنواع الإجراءات التحليلية

أنواع الإجراءات التحليلية

بعد أن تأكدنا من أننا قد أجرينا المسح بنجاح، لدينا فرضيات البحث تم صياغتها بشكل صحيح؛ تم تصميم عيناتنا بشكل علمي، وتم إنشاء أدوات المسح الخاصة بنا بشكل صحيح واختبارها والتحقق من صحتها، وأخيراً تم إدخال البيانات بشكل صحيح على الكمبيوتر، ومهمتنا التالية هي التخطيط لتحليل البيانات.

يعد تحليل البيانات ضروريًا بشكل خاص لاختبار الفرضيات أو الإجابات التي نطرحها أسئلة البحث وتعزيز هدفنا العام المتمثل في فهم الظواهر الاجتماعية.

قد يتم تفسير بياناتنا وتقديمها بمصطلحات لفظية بالكامل، لا سيما في الدراسات الرصدية ودراسات الوثائق.

ومع ذلك، عندما نتعامل مع البيانات الكمية، فإننا نفضل استخدام التقنيات الإحصائية لتحليل بياناتنا. هدفنا في التحليل الإحصائي يمكن تحقيقه من خلال عملية الوصف والتفسير والتنبؤ.

من بين المهام الثلاث، يشير التحليل الوصفي إلى تحويل البيانات الأولية إلى نموذج يسهل فهمها وتفسيرها. عادةً ما يكون وصف الاستجابات أو الملاحظات هو الشكل الأول للتحليل.

يحاول التحليل الوصفي ببساطة معرفة كيف "تبدو" البيانات، على سبيل المثال، عدد الحالات التي تم تحليلها، وما هو نطاق النتيجة، وما هي النتيجة المتوسطة، وكيف تختلف الدرجات الفردية عن بعضها البعض، وما إلى ذلك.

يتم إجراء هذا غالبًا لمتغير واحد في كل مرة، وهو مؤهل للتحليل أحادي المتغير.

عادةً ما يكون الشرح والتنبؤات أكثر تعقيدًا من الوصف ويتطلب المزيد من الفهم بالإضافة إلى المزيد من التفسير.

يمكن أن يتخذ التحليل الإحصائي التوضيحي عدة أشكال ولكنه يتكون عمومًا من تحليل العلاقة بين متغيرين أو أكثر.

يتم تحقيق ذلك عادة من خلال مجموعة متنوعة من التقنيات الإحصائية: اختبار الأهمية، وتحليل الارتباط، وتحليل الانحدار، وما شابه ذلك.

أنواع الإجراءات التحليلية

سيقدم القسم التالي لمحة موجزة عن طرق تحليل البيانات حول؛

  1. أحادي المتغير،
  2. ثنائي المتغير,
  3. ييري-فاريت، و
  4. تحليل متعدد المتغيرات.

تحليل أحادي أو عديد المتغير

الخطوة الأولى لمعرفة الشكل الذي تبدو عليه بياناتك هي فحص كل متغير على حدة. ويمكن تحقيق ذلك عن طريق الحصول على توزيع كل متغير واحدا تلو الآخر.

ويسمى هذا التحليل أحادي المتغير تحليل أحادي أو عديد المتغير، أي التحليل على أساس متغير واحد. ال أبسط شكل من أشكال تحليل المتغير الفردي هو حساب عدد الحالات في كل فئة.

ويسمى العدد الناتج أ التوزيع بتكرار. يمكننا تشكيل توزيعات تكرارية لمتغيرات مفردة مثل الدين (الذي يقاس على مقياس اسمي)، ومستوى التعليم (مقياس ترتيبي)، ودرجة الحرارة (مقياس فاصل)، والعمر (مقياس نسبة).

ومع ذلك، فإن التوزيع التكراري لا يكون عادةً مثيرًا للاهتمام وغني بالمعلومات دون معالجة إحصائية إضافية.

يمكن الحصول على عدة قياسات إحصائية من التوزيع التكراري. ومع ذلك، فإن الطبيعة الدقيقة للتدابير المسموح بها ستعتمد على نوع المتغير، أو بشكل أكثر دقة على مستوى القياس.

مستويات القياس شائعة الاستخدام هي الاسمية والترتيبية والفاصلية، والتي ناقشناها سابقًا. ويبين الجدول المصاحب مستوى تعليم مجموعة من النساء كما تم الحصول عليه في الدراسة الاستقصائية المتعلقة بالتنمية البشرية للفترة 1993-1994.

مثال التحليل أحادي المتغير 1

إن مستوى التعليم الموضح في العمود 1 هو المتغير الوحيد الذي يتم قياسه على مقياس ترتيبي. التوزيع هو أحادي المتغير.

يمثل العمودان الثاني والثالث التكرارات المطلقة والنسبة المئوية، على التوالي. الترددات هي أرقام مطلقة ولا تصلح لتفسير ذي معنى ما لم يتم توحيد حجمها. ويكون هذا أكثر أهمية عند مقارنة توزيعين أو أكثر.

تشكيل النسب أو النسب المئوية، يمكن إزالة هذه المشكلة. النسب المئوية تخدم غرضين في تحليل البيانات. يتم تبسيطها عن طريق تقليل جميع الأرقام إلى نطاق من 0 إلى 100.

ثانيًا، يقومون بترجمة البيانات إلى نموذج قياسي، بقاعدة 100، للمقارنة النسبية.

ومع ذلك، يجب توخي الحذر عند استخدام النسب المئوية. لاحظ أن جميع قيم النسب المئوية يجب أن تضيف إلى 100 (ما لم تكن هناك استجابات متعددة). ولا يمكن حساب متوسط القيم المئوية بشكل عادي.

لاحظ أن متغير "المستوى التعليمي" هو متغير يقاس بمقياس ترتيبي، ولا يمكننا أن نتجاوز كثيرًا نوع التحليل الموضح في الجدول أعلاه.

ومع ذلك، يمكننا أن نحاول الحصول على متوسط، وهو مقياس للاتجاه المركزي، حيث أنه من الممكن تصنيف النساء حسب مستوى تعليمهن.

والفئة المتوسطة هي فئة "بدون تعليم" لأنه عند التراكم، تنتمي النساء رقم 100/2=50 إلى هذه الفئة عند ترتيبهن في مستوى التعليم المعزز.

الوضع، وهو مقياس آخر للنزعة المركزية، له نفس الفئة أيضًا في هذه الحالة بالذات.

يمكن أيضًا أن يعمل العرض الرسومي للبيانات بشكل جيد في المثال الحالي لوصف البيانات الموجودة. يبدو أن المخططات الدائرية والشريطية هي أفضل الخيارات في هذه الحالة.

عندما تكون البيانات الكمية (الفاصل الزمني أو النسبة) في متناول اليد، يمكن محاولة اتخاذ تدابير وصفية أخرى، مثل المتوسط، والانحراف المعياري، ومعامل التباين، وما إلى ذلك، بالإضافة إلى الوسيط والمنوال، في نطاق التحليل أحادي المتغير.

خذ بعين الاعتبار بيانات "العاملين في مجال الجنس"، حيث قمنا بجمع بيانات مثل العمر والطول والوزن والدخل ومؤشر كتلة الجسم.

يمكننا حساب المتوسط ​​والوسيط والمنوال لكل من هذه المتغيرات مباشرة من البيانات الأولية إما عن طريق الآلة الحاسبة أو عن طريق جهاز كمبيوتر يستخدم SPSS.

ومع ذلك، فإن هذه الإحصائيات لا تخبرنا الكثير عن البيانات ما لم نقوم بتحليلها من منظور مقارن.

مثال التحليل أحادي المتغير 2

تم إجراء التقديرات المذكورة أعلاه من توزيعين منفصلين بمتغير واحد: توزيع المشتغلين بالجنس في بيوت الدعارة والمشتغلين بالجنس في الشوارع.

يعطي الانحراف المعياري متوسط ​​المسافة أو التباين لملاحظات القياس الفردية من متوسط ​​المجموعة.

المقاييس الأخرى للتباين هي المدى، والانحراف الربعي، ومعامل التباين. هل تختلف مجموعتا العاملين في مجال الجنس بشكل كبير فيما يتعلق بأعمارهم ودخلهم وما إلى ذلك؟

للإجابة على هذا السؤال، يمكن للمرء إجراء "اختبار مساواة المتوسطين" لتقييم ما إذا كانت الاختلافات كبيرة.

تحليل ثنائي المتغير

يقوم العرض ثنائي المتغير بوضع متغيرين معًا في جدول واحد بطريقة يمكن من خلالها فحص هذه العلاقات المتبادلة. قد يعتمد الجدول على متغيرين اسميين، أو متغيرين على مستوى النسبة، أو أي مزيج منهما.

تسمى هذه الجداول جداول ثنائية المتغير أو طاولات متقاطعة. تُسمى أحيانًا الجداول المتقاطعة المستندة إلى البيانات الرقمية (الفاصل الزمني أو النسبة). جداول الارتباط. تسمى الجداول التي يتم إنشاؤها بناءً على البيانات الاسمية فقط جداول الطوارئ.

وفقًا للتقاليد والتقليد، عادةً ما يتم تسمية متغير واحد يسمى متغير العمود في الجزء العلوي بحيث تشكل فئاته أعمدة رأسيًا أسفل الصفحة.

يتم تسمية المتغير الثاني أو متغير الصف على الهامش الأيسر حيث تشكل فئاته الصف أفقيًا عبر الصفحة.

نظرًا لأنه من الممكن دائمًا تبادل الصفوف والأعمدة في أي جدول، فلا يمكن إعطاء قواعد عامة حول متى يتم استخدام النسب المئوية للصفوف والأعمدة. ومع ذلك، فمن المستحسن بشكل عام النسبة المئوية مع المتغير المستقل.

إذا كان المتغير المستقل هو متغير الصف، فحدد النسب المئوية للصف؛ إذا كان المتغير المستقل هو متغير العمود، فحدد النسب المئوية للعمود.

على سبيل المثال، تخيل أننا نقوم بتحليل سؤال استطلاعي يسأل: هل توافق على الإجهاض (نعم/لا).

ونجد من التحليل الأولي أن الجنس متغير مهم في تحديد الإجابة على هذا السؤال، ونقرر بناء جدول ثنائي المتغير يحتوي على هذين المتغيرين.

لا يمكن لرأي الشخص أن يؤثر على جنسه، ولكن الجنس يمكن أن يؤثر على الرأي. وبالتالي فإن الجنس هو المتغير المستقل، والرأي في الإجهاض هو المتغير التابع.

ويبين الجدول أدناه نتائج هذا التحقيق.

بالنسبة المئوية للمتغير المستقل (الجنس)، يمكننا أن نرى ما إذا كان التغيير في المتغير المستقل (على سبيل المثال، من ذكر إلى أنثى) يؤدي إلى توزيع مختلف لدرجات نعم / لا (أي صالح / لا يفضل) على التابع عامل.

فيما يلي تحليل محتمل للجدول؛

مثال تحليل ثنائي المتغير

تعتمد أنواع التقنيات التحليلية المناسبة لدراسة العلاقات ثنائية المتغير على طبيعة المتغيرات، سواء كانت اسمية أو ترتيبية أو فاصلة.

نقدم أدناه لمحة موجزة عن نوع البيانات اللازمة لإنجاز أنواع مختلفة من التحليلات ثنائية المتغير التي تشير إلى الاختبار الإحصائي المحتمل الذي يمكن تطبيقه.

عندما يتم قياس البيانات على نطاق اسمي

في أغلب الأحيان، نحن مهتمون بتحديد ما إذا كانت الاختلافات الملحوظة في البيانات قد حدثت عن طريق الصدفة وحدها. في المثال أعلاه، حيث يكون المتغيران اسميين، فإن 40% من الذكور مقابل 60% من الإناث يؤيدون الإجهاض.

هل هذا الاختلاف ذو دلالة إحصائية، أم أنه قد حدث بالصدفة وحدها؟ ربما يكون الاختبار الإحصائي الأكثر استخدامًا هو اختبار مربع كاي للإجابة على السؤال.

ومع ذلك، فإن إحصائية مربع كاي لا تقيس قوة العلاقة.

ولهذا الغرض، هناك حاجة إلى "مقياس الارتباط". ولهذا الغرض، يمكننا استخدام تدابير مثل معامل فاي و كريمر الخامس, المشتقة من قيمة مربع كاي.

عندما يتم قياس البيانات على المقياس الترتيبي

هناك العديد من مقاييس الارتباط المختلفة للتبويبات المتقاطعة للمتغيرات المقاسة ترتيبيًا.

ولعل المقياس الأكثر استخدامًا للارتباط لمثل هذه الجداول هو ما يسمى جاما. يُطلق على الشكل الرباعي لجاما اسم Yule's Q.

عندما يحتوي الجدول على أكثر من أربع خلايا، يُسمى معامل Q جاما بدلاً من Q. والعيب الرئيسي لجاما كمقياس للارتباط هو أنه لا توجد حلمة ذات أهمية بسيطة لتقييم جاما.

عندما يتم قياس البيانات على نطاق فاصل

يمكن دراسة العلاقات بين متغيرات الفترة مع أو بدون الجدولة التبادلية.

إذا تم إجراء الجدولة الترافقية من متغيرات الفاصل الزمني، فيمكن للمرء أن يحاول حساب غاما أو Cramer's V، وفحص الطبيعة الظاهرة للعلاقة بين المتغيرات.

ومع ذلك، فمن الأكثر شيوعًا قياس العلاقة بين أزواج المتغيرات الفاصلة دون الرجوع إلى أي جداول ترافقية باستخدام معامل ارتباط بيرسون في لحظة المنتج والذي يُشار إليه بـ ص. يمكن لاختبار t تقييم الأهمية الإحصائية لـ r .

يخبرنا معامل الارتباط بمدى قوة الارتباط بين متغيرين تم قياسهما على مقياس فاصل على الأقل. ومع ذلك، فهو لا يمكننا من التنبؤ بقيمة الفرد أو درجاته في متغير واحد من خلال معرفة درجاته في المتغير الثاني.

تحليل الانحدار هو أسلوب يسمح لنا بإجراء مثل هذا التنبؤ.

في هذه الحالة، يكون مقياس الارتباط هو معامل الانحدار من الدرجة الصفرية، والذي يشير إلى متوسط ​​مقدار التغير في المتغير التابع المرتبط بتغير الوحدة في المتغير المستقل.

وهنا أيضاً لدينا مجال لاختبار أهمية معامل الانحدار إحصائياً.

التحليل الثلاثي المتغير

يشير التعرف على وجود علاقة ذات معنى بين المتغيرات بشكل عام إلى الحاجة إلى مزيد من التحقيق. وحتى لو وجد المرء علاقة ذات دلالة إحصائية، فإن السؤال لماذا وتحت أي ظروف يظل قائما.

إدخال متغير ثالث يسمى متغير السيطرة غالبًا ما يكون تفسير العلاقة ضروريًا.

تعمل الجداول المتقاطعة لثلاثة متغيرات كإطار لمثل هذا التحليل. جدول المتغيرات الثلاثة الأكثر شيوعًا هو جدول 2x2x2 الذي يحتوي على 3 متغيرات ثنائية التفرع.

انظر إلى الجدول 2 × 2 الذي يصف آراء 90 مشاركًا حسب الجنس. يمكننا توسيع جدول 2×2 إلى جدول 2×2×2 ببساطة عن طريق إضافة متغير آخر، مثل الدين، والذي يعتقد أنه يؤثر على العلاقة بين الجنس والموقف تجاه الإجهاض.

أي أن تأثير الجنس على موقف الإجهاض قد يكون مختلفًا بالنسبة للمسلمين عنه بالنسبة لغير المسلمين.

سيبدو الجدول الناتج الآن كما يلي:

مثال على التحليل الثلاثي المتغير

في هذه الحالة، يسمى الدين أ 'متغير السيطرة. ويبين الجدول السابق العلاقة بين الجنس والموقف تجاه الإجهاض، حيث لم يكن الدين معروفا.

إذا شعرنا أن العلاقة بين الجنس والموقف ستكون هي نفسها بغض النظر عن دين الشخص، فليست هناك حاجة لبناء الجدول 2، حيث أن كلا جزأين الجدول 2 سوف يؤديان إلى نتائج متطابقة.

ومع ذلك، إذا شعرنا أن العرق سيؤثر على العلاقة بين الجنس والموقف، فإننا نتوقع أن ترددات الخلايا الداخلية في نصفي الجدول 2 ستكون مختلفة.

إنه أ * ه، ب، وما إلى ذلك وهلم جرا.

يسمى هذا التأثير، حيث تعتمد العلاقة بين متغيرين على المتغير الثالث تأثير التفاعل الإحصائي.

فإذا شعرنا أن الدين سيكون له مثل هذا التأثير، فإن العلاقة الموضحة في الجدول 1 غير كافية ومضللة وتحتاج إلى حساب السيطرة على الدين.

نقول إن العرق متحكم فيه لأنه داخل كل خلية من الجدول 2، يكون الدين ثابتًا (كل المسلمين أو كل غير المسلمين) وبالتالي لا يمكن أن يؤثر على النتيجة.

تحليل متعدد المتغيرات

التحليلات التي تسمح للباحث بدراسة تأثير السيطرة على واحد أو تسمى المتغيرات المتعددة التحليلات متعددة المتغيرات منذ أن تورطوا متعددة (أكثر من اثنين) المتغيرات.

معظم التقنيات متعددة المتغيرات أيضًا السماح بقياس درجة العلاقة بين متغير تابع ومتغيرين مستقلين أو أكثر في وقت واحد.

تشمل التقنيات متعددة المتغيرات الأكثر استخدامًا، من بين أمور أخرى، تحليل الانحدار المتعدد، وتحليل التصنيف المتعدد (MCA)، والتحليل التمييزي، وتحليل التباين متعدد المتغيرات (MANOVA)، وتحليل الانحدار اللوجستي، وتحليل المخاطر.

الطرق الأخرى في الإعدادات متعددة المتغيرات هي تحليل العوامل، والتحليل العنقودي، والقياس متعدد الأبعاد. يمكن أن تكون التقنيات متعددة المتغيرات أدوات تحليلية قوية جدًا، ولكن يجب استخدامها بحذر شديد.

وتستند جميعها إلى العديد من الافتراضات التي يصعب جدًا تحقيقها في معظم أبحاث العلوم الاجتماعية. مثل أ ونتيجة لذلك، فإن النتائج ليست صالحة في كثير من الأحيان.

يجب ألا تتضمن خطة التحليل الخاصة بك أي تقنيات متعددة المتغيرات دون التأكد من إمكانية تطبيقها.

قبل اختتام هذا القسم، نؤكد هنا أنه كأول تحليل متعدد المتغيرات للبيانات، يُنصح القراء بالبدء بتحليل الانحدار.

ما هو الغرض الأساسي من تحليل البيانات في البحث؟

الغرض الأساسي من تحليل البيانات في البحث هو اختبار الفرضيات، والإجابة على أسئلة البحث، وتعزيز الهدف العام المتمثل في فهم الظواهر الاجتماعية.

ما هو التحليل أحادي المتغير وكيف يتم استخدامه؟

يشير التحليل أحادي المتغير إلى فحص كل متغير على حدة. وهو ينطوي على تحويل البيانات الأولية إلى نموذج يجعل من السهل فهمها وتفسيرها، غالبًا عن طريق تشكيل توزيعات تكرارية لمتغيرات فردية.

كيف يختلف التحليل ثنائي المتغير عن التحليل أحادي المتغير؟

يفحص التحليل ثنائي المتغير العلاقة بين متغيرين في وقت واحد، في حين ينظر التحليل أحادي المتغير إلى متغير واحد في كل مرة. يمكن استخدام التحليل ثنائي المتغير لدراسة العلاقات المتبادلة بين متغيرين في جدول واحد.

ما هو دور متغير التحكم في التحليل الثلاثي المتغير؟

يتم تقديم متغير التحكم في التحليل ثلاثي المتغيرات لتفسير العلاقة بين متغيرين آخرين. ويساعد في تحديد ما إذا كانت العلاقة بين المتغيرين الرئيسيين تعتمد على المتغير الثالث، المعروف باسم تأثير التفاعل الإحصائي.

ما هي بعض التقنيات متعددة المتغيرات شائعة الاستخدام في تحليل البيانات؟

تتضمن التقنيات متعددة المتغيرات شائعة الاستخدام تحليل الانحدار المتعدد، وتحليل التصنيف المتعدد (MCA)، والتحليل التمييزي، وتحليل التباين متعدد المتغيرات (MANOVA)، وتحليل الانحدار اللوجستي، وتحليل المخاطر.

لماذا يجب استخدام التقنيات متعددة المتغيرات بحذر؟

يجب استخدام التقنيات متعددة المتغيرات بحذر لأنها تعتمد على العديد من الافتراضات التي غالبًا ما يصعب تحقيقها في معظم أبحاث العلوم الاجتماعية، مما يجعل النتائج غير صالحة.

ما أهمية النسب المئوية في تحليل البيانات؟

تعمل النسب المئوية على تبسيط البيانات عن طريق تقليل جميع الأرقام إلى نطاق من 0 إلى 100. كما أنها تترجم البيانات إلى نموذج قياسي للمقارنة النسبية، مما يسهل تفسير مجموعات البيانات المختلفة ومقارنتها.