تحليل البيانات في البحوث

تحليل البيانات في البحوث

يواجه الباحث في أي تخصص مشكلة ما يجب فعله بالبيانات بعد جمعها. وقد تكون كتلة البيانات كبيرة لدرجة أن الباحث لا يستطيع أن يضعها كلها بالشكل الذي جمعه به في تقريره.

يجب اختزال الكثير من البيانات إلى شكل مناسب للتحليل بحيث يمكن تقديم مجموعة موجزة من الاستنتاجات أو النتائج إلى الجمهور العلمي.

في محاولة لتحليل البيانات، يجب علينا أن نقرر أولا

  • ما إذا كان سيتم تنفيذ جدولة البيانات باليد أو عن طريق الكمبيوتر
  • كيف يمكن تحويل المعلومات إلى نموذج يسمح بمعالجتها بكفاءة و
  • ما هي الأدوات أو الأساليب الإحصائية التي سيتم استخدامها

في الآونة الأخيرة، أصبحت أجهزة الكمبيوتر أداة أساسية لتجميع وتحليل بيانات المسح.

حتى في الدراسات الصغيرة التي تستخدم إجراءات إحصائية بسيطة نسبيًا، يتم تشجيع الجدولة الحاسوبية للتعامل السهل والمرن مع البيانات.

يمكن لأجهزة الكمبيوتر الصغيرة والمحمولة إنتاج جداول من أي بُعد وإجراء العمليات الإحصائية بسهولة أكبر وعادةً ما يكون بها خطأ أقل بكثير مما هو ممكن يدويًا.

على افتراض أن قاعدة البيانات كبيرة وأن معالجة البيانات ستتم بواسطة الكمبيوتر، فسوف نتناول القضايا الرئيسية التالية في مهمة تحليل البيانات:

  • إعداد البيانات والذي يشمل؛
    • التحرير,
    • الترميز، و
    • ادخال بيانات.
  • استكشاف وعرض وفحص البيانات التي تتضمن تقسيم البيانات وفحصها وإعادة ترتيبها للبحث عن أوصاف وأنماط وعلاقات ذات معنى.

التحرير

الخطوة الأولى المعتادة في التحليل هي تحرير البيانات الأولية. يكتشف التحرير الأخطاء والسهو، ويصححها كلما أمكن ذلك، ويشهد على تحقيق الحد الأدنى من معايير جودة البيانات.

مسؤولية المحرر هي ضمان أن البيانات؛

  1. دقيق،
  2. بما يتوافق مع غرض السؤال أو المعلومات الأخرى،
  3. دخلت بشكل موحد
  4. كاملة، و
  5. تم ترتيبها لتبسيط الترميز والتبويب.

يمكن أن يتم تحرير البيانات بطريقتين: التحرير الميداني والتحرير الداخلي، ويسمى أيضًا التحرير المركزي.

التحرير الميداني هو التحرير الأولي للبيانات من قبل المشرف الميداني في نفس يوم المقابلة. والغرض منه هو تحديد الإغفالات الفنية، والتحقق من الوضوح، وتوضيح الاستجابات غير المتسقة منطقيا أو مفاهيميا.

عندما تكون هناك فجوات في المقابلات، يجب إعادة الاتصال بدلاً من تخمين ما "كان من المحتمل أن يقوله" المستجيب.

المهمة الثانية المهمة للمشرف هي إعادة مقابلة عدد قليل من المستجيبين، على الأقل بشأن بعض الأسئلة المحددة مسبقًا، للتحقق من الصحة. في وسط أو التحرير الداخلي، تخضع جميع الاستبيانات لتحرير شامل. إنها مهمة صارمة يقوم بها موظفو المكتب المركزي.

الترميز

الترميز هو عملية تعيين أرقام أو رموز أخرى للإجابات بحيث يمكن تجميع الإجابات في عدد محدود من الفئات أو الفئات. يساعد الترميز الباحث على تقليل عدة آلاف من الردود على فئات قليلة تحتوي على المعلومات المهمة المخصصة للسؤال المطروح.

يمكن دمج الترميز الرقمي عند إعداد الاستبيان نفسه، وهو ما نسميه الترميز المسبق أو بعد الانتهاء من الاستبيان تمت الإجابة على الأسئلة التي نسميها ما بعد الترميز.

يقتصر الترميز المسبق بالضرورة بشكل أساسي على الأسئلة التي تكون فئات إجاباتها معروفة مسبقًا.

وهي في المقام الأول أسئلة مغلقة (مثل الجنس أو الدين) أو أسئلة تكون إجابتها رقمًا بالفعل وبالتالي لا تحتاج إلى تحويل (مثل العمر وعدد الأطفال).

يعد الترميز المسبق مفيدًا بشكل خاص لإدخال البيانات لأنه يجعل الخطوة المتوسطة المتمثلة في إكمال ورقة الترميز غير ضرورية. يمكن الوصول إلى البيانات مباشرة من الاستبيان.

يمكن للمستجيب أو القائم بإجراء المقابلة أو المشرف الميداني أو الباحث (اعتمادًا على طريقة جمع البيانات) تعيين إجابات رقمية مناسبة على الأداة عن طريق التحقق منها أو وضع دائرة حولها في موقع الترميز المناسب.

تتمثل الميزة الرئيسية للترميز اللاحق على الترميز المسبق في أن الترميز اللاحق يسمح للمبرمج بالتأكد من الإجابات التي قدمها المستجيب قبل بدء الترميز.

وهذا يمكن أن يؤدي إلى تبسيط كبير. يسمح الترميز اللاحق أيضًا للباحث بترميز إجابات متعددة لمتغير واحد عن طريق كتابة رقم رمز مختلف لكل مجموعة من الإجابات المقدمة.

الترميز، سواء قبله أو بعده، هو إجراء من جزأين يتضمن؛

  1. اختيار رقم مختلف لكل فئة إجابة محتملة؛ و
  2. اختيار العمود أو الأعمدة المناسبة على بطاقة الكمبيوتر التي تحتوي على أرقام الأكواد الخاصة بتلك المتغيرات.

يضحي ترميز البيانات ببعض تفاصيل البيانات، ولكنه ضروري للتحليل الفعال. فبدلاً من طلب كلمة مسلم أو مسيحي للإجابة على سؤال يحدد هوية الشخص، يمكننا استخدام الرمز "M" أو "C".

عادةً ما يتم ترميز هذا المتغير بالرقم 1 للمسلمين و2 للمسيحيين. تسمى الرموز من النوع "QI" أو "VI" بالرموز الأبجدية الرقمية. عندما يتم استخدام الأرقام حصريًا (على سبيل المثال، 1، 2، وما إلى ذلك)، تكون الرموز رقمية.

كتاب الشفرات وبنائه

كتاب الرموز هو نوع من الكتيبات التي يجمعها موظفو المسح والتي تحكي معنى كل رمز من كل سؤال في الاستبيان.

على سبيل المثال، قد يكشف كتاب الشفرات أنه بالنسبة للسؤال رقم 10، تم ترميز الذكر بـ 1 والأنثى بـ 2.

يستخدم الباحث كتاب الرموز كدليل لجعل إدخال البيانات أقل عرضة للخطأ وأكثر كفاءة. وهو أيضاً

المصدر النهائي لتحديد مواقع المتغيرات في ملف البيانات أثناء التحليل.

إذا كان من الممكن ترميز الاستبيان مسبقًا بالكامل، مع رمز حافة يشير إلى موقع المتغير في ملف البيانات، فلن يكون من الضروري وجود كتاب رموز منفصل، ويمكن استخدام استبيان فارغ ككتاب رموز.

ومع ذلك، خاصة فيما يتعلق بمرحلة ما بعد الترميز والأسئلة المفتوحة التي تتلقى العديد من الإجابات، لا توجد مساحة كافية في الاستبيان لتحديد جميع الرموز.

ما يلي هو مثال على جزء من كتاب الرموز.

عينة من كتاب الرموز

السؤال رقم.موقع العمودرقم متغيروصف متغيراسم المتغير
1-3V101رقم المستجيب

الرمز الذاتي 999=مفقود

بطاقة تعريف
4V102مكان الإقامة: ل=الريف 2=الحضر 9=مفقودالدقة
25V103جنس المستجيب: ل=ذكر 2=أنثى 9=مفقودالجنس
36-7V104عمر:

الكود الذاتي
99=مفقود

عمر
48V105الحالة الاجتماعية: ل=أعزب 2=متزوج 3=أرمل 4=مطلق 5=منفصل 9=مفقودالزوجية

ترميز عدم الاستجابات

عدم الإجابة (أو الحالات المفقودة) يحدث نتيجة عدم تقديم أي إجابة على الإطلاق لسؤال ما، وهذه أمور لا مفر منها في أي استبيان.

وينبغي توخي الحذر لمنع عدم الإجابات، ولكن في حالة حدوث ذلك، يجب على الباحث أن يبتكر مخططًا ما لترميزها، ويفضل أن يكون مخططًا قياسيًا بحيث يمكن استخدام نفس الكود في حالة عدم الاستجابة بغض النظر عن السؤال المحدد.

يجب تعيين رمز رقمي لعدم الاستجابة.

الأرقام المستخدمة في أغلب الأحيان لعدم الاستجابة هي 0 و9. بالنسبة للمتغيرات التي تتطلب أكثر من عمود واحد، يتم تكرار الرقم فقط لكل عمود (على سبيل المثال، 99، 999).

يعد أي رمز رقمي مرضيًا لعدم الاستجابة طالما أنه ليس رقمًا يمكن أن يحدث كاستجابة مشروعة.

على سبيل المثال، إذا طلبت من المستجيب أن يذكر عدد الأطفال في عائلته، فيجب ألا تستخدم الرقم 9 لعدم الإجابة لأنك لا تستطيع التمييز بين عدم الإجابة وبين عائلة مكونة من تسعة أطفال.

بالإضافة إلى عناصر عدم الاستجابة، قد يلزم أيضًا تعيين رمز لإجابات "لا أعرف" المختصرة "DK" وللإجابات "غير قابلة للتطبيق (NA)"، حيث لا ينطبق السؤال على مستجيب معين. غالبًا ما يتم ترميز الإجابات "لا أعرف" بالرمز "O" أو "OO".

ادخال بيانات

بعد انتهاء عملية الترميز، فإن الخطوة التالية هي إدخال المعلومات المشفرة في ملف يمكن تخزينه عليه أ القرص أو القرص المرن أو الشريط.

إذا كانت الاستبيانات مشفرة مسبقًا، بما في ذلك ترميز الحواف للإشارة إلى الأعمدة المناسبة في ملف البيانات لكل متغير، فيمكن استخراج الرموز مباشرة من الاستبيانات.

يُنصح بهذا إذا كان ذلك ممكنًا لأنه يوفر العمل الكتابي، الذي لا يكلف الوقت والمال فحسب، بل يوفر أيضًا احتمال حدوث أخطاء إضافية.

ومع ذلك، إذا تم ترميز الاستبيان لاحقًا، وإذا كانت الرموز معقدة وتتطلب كتاب رموز مطولًا، فسيكون من الصعب أو المستحيل العمل مباشرة من الاستبيانات. في مثل هذه الحالة، يتمثل الإجراء القياسي في تقسيم مهمة إنشاء ملف البيانات إلى عمليتين منفصلتين؛

  1. قراءة الاستبيانات وكتاب الشفرات ونقل الرموز الرقمية الصحيحة لكل سؤال إلى ورقة النسخ أو النقل، و
  2. إدخال البيانات إلى الكمبيوتر من خلال محطة الكمبيوتر.

حتى وقت قريب جدًا، كان استخدام بطاقة ثقب كانت الطريقة الأكثر شيوعًا لإدخال البيانات على أجهزة الكمبيوتر.

وقد اختفى هذا النظام عمليا. في الآونة الأخيرة، أصبحت العديد من أجهزة الكمبيوتر تسمح بإدخال البيانات من نماذج المسح الضوئي في الامتحانات، يقوم الممتحنون بتغميق دوائر صغيرة أو علامات حذف أو مجموعة من الخطوط المتوازية لاختيار إجابة الاختبار.

تقوم الماسحات الضوئية بمعالجة الاستبيانات ذات الاستشعار الملحوظ وتخزين الإجابات في ملف بيانات أولية في الكمبيوتر. تم الآن تطوير بعض الاستبيانات، والتي تحتوي على نماذج المسح الضوئي كأوراق إجابات، أو قد يتم فرض الاستبيان نفسه على نموذج المسح الضوئي.

إذا كان الأمر كذلك، فلن يحتاج الباحث إلى نقل البيانات إلى النماذج.

تم اعتماد هذه التقنية من قبل مصممي الاستبيانات لجمع البيانات الأكثر روتينية. فهو يقلل من عدد مرات معالجة البيانات، وبالتالي تقليل عدد الأخطاء التي يتم تقديمها.

بالإضافة إلى الإجراء المذكور أعلاه، يظل الإدخال باستخدام لوحة المفاتيح بمثابة الدعامة الأساسية للباحثين الذين يحتاجون إلى إنشاء ملف بيانات على الفور وتخزينه في مساحة صغيرة على مجموعة متنوعة من الوسائط.

بالنسبة لهذا الإجراء، يتعين على المرء أن يأخذ بياناته المشفرة، ويجلس أمام محطة الكمبيوتر، ويدخل بياناته على لوحة المفاتيح الخاصة بالمحطة، كل حالة على حدة. بمجرد إدخال البيانات، يمكننا الحصول على قائمة من الكمبيوتر بما قمت بإدخاله والتحقق من القائمة باستخدام البيانات المشفرة الأصلية.

استجابة لوحة مفاتيح الهاتف وهي قدرة أخرى أصبحت ممكنة بفضل أجهزة الكمبيوتر المرتبطة بخطوط الهاتف.

باستخدام لوحة مفاتيح الهاتف (لمسة واحدة)، يجيب المستجيب على الأسئلة بالضغط على الرقم المناسب.

يلتقط الكمبيوتر البيانات عن طريق "الاستماع"، وفك تشفير الإشارة الكهربائية للنغمات، وتخزين الإجابة الرقمية أو الأبجدية في ملف بيانات.

في الوقت الحاضر، القراء الباركود تستخدم على نطاق واسع في الأعمال التجارية. يمكن استخدام هذه التكنولوجيا لتبسيط دور القائم بإجراء المقابلة كمسجل للبيانات.

فبدلاً من كتابة أو كتابة معلومات حول المستجيبين وإجاباتهم يدويًا، يمكن للقائم بالمقابلة تمرير عصا الرمز الشريطي فوق الرموز المناسبة. يتم تسجيل البيانات في وحدة صغيرة وخفيفة الوزن لترجمتها لاحقًا.

التحول المتغير

غالبًا ما يكون من الضروري تحويل البيانات أو تعديلها للتحليلات اللاحقة. إنها عملية تغيير البيانات من شكلها الأصلي إلى تنسيق يدعم تحليل البيانات بشكل أفضل تحقيق أهداف البحث.

يعتقد العديد من الباحثين أن انحياز الاستجابة سيكون أقل إذا سأل القائمون على المقابلات المشاركين عن سنة ميلادهم بدلاً من أعمارهم، على الرغم من أن الهدف من تحليل البيانات هو التحقق من عمر المشاركين بالسنوات.

يمكن بسهولة تحويل البيانات الأولية المُرمزة بسنة الميلاد إلى العمر الحالي عن طريق طرح سنة الميلاد من السنة الحالية.

نظرًا لأن هذا الحساب يمكن إجراؤه بسهولة ودقة أكبر بواسطة الكمبيوتر مقارنةً باليد، فيجب إجراؤه أثناء تحليل البيانات المرحلة وليس أثناء الترميز.

يعد طي أو دمج الفئات المتجاورة للمتغير بمثابة تحويل شائع للبيانات يقلل من عدد الفئات، ويمكن إجراء كل هذا التحويل في الكمبيوتر في أي مرحلة من مراحل التحليل. على سبيل المثال، يمكن طي السنوات المفردة من العمر (مثل 0، 1،..) وتحويلها إلى فئات عمرية 0-4, 5-9، 10-14، إلخ.

أحد عيوب هذه العملية المنهارة هو فقدان الهوية الفردية للملاحظات بشكل دائم.

لتجنب ذلك، يُنصح بإنشاء متغير جديد من المتغير القديم مع الاحتفاظ بالمتغير الأصلي.

على أية حال، يجب الاحتفاظ بالمتغير الأصلي، ويجب إعطاء المتغير المحول اسمًا جديدًا حتى تتمكن من إجراء المزيد من التحويل عند الحاجة.

حساب متغير جديد

في بعض الأحيان، يكون من الضروري حساب متغير جديد من خلال الجمع بين متغيرين أو أكثر للتحليل.

لنفترض أنك قمت بتسجيل عدد البنات (x1) وعدد الأبناء (س2) لديه أو لديها.

تريد دمج هذين المتغيرين في متغير واحد (x)، والذي يشير إلى إجمالي عدد الأطفال لدى الفرد، بحيث يكون x=x1+x2.

عند حساب متغير جديد، يمكنك إجراء عمليات الجمع والطرح والضرب والقسمة باستخدام متغير أصلي واحد أو أكثر.

لحساب هامش الربح P، يمكنك طرح قيمة الشراء (Y) من قيمة المبيعات (X). ف = س ص . وبالتالي فإن P هو المتغير المحسوب الخاص بك. يمكن إجراء كل هذه العمليات بسهولة بواسطة برنامج كمبيوتر في أي مرحلة من مراحل تحليل البيانات الخاصة بك.

إعادة ترميز البيانات

إعادة الترميز هي إجراء معالجة شائع يجب عليك اعتماده في إعداد المتغير الخاص بك للتحليل.

الغرض من التسجيل بشكل عام هو تقليل عدد الفئات في المتغير إلى مستوى أكثر قابلية للإدارة للتحليل الرقمي.

لنفترض، على سبيل المثال، أنك قمت بترميز الدين على النحو التالي:

مسلم = 1، هندوسي = 2، مسيحي = 3، بوذي = 4، آخرون = 5

لنفترض أن سلسلة الترددات تصور أن المسيحيين والبوذيين وفئة "الآخرين" معًا لا يشكلون سوى نسبة صغيرة من الكل. وفي هذه الحالة، أنت مقتنع بأن التحليل المنفصل لبياناتك من خلال هذه الفئات الممثلة تمثيلا ناقصا قد لا يكون ذا معنى.

في هذه الحالة، سوف تميل إلى الجمع بين هذه الفئات الثلاث وتعيين رمز جديد "3".

ما هو التحدي الرئيسي الذي يواجه الباحثين بعد جمع البيانات؟

بعد جمع البيانات، يواجه الباحثون التحدي المتمثل في معالجة وتحليل الكم الهائل من البيانات لتقديمها بشكل موجز وهادف ومناسب لتقديم التقارير إلى مؤسسة علمية. جمهور.

لماذا تعتبر أجهزة الكمبيوتر أدوات أساسية لتبويب وتحليل بيانات المسح؟

تعتبر أجهزة الكمبيوتر ضرورية لتبويب وتحليل بيانات المسح لأنها يمكن أن تنتج جداول من أي بعد، وتؤدي عمليات إحصائية بسهولة أكبر، وعادة ما تكون الأخطاء فيها أقل بكثير من الطرق اليدوية، مما يجعل معالجة البيانات تتسم بالكفاءة والمرونة.

ما هو الغرض من تحرير البيانات الأولية في البحث؟

يؤدي تحرير البيانات الأولية إلى الكشف عن الأخطاء والسهو، وتصحيحها كلما أمكن ذلك، والتأكد من أن البيانات تلبي الحد الأدنى من معايير الجودة. ويضمن أن تكون البيانات دقيقة ومتسقة ومدخلة بشكل موحد ومرتبة لتبسيط عملية الترميز والتبويب اللاحقة.

ما هو الترميز في سياق تحليل البيانات، ولماذا هو ضروري؟

الترميز هو عملية تعيين أرقام أو رموز أخرى للإجابات، مما يسمح بتجميع الإجابات في عدد محدود من الفئات أو الفئات. فهو يساعد على تقليل الردود العديدة على بعض الفئات التي تحتوي على المعلومات الهامة المخصصة للسؤال المطروح.

ما الفرق بين الترميز المسبق والترميز اللاحق؟

يقوم الترميز المسبق بتعيين رموز رقمية للإجابات عند إعداد الاستبيان، وذلك في المقام الأول للأسئلة ذات فئات الإجابات المعروفة. يقوم الترميز اللاحق بتعيين الرموز بعد إدارة الاستبيان، مما يسمح بمزيد من المرونة في ترميز الإجابات المتعددة أو غير المتوقعة.

كيف يتم التعامل مع حالات عدم الاستجابات أو الحالات المفقودة في تحليل البيانات؟

عدم الإجابات أمر لا مفر منه في أي استبيان. ويتم تخصيص رمز رقمي لها، غالبًا ما يكون 0 أو 9، لتمييزها عن الاستجابات المشروعة. يتم الحرص على التأكد من عدم الخلط بين رمز عدم الاستجابة والإجابة الصحيحة.

ما هو التحول المتغير في تحليل البيانات؟

التحويل المتغير هو عملية تغيير البيانات من شكلها الأصلي إلى تنسيق يدعم تحليل البيانات بشكل أفضل لتحقيق أهداف البحث. يمكن أن تتضمن عمليات مثل الجمع أو الطرح أو الضرب أو القسمة على واحد أو أكثر من المتغيرات الأصلية.