هذا المقال ترجمة من اللغة الأصلية.

🧠 هل تعلم

التنقيب العشوائي عن البيانات: تاريخ الـ P-Hacking المظلم الذي يخدع العلم

وراء كواليس البحث، هناك ممارسة محظورة تُعرف بـ "التنقيب في البيانات" - استكشاف البيانات دون فرضية واضحة حتى يتم العثور على ارتباطات زائفة. تاريخ هذه الممارسة ليس فقط مخزياً، بل أدى إلى إنتاج آلاف الدراسات الزائفة. هذا المقال يستعرض أصلها، الشخصيات المثيرة للجدل، وتأثيراتها السلبية على العالم العلمي.

27 Jun 20265 دقيقة قراءة0 مشاهداتبواسطة Redaksi KhatulistiwaWikipedia — Data dredging

الصورة: Foto: Wikipedia — Data dredging (CC BY-SA 4.0)

عصر الإحصاء الذهبي: ظهور مغريات التنقيب في البيانات

في بداية القرن العشرين، ثورة الإحصاء غيرت طريقة البشر لفهم العالم. سيد رونالد فيشر، والد الإحصاء الحديث، قدم مفهوم اختبارات الدلالة والقيمة p في عام 1925. فكرة بسيطة: إذا كانت احتمالية حدوث نتيجة ما بشكل صدفة صغيرة جدًا (عادة أقل من 0.05)، فإن هذه النتيجة تُعتبر دلالة إحصائية. ومع ذلك، حذر فيشر نفسه أن هذه الاختبارات صالحة فقط إذا تم تحديد الفرضية قبل جمع البيانات. للأسف، هذه التحذيرات غالبًا ما تُتجاهل.

في عقد الخمسينيات والستينيات، بدأت الحواسيب تستخدم في تحليل البيانات. مع القدرة على اختبار الآلاف من العلاقات في لحظة، وقع الباحثون في "الـ p-hacking" - إعادة الاختبارات حتى الحصول على قيمة p دلالة. خبير الإحصاء جون توكى في عام 1962 أطلق على هذه الظاهرة اسم "التنقيب في البيانات" وحذر من أنها تزيد بشكل كبير من خطر النتائج الإيجابية الكاذبة.

أكبر فضيحة: من علم النفس إلى الطب

أحد الحالات الشهيرة حدثت في علم النفس الاجتماعي. في عام 2011، نشر الباحث داريل بيم دراسة زعمت أن البشر يمكنهم التنبؤ بالمستقبل - شكل من أشكال القوى فوق الطبيعية. استخدمت الدراسة تسعة تجارب مختلفة مع اختبارات إحصائية متعددة. عند مراجعتها، وجد أن عدد قليل من الاختبارات أظهرت تأثيرًا دلالة، بينما فشلت باقيها. هذا هو مثال كلاسيكي للتنقيب في البيانات: الإبلاغ فقط عن النتائج التي تدعم الفرضية، مع إخفاء الأخرى.

في مجال الطب، حدثت مأساة أكبر. في عام 2004، أظهرت دراسة حول أدوية مضادة للاكتئاب للأطفال أن الشركات الصيدلانية نشرت فقط الدراسات التي أظهرت تأثيرات إيجابية، بينما تم إخفاء الدراسات التي أظهرت عدم وجود تأثير أو آثار ضارة. وبسبب ذلك، تلقى آلاف المراهقين أدوية غير فعالة وخطيرة. أدت هذه الفضيحة إلى إصلاحات في تسجيل التجارب السريرية.

كيف يعمل التنقيب في البيانات: آليات الاحتيال

عادة ما يتضمن عملية التنقيب في البيانات الخطوات التالية:

جمع البيانات دون فرضية محددة: يأخذ الباحثون بيانات كبيرة متوفرة مسبقًا، مثل بيانات التعداد أو سجلات المستشفيات.
اختبار العديد من الارتباطات: يختبرون آلاف الأزواج من المتغيرات - على سبيل المثال، هل عدد المظلات المباعة مرتبط بمعدل الجرائم؟ (ربما يوجد ارتباط، لكنه لا يعني سببًا ونتيجة).
اختيار تلك التي تكون دلالة: تُعلن فقط الارتباطات التي تنتج قيمة p أقل من 0.05، بينما تُهمل الأخرى.
تعديل التحليل: أحيانًا يغيرون طريقة جمع البيانات أو تحليلها - على سبيل المثال، إزالة القيم الشاذة، تغيير تعريف المتغير، أو دمج المجموعات - حتى تصبح النتائج دلالة.

نتيجة لذلك، ستظهر واحدة من كل 20 اختبارات دلالة عرضية. إذا تم إجراء 20 اختبارًا، سيظهر ناتج كاذب بالتأكيد. ولكن الباحثون غير الصادقين يمكن أن يجريوا 100 أو 1000 اختبار.

شخصيات مثيرة للجدل: أنقذوا أم خداعوا؟

من بين الشخصيات النشطة في كشف التنقيب في البيانات هو جون أيوناديس، طبيب وعالم إحصاء. في عام 2005، نشر مقالًا مشهورًا بعنوان "لماذا معظم النتائج المنشورة في البحث هي كاذبة" (لماذا معظم نتائج البحث المنشورة هي كاذبة). أظهر أن أكثر من 80% من الدراسات التي زعمت اكتشافات دلالة في الطب لم تتمكن من التكرار.

من ناحية أخرى، هناك أيضًا شخصيات اُتهمت بممارسة التنقيب في البيانات. على سبيل المثال، براين وانسنك، أستاذ في جامعة كورنيل، نشر العديد من الدراسات حول علم نفس الأكل. في عام 2018، أظهرت تحقيق أنّه كان غالبًا يبلغ عن نتائج غير متسقة ويقوم بتحليلات غير مناسبة. وأدى ذلك إلى سحب أكثر من 15 مقالة.

وراثة مهينة: أزمة التكرار

الآن، يواجه العالم العلمي أزمة تكرار. في عام 2015، وجد مشروع التكرار في علم النفس أن فقط 39% من 100 دراسة رئيسية يمكن إنتاجها بنجاح. وفي مجال الأورام، معدل التكرار أقل، حوالي 11%.

هذه الأزمة تأتي في الغالب من التنقيب في البيانات. عندما يستخدم الباحثون هذه الممارسة، فإنهم ينتجون اكتشافات تبدو رائعة لكنها في الواقع كاذبة. عندما يحاول الباحثون الآخرون إعادة إنتاج هذه الدراسات، يفشلون. وهذا يهدر موارد كبيرة ويضلل السياسات العامة.

الطريق نحو التعافي: الشفافية والتسجيل المسبق

للمعالجة، تم تقديم عدة خطوات. أولًا، تسجيل الدراسات مسبقًا: يجب على الباحثين تسجيل فرضياتهم وطرق تحليلهم قبل جمع البيانات. هذا يمنعهم من تغيير التحليل بعد رؤية البيانات. ثانيًا، استخدام التحليلات المجهولة: لا يعرف المحللون مجموعات العلاج والتحكم حتى يكتمل التحليل. ثالثًا، تشجيع الإبلاغ عن جميع الاختبارات، وليس فقط تلك التي تكون دلالة.

الآن، تمارس العديد من المجلات العلمية هذه السياسة. على سبيل المثال، مجلة Nature وPLOS ONE تتطلب من الباحثين الإعلان بوضوح ما إذا كانت تحليلاتهم استكشافية أو تأكيدية. هذا يساعد في تمييز الاكتشافات الحقيقية عن نتائج الـ p-hacking.

الخاتمة: دروس للجيل القادم

التنقيب في البيانات ليس مجرد ممارسة علمية خاطئة؛ بل هو انتهاك أخلاقي أثر على ثقة الجمهور بالعلم. التاريخ يعلّمنا أن الحقيقة لا يمكن تشكيلها حسب رغباتنا. كل مرة نرى فيها دراسة تدعي اكتشافًا مذهلاً، يجب أن نسأل: هل هذا نتيجة تحليل دقيق أم مجرد تنقيب في البيانات المخادع؟

كقارئ ومُستخدم للعلم، يجب أن نكون ذوي حكمة. لا تصدق بسهولة العناوين المثيرة. اطلب الشفافية، التكرار، والصدق. فقط بهذه الطريقة يمكننا ضمان أن المعرفة التي نبنيها قوية، وليس هشة مثل قصور الرمال.

---
تم كتابة هذا المقال بناءً على مصادر تاريخية وإحصائية موثوقة. المصادر الرئيسية: Ioannidis (2005)، Simmons et al. (2011)، وتقرير مشروع التكرار.

---
المراجع: التنقيب في البيانات — ويكيبيديا

متوفر في:

BM AR EN ES ID PT

التنقيب العشوائي عن البيانات: تاريخ الـ P-Hacking المظلم الذي يخدع العلم. وراء كواليس البحث، هناك ممارسة محظورة تُعرف بـ "التنقيب في البيانات" - استكشاف البيانات دون فرضية واضحة حتى يتم العثور على ارتباطات زائفة. تاريخ هذه الممارسة ليس فقط مخزياً، بل أدى إلى إنتاج آلاف الدراسات الزائفة. هذا المقال يستعرض أصلها، الشخصيات المثيرة للجدل، وتأثيراتها السلبية على العالم العلمي.. عصر الإحصاء الذهبي: ظهور مغريات التنقيب في البيانات في بداية القرن العشرين، ثورة الإحصاء غيرت طريقة البشر لفهم العالم. سيد رونالد فيشر، والد الإحصاء الحديث، قدم مفهوم اختبارات الدلالة والقيمة p في عام 1925. فكرة بسيطة: إذا كانت احتمالية حدوث نتيجة ما بشكل صدفة صغيرة جدًا عادة أقل من 0.05 ، فإن هذه النتيجة تُعتبر دلالة إحصائية. ومع ذلك، حذر فيشر نفسه أن هذه الاختبارات صالحة فقط إذا تم تحديد الفرضية قبل جمع البيانات. للأسف، هذه التحذيرات غالبًا ما تُتجاهل. في عقد الخمسينيات والستينيات، بدأت الحواسيب تستخدم في تحليل البيانات. مع القدرة على اختبار الآلاف من العلاقات في لحظة، وقع الباحثون في "الـ p-hacking" - إعادة الاختبارات حتى الحصول على قيمة p دلالة. خبير الإحصاء جون توكى في عام 1962 أطلق على هذه الظاهرة اسم "التنقيب في البيانات" وحذر من أنها تزيد بشكل كبير من خطر النتائج الإيجابية الكاذبة. أكبر فضيحة: من علم النفس إلى الطب أحد الحالات الشهيرة حدثت في علم النفس الاجتماعي. في عام 2011، نشر الباحث داريل بيم دراسة زعمت أن البشر يمكنهم التنبؤ بالمستقبل - شكل من أشكال القوى فوق الطبيعية. استخدمت الدراسة تسعة تجارب مختلفة مع اختبارات إحصائية متعددة. عند مراجعتها، وجد أن عدد قليل من الاختبارات أظهرت تأثيرًا دلالة، بينما فشلت باقيها. هذا هو مثال كلاسيكي للتنقيب في البيانات: الإبلاغ فقط عن النتائج التي تدعم الفرضية، مع إخفاء الأخرى. في مجال الطب، حدثت مأساة أكبر. في عام 2004، أظهرت دراسة حول أدوية مضادة للاكتئاب للأطفال أن الشركات الصيدلانية نشرت فقط الدراسات التي أظهرت تأثيرات إيجابية، بينما تم إخفاء الدراسات التي أظهرت عدم وجود تأثير أو آثار ضارة. وبسبب ذلك، تلقى آلاف المراهقين أدوية غير فعالة وخطيرة. أدت هذه الفضيحة إلى إصلاحات في تسجيل التجارب السريرية. كيف يعمل التنقيب في البيانات: آليات الاحتيال عادة ما يتضمن عملية التنقيب في البيانات الخطوات التالية: 1. جمع البيانات دون فرضية محددة : يأخذ الباحثون بيانات كبيرة متوفرة مسبقًا، مثل بيانات التعداد أو سجلات المستشفيات. 2. اختبار العديد من الارتباطات : يختبرون آلاف الأزواج من المتغيرات - على سبيل المثال، هل عدد المظلات المباعة مرتبط بمعدل الجرائم؟ ربما يوجد ارتباط، لكنه لا يعني سببًا ونتيجة . 3. اختيار تلك التي تكون دلالة : تُعلن فقط الارتباطات التي تنتج قيمة p أقل من 0.05، بينما تُهمل الأخرى. 4. تعديل التحليل : أحيانًا يغيرون طريقة جمع البيانات أو تحليلها - على سبيل المثال، إزالة القيم الشاذة، تغيير تعريف المتغير، أو دمج المجموعات - حتى تصبح النتائج دلالة. نتيجة لذلك، ستظهر واحدة من كل 20 اختبارات دلالة عرضية. إذا تم إجراء 20 اختبارًا، سيظهر ناتج كاذب بالتأكيد. ولكن الباحثون غير الصادقين يمكن أن يجريوا 100 أو 1000 اختبار. شخصيات مثيرة للجدل: أنقذوا أم خداعوا؟ من بين الشخصيات النشطة في كشف التنقيب في البيانات هو جون أيوناديس، طبيب وعالم إحصاء. في عام 2005، نشر مقالًا مشهورًا بعنوان "لماذا معظم النتائج المنشورة في البحث هي كاذبة" لماذا معظم نتائج البحث المنشورة هي كاذبة . أظهر أن أكثر من 80% من الدراسات التي زعمت اكتشافات دلالة في الطب لم تتمكن من التكرار. من ناحية أخرى، هناك أيضًا شخصيات اُتهمت بممارسة التنقيب في البيانات. على سبيل المثال، براين وانسنك، أستاذ في جامعة كورنيل، نشر العديد من الدراسات حول علم نفس الأكل. في عام 2018، أظهرت تحقيق أنّه كان غالبًا يبلغ عن نتائج غير متسقة ويقوم بتحليلات غير مناسبة. وأدى ذلك إلى سحب أكثر من 15 مقالة. وراثة مهينة: أزمة التكرار الآن، يواجه العالم العلمي أزمة تكرار. في عام 2015، وجد مشروع التكرار في علم النفس أن فقط 39% من 100 دراسة رئيسية يمكن إنتاجها بنجاح. وفي مجال الأورام، معدل التكرار أقل، حوالي 11%. هذه الأزمة تأتي في الغالب من التنقيب في البيانات. عندما يستخدم الباحثون هذه الممارسة، فإنهم ينتجون اكتشافات تبدو رائعة لكنها في الواقع كاذبة. عندما يحاول الباحثون الآخرون إعادة إنتاج هذه الدراسات، يفشلون. وهذا يهدر موارد كبيرة ويضلل السياسات العامة. الطريق نحو التعافي: الشفافية والتسجيل المسبق للمعالجة، تم تقديم عدة خطوات. أولًا، تسجيل الدراسات مسبقًا: يجب على الباحثين تسجيل فرضياتهم وطرق تحليلهم قبل جمع البيانات. هذا يمنعهم من تغيير التحليل بعد رؤية البيانات. ثانيًا، استخدام التحليلات المجهولة: لا يعرف المحللون مجموعات العلاج والتحكم حتى يكتمل التحليل. ثالثًا، تشجيع الإبلاغ عن جميع الاختبارات، وليس فقط تلك التي تكون دلالة. الآن، تمارس العديد من المجلات العلمية هذه السياسة. على سبيل المثال، مجلة Nature وPLOS ONE تتطلب من الباحثين الإعلان بوضوح ما إذا كانت تحليلاتهم استكشافية أو تأكيدية. هذا يساعد في تمييز الاكتشافات الحقيقية عن نتائج الـ p-hacking. الخاتمة: دروس للجيل القادم التنقيب في البيانات ليس مجرد ممارسة علمية خاطئة؛ بل هو انتهاك أخلاقي أثر على ثقة الجمهور بالعلم. التاريخ يعلّمنا أن الحقيقة لا يمكن تشكيلها حسب رغباتنا. كل مرة نرى فيها دراسة تدعي اكتشافًا مذهلاً، يجب أن نسأل: هل هذا نتيجة تحليل دقيق أم مجرد تنقيب في البيانات المخادع؟ كقارئ ومُستخدم للعلم، يجب أن نكون ذوي حكمة. لا تصدق بسهولة العناوين المثيرة. اطلب الشفافية، التكرار، والصدق. فقط بهذه الطريقة يمكننا ضمان أن المعرفة التي نبنيها قوية، وليس هشة مثل قصور الرمال. --- تم كتابة هذا المقال بناءً على مصادر تاريخية وإحصائية موثوقة. المصادر الرئيسية: Ioannidis 2005 ، Simmons et al. 2011 ، وتقرير مشروع التكرار. --- المراجع: التنقيب في البيانات — ويكيبيديا https://en.wikipedia.org/wiki/Data dredging

Kongsi:💬WhatsApp ✈️Telegram 𝕏X / Twitter 📘Facebook