Artikel ini adalah terjemahan dari bahasa asal.

🧠 Tahukah Kamu

Menggali Data Secara Buta: Sejarah Kelam P-Hacking yang Menyesatkan Sains

Di balik layar penelitian, ada praktik ilegal yang dikenal sebagai data dredging — menelusuri data tanpa hipotesis jelas hingga menemukan korelasi palsu. Sejarah praktik ini tidak hanya memalukan, tetapi juga telah melahirkan ribuan penelitian palsu. Artikel ini membahas asal-usul, tokoh-tokoh kontroversial, dan dampak buruknya terhadap dunia ilmiah.

27 Jun 20265 minit baca0 tontonanOleh Redaksi KhatulistiwaWikipedia — Data dredging

Imej: Foto: Wikipedia — Data dredging (CC BY-SA 4.0)

Zaman Keemasan Statistik: Kelahiran Godaan Data Dredging

Pada awal abad ke-20, revolusi statistik mengubah cara manusia memahami dunia. Sir Ronald Fisher, bapak statistik modern, memperkenalkan konsep uji signifikansi dan nilai p pada tahun 1925. Ide sederhananya: jika kemungkinan suatu hasil terjadi secara kebetulan sangat kecil (biasanya di bawah 0.05), maka hasil tersebut dianggap signifikan secara statistik. Namun, Fisher sendiri memberi peringatan bahwa uji ini hanya sah jika hipotesis ditetapkan sebelum data dikumpulkan. Sayangnya, peringatan ini sering diabaikan.

Pada era 1950-an dan 1960-an, komputer mulai digunakan dalam analisis data. Dengan kemampuan untuk menguji ribuan hubungan dalam sekejap, para peneliti terjebak dalam "p-hacking" — mengulang uji sampai mendapatkan nilai p yang signifikan. Pakar statistik John Tukey pada tahun 1962 menyebut fenomena ini sebagai "data snooping" dan memberi peringatan bahwa hal ini meningkatkan risiko kesalahan positif secara drastis.

Skandal Terbesar: Dari Psikologi Hingga Kedokteran

Salah satu kasus paling terkenal terjadi dalam psikologi sosial. Pada tahun 2011, peneliti Daryl Bem menerbitkan studi yang mengklaim manusia bisa meramal masa depan — bentuk psikik. Studi itu menggunakan sembilan eksperimen dengan berbagai uji statistik. Setelah diverifikasi, ditemukan bahwa hanya sedikit uji menunjukkan efek signifikan, sementara sisanya gagal. Ini adalah contoh klasik data dredging: melaporkan hanya hasil yang mendukung hipotesis, sambil menyembunyikan yang lain.

Dalam bidang kedokteran, tragedi lebih besar terjadi. Pada tahun 2004, studi tentang obat antidepresan untuk remaja mengungkap bahwa perusahaan farmasi hanya menerbitkan studi yang menunjukkan efek positif, sementara studi yang menunjukkan tidak ada efek atau efek berbahaya disembunyikan. Akibatnya, ribuan remaja diberi obat yang tidak efektif dan berbahaya. Skandal ini memicu reformasi pendaftaran uji klinis.

Bagaimana Data Dredging Bekerja: Mekanisme Penipuan

Proses data dredging biasanya melibatkan langkah-langkah berikut:

Mengumpulkan data tanpa hipotesis khusus: Peneliti mengambil dataset besar yang sudah ada, seperti data sensus atau catatan rumah sakit.
Menguji banyak korelasi: Mereka menguji ribuan pasangan variabel — misalnya, apakah jumlah payung yang terjual berkorelasi dengan tingkat kejahatan? (Bisa ada korelasi, tetapi bukan berarti ada hubungan sebab-akibat).
Memilih yang signifikan: Hanya korelasi yang menghasilkan nilai p di bawah 0.05 dilaporkan, sementara yang lain diabaikan.
Menyesuaikan analisis: Kadang mereka mengubah cara data dikumpulkan atau dianalisis — contohnya, menghilangkan outlier, mengubah definisi variabel, atau menggabungkan kelompok — agar hasil menjadi signifikan.

Akibatnya, satu dari 20 uji akan menunjukkan signifikan secara kebetulan. Jika 20 uji dilakukan, satu hasil palsu pasti muncul. Tapi peneliti yang tidak jujur bisa melakukan 100 atau 1.000 uji.

Tokoh Kontroversi: Penyelamat atau Penipu?

Antara tokoh yang aktif mengungkap data dredging adalah John Ioannidis, seorang dokter dan ahli statistik. Pada tahun 2005, ia menerbitkan artikel terkenal "Why Most Published Research Findings Are False" (Kenapa Kebanyakan Temuan Penelitian yang Diterbitkan Adalah Palsu). Ia menunjukkan bahwa dalam bidang kedokteran, lebih dari 80% penelitian yang mengklaim temuan signifikan tidak dapat direplikasi.

Di sisi lain, ada juga tokoh yang dituduh melakukan data dredging. Contohnya, Brian Wansink, profesor di Universitas Cornell, menerbitkan banyak penelitian tentang psikologi makanan. Pada tahun 2018, penyelidikan menemukan bahwa ia sering melaporkan hasil yang tidak konsisten dan melakukan analisis yang tidak wajar. Akibatnya, ia harus menarik kembali lebih dari 15 artikel.

Warisan Memalukan: Krisis Replikasi

Sekarang, dunia sains sedang menghadapi krisis replikasi. Pada tahun 2015, Proyek Reproducibility dalam psikologi menemukan bahwa hanya 39% dari 100 penelitian utama dapat direproduksi dengan sukses. Dalam bidang onkologi, tingkat replikasi lebih rendah, sekitar 11%.

Krisis ini sebagian besar disebabkan oleh data dredging. Ketika peneliti menggunakan praktik ini, mereka menghasilkan temuan yang tampak hebat tetapi sebenarnya palsu. Ketika peneliti lain mencoba mereplikasi penelitian tersebut, mereka gagal. Hal ini membuang sumber daya yang besar dan membingungkan kebijakan publik.

Jalan Menuju Pemulihan: Transparansi dan Pra-Registrasi

Untuk mengatasi masalah ini, berbagai langkah diperkenalkan. Pertama, pra-registrasi penelitian: peneliti harus mendaftarkan hipotesis dan metode analisis mereka sebelum mengumpulkan data. Ini mencegah mereka mengubah analisis setelah melihat data. Kedua, penggunaan analisis buta: analis tidak tahu kelompok perlakuan dan kontrol hingga analisis selesai. Ketiga, dorongan untuk melaporkan semua uji, bukan hanya yang signifikan.

Sekarang, banyak jurnal ilmiah menerapkan kebijakan ini. Contohnya, jurnal Nature dan PLOS ONE meminta peneliti menyatakan dengan jelas apakah analisis mereka bersifat eksploratif atau konfirmatif. Ini membantu membedakan antara temuan nyata dan hasil p-hacking.

Kesimpulan: Pelajaran untuk Generasi Mendatang

Data dredging bukan hanya praktik ilmiah yang salah; itu adalah pelanggaran etika yang telah merusak kepercayaan publik terhadap sains. Sejarah mengajarkan kita bahwa kebenaran tidak boleh dibentuk sesuai keinginan hati. Setiap kali kita melihat penelitian yang mengklaim temuan luar biasa, kita harus bertanya: apakah ini hasil dari analisis yang teliti atau sekadar data dredging yang licik?

Sebagai pembaca dan pengguna sains, kita harus cerdas. Jangan mudah percaya pada judul sensasional. Minta transparansi, replikasi, dan kejujuran. Hanya dengan cara ini kita dapat memastikan bahwa pengetahuan yang kita bangun kuat, bukan rapuh seperti istana pasir.

---
Artikel ini ditulis berdasarkan sumber sejarah dan statistik yang valid. Rujukan utama: Ioannidis (2005), Simmons et al. (2011), dan laporan Proyek Reproducibility.

---
Rujukan: Data dredging — Wikipedia

Tersedia dalam:

BM AR EN ES ID PT

Menggali Data Secara Buta: Sejarah Kelam P-Hacking yang Menyesatkan Sains. Di balik layar penelitian, ada praktik ilegal yang dikenal sebagai data dredging — menelusuri data tanpa hipotesis jelas hingga menemukan korelasi palsu. Sejarah praktik ini tidak hanya memalukan, tetapi juga telah melahirkan ribuan penelitian palsu. Artikel ini membahas asal-usul, tokoh-tokoh kontroversial, dan dampak buruknya terhadap dunia ilmiah.. Zaman Keemasan Statistik: Kelahiran Godaan Data Dredging Pada awal abad ke-20, revolusi statistik mengubah cara manusia memahami dunia. Sir Ronald Fisher, bapak statistik modern, memperkenalkan konsep uji signifikansi dan nilai p pada tahun 1925. Ide sederhananya: jika kemungkinan suatu hasil terjadi secara kebetulan sangat kecil biasanya di bawah 0.05 , maka hasil tersebut dianggap signifikan secara statistik. Namun, Fisher sendiri memberi peringatan bahwa uji ini hanya sah jika hipotesis ditetapkan sebelum data dikumpulkan. Sayangnya, peringatan ini sering diabaikan. Pada era 1950-an dan 1960-an, komputer mulai digunakan dalam analisis data. Dengan kemampuan untuk menguji ribuan hubungan dalam sekejap, para peneliti terjebak dalam "p-hacking" — mengulang uji sampai mendapatkan nilai p yang signifikan. Pakar statistik John Tukey pada tahun 1962 menyebut fenomena ini sebagai "data snooping" dan memberi peringatan bahwa hal ini meningkatkan risiko kesalahan positif secara drastis. Skandal Terbesar: Dari Psikologi Hingga Kedokteran Salah satu kasus paling terkenal terjadi dalam psikologi sosial. Pada tahun 2011, peneliti Daryl Bem menerbitkan studi yang mengklaim manusia bisa meramal masa depan — bentuk psikik. Studi itu menggunakan sembilan eksperimen dengan berbagai uji statistik. Setelah diverifikasi, ditemukan bahwa hanya sedikit uji menunjukkan efek signifikan, sementara sisanya gagal. Ini adalah contoh klasik data dredging: melaporkan hanya hasil yang mendukung hipotesis, sambil menyembunyikan yang lain. Dalam bidang kedokteran, tragedi lebih besar terjadi. Pada tahun 2004, studi tentang obat antidepresan untuk remaja mengungkap bahwa perusahaan farmasi hanya menerbitkan studi yang menunjukkan efek positif, sementara studi yang menunjukkan tidak ada efek atau efek berbahaya disembunyikan. Akibatnya, ribuan remaja diberi obat yang tidak efektif dan berbahaya. Skandal ini memicu reformasi pendaftaran uji klinis. Bagaimana Data Dredging Bekerja: Mekanisme Penipuan Proses data dredging biasanya melibatkan langkah-langkah berikut: 1. Mengumpulkan data tanpa hipotesis khusus : Peneliti mengambil dataset besar yang sudah ada, seperti data sensus atau catatan rumah sakit. 2. Menguji banyak korelasi : Mereka menguji ribuan pasangan variabel — misalnya, apakah jumlah payung yang terjual berkorelasi dengan tingkat kejahatan? Bisa ada korelasi, tetapi bukan berarti ada hubungan sebab-akibat . 3. Memilih yang signifikan : Hanya korelasi yang menghasilkan nilai p di bawah 0.05 dilaporkan, sementara yang lain diabaikan. 4. Menyesuaikan analisis : Kadang mereka mengubah cara data dikumpulkan atau dianalisis — contohnya, menghilangkan outlier, mengubah definisi variabel, atau menggabungkan kelompok — agar hasil menjadi signifikan. Akibatnya, satu dari 20 uji akan menunjukkan signifikan secara kebetulan. Jika 20 uji dilakukan, satu hasil palsu pasti muncul. Tapi peneliti yang tidak jujur bisa melakukan 100 atau 1.000 uji. Tokoh Kontroversi: Penyelamat atau Penipu? Antara tokoh yang aktif mengungkap data dredging adalah John Ioannidis, seorang dokter dan ahli statistik. Pada tahun 2005, ia menerbitkan artikel terkenal "Why Most Published Research Findings Are False" Kenapa Kebanyakan Temuan Penelitian yang Diterbitkan Adalah Palsu . Ia menunjukkan bahwa dalam bidang kedokteran, lebih dari 80% penelitian yang mengklaim temuan signifikan tidak dapat direplikasi. Di sisi lain, ada juga tokoh yang dituduh melakukan data dredging. Contohnya, Brian Wansink, profesor di Universitas Cornell, menerbitkan banyak penelitian tentang psikologi makanan. Pada tahun 2018, penyelidikan menemukan bahwa ia sering melaporkan hasil yang tidak konsisten dan melakukan analisis yang tidak wajar. Akibatnya, ia harus menarik kembali lebih dari 15 artikel. Warisan Memalukan: Krisis Replikasi Sekarang, dunia sains sedang menghadapi krisis replikasi. Pada tahun 2015, Proyek Reproducibility dalam psikologi menemukan bahwa hanya 39% dari 100 penelitian utama dapat direproduksi dengan sukses. Dalam bidang onkologi, tingkat replikasi lebih rendah, sekitar 11%. Krisis ini sebagian besar disebabkan oleh data dredging. Ketika peneliti menggunakan praktik ini, mereka menghasilkan temuan yang tampak hebat tetapi sebenarnya palsu. Ketika peneliti lain mencoba mereplikasi penelitian tersebut, mereka gagal. Hal ini membuang sumber daya yang besar dan membingungkan kebijakan publik. Jalan Menuju Pemulihan: Transparansi dan Pra-Registrasi Untuk mengatasi masalah ini, berbagai langkah diperkenalkan. Pertama, pra-registrasi penelitian: peneliti harus mendaftarkan hipotesis dan metode analisis mereka sebelum mengumpulkan data. Ini mencegah mereka mengubah analisis setelah melihat data. Kedua, penggunaan analisis buta: analis tidak tahu kelompok perlakuan dan kontrol hingga analisis selesai. Ketiga, dorongan untuk melaporkan semua uji, bukan hanya yang signifikan. Sekarang, banyak jurnal ilmiah menerapkan kebijakan ini. Contohnya, jurnal Nature dan PLOS ONE meminta peneliti menyatakan dengan jelas apakah analisis mereka bersifat eksploratif atau konfirmatif. Ini membantu membedakan antara temuan nyata dan hasil p-hacking. Kesimpulan: Pelajaran untuk Generasi Mendatang Data dredging bukan hanya praktik ilmiah yang salah; itu adalah pelanggaran etika yang telah merusak kepercayaan publik terhadap sains. Sejarah mengajarkan kita bahwa kebenaran tidak boleh dibentuk sesuai keinginan hati. Setiap kali kita melihat penelitian yang mengklaim temuan luar biasa, kita harus bertanya: apakah ini hasil dari analisis yang teliti atau sekadar data dredging yang licik? Sebagai pembaca dan pengguna sains, kita harus cerdas. Jangan mudah percaya pada judul sensasional. Minta transparansi, replikasi, dan kejujuran. Hanya dengan cara ini kita dapat memastikan bahwa pengetahuan yang kita bangun kuat, bukan rapuh seperti istana pasir. --- Artikel ini ditulis berdasarkan sumber sejarah dan statistik yang valid. Rujukan utama: Ioannidis 2005 , Simmons et al. 2011 , dan laporan Proyek Reproducibility. --- Rujukan: Data dredging — Wikipedia https://en.wikipedia.org/wiki/Data dredging

Kongsi:💬WhatsApp ✈️Telegram 𝕏X / Twitter 📘Facebook