Este artigo é uma tradução do idioma original.

🧠 Você Sabia

Menggali Data Secara Buta: Sejarah Kelam P-Hacking yang Menyesatkan Sains

Di sebalik tabir penyelidikan, ada amalan haram yang dikenali sebagai data dredging — menyelongkar data tanpa hipotesis jelas sehingga menemui korelasi palsu. Sejarah amalan ini bukan sahaja memalukan, tetapi juga telah melahirkan ribuan kajian palsu.

27 Jun 20264 min de leitura0 visualizaçõesPor Redaksi KhatulistiwaWikipedia — Data dredging

Imagem: Foto: Wikipedia — Data dredging (CC BY-SA 4.0)

Zaman Keemasan Statistik: Kelahiran Godaan Data Dredging

Pada awal abad ke-20, revolusi statistik mengubah cara manusia memahami dunia. Sir Ronald Fisher, bapa statistik moden, memperkenalkan konsep ujian signifikan dan nilai p pada tahun 1925. Idenya sederhana: jika kebarangkalian suatu keputusan berlaku secara kebetulan sangat kecil (biasanya di bawah 0.05), maka keputusan itu dianggap signifikan secara statistik. Namun, Fisher sendiri memberi amaran bahawa ujian ini hanya sah jika hipotesis ditetapkan sebelum data dikumpul. Malangnya, amaran ini sering diabaikan.

Pada era 1950-an dan 1960-an, komputer mula digunakan dalam analisis data. Dengan keupayaan menguji beribu-ribu hubungan dalam sekelip mata, penyelidik terjebak dalam "p-hacking" — mengulang ujian sehingga menemui nilai p yang signifikan. Pakar statistik John Tukey pada tahun 1962 menyebut fenomena ini sebagai "data snooping" dan memberi amaran bahawa ia meningkatkan risiko positif palsu secara drastik.

Skandal Terbesar: Dari Psikologi Hingga Perubatan

Salah satu kes paling terkenal berlaku dalam psikologi sosial. Pada tahun 2011, penyelidik Daryl Bem menerbitkan kajian yang mendakwa manusia boleh meramal masa depan — satu bentuk psikik. Kajian itu menggunakan sembilan eksperimen dengan pelbagai ujian statistik. Apabila disemak, didapati bahawa hanya segelintir ujian menunjukkan kesan signifikan, manakala selebihnya gagal. Ini adalah contoh klasik data dredging: melaporkan hanya hasil yang menyokong hipotesis, sambil menyembunyikan yang lain.

Dalam bidang perubatan, tragedi lebih besar berlaku. Pada tahun 2004, kajian mengenai ubat antidepresan untuk remaja mendedahkan bahawa syarikat farmaseutikal hanya menerbitkan kajian yang menunjukkan kesan positif, sementara kajian yang menunjukkan tiada kesan atau kesan berbahaya disembunyikan. Akibatnya, ribuan remaja diberi ubat yang tidak berkesan dan berbahaya. Skandal ini membawa kepada reformasi pendaftaran percubaan klinikal.

Bagaimana Data Dredging Berfungsi: Mekanisma Penipuan

Proses data dredging biasanya melibatkan langkah-langkah berikut:

Mengumpul data tanpa hipotesis khusus: Penyelidik mengambil dataset besar yang sedia ada, seperti data banci atau rekod hospital.
Menguji banyak korelasi: Mereka menguji ribuan pasangan pemboleh ubah — misalnya, adakah bilangan payung yang dijual berkorelasi dengan kadar jenayah? (Mungkin ada korelasi, tetapi tidak bermakna sebab akibat).
Memilih yang signifikan: Hanya korelasi yang menghasilkan nilai p di bawah 0.05 dilaporkan, manakala yang lain diabaikan.
Melaraskan analisis: Kadang-kadang mereka menukar cara data dikumpulkan atau dianalisis — contohnya, menggugurkan outlier, menukar definisi pemboleh ubah, atau menggabungkan kumpulan — sehingga keputusan menjadi signifikan.

Akibatnya, satu daripada 20 ujian akan menunjukkan signifikan secara kebetulan. Jika 20 ujian dijalankan, satu hasil palsu pasti muncul. Tetapi penyelidik yang tidak jujur boleh melakukan 100 atau 1,000 ujian.

Tokoh Kontroversi: Penyelamat atau Penipu?

Antara tokoh yang aktif membongkar data dredging ialah John Ioannidis, seorang doktor dan pakar statistik. Pada tahun 2005, beliau menerbitkan artikel terkenal "Why Most Published Research Findings Are False" (Kenapa Kebanyakan Penemuan Penyelidikan yang Diterbitkan Adalah Palsu). Beliau menunjukkan bahawa dalam bidang perubatan, lebih daripada 80% kajian yang mendakwa penemuan signifikan tidak dapat direplikasi.

Di sisi lain, ada juga tokoh yang dituduh mengamalkan data dredging. Contohnya, Brian Wansink, profesor di Universiti Cornell, menerbitkan banyak kajian mengenai psikologi pemakanan. Pada tahun 2018, siasatan mendapati bahawa beliau sering melaporkan hasil yang tidak konsisten dan melakukan analisis yang tidak wajar. Akibatnya, beliau terpaksa menarik balik lebih 15 artikel.

Warisan Memalukan: Krisis Replikasi

Kini, dunia sains sedang bergelut dengan krisis replikasi. Pada tahun 2015, Projek Reproducibility dalam psikologi mendapati bahawa hanya 39% daripada 100 kajian utama dapat dihasilkan semula dengan berjaya. Dalam bidang onkologi, kadar replikasi lebih rendah, sekitar 11%.

Krisis ini sebahagian besarnya berpunca daripada data dredging. Apabila penyelidik menggunakan amalan ini, mereka menghasilkan penemuan yang kelihatan hebat tetapi sebenarnya palsu. Apabila penyelidik lain cuba mengulangi kajian tersebut, mereka gagal. Ini membazirkan sumber yang besar dan mengelirukan dasar awam.

Jalan Menuju Pemulihan: Transparansi dan Pra-Registrasi

Untuk menangani masalah ini, pelbagai langkah diperkenalkan. Pertama, pra-registrasi kajian: penyelidik mesti mendaftarkan hipotesis dan kaedah analisis mereka sebelum data dikumpul. Ini menghalang mereka daripada mengubah analisis setelah melihat data. Kedua, penggunaan analisis buta: penganalisis tidak tahu kumpulan rawatan dan kawalan sehingga analisis selesai. Ketiga, galakan untuk melaporkan semua ujian, bukan hanya yang signifikan.

Kini, banyak jurnal saintifik mengamalkan dasar ini. Contohnya, jurnal Nature dan PLOS ONE memerlukan penyelidik menyatakan dengan jelas sama ada analisis mereka bersifat eksploratif atau konfirmatif. Ini membantu membezakan antara penemuan sebenar dan hasil p-hacking.

Kesimpulan: Pengajaran untuk Generasi Akan Datang

Data dredging bukan sekadar amalan saintifik yang salah; ia adalah pencabulan etika yang telah menjejaskan kepercayaan awam terhadap sains. Sejarah mengajar kita bahawa kebenaran tidak boleh ditempa mengikut kehendak hati. Setiap kali kita melihat kajian yang mendakwa penemuan menakjubkan, kita harus bertanya: adakah ini hasil daripada analisis yang teliti atau sekadar data dredging yang licik?

Sebagai pembaca dan pengguna sains, kita mesti bijak. Jangan mudah percaya dengan tajuk sensasi. Tuntut transparansi, replikasi, dan kejujuran. Hanya dengan cara ini kita dapat memastikan bahawa pengetahuan yang kita bina adalah kukuh, bukan rapuh seperti istana pasir.

Disponível em:

BM AR EN ES ID PT

Menggali Data Secara Buta: Sejarah Kelam P-Hacking yang Menyesatkan Sains. Di sebalik tabir penyelidikan, ada amalan haram yang dikenali sebagai data dredging — menyelongkar data tanpa hipotesis jelas sehingga menemui korelasi palsu. Sejarah amalan ini bukan sahaja memalukan, tetapi juga telah melahirkan ribuan kajian palsu.. Zaman Keemasan Statistik: Kelahiran Godaan Data Dredging Pada awal abad ke-20, revolusi statistik mengubah cara manusia memahami dunia. Sir Ronald Fisher, bapa statistik moden, memperkenalkan konsep ujian signifikan dan nilai p pada tahun 1925. Idenya sederhana: jika kebarangkalian suatu keputusan berlaku secara kebetulan sangat kecil biasanya di bawah 0.05 , maka keputusan itu dianggap signifikan secara statistik. Namun, Fisher sendiri memberi amaran bahawa ujian ini hanya sah jika hipotesis ditetapkan sebelum data dikumpul. Malangnya, amaran ini sering diabaikan. Pada era 1950-an dan 1960-an, komputer mula digunakan dalam analisis data. Dengan keupayaan menguji beribu-ribu hubungan dalam sekelip mata, penyelidik terjebak dalam "p-hacking" — mengulang ujian sehingga menemui nilai p yang signifikan. Pakar statistik John Tukey pada tahun 1962 menyebut fenomena ini sebagai "data snooping" dan memberi amaran bahawa ia meningkatkan risiko positif palsu secara drastik. Skandal Terbesar: Dari Psikologi Hingga Perubatan Salah satu kes paling terkenal berlaku dalam psikologi sosial. Pada tahun 2011, penyelidik Daryl Bem menerbitkan kajian yang mendakwa manusia boleh meramal masa depan — satu bentuk psikik. Kajian itu menggunakan sembilan eksperimen dengan pelbagai ujian statistik. Apabila disemak, didapati bahawa hanya segelintir ujian menunjukkan kesan signifikan, manakala selebihnya gagal. Ini adalah contoh klasik data dredging: melaporkan hanya hasil yang menyokong hipotesis, sambil menyembunyikan yang lain. Dalam bidang perubatan, tragedi lebih besar berlaku. Pada tahun 2004, kajian mengenai ubat antidepresan untuk remaja mendedahkan bahawa syarikat farmaseutikal hanya menerbitkan kajian yang menunjukkan kesan positif, sementara kajian yang menunjukkan tiada kesan atau kesan berbahaya disembunyikan. Akibatnya, ribuan remaja diberi ubat yang tidak berkesan dan berbahaya. Skandal ini membawa kepada reformasi pendaftaran percubaan klinikal. Bagaimana Data Dredging Berfungsi: Mekanisma Penipuan Proses data dredging biasanya melibatkan langkah-langkah berikut: 1. Mengumpul data tanpa hipotesis khusus : Penyelidik mengambil dataset besar yang sedia ada, seperti data banci atau rekod hospital. 2. Menguji banyak korelasi : Mereka menguji ribuan pasangan pemboleh ubah — misalnya, adakah bilangan payung yang dijual berkorelasi dengan kadar jenayah? Mungkin ada korelasi, tetapi tidak bermakna sebab akibat . 3. Memilih yang signifikan : Hanya korelasi yang menghasilkan nilai p di bawah 0.05 dilaporkan, manakala yang lain diabaikan. 4. Melaraskan analisis : Kadang-kadang mereka menukar cara data dikumpulkan atau dianalisis — contohnya, menggugurkan outlier, menukar definisi pemboleh ubah, atau menggabungkan kumpulan — sehingga keputusan menjadi signifikan. Akibatnya, satu daripada 20 ujian akan menunjukkan signifikan secara kebetulan. Jika 20 ujian dijalankan, satu hasil palsu pasti muncul. Tetapi penyelidik yang tidak jujur boleh melakukan 100 atau 1,000 ujian. Tokoh Kontroversi: Penyelamat atau Penipu? Antara tokoh yang aktif membongkar data dredging ialah John Ioannidis, seorang doktor dan pakar statistik. Pada tahun 2005, beliau menerbitkan artikel terkenal "Why Most Published Research Findings Are False" Kenapa Kebanyakan Penemuan Penyelidikan yang Diterbitkan Adalah Palsu . Beliau menunjukkan bahawa dalam bidang perubatan, lebih daripada 80% kajian yang mendakwa penemuan signifikan tidak dapat direplikasi. Di sisi lain, ada juga tokoh yang dituduh mengamalkan data dredging. Contohnya, Brian Wansink, profesor di Universiti Cornell, menerbitkan banyak kajian mengenai psikologi pemakanan. Pada tahun 2018, siasatan mendapati bahawa beliau sering melaporkan hasil yang tidak konsisten dan melakukan analisis yang tidak wajar. Akibatnya, beliau terpaksa menarik balik lebih 15 artikel. Warisan Memalukan: Krisis Replikasi Kini, dunia sains sedang bergelut dengan krisis replikasi. Pada tahun 2015, Projek Reproducibility dalam psikologi mendapati bahawa hanya 39% daripada 100 kajian utama dapat dihasilkan semula dengan berjaya. Dalam bidang onkologi, kadar replikasi lebih rendah, sekitar 11%. Krisis ini sebahagian besarnya berpunca daripada data dredging. Apabila penyelidik menggunakan amalan ini, mereka menghasilkan penemuan yang kelihatan hebat tetapi sebenarnya palsu. Apabila penyelidik lain cuba mengulangi kajian tersebut, mereka gagal. Ini membazirkan sumber yang besar dan mengelirukan dasar awam. Jalan Menuju Pemulihan: Transparansi dan Pra-Registrasi Untuk menangani masalah ini, pelbagai langkah diperkenalkan. Pertama, pra-registrasi kajian: penyelidik mesti mendaftarkan hipotesis dan kaedah analisis mereka sebelum data dikumpul. Ini menghalang mereka daripada mengubah analisis setelah melihat data. Kedua, penggunaan analisis buta: penganalisis tidak tahu kumpulan rawatan dan kawalan sehingga analisis selesai. Ketiga, galakan untuk melaporkan semua ujian, bukan hanya yang signifikan. Kini, banyak jurnal saintifik mengamalkan dasar ini. Contohnya, jurnal Nature dan PLOS ONE memerlukan penyelidik menyatakan dengan jelas sama ada analisis mereka bersifat eksploratif atau konfirmatif. Ini membantu membezakan antara penemuan sebenar dan hasil p-hacking. Kesimpulan: Pengajaran untuk Generasi Akan Datang Data dredging bukan sekadar amalan saintifik yang salah; ia adalah pencabulan etika yang telah menjejaskan kepercayaan awam terhadap sains. Sejarah mengajar kita bahawa kebenaran tidak boleh ditempa mengikut kehendak hati. Setiap kali kita melihat kajian yang mendakwa penemuan menakjubkan, kita harus bertanya: adakah ini hasil daripada analisis yang teliti atau sekadar data dredging yang licik? Sebagai pembaca dan pengguna sains, kita mesti bijak. Jangan mudah percaya dengan tajuk sensasi. Tuntut transparansi, replikasi, dan kejujuran. Hanya dengan cara ini kita dapat memastikan bahawa pengetahuan yang kita bina adalah kukuh, bukan rapuh seperti istana pasir.

Kongsi:💬WhatsApp ✈️Telegram 𝕏X / Twitter 📘Facebook