Demikian pula dari
informasi 'keinginan mengonsumsi makanan berkuah panas' dengan informasi 'waktu
mengonsumsinya' di jam 11-12 dini hari, terdapat keterkaitan, walaupun tak
langsung. Tambahan informasi 'suhu udara terdingin saat terjaga', menjelaskan
adanya keterkaitan sosialnya. Suhu udara terdingin, jadi penyebab dikonsumsinya
makanan hangat.
Keterkaitan-keterkaitan
alamiah maupun sosial antar peristiwa nyata itu, disebut relasi positif.
Seluruhnya jadi pembentuk pengetahuan yang dapat diterima.
Sedangkan pada informasi 'adanya kebun binatang', dengan informasi 'rendahnya
kriminalitas' di sebuah kota, tak mudah ditemukan kaitan alamiah maupun
sosialnya.
Adanya penelusuran
lebih lanjut, baru diketahui: adanya kebun binatang menyiratkan pendapatan
penduduknya yang lebih tinggi, dibanding kota lain.
Lebih tingginya ini,
menyebabkan pergeseran pemenuhan kebutuhan dari primer ke sekunder. Bahkan ke
tingkat berikutnya. Kota dengan kebun binatang, lebih sejahtera. Warganya dapat
memenuhi kebutuhan pokoknya, hingga kebutuhan hiburan. Niat bertindak kriminal
tereliminasi, terbaca sebagai rendahnya tingkat kriminalitas.
Namun tak jarang juga,
pada keadaan semacam di atas, benar-benar tak ada kaitan sebab-akibatnya.
Informasi berfrekuensi statistik tinggi belaka. Terlebih ketika pada kota yang
tak ada kebun binatangnya, kriminalitas juga rendah. Kesejahteraan ekonomi
memang jadi penyebab rendahnya kriminalistas. Namun rendahnya kesejahteraan
ekonomi, bukan prediktor tingginya kriminalitas.
Aneka relasi positif
semacam ilustrasi di atas, menarik perhatian pengembang ilmu pengetahuan. Salah
satunya filsuf terkemuka Perancis, Isidore Auguste Marie François Xavier Comte.
Ia lebih dikenal sebagai August Comte. Hidup pada tahun 1798-1857.
Penyelidikannya
berkembang sebagai Filsafat Positivisme, yang mendasari kelahiran Sosiologi
modern.
Menurut Filsafat
Positivisme, suatu pernyataan diterima sebagai pengetahuan, jika data dan
informasinya bersumber dari pengalaman panca indera. Ini disebut pengalaman
empiris. Aneka pengalaman empiris yang dihubungkan secara positif, juga
menghasilkan pengetahuan. Pernyataan intuisi, keyakinan, maupun spekulasi yang
dihasilkan para filsuf awal, ~kecuali jika disusun dari fenomena yang dapat
diamati, diukur dan dibuktikan secara obyektif~ tak diterima sebagai
pengetahuan. Karenanya, pernyataan abstrak-metafisis bukan hasil sensasi
inderawi, ditolak.
Hari ini saat big data
berkembang intensif, kemampuan memperlakukan data turut meningkat. Kriteria
volume, velocity, variety, veracity, viability dan value data, dapat diproses
dan tuntas dianalisa. Hasilnya, pengetahuan dari keterkaitan-keterkaitan yang
semula tak dikenali. Bahkan di antaranya merupakan keterkaitan yang ganjil.
Contohnya, kebiasaan menggigit kuku dengan tingginya tingkat kecerdasan. Atau
kebiasaan sulit membuang barang bekas, dengan depresi yang dialami seseorang.
Keterkaitan antar
informasi itu, bisa jadi akibat belum tersedianya data. Dengan adanya analisa
big data, terbuka sumber pengetahuan baru. Namun bisa juga, data hanya
mengantarkan pada keterkaitan palsu. Keadaan ini sering jadi fenomena, yang
menjangkiti "positivisme digital".
Pada "From Digital
Positivism and Administrative Big Data Analytics Towards Critical Digital and
Social Media Research!", Christian Fuchs, 2017, menyebutkan positivisme
digital, sebagai implikasi mengemukanya analisa big data seiring perkembangan
dan pemanfaatan teknologi digital. Paradigma positivisme menempati cara pandang
utama, kajian media digital maupun fenomena sosial.
Paradigma ini menyebut,
pengetahuan dapat berkembang obyektif dan tanpa bias selama berpijak pada
asal-usul data yang diperoleh dari observasi empiris maupun pencarian kebenaran
universal. Seluruhnya konsisten dengan Filsafat Positivisme. Positivisme
digital merupakan kelanjutan positvisme tradisional, di dunia digital.
Analisa big data
berparadigma positivisme, beroperasi mengikuti kaidah statistik dan
komputasional dalam memahami realitas. Jeffrey Richman, 2023, dalam "Big
Data Analytics: What It Is, How It Works, & Examples" menyebut
urut-urutan kerjanya. Umumnya melalui 5 tahap. Dimulai dari pengumpulan data,
penyimpanan data, pemrosesan data, analisa data, hingga diperolehnya hasil
berupa pola dan keteraturan.
Organisasi mengumpulkan
data dari berbagai sumber, seperti media sosial, website, aplikasi maupun
perangkat sensor dalam menangkap suatu fenomena. Data disimpan dalam gudang
data, untuk dianalisa. Dari analisa ini, fenomena yang semula tampak acak jadi
terlihat polanya. Juga keterkaitannya.
Jika dikaitkan dengan
tuntutan data yang empiris dan obyektif, analisa big data bersumber data
obyektif dari peristiwa yang nyata. Dikumpulkan saat sumber data dalam
kesadaran praktis. Data yang diberikan dalam kesadaran praktis, didasari
kebiasaan spontan yang alamiah. Misalnya saat mengomentari konten sosial media
pengguna lain, perilaku menggunggah ulang konten yang menarik, karya kreatif
meme dalam menanggapi suatu kejadian. Juga penentuan pilihan warna produk
maupun jenis kuliner, saat berbelanja.
Memberikan data dalam
kesadaran praktis, berbeda keadaannya dengan perilaku yang sama dalam kesadaran
diskursif. Dalam kesadaran diskurif, sumber data terlebih dahulu berdiskusi
dengan dirinya sendiri. Dipertimbangkan konsekuensi atas data yang diberikannya.
Jika berakibat baik akan dilanjutkan. Jika sebaliknya, akan diubah sebagai
pernyataan lain. Memang seluruhnya merupakan tindakan yang rasional, namun tak
merepresentasikan keadaan apa adanya. Ini sering jadi kelemahan pengumpulan
data secara tradisonal, lewat survey. Jawaban telah disesuaikan.
Pada pengumpulan untuk
analisa big data terpenuhi persyaratan empiris dan obyektif. Analisa dengan
cara ini dianggap terbaik, dalam memahami fenomena alamiah maupun sosial.
Demikian pula ketika proses analisanya, yang bertumpu pada sistem yang telah
diprogram. Pengungkapan realitasnya mengikuti kaidah statistik dan
komputasional. Ini memberikan hasil yang terbebas dari tafsir manusia, yang
sering mengandung bias. Hasil analisa big data memenuhi tuntutan obyektivitas.
Positivisme digital,
tampaknya mampu memberikan alternatif cara memahami realitas alamiah maupun
sosial. Juga menghasilkan pengetahuan baru, yang semula bersembunyi di balik
keterbatasan data. Keterkaitan antara kebiasaan menggigit kuku dengan kecerdasan
seseorang tersingkap oleh data: orang yang cerdas adalah individu pembosan.
Kecerdasannya menyebabkan mampu memahami kaitan antar fenomena, dengan cepat.
Tanpa permasalahan baru yang menantang kecerdasannya, hanya bosan yang dialami.
Menggigit kuku jadi pengalih kebosanan.
Hari ini, saat analisa
big data diikuti pengembangan yang berbasis artificial intelligence (AI),
apakah ketakterandalan analisa makin terpenuh? Tampaknya muncul tantangan baru.
Fuchs melanjutkan dalam tulisannya di atas: positivisme digital bergeser jadi
masalah, ketika big data maupun pengukuran digital secara membabi buta
diandalkan sebagai satu-satunya sumber kebenaran. Fenomena sosial yang sumber
datanya adalah perilaku manusia, diabaikan kompleksitasnya. Demikian pula konteks
sosial yang sering luput dari perhatian. Seluruhnya ini diikuti adanya potensi
bias data yang memandu pada melesetnya hasil analisa.
Mengandalkan analisa
dengan kelemahan-kelemahan di atas, dapat mengantar pada ketersesatan memahami
realitas. Tak mustahil pula jadi keputusan yang mengakibatkan diskriminasi
sosial maupun kerugian ekonomi. Seluruhnya akibat terabaikannya kompleksitas
relasi maupun konteks peristiwa. Membicarakan kriminalitas di Texas misalnya,
hampir pasti pelakunya adalah individu berkulit hitam. Ini lantaran Texas
adalah negara bagian di Amerika, dengan penduduk berkulit hitam terbanyak.
Demikian pula dengan
penderita kanker otak di Indonesia, hampir seluruhnya adalah pemakan nasi. Ini
karena sebagian besar penduduk Indonesia adalah pemakan nasi.
Namun ketika diajukan
pertanyaan lebih lanjut: mengapa orang kulit hitam sering jadi pelaku utama
kriminalitas?" juga "apakah nasi jadi penyebab kanker otak?"
Mengacu pada data, jawabannya jadi ganjil.
Konteks pengumpulan
data, proses pembentukan keterkaitannya yang kompleks--seluruhnya merupakan
aspek non data--tak dapat diabaikan dalam pembentukan pengetahuan. Di baliknya,
ada realitas yang tak dikenali. Dalam keadaan tak sepenuhnya mengenali,
memaksakan keterkaitannya akibat frekuensi statistiknya yang tinggi, hanya
menghasilkan pengetahuan yang seolah-olah empiris dan obyektif.
Cristian S. Calude dan
Giuseppe Longo, 2016 dalam 'The Deluge of Spurious Correlations in Big Data',
menyebut fenomena di atas sebagai 'korelasi palsu'. Keadaan yang juga dikenal
sebagai spurious correlation. Terjadinya oleh keterkaitan yang ditunjukkan skor
statistik antara dua informasi berfrekuensi tinggi, pada big data.
Sesungguhnya, hubungan antara keduanya tak ada. Korelasi palsu, juga bisa
muncul akibat faktor tersembunyi atau bias. Keterkaitan yang menyesatkan ini
bukan hubungan sebab akibat yang alamiah.
Maka dalam keterbatasan
ini, bukankah wajar jika harus kritis menggunakan big data, bahkan yang
dipercanggih AI? Realitas kompleks yang tersingkap oleh data besar pun,
ternyata bisa palsu.