Trending

#02 Teknik Pengumpulan Data

 4.2 Teknik Pengumpulan Data: Mengapa Tidak Boleh Asal?

Sebelum kita masuk ke teknis, mari kita pahami sebuah prinsip emas dalam KKA: GIGO (Garbage In, Garbage Out). Jika data yang kalian kumpulkan adalah "sampah" (salah, tidak jujur, atau tidak relevan), maka AI yang kalian buat akan menghasilkan keputusan "sampah" juga.

Analogi: Memancing di Kolam yang Tepat

Mencari data itu seperti memancing. Jika kalian ingin menangkap ikan lele, kalian tidak akan pergi ke laut lepas dengan umpan buah apel. Kalian harus tahu:

  • Targetnya siapa? (Jenis ikannya)
  • Umpannya apa? (Pertanyaan atau alatnya)
  • Lokasinya di mana? (Sumber datanya)


4.2.1 Mendesain Kuesioner Digital yang Efektif (Data Primer)

Kuesioner adalah teknik pengumpulan data Primer, artinya kalian mengambil data langsung dari sumbernya (manusia). Di era sekarang, kita menggunakan alat digital seperti Google Forms, Typeform, atau Microsoft Forms.

A. Anatomi Kuesioner yang "Gak Bikin Pusing"

Banyak orang gagal mendapatkan data karena kuesionernya membosankan atau membingungkan. Siswa SMK harus paham bahwa kuesioner adalah percakapan digital.

1. Judul dan Deskripsi yang Jelas

Jangan langsung kasih pertanyaan! Kenalkan diri kalian dan jelaskan untuk apa data ini diambil.

  • Contoh Buruk: "Isi dong buat tugas."
  • Contoh Profesional: "Survei Minat Belajar KKA Siswa Kelas X SMK. Data ini akan digunakan untuk mengembangkan asisten belajar berbasis AI."

2. Pertanyaan Tertutup vs Terbuka

Pertanyaan Tertutup (Data Terstruktur): Pilihan ganda atau skala (1-5). Ini adalah favorit orang KKA karena datanya langsung bisa diolah komputer.

Contoh: 

"Berapa jam Anda belajar koding dalam sehari? (A. 1 jam, B. 2 jam, C. >3 jam)"

Pertanyaan Terbuka (Data Tak Terstruktur): Jawaban panjang (paragraf). Ini kaya akan informasi tapi sulit diolah otomatis tanpa bantuan AI (Natural Language Processing).

Contoh: 

"Ceritakan kesulitan terbesar Anda saat belajar Python."

B. Rahasia Mendesain Kuesioner yang Efektif

Agar responden tidak asal-asalan dalam mengisi, ikuti aturan ini:

  • Gunakan Bahasa yang Relevan: Jika targetnya siswa SMK, jangan gunakan bahasa hukum yang kaku. Gunakan bahasa yang santai tapi sopan.
  • Prinsip Satu Pertanyaan Satu Tujuan: Jangan tanya "Apakah Anda suka koding dan desain?". Jika dia suka koding tapi benci desain, dia bingung mau jawab apa. Pisahkan!
  • Hindari Pertanyaan Menggiring: Jangan tanya "Setujukah Anda bahwa belajar KKA itu keren?". Ini memaksa orang untuk setuju. Tanya saja "Bagaimana pendapat Anda tentang mata pelajaran KKA?".
  • Logika Percabangan (Branching): Ini fitur keren di digital form. Jika responden menjawab "Tidak punya komputer", jangan tanya lagi "Apa merk komputer Anda?". Langsung lompat ke pertanyaan berikutnya.

Analogi: Kuesioner sebagai "Wawancara yang Tertulis"

Bayangkan kalian sedang mewawancarai idola kalian. Kalian tentu tidak akan memberikan 100 pertanyaan sekaligus dalam satu helai kertas yang penuh sesak. Kalian akan bertanya satu-persatu, mulai dari yang ringan, baru ke yang mendalam. Kuesioner digital juga harus seperti itu, mengalir.


4.2.2 Teknik Observasi Data Sekunder dari Internet

Tidak semua data harus kita ambil sendiri lewat kuesioner. Kadang, datanya sudah ada di internet, tinggal bagaimana cara kita menemukannya dan mengambilnya. Inilah yang disebut Data Sekunder.

A. Di Mana "Harta Karun" Itu Berada?

Internet adalah perpustakaan terbesar di dunia. Untuk KKA, ada beberapa tempat favorit:

  • Kaggle: Ini adalah "Facebook"-nya para ahli data. Di sini ribuan dataset (kumpulan data) gratis tersedia, mulai dari harga rumah hingga foto penyakit tanaman.
  • Portal Data Pemerintah (data.go.id): Berisi data statistik resmi tentang penduduk, ekonomi, dan pendidikan.
  • Google Dataset Search: Mesin pencari khusus untuk mencari data.
  • Media Sosial & Berita: Untuk mengambil data tren atau opini publik (biasanya menggunakan teknik Scraping).

B. Teknik Observasi yang Benar

Mengambil data dari internet bukan cuma "Copy-Paste". Kalian harus melakukan:

  • Cek Kredibilitas: Siapa yang mengunggah data ini? Apakah dari lembaga resmi atau akun anonim? Jangan sampai AI kalian belajar dari data palsu (hoaks).
  • Cek Metadata: Lihat kapan data ini diambil. Data harga HP tahun 2010 sudah tidak berguna untuk memprediksi harga HP tahun 2024.
  • Legalitas & Lisensi: Ini sangat penting! Apakah data tersebut boleh diambil secara gratis? Ada lisensi seperti Creative Commons (CC) yang harus diperhatikan agar tidak terkena masalah hukum (plagiarisme data).

Analogi: Observasi Data sebagai "Detektif Perpustakaan"

Kalian tidak perlu mewawancarai setiap orang di kota untuk tahu sejarah kota tersebut. Kalian cukup pergi ke perpustakaan, mencari koran lama, catatan sipil, dan peta tua. Observasi data sekunder adalah proses mengumpulkan potongan-potongan sejarah digital untuk menyusun sebuah gambaran besar.


4.3 Sub Bab Baru: Web Scraping - Mengambil Data Secara Otomatis (Intro)

Sebagai siswa SMK KKA, kalian tidak mungkin meng-copy satu persatu 1.000 komentar di YouTube untuk dianalisis. Kalian butuh "robot" kecil.

Apa itu Web Scraping?

Web Scraping adalah teknik mengambil data dari website secara otomatis menggunakan kode program (biasanya Python).

Contoh: 

Kalian membuat program yang setiap pagi mengambil harga emas dari sebuah website berita dan menyimpannya di Excel kalian sendiri.

Etika Scraping (Penting!)

Jangan jadi "robot" yang jahat. Ada aturan mainnya:

  • Jangan Membebani Server: Jangan mengambil data terlalu cepat sehingga website orang tersebut menjadi lambat atau mati (down).
  • Patuhi file robots.txt: Ini adalah file di website yang berisi aturan bagian mana yang boleh diambil robot dan mana yang dilarang.


4.4 Validasi dan Verifikasi Data (Memastikan Kejujuran Data)

Setelah data terkumpul, baik dari kuesioner maupun internet, jangan langsung dipakai!

Perbedaan Validasi dan Verifikasi

Validasi: "Apakah datanya masuk akal?".

Contoh: 

Jika di kuesioner ada siswa SMK yang mengisi umurnya "500 tahun", maka data itu tidak valid dan harus dibuang.

Verifikasi: "Apakah datanya benar?".

Contoh: 

Mengecek kembali apakah data jumlah penduduk di website A sama dengan data resmi di Badan Pusat Statistik (BPS).


Tugas Kelompok: "The Data Hunter Project"

  • Kelompok 1-3: Buatlah satu kuesioner digital (Google Form) untuk mencari tahu "Gaya Belajar Teman Sekelas". Pastikan menggunakan logic branching dan minimal 5 pertanyaan efektif.
  • Kelompok 4-6: Carilah dataset sekunder di internet (bisa lewat Kaggle atau Google Dataset Search) tentang "Penjualan Smartphone Global". Tuliskan sumbernya, tahun datanya, dan apa lisensinya.
  • Presentasikan: Mengapa kalian memilih teknik tersebut dan bagaimana kalian menjamin data tersebut bukan "sampah"?

Posting Komentar

Lebih baru Lebih lama

Formulir Kontak