Trending

#01 Pengenalan Data di Era Digital

 Selamat datang di jantung dari Kecerdasan Artifisial (AI). Jika kalian pernah bertanya-tanya, "Bagaimana YouTube bisa tahu lagu apa yang saya sukai?" atau "Bagaimana filter Instagram bisa tahu di mana letak hidung saya?", jawabannya bukan sihir, melainkan Analisis Data.

Di bab ini, kita akan belajar menjadi "Detektif Data". Kita akan belajar melihat apa yang tidak dilihat orang lain di balik tumpukan angka, gambar, dan suara.


4.1 Pengenalan Data di Era Digital

Dahulu, harta paling berharga adalah emas atau minyak bumi. Tapi sekarang, di era kalian, harta paling berharga adalah DATA. Perusahaan besar seperti Google, TikTok, dan Meta (Facebook) bisa menjadi raksasa bukan karena mereka menjual barang fisik, tapi karena mereka memiliki dan mengolah data kalian.

Analogi:

Data sebagai Bahan Bakar vs Data sebagai Bahan Masakan

Bayangkan sebuah mesin AI yang sangat canggih sebagai mobil sport terbaru. Mobil itu memiliki mesin ribuan CC yang hebat. Namun, jika kalian mengisinya dengan air selokan, mobil itu tidak akan jalan. Jika diisi bensin berkualitas rendah, mesinnya akan cepat rusak.

Begitu juga AI. Data adalah bahan bakarnya. Jika datanya sampah, maka output AI-nya pun akan sampah (Garbage In, Garbage Out).

Secara definisi, Data adalah sekumpulan fakta, karakter, atau simbol mentah yang belum diolah. Data baru akan menjadi Informasi ketika kita sudah mengolahnya dan memberikan konteks.

Mengapa Siswa SMK Harus Paham Data?

Sebagai siswa jurusan KKA, kalian bukan hanya akan menjadi "pemakai" teknologi, tapi "pencipta". Untuk membuat program yang pintar, kalian harus tahu cara memberikan "makan" (data) yang benar kepada program tersebut.


4.2 Klasifikasi Data

Dalam dunia digital, data terbagi menjadi dua kelompok besar berdasarkan bentuknya. Ini sangat penting karena cara kita memperlakukan mereka sangat berbeda.

4.1.1 Perbedaan Data Terstruktur dan Tak Terstruktur

A. Data Terstruktur (The Organized Student)

Data Terstruktur adalah data yang sangat rapi, memiliki format yang tetap, dan biasanya disimpan dalam bentuk tabel (baris dan kolom).

Analogi: 

Rak Sepatu Sekolah. Bayangkan sebuah rak sepatu yang setiap kotaknya sudah diberi nomor absen dan nama siswa. Jika kalian ingin mencari sepatu nomor absen 10, kalian tinggal pergi ke kotak nomor 10. Sangat mudah, cepat, dan pasti.

Karakteristik:

  • Disimpan dalam database relasional atau Spreadsheet (Excel/Google Sheets).
  • Biasanya berupa angka, tanggal, atau teks pendek yang polanya jelas.
  • Mudah dicari oleh komputer menggunakan bahasa pemrograman seperti SQL.

Contoh di SMK:

Tabel nilai siswa (Nama, Kelas, Nilai), Daftar stok barang di gudang sekolah, data kehadiran.

B. Data Tak Terstruktur (The Creative Chaos)

Data Tak Terstruktur adalah data yang tidak memiliki format baku. Data ini "liar" dan tidak bisa langsung dimasukkan ke dalam kotak-kotak tabel.

Analogi: 

Tumpukan Pakaian di Keranjang Cucian. Bayangkan sebuah keranjang besar berisi baju, celana, kaos kaki, hingga handuk yang tercampur aduk. Jika kalian ingin mencari "kaos kaki warna biru", kalian harus membongkar seluruh tumpukan itu. Tidak ada "kolom" atau "baris" yang menunjukkan di mana kaos kaki itu berada.

Karakteristik:

  • Bentuknya beragam: Gambar, Audio, Video, teks panjang (email/artikel).
  • Sangat besar ukurannya (memakan banyak memori).
  • Sulit diolah dengan metode statistik biasa. Inilah alasan utama mengapa kita butuh Artificial Intelligence (AI)—untuk mengenali pola di dalam kekacauan ini.

Contoh: 

  • Gambar/Foto: File .jpg atau .png. Komputer hanya melihat deretan angka (pixel), tapi AI harus bisa menebak itu foto kucing atau manusia.
  • Audio: Rekaman suara di WhatsApp. AI harus mengubah getaran suara menjadi teks.
  • Video: Rekaman CCTV yang harus mendeteksi gerakan mencurigakan secara otomatis.

C. Penengah: Data Semi-Terstruktur (Bonus Materi)

Ada juga data di tengah-tengah. Tidak rapi sekali, tapi juga tidak berantakan.

  • Contoh: File JSON atau XML.

  • Analogi: Seperti paket belanja online. Di dalamnya isinya bebas (tak terstruktur), tapi di luar kardusnya ada label pengiriman yang rapi (terstruktur).


4.3 Siklus Hidup Data

Data tidak langsung jadi "pintar". Ada proses panjang yang harus dilewati. Di industri, ini disebut Data Life Cycle. Kita akan membaginya menjadi 4 tahap utama yang mudah dipahami.

4.1.2 Membedah Siklus: Koleksi, Olah, Analisis, Sajikan

Tahap 1: Koleksi (Data Collection) - Mencari Bahan Mentah

Ini adalah tahap awal di mana kita mengumpulkan fakta-fakta.

Proses:

Kita bisa mendapatkan data dari sensor (suhu/gerak), survei (Google Form), Web Scraping (mengambil data dari internet otomatis), atau dari data yang sudah ada di komputer.

Analogi: 

Tahap ini seperti seorang koki yang pergi ke pasar untuk membeli sayur, daging, dan bumbu. Jika koki membeli bahan yang busuk, masakan pun akan gagal.

Pesan Penting: 

Data yang diambil harus relevan. Jangan mengumpulkan data tinggi badan jika kalian ingin memprediksi nilai matematika.

Tahap 2: Olah (Data Processing/Cleaning) - Membersihkan Bahan

Ini adalah tahap yang paling melelahkan (seringkali memakan waktu 80% dari total pekerjaan).

Proses: Kita membersihkan data yang salah.

  • Menghapus data ganda (duplikat).
  • Mengisi data yang kosong (missing values).
  • Memperbaiki penulisan (Contoh: "Jakarta" dan "jkrt" harus disamakan).

Analogi: 

Tahap ini seperti mencuci sayuran, mengupas bawang, dan memotong daging. Kita membuang bagian yang tidak berguna agar bahan siap dimasak.

Mengapa Penting? Data kotor akan menghasilkan analisis yang salah.

Tahap 3: Analisis (Data Analysis) - Memasak Informasi

Di sinilah keajaiban terjadi. Kita menggunakan rumus matematika atau model AI untuk menemukan pola.

Proses: Kita bertanya pada data.

  • "Berapa rata-rata nilai siswa?"
  • "Kenapa penjualan es teh menurun saat hujan?"
  • "Apa hubungan antara sering bolos dengan nilai ujian?"

Analogi: 

Tahap ini adalah saat koki menyalakan kompor, mencampur bumbu, dan menumis bahan. Aroma masakan mulai tercium, pola mulai terlihat.

Tahap 4: Sajikan (Data Visualization/Communication) - Menghidangkan Hasil

Data yang sudah dianalisis tidak akan berguna jika tidak bisa dipahami orang lain.

Proses: 

Mengubah angka-angka rumit menjadi grafik yang cantik, diagram lingkaran, atau dashboard yang interaktif.

Analogi: 

Ini adalah tahap plating atau penyajian. Makanan yang enak harus disajikan di piring yang cantik agar menarik dan mudah dimakan oleh tamu.

Alat: 

Kita bisa menggunakan grafik batang (Bar Chart), diagram garis (Line Chart), atau tabel ringkasan.


4.4 Etika dan Privasi Data

Sebagai siswa KKA, kalian harus punya moral. Memegang data orang lain berarti memegang rahasia.

  • Privasi: Jangan pernah menggunakan data pribadi orang lain tanpa izin (No HP, Alamat, dll).
  • Keamanan: Pastikan data yang kalian simpan tidak mudah dicuri orang lain.
  • Bias Data: Jangan biarkan data kalian tidak adil. Misalnya, melatih AI pengenal wajah hanya menggunakan foto orang kulit putih, sehingga saat ada orang kulit sawo matang, AI-nya tidak kenal. Itu namanya Bias.


Tugas Kelompok (Aktivitas Detektif Data):

Instruksi: Carilah satu aplikasi yang sering kalian gunakan (Contoh: Mobile Legends, TikTok, atau Shopee).

  • Sebutkan 3 contoh data Terstruktur yang dikumpulkan aplikasi tersebut.
  • Sebutkan 3 contoh data Tak Terstruktur yang ada di sana.
  • Jelaskan, kira-kira menurut kalian, bagaimana aplikasi tersebut Menyajikan data tersebut kepada kalian (dalam bentuk apa grafiknya atau tampilannya)?

Posting Komentar

Lebih baru Lebih lama

Formulir Kontak