Skip to main content

2. Pengambilan-Dataset-Image.html

Pengambilan dataset image

Halo sobat AI, gimana nih kabarnya? pasti baik-baik saja kan ya 😊. Okeh, pada section kali ini kita akan mempelajari tentang materi pengambilan dataset image. Pasti sudah tidak sabar kan, yuk mari kita mulai.

Di zaman sekarang ini, sobal AI pasti sering dengar mengenai banyaknya e-commerce dan situs online yang bermunculan di jagad media sosial kan. Sebagai contoh misalnya seperti di Alibaba, Amazon, IKEA dan lain-lain. Naah, mereka-mereka ini telah memanfaatkan pengambilan gambar sebagai metode pemasarannya. Mereka menggunakan teknologi AR dengan metode mengambil gambar sebagai data test nya misalnya seperti kursi yang ingin dicocokan tempatnya di sudut ruangan maka kamera hp dapat mengambil gambar ruangan yang dimaksud dan menaruh kursi tersebut disana. Hal ini adalah contoh kecil dari metode pengambilan gambar sebagai datasetnya, masih banyak lagi contoh-contoh pengambilan dataset image ya sobat.

 

 

Bagaimana kalau di AI kak? woke, kalau di AI pengambilan dataset image dilakukan untuk proses training model AI. Jadi nanti sistem AI dapat mempelajari fitur-fitur apa yang mirip didalam dataset gambar lalu mengklasifikasikannya kedalam kelasnya masing-masing yang kemudian saat model diuji pada data test baik secara real time atau tidak maka model dapat mengetahui tipe kelas dari data tes tersebut berdasarkan dari fitur yang sama pada dataset gambar. Mungkin analogi yang paling cocok terhadap skema proses tersebut adalah sebagai berikut :

[1] 

 

Naah sobat AI jadi tau kan kalau dataset image itu penting banget dalam suatu proses artificial intelligence. Selanjutnya kita akan belajar jenis-jenis dari dataset image itu sendiri. Nah berikut penjabarannya.

  1. Data Train

Data ini digunakan pada proses training model. Jadi sistem dapat mencari fitur-fitur apa saja yang memiliki kemiripan antara 1 dengan yang lainnya di dalam 1 kelas yang sama. Biasanya suatu dataset image akan dibagi kedalam 2 jenis data yaitu data train dan data validasi.

  1. Data Validasi

Pada data validasi ini digunakan untuk proses validasi terhadap hasil dari data training sebelumnya sehingga hasil model dapat lebih baik karena dilakukan 2 kali pencocokan dan juga dapat mencegah terjadinya overfitting pada model AI.

  1. Data Test

Kemudian pada data test, sesuai dengan namanya data test digunakan dalam proses pengujian dari performa atau kualitas suatu model AI. Data test ini berisi data image yang tidak diberi label sehingga saat dicoba pada model AI maka dapat diketahui jenis akurasi dari proses pendeteksian objek tersebut.

 

 

 

 

  1. Annotasi

Data anotasi adalah data yang berisikan metadata atau label dalam bentuk teks atau gambar. Data anotasi ini biasanya digunakan dalam proses pendeteksian objek yang berisi koordinat bounding box dari objek pada gambar tersebut.

Di section sebelumnya, kalian sudah mengetahui prosedur-prosedur dalam memperoleh suatu dataset, nah sekarang kita akan mempelajari metode-metode apa saja dalam proses pengambilan dataset image, sobat AI bisa baca poin-poin penjelasan berikut ini ya

Mencari dataset yang sudah tersedia secara online:

Terdapat banyak dataset image yang sudah tersedia secara gratis ataupun berbayar di internet. Oleh karena itu, sobat AI hanya tinggal mencari platform atau website apa saja sih yang memiliki dataset image. Sebagai contohnya berikut terdapat beberapa contoh sumber dataset image yaitu antara lain Kaggle, ImageNet, COCO, Open Images, dan sebagainya.

Nah dari beberapa sumber dataset yang telah disebutkan tadi, kalian dapat mencari dataset yang kalian inginkan sesuai dengan model atau jenis data image yang ingin kalian olah nanti. Namun, sebelum mengunduh dataset tersebut, pastikan untuk memperhatikan lisensi penggunaan dan aturan yang berlaku yaa. Berikut terdapat contoh tutorial cara mengambil dataset image pada platform COCO yang dapat teman-teman ikuti..

1.      Kunjungi website COCO[2] 

Pertama, kita kunjungi website COCO dengan mengetik atau menekan link berikut ini https://cocodataset.org/

2.      Cari menu dataset

Pada baris menu di atas tampilan website, pilih menu Dataset dan lalu pilih menu Download

3.      Pilih jenis dataset yang diinginkan

Selanjutnya kalian dapat memilih jenis dataset yang tersedia dan sesuai dengan model yang kalian punya, misalnya sobat AI ingin melakukan pendeteksian objek maka sobat AI dapat mendownload jenis dataset Train, Val, Test serta Annotasinya.

 

Setelah selesai diunduh, maka sobat AI dapat langsung mengolah dataset tersebut yaa..

 

Mengambil gambar sendiri:[3] 

Metode pengambilan gambar sendiri ini dilakukan apabila dataset yang diinginkan tidak tersedia di internet ataupun sobat AI ingin suatu dataset yang originalitasnya milik sendiri. Proses pengambilan gambar sendiri ini dapat dilakukan dengan menggunakan kamera atau perangkat pengambil gambar lainnya. Akan tetapi, pengambilan gambar sendiri untuk dijadikan dataset ini prosesnya cukup rumit karena sebuah dataset image biasanya memiliki lebih dari 100 gambar dimasing-masing kelasnya sehingga diperlukan lebih dari 100 pengambilan gambar secara manual dan hal tersebut lumayan memakan waktu dan usaha. Walaupun begitu, jika sobat AI tidak masalah dan semangat untuk membuat model AI yang bagus maka gasskeun saja yaa.

Adapun aturan-aturan yang sobat AI harus ikuti agar dapat melakukan pengambilan dataset image yang baik dan benar.

1.      Pastikan objek yang terdapat pada image terlihat jelas

2.      Background atau latar belakang image sebisa mungkin memiliki warna yang kontras dengan objeknya

3.      Perhatikan hak privasi yang berlaku saat proses pengambilan gambar di tempat-tempat tertentu

4.      Disarankan pada proses pengambilan gambar, sudut dan pencahayaan gambar dibuat sebanyak mungkin jenisnya sehingga dapat memaksimalkan dalam proses training model.

Nah itu dia, penjabaran materi mengenai proses pengambilan dataset image secara manual, sobat AI dapat ikuti ya dan tetap semangat

Preprocessing data image

Preprocessing data gambar atau citra ini merupakan langkah penting dalam membangun model AI berbasis gambar. Proses preprocessing data image dilakukan untuk memperbaiki atau meningkatkan kualitas dari dataset image sebelum sampai ke proses pengolahan. Preprocessing umumnya melibatkan serangkaian operasi yang mentransformasikan data gambar mentah menjadi format yang lebih sesuai untuk diproses oleh algoritma AI. Berikut terdapat beberapa langkah preprocessing yang umum dilakukan pada dataset gambar:

       Resize

Proses resize ini adalah mengubah ukuran gambar menjadi ukuran standar sehingga semua gambar memiliki dimensi yang sama. Hal ini diperlukan karena banyak algoritma machine learning membutuhkan input dengan bentuk dan ukuran yang sama.

       Normalisasi

Normalisasi nilai piksel gambar sehingga memiliki mean nol dan variansi satu. Ini membantu algoritma machine learning konvergen lebih cepat dan menghindari ketidakstabilan numerik.

       Cropping

Proses Cropping ini bertujuan untuk memfokuskan suatu objek yang ingin diolah dengan memotong sebagian piksel pada gambar sehingga dapat mengurangi banyak latar belakang atau informasi yang tidak relevan

 

       Augmentasi

Augmentasi data dapat membantu meningkatkan ukuran dataset dengan membuat gambar baru yang sedikit dimodifikasi. Teknik augmentasi yang umum meliputi flipping, rotasi, zoom, dan penambahan noise.

       Konversi Ruang Warna

Metode ini dilakukan jika diperlukan suatu konversi gambar ke ruang warna yang berbeda seperti grayscale, RGB, atau HSV. Biasanya metode ini digunakan untuk meningkatkan fokus ojek atau persiapan untuk proses filtering

       Filtering

Metode filtering ini bertujuan untuk menghilangkan noise pada gambar sehingga objek yang ingin kita olah dapat terlihat dengan lebih jelas. Filter yang umumnya digunakan yaitu seperti filter blur dan filter sharpen.

Metode preprocessing yang dijabarkan diatas merupakan contoh kecil saja. Untuk metode preprocessing yang lebih jelasnya dapat kalian sesuaikan terhadap model atau hasil data yang kalian inginkan ya


Last modified: Wednesday, 9 August 2023, 11:10 AM