Skip to main content

3. Data Object - Attributes Types.html

Data Object & Attributes Types

 

Pendahuluan

Halo Mahasiswa Stupenss, selamat datang dalam materi Data Object and Attribute Types. Dalam materi ini, kalian akan mempelajari tentang konsep dasar dan jenis jenis Datasets, Data Object dan Attribute Types. Kemampuan dalam mengelola dan memanipulasi data merupakan keterampilan yang sangat penting dalam analisis data dan machine learning. Oleh karena itu, diharapkan dengan mempelajari materi ini, kalian dapat memiliki pemahaman yang baik tentang Data Object and Attribute Types dan dapat menerapkannya pada berbagai aplikasi machine learning. Yuk kita belajar bersama belajar!

Types of Data Sets

Hai Stupens! Dalam analisis data, kita sering menemukan berbagai jenis dataset yang memerlukan pendekatan analisis yang berbeda-beda. Salah satu cara untuk mengklasifikasikan dataset adalah berdasarkan jenis data yang terkandung di dalamnya. Beberapa jenis dataset yang umum ditemukan antara lain adalah record, graph and network, ordered, spatial, image, dan multimedia dataset.

Jenis Dataset

Penjelasan

Record Dataset

jenis dataset yang terdiri dari sejumlah record atau catatan yang menyimpan beberapa atribut atau variabel. Biasanya,

dataset jenis ini digunakan dalam basis data dan aplikasi bisnis yang

menyimpan data pelanggan, karyawan, atau produk. Contohnya adalah

dataset informasi pelanggan toko online yang mencakup nama, alamat,

nomor telepon, email, jenis kelamin, dan riwayat pembelian.

Graph and Network Dataset

Graph and network dataset adalah jenis dataset yang terdiri dari simpul dan sambungan antar simpul. Biasanya, dataset jenis ini digunakan dalam analisis jaringan sosial, di mana simpul mewakili orang atau kelompok dan sambungan mewakili hubungan antara mereka. Contohnya adalah dataset hubungan teman di Facebook, di mana simpul mewakili pengguna Facebook dan sambungan mewakili persahabatan antara mereka.

Ordered Dataset

Ordered dataset adalah jenis dataset yang memiliki urutan atau susunan tertentu. Biasanya, dataset jenis ini digunakan dalam data deret waktu dan urutan teks. Contohnya adalah dataset harga saham selama beberapa tahun, di mana setiap entri memiliki tanggal dan harga saham pada tanggal tersebut.

Spatial Dataset

Spatial dataset adalah jenis dataset yang menyimpan informasi lokasi geografis. Biasanya, dataset jenis ini digunakan dalam pemetaan dan analisis lingkungan. Contohnya adalah dataset perubahan suhu di seluruh dunia, di mana setiap entri memiliki koordinat geografis dan nilai suhu pada lokasi tersebut.

Image Dataset

Image dataset adalah jenis dataset yang berisi gambar atau visual yang kompleks. Biasanya, dataset jenis ini digunakan dalam bidang penglihatan komputer dan pengenalan citra. Contohnya adalah dataset gambar wajah manusia untuk pengenalan wajah, di mana setiap entri berisi gambar wajah dan label identitas yang sesuai.

Multimedia Dataset

Multimedia dataset adalah jenis dataset yang berisi informasi multimedia seperti audio, video, dan teks. Biasanya, dataset jenis ini digunakan dalam aplikasi multimedia seperti pengenalan suara dan pengenalan wajah. Contohnya adalah dataset teks berita untuk analisis sentimen, dimana setiap entri berisi teks artikel berita dan label sentimen yang sesuai.

 

 

Data Objects

Data object adalah suatu konsep dalam pemrograman yang digunakan untuk merepresentasikan objek atau entitas dalam dunia nyata ke dalam bentuk data yang dapat diproses oleh komputer. Konsep ini sangat penting dalam pemrograman karena memungkinkan kita untuk merepresentasikan dunia nyata dalam bentuk yang dapat diproses oleh komputer.

Setiap data object terdiri dari beberapa atribut atau karakteristik yang merepresentasikan objek tersebut. Attributes ini bisa berupa data numerik, string, atau bahkan data yang lebih kompleks seperti gambar atau teks. Setiap atribut memiliki tipe data tertentu yang merepresentasikan jenis nilai atau informasi yang dapat disimpan dalam atribut tersebut.

Misalnya, jika kita ingin merepresentasikan sebuah mobil dalam bentuk data object, kita bisa menggunakan beberapa atribut seperti merek, model, warna, tahun pembuatan, dan nomor polisi. Setiap atribut tersebut memiliki tipe data tertentu, seperti string untuk merek dan model, integer untuk tahun pembuatan, dan float untuk nomor polisi.

Data object sangat penting dalam pemrograman karena memungkinkan kita untuk merepresentasikan data yang kompleks atau struktur data yang lebih rumit. Misalnya, dalam machine learning, data object sering digunakan untuk merepresentasikan data yang terdiri dari banyak atribut, seperti gambar atau teks. Dalam hal ini, setiap atribut merepresentasikan bagian-bagian atau fitur-fitur yang ada pada gambar atau teks tersebut.

Dalam pemrograman, data objects sering direpresentasikan dalam bentuk kelas atau struktur data. Kelas merupakan suatu blueprint atau rancangan yang mendefinisikan atribut dan method yang ada pada data object. Setiap instance atau objek yang dibuat dari kelas tersebut merepresentasikan satu objek atau entitas dalam dunia nyata.

Dalam Python, data objects sering direpresentasikan dalam bentuk dictionary, list, atau kelas. Dictionary digunakan untuk merepresentasikan data dalam bentuk pasangan key-value, sedangkan list digunakan untuk merepresentasikan data dalam bentuk urutan atau kumpulan data. Kelas digunakan untuk merepresentasikan data dalam bentuk yang lebih terstruktur dan lebih mudah untuk diproses.

Attributes

Attributes adalah karakteristik atau properti dari suatu objek atau entitas yang kita ingin merepresentasikan dalam bentuk data object. Misalnya, jika kita ingin merepresentasikan seorang mahasiswa dalam bentuk data object, beberapa atribut yang bisa kita gunakan adalah nama, usia, alamat, jurusan, dan IPK. Setiap atribut ini memiliki nilai atau data yang merepresentasikan karakteristik dari mahasiswa tersebut.

Tipe data atau measurement scale adalah cara untuk merepresentasikan nilai atau data yang dimiliki oleh sebuah atribut. Tipe data ini sangat penting dalam analisis data karena mempengaruhi jenis analisis yang bisa dilakukan pada data tersebut. Berikut adalah beberapa tipe data yang biasa digunakan dalam analisis data:

1. Binary: tipe data ini hanya memiliki dua nilai atau kategori, seperti ya/tidak atau benar/salah. Contohnya, jika kita ingin merepresentasikan status mahasiswa, kita bisa menggunakan binary dengan nilai 1 untuk status aktif dan 0 untuk status tidak aktif.

2. Nominal: tipe data ini digunakan untuk merepresentasikan atribut yang memiliki beberapa kategori atau nilai yang tidak memiliki urutan atau tingkatan yang jelas. Contohnya, jika kita ingin merepresentasikan jurusan mahasiswa, kita bisa menggunakan nominal dengan kategori seperti matematika, fisika, atau biologi.

3. Ordinal: tipe data ini digunakan untuk merepresentasikan atribut yang memiliki beberapa kategori atau nilai yang memiliki urutan atau tingkatan yang jelas. Contohnya, jika kita ingin merepresentasikan tingkat pendidikan mahasiswa, kita bisa menggunakan ordinal dengan kategori seperti SD, SMP, SMA, atau perguruan tinggi.

4. Numerik: tipe data ini digunakan untuk merepresentasikan atribut yang memiliki nilai atau data numerik atau berkelanjutan. Tipe data numerik ini bisa dibagi lagi menjadi dua jenis yaitu:

a. Interval: tipe data ini digunakan untuk merepresentasikan atribut yang memiliki nilai numerik berkelanjutan tanpa memiliki nilai nol mutlak. Contohnya, jika kita ingin merepresentasikan suhu dalam celcius, kita bisa menggunakan interval karena nilai nol celcius hanya merupakan nilai acuan dan bukan nilai mutlak.

b. Ratio: tipe data ini digunakan untuk merepresentasikan atribut yang memiliki nilai numerik berkelanjutan dengan nilai nol mutlak. Contohnya, jika kita ingin merepresentasikan tinggi badan seseorang, kita bisa

menggunakan tipe data ratio karena nilai nol pada tinggi badan adalah nilai mutlak dan tidak dapat bernilai negatif.

Pemahaman mengenai tipe data dan measurement scale sangat penting dalam analisis data karena akan mempengaruhi jenis analisis dan teknik statistik yang dapat digunakan pada data tersebut. Oleh karena itu, sebagai seorang mahasiswa, kamu harus memahami konsep ini dengan baik agar dapat mengolah data dengan benar dan mengambil kesimpulan yang tepat dari analisis data yang dilakukan.

Pemilihan Jenis Data Object dan Attributes

Memilih jenis data object dan tipe atribut yang tepat sangat penting dalam proses analisis data menggunakan machine learning. Beberapa hal yang perlu diperhatikan dalam memilih jenis data object dan tipe atribut antara lain:

 

1. Jenis Masalah: Jenis masalah yang ingin dipecahkan harus menjadi pertimbangan dalam memilih jenis data object dan tipe atribut. Misalnya, jika ingin melakukan klasifikasi biner, maka data object yang cocok adalah record atau image, sedangkan tipe atribut yang cocok adalah binary atau nominal.

2. Algoritma Machine Learning: Jenis algoritma machine learning yang digunakan juga harus menjadi pertimbangan dalam memilih jenis data object dan tipe atribut. Misalnya, algoritma decision tree lebih cocok untuk data dengan tipe atribut nominal atau ordinal, sedangkan algoritma regression lebih cocok untuk data dengan tipe atribut numerik.

3. Sumber Data: Sumber data yang digunakan juga harus menjadi pertimbangan dalam memilih jenis data object dan tipe atribut. Misalnya, jika data berasal dari sensor, maka data object yang cocok adalah spatial, sedangkan jika data berasal dari sosial media, maka data object yang cocok adalah graph and network.

4. Preprocessing Data: Proses preprocessing data juga harus menjadi pertimbangan dalam memilih jenis data object dan tipe atribut. Misalnya, jika ingin melakukan analisis gambar, maka perlu dilakukan preprocessing data seperti ekstraksi fitur dan resizing image.

Selain itu, terdapat beberapa teknik dalam preprocessing data yang dapat digunakan untuk mempersiapkan data sebelum dilakukan analisis dengan machine learning, seperti feature scaling, one-hot encoding, dan label encoding.

Dalam memilih jenis data object dan tipe atribut, perlu dilakukan eksplorasi data terlebih dahulu untuk memahami karakteristik data dan mengevaluasi apakah jenis data object dan tipe atribut yang dipilih memenuhi kebutuhan analisis data menggunakan machine learning.

Quiz

1. Apa yang dimaksud dengan data object?

a. Jenis data yang terdiri dari angka dan karakter

b. Objek yang memungkinkan penggunaan metode dan atribut yang terkait dengannya

c. Data yang dapat diakses secara langsung melalui komputer

d. Jenis data yang dihasilkan oleh mesin pemroses data (data processing machine)

2. Apa yang dimaksud dengan tipe atribut nominal?

a. Tipe atribut yang dapat diurutkan

b. Tipe atribut yang mengandung nilai numerik

c. Tipe atribut yang hanya memiliki nilai kategorikal tanpa urutan tertentu d. Tipe atribut yang memiliki rentang nilai tertentu dan dapat diukur

3. Apa yang dimaksud dengan data object jenis image and multimedia? a. Data yang terdiri dari gambar, audio, dan video

b. Data yang diambil dari sumber terkait

c. Data yang berkaitan dengan keadaan spasial

d. Data yang terdiri dari urutan waktu dan serangkaian peristiwa

4. Apa yang dimaksud dengan tipe atribut numerik?

a. Tipe atribut yang dapat diurutkan

b. Tipe atribut yang mengandung nilai numerik

c. Tipe atribut yang hanya memiliki nilai kategorikal tanpa urutan tertentu d. Tipe atribut yang memiliki rentang nilai tertentu dan dapat diukur

5. Apa perbedaan antara atribut nominal dan atribut ordinal pada data object? A. Attributes nominal hanya memiliki dua nilai yang berbeda, sedangkan atribut ordinal memiliki tiga nilai atau lebih.

B. Attributes nominal tidak memiliki urutan atau hierarki tertentu, sedangkan atribut ordinal memiliki urutan atau hierarki tertentu.

C. Attributes nominal dan atribut ordinal sama-sama tidak memiliki urutan atau hierarki tertentu.

D. Attributes nominal dan atribut ordinal sama-sama memiliki tiga nilai atau lebih.

Referensi

https://www.kaggle.com/code/mohtashimnawaz/types-of-data-statistics-and proximity-measures/notebook

https://www.geeksforgeeks.org/understanding-data-attribute-types-qualitative-and quantitative/

https://docs.oracle.com/en/database/oracle/machine

learning/oml4sql/21/dmprg/about-attributes.html

https://t4tutorials.com/attributes-types-in-data-mining/

https://towardsdatascience.com/data-types-from-a-machine-learning-perspective with-examples-111ac679e8bc

Last modified: Monday, 7 August 2023, 10:11 AM