Machine Learning
Assalamualaikum warahmatullahi wabarakatuh, nama saya m fari artha yudha dengan NIM 202031048 salah satu mahasiswa jurusan teknik informatika di Institut Teknologi Perusahaan Listrik Negara. Saat ini saya sedang menempuh semester 5 dan mendapatkan mata kuliah dengan judul "Machine Learning". Pada kesempatan kali ini saya akan menulis artikel yang berisi rangkuman dari materi machine learning yang telah saya dapatkan selama 1 semester ini.
Pengertian Machine Learning
Di tengah pesatnya perkembangan teknologi kecerdasan buatan atau artificial intelligence (AI) saat ini. Belum banyak orang yang mengetahui bahwa kecerdasan buatan itu terdiri dari beberapa cabang, salah satunya adalah machine learning atau pembelajaran mesin. Teknologi machine learning (ML) ini merupakan salah satu cabang dari AI yang sangat menarik perhatian, kenapa? Karena machine learning merupakan mesin yang bisa belajar layaknya manusia.
Kembali pada kecerdasan buatan. Kecerdasan buatan pada pengaplikasiannya secara garis besar terbagi tujuh cabang, yaitu machine learning, natural language processing, expert system, vision, speech, planning dan robotics. Percabangan dari kecerdasan buatan tersebut dimaksudkan untuk mempersempit ruang lingkup saat pengembangan atau belajar AI, karena pada dasarnya kecerdasan buatan memiliki ruang lingkup yang sangat luas.
Teknologi machine learning (ML) adalah mesin yang dikembangkan untuk bisa belajar dengan sendirinya tanpa arahan dari penggunanya. Pembelajaran mesin dikembangkan berdasarkan disiplin ilmu lainnya seperti statistika, matematika dan data mining sehingga mesin dapat belajar dengan menganalisa data tanpa perlu di program ulang atau diperintah.
Dalam hal ini machine learning memiliki kemampuan untuk memperoleh data yang ada dengan perintah ia sendiri. ML juga dapat mempelajari data yang ada dan data yang ia peroleh sehingga bisa melakukan tugas tertentu. Tugas yang dapat dilakukan oleh ML pun sangat beragam, tergantung dari apa yang ia pelajari.Sejarah Machine Learning
Istilah machine learning pertama kali dikemukakan oleh beberapa ilmuwan matematika seperti Adrien Marie Legendre, Thomas Bayes dan Andrey Markov pada tahun 1920-an dengan mengemukakan dasar-dasar machine learning dan konsepnya. Sejak saat itu ML banyak yang mengembangkan. Salah satu contoh dari penerapan ML yang cukup terkenal adalah Deep Blue yang dibuat oleh IBM pada tahun 1996.
Deep Blue merupakan machine learning yang dikembangkan agar bisa belajar dan bermain catur. Deep Blue juga telah diuji coba dengan bermain catur melawan juara catur profesional dan Deep Blue berhasil memenangkan pertandingan catur tersebut.Peran Machine Learning
Peran machine learning banyak membantu manusia dalam berbagai bidang. Bahkan saat ini penerapan ML dapat dengan mudah kamu temukan dalam kehidupan sehari-hari. Misalnya saat kamu menggunakan fitur face unlock untuk membuka perangkat smartphone kamu, atau saat kamu menjelajah di internet atau media sosial kamu akan sering disuguhkan dengan beberapa iklan. Iklan-iklan yang dimunculkan juga merupakan hasil pengolahan ML yang akan memberikan iklan sesuai dengan pribadi kamu.Sebenarnya masih banyak contoh dari penerapan machine learning yang sering kamu jumpai. Lalu pertanyaanya, bagaimana ML dapat belajar? ML bisa belajar dan menganalisa data berdasarkan data yang diberikan saat awal pengembangan dan data saat ML sudah digunakan. ML akan bekerja sesuai dengan teknik atau metode yang digunakan saat pengembangan.
Teknik belajar Machine Learning
Ada beberapa teknik yang dimiliki oleh machine learning, namun secara luas ML memiliki dua teknik dasar belajar, yaitu supervised dan unsupervised.
Supervised Learning
Teknik supervised learning merupakan teknik yang bisa kamu terapkan pada pembelajaran mesin yang bisa menerima informasi yang sudah ada pada data dengan memberikan label tertentu. Diharapkan teknik ini bisa memberikan target terhadap output yang dilakukan dengan membandingkan pengalaman belajar di masa lalu.
Misalkan kamu mempunyai sejumlah film yang sudah kamu beri label dengan kategori tertentu. Kamu juga memiliki film dengan kategori komedi meliputi film 21 Jump Street dan Jumanji. Selain itu kamu juga punya kategori lain misalkan kategori film horror seperti The Conjuring dan It. Ketika kamu membeli film baru, maka kamu akan mengidentifikasi genre dan isi dari film tersebut. Setelah film teridentifikasi barulah kamu akan menyimpan film tersebut pada kategori yang sesuai.
Unsupervised Learning
Teknik unsupervised learning merupakan teknik yang bisa kamu terapkan pada machine learning yang digunakan pada data yang tidak memiliki informasi yang bisa diterapkan secara langsung. Diharapkan teknik ini dapat membantu menemukan struktur atau pola tersembunyi pada data yang tidak memiliki label.
Sedikit berbeda dengan supervised learning, kamu tidak memiliki data apapun yang akan dijadikan acuan sebelumnya. Misalkan kamu belum pernah sekalipun membeli film sama sekali, akan tetapi pada suatu waktu, kamu membeli sejumlah film dan ingin membaginya ke dalam beberapa kategori agar mudah untuk ditemukan.
Tentunya kamu akan mengidentifikasi film-film mana saja yang mirip. Dalam hal ini misalkan kamu mengidentifikasi berdasarkan dari genre film. Misalnya, kamu mempunyai film the Conjuring, maka kamu akan menyimpan film The Conjuring tersebut pada kategori film horror.
Metode yang ada di Machine Learning yang digunakan untuk analisis data
Pada saat mempelajari machine learning saya menemukan tiga buah istilah yang sering dipakai oleh dosen, yaitu Regression, Classification, dan Clustering. istilah istilah ini merupakan beberapa metode yang ada di machine learning. apa maksud dari ketiga istilah tersebut?
Pada saat menganalisis data, tentu saja kita mengharapkan mendapatkan informasi dari data yang sudah didapatkan. Pada saat mencoba untuk mendapatkan informasi tersebut, kita harus memilih metode apa yang sesuai untuk diterapkan pada data yang sudah terkumpul.
Pengertian Regression
Regresi adalah suatu teknik analisis untuk mengidentifikasi relasi atau hubungan diantara dua variabel atau lebih. Regresi bertujuan untuk menemukan suatu fungsi yang memodelkan data dengan meminimalkan error atau selisih antara nilai prediksi dengan nilai sebenarnya.
Regresi termasuk ke dalam supervised learning yang digunakan untuk memprediksi nilai kontinu.Dalam regresi, ada dua jenis variabel yaitu Dependent variable dan Independent variable. Variabel dependen adalah variabel yang akan kita prediksi atau pelajari, sedangkan variabel independen adalah variabel yang menjelaskan atau menyebabkan nilai target di variabel dependen.
Variabel independen dinotasikan dengan X, sementara variabel dependen dinotasikan dengan Y. Yang harus diperhatikan dalam kasus regresi adalah nilai dari variabel dependen (Y) harus berupa nilai kontinu, bukan diskrit. Sementara itu untuk variabel independen (X) bisa berupa nilai kontinu maupun kategori, misalnya sedan, hatchback, wagon, convertible.Tipe model regresi
Pada dasarnya, ada dua tipe model regresi yaitu simple regression (regresi sederhana), dan multiple regression (regresi berganda).
Simple Regression
Simple regression adalah ketika hanya satu variabel independen yang digunakan untuk memprediksi dependen variabel, bisa berupa linear (simple linear regression) maupun non-linear (simple non-linear regression). Misalnya memprediksi harga mobil hanya dengan berdasarkan engine-size saja.
Multiple Regression
Multiple regression adalah ketika ada lebih dari satu variabel independen yang digunakan untuk memprediksi variabel dependen. Misalnya memprediksi harga mobil berdasarkan engine-size, body-style, horsepower, dan sebagainya.
Program penerapan regresi pada machine learning menggunakan python
Langkah pertama adalah kita perlu mengimport beberapa library yaitu numpy, pandas, matplotlib, dan sklearn.- numpy : digunakan untuk melakukan operasi numerik pada python
- pandas : untuk menload dan memanipulasi dataset
- matplotlib : untuk melakukan ploting visualiasi data
- sklearn : untuk menghitung linear regression
lalu dengan menggunakan fungsi read_csv dari library pandas, kita membaca dataset dengan nama file "latihanregresi.csv" dan kemudian dimasukkan kedalam variable dengan nama dataset.
kemudian data x_train, dan y_train dilakukan fitting ke model LinearRegression
melakukan prediksi dengan model yang telah di buat lalu kemudian di tampilkan hasil prediksi nya
Decision tree
Decision tree adalah jenis algoritma klasifikasi yang strukturnya mirip seperti sebuah pohon yang memiliki akar, ranting, dan daun. Simpul akar (internal node) mewakili fitur pada dataset, simpul ranting (branch node) mewakili aturan keputusan (decision rule), dan tiap-tiap simpul daun (leaf node) mewakili hasil keluaran. Itulah kenapa algoritma ini disebut Decision tree atau pohon keputusan.
Tujuan penggunaan Decision tree adalah untuk membuat training model yang dapat digunakan untuk memprediksi kelas atau nilai variabel target dengan mempelajari aturan keputusan sederhana yang disimpulkan dari data sebelumnya (data training).
Dalam algoritma decision tree, terdapat 2 node, yakni Decision Node dan Leaf Node
Categorical variable decision tree
Decision tree yang memiliki variabel target kategori. Misalnya, kategorinya bisa ya atau tidak. Kategori berarti bahwa setiap tahap proses keputusan masuk tepat ke dalam satu kelompok, dan tidak ada di antaranya.
Continuous variable decision tree
Decision tree yang variabel targetnya kontinu. Misalnya, pendapatan individu yang pendapatannya tidak diketahui dapat diprediksi berdasarkan informasi yang tersedia seperti pekerjaan, usia, dan variabel kontinu lainnya.
Comments
Post a Comment