Pembelajaran mesin (mechine learning), merupakan disiplin ilmu yang menggabungkan perancangan dan pegembangan algoritma yang memungkinkan komputer untuk mengembangkan perilaku yang didasarkan pada data empiris. Pembelajaran mesin adalah bagaimana mengenali secara otomatis pola kompleks dan membuat keputusan cerdas berdasarkan data.
Karena itu pembelajar harus mengeneralisasi perilaku dari data yang ada untuk menghasilkan insight yang berguna dalam kasus baru. Pada tahun 1952, Arthur Samuel menciptakan program, game of checkers, pada sebuah komputer IBM karena sejak pertama penciptaan komputer, manusia sudah memikirkan bagaimana cara agar komputer dapat belajar dari pengalaman.
Program yang dilakukan oleh Arthur Samuel dapat mempelajari gerakan untuk memenangkan permainan checkers dan menyimpan gerakan kedalam memorinya.
Machine learning di era digital dapat dimanfaatkan dalam segala bidang. Berikut implementsi dari mechine learning:
1. Text Analysis
Machine learning digunakan untuk menganalisa suatu analisa untuk mendapatkan informasi sumber teks, selain itu dapat digunakan untuk mendeteksi keakuratan atau kebenaran teks. Misalnya:
– Spam Filteringek
– Sentiment Analysis
– Information Extraction
2. Image Processing
Image processing merupakan tahapan dari pengolahan suatu gambar untuk mendapatkan data dari gambar sehingga dapat diolah atau ditransformasikan, diantaranya adalah:
– Image tagging/face detection
– Optical Character Recognition (OCR)
– Self Driving Cars
3. Finance
Machine learning diterapkan dalam bidang finansial untuk membantu memprediksi maupun mengambil keputusan dengan menggunakan:
– Stock Trading
– Fraud Detection
4. Search and Recomendation Engine
Machine Learning bermanfaat untuk memaksimalkan fungsi pencarian dan rekomendasi oleh situs pencari, e-commerce dan media sosial. Contoh penerapannya adalah:
– Amazon, Lazada, Alibaba, dan lainnya
Teknik-teknik machine learning dapat diaplikasikan jika ada data. Tanpa data, algoritma machine learning tidak bekerja. Data yang dimiliki biasanya dibagi menjadi 2, yaitu data training dan data testing.
Data training digunakan untuk melatih algoritma, sedangkan data testing dipakai untuk mengetahui performa algoritma yang sudah dilatih sebelumnya ketika menemukan data baru yang belum pernah dilihat sebelumnya. Ini biasanya disebut dengan generalisasi. Hasil dari pelatihan tersebut bisa disebut dengan model.
Data yang digunakan misalnya data analitycs hosting dan data pengguna website, untuk mengetahui provider hosting Indonesia yang menjadi hosting terbaik Indonesia.
Model yang sudah diketahui dapat membantu melakukan prediksi. Jika hasil prediksinya bersifat diskrit, maka proses itu disebut klasifikasi.
Jika keluarannya bersifat kontinyu, maka itu disebut dengan regresi, misalnya prediksi cuaca besok berdasarkan data cuaca 3 bulan terakhir.
Performa dari sebuah algoritma machine learning itu sendiri bisa dihitung dari akurasi atau seberapa banyak prediksi yang dibuat yang sesuai dengan kenyataan.