Pernah mendengar tentang data scientist? Data scientist yang merupakan salah satu profesi yang sangat di butuhkan saat ini, sebuah riset yang dilakukan oleh McKinsey & Company menunjukkan bahwa pada tahun 2018, terdapat 140.000 sampai 190.000 lowongan pekerjaan data scientist yang belum terisi.
Mengapa data scientist sangat dibutuhkan saat ini? Alasannya karena data sangat berkembang secara pesat pada era ini terutama di perusahaan yang bergerak dalam bidang teknologi dan sosial media. Data Scientist adalah sebuah profesi yang memiliki pengetahun berikut ini:
Statistika
Statistika merupakan ilmu yang mempelajari bagaimana merencanakan, mengumpulkan, menganalisis, menginterpretasi, dan mempresentasikan data. Secara singkat, statistika adalah ilmu yang berkenaan dengan data.
Pemrograman Komputer
Pemrograman adalah proses menulis, menguji, dan memperbaiki, dan memelihara kode yang membangun suatu program komputer. Kode ini ditulis dalam berbagai bahasa pemrograman. Tujuan dari pemrograman adalah untuk memuat suatu program yang dapat melakukan suatu perhitungan atau pekerjaan sesuai dengan keinginan si pemrogram. Untuk melakukan pemrograman, diperlukan keterampilan dalam algoritma, logika, bahasa pemrograman, dan pada banyak kasus, pengetahuan-pengetahuan lain seperti matematika.
Pengolahan database
Database merupakan kumpulan data yang terstruktur. Database dapat digunakan untuk memenuhi kebutuhan informasi. Software yang kusus membuat dan mengelola database disebut dengan RDBMS (Relational Database Management System).
Mechine learning
Istilah machine learning pada dasarnya adalah proses komputer untuk belajar dari data (learn from data). Tanpa adanya data, komputer tidak akan bisa belajar apa-apa. oleh karena itu jika kita ingin belajar machine learning, pasti akan terus berinteraksi dengan data. Semua pengetahuan mechine learning pasti akan melibatkan data. Data bisa saja sama, akan tetapi algoritma dan pendekatannya berbeda-beda untuk mendapatkan hasil yang optimal.
Pemodelan matematika.
Suatu model matematika sebagai pendekatan terhadap suatu fenomena (alami atau buatan) hanya mencakup sebanyak hingga pengamatan atau hanya mencakup daerah yang terbayas dari fenomena tersebut (yang tak terbatas) atau hanya bersifat diskrit, walaupun model tersebut masih dianggap sebagai bentuk yang sangat ideal dan yang sangat mendekati fenomena fisik aslinya.
Tetapi sejak berkembangnya ilmu-ilmu komputer, penerapan cabang-cabang matematika yang mempelajari fenomena-fenomena yang bukan sekedar diskrit, bahkan berhingga, berkembang dengan cepat.
Pengetahuan tersebut sangat dibutuhkan oleh seorang Data Scientist untuk membantu dalam menyelesaikan tugas dasar seorang Data Scientist sebagai berikut:
- Memahami dan mendefinisikan permasalahan bisnis
- Mendesain proses analisa
- Menentukan proses pendekatan
- Mengambil insight dan kesimpulan
- Menyusun stategi bisnis
Namun, dalam realitanya seorang Data Scientist tidak dapat melakukan pekerjaannya secara idependent, ada seorang Data Analis (link) dan Data Engineer (link) yang membantu dalam menentukan insight dan strategi bisnis yang sesuai dengan perusahaan yang terkait. Misalkan seorang Data Scientist berada pada perusahaan provider hosting Indonesia, maka dengan seuruh data yang dimiliki oleh perusahaan. Seorang Data Scientist dapat mengkombinasikan data-data yang ada, contohnya data pengguna website untuk menjadi suatu informasi yang akhirnya menjadi sebuah tindakan sehingga dapat menjadikan perusahaan tersebut sebagai perusahaan hosting terbaik Indonesia.