Apa itu machine learning?

Machine learning adalah ilmu pengembangan algoritme dan model secara statistik yang digunakan sistem komputer untuk menjalankan tugas tanpa instruksi eksplisit, mengandalkan pola serta inferensi sebagai gantinya. Sistem komputer menggunakan algoritme machine learning untuk memproses data historis berjumlah besar dan mengidentifikasi pola data. Hal ini memungkinkannya untuk memprediksi hasil yang lebih akurat dari set data input yang diberikan. Misalnya, ilmuwan data dapat melatih aplikasi medis untuk mendiagnosis kanker dari gambar sinar-x dengan cara menyimpan jutaan gambar yang dipindai dan diagnosis yang sesuai.

Mengapa machine learning itu penting?

Machine learning membantu bisnis dengan cara mendorong pertumbuhan, membuka aliran pendapatan baru, dan menyelesaikan masalah-masalah yang menantang. Data adalah penggerak yang penting di balik pengambilan keputusan bisnis, tetapi secara tradisional, perusahaan telah menggunakan data dari berbagai sumber, seperti umpan balik pelanggan, karyawan, dan keuangan. Penelitian machine learning mengotomatiskan dan mengoptimalkan proses ini. Dengan menggunakan perangkat lunak yang menganalisis data bervolume besar dengan kecepatan tinggi, bisnis akan dapat mencapai hasil secara lebih cepat.

Kasus penggunaan machine learning dan contoh dunia nyata

Mari perhatikan aplikasi machine learning di beberapa industri kunci:

Manufaktur

Machine learning dapat mendukung pemeliharaan prediktif, kontrol kualitas, dan riset inovatif dalam sektor manufaktur. Teknologi machine learning juga membantu perusahaan meningkatkan solusi logistik, termasuk aset, rantai pasokan, dan manajemen inventaris. Misalnya, raksasa manufaktur 3M menggunakan machine learning untuk menginovasikan ampelas. Algoritme machine learning memungkinkan para peneliti 3M untuk menganalisis cara perubahan kecil dalam bentuk, ukuran, dan orientasi dapat meningkatkan sifat abrasif serta daya tahan. Saran-saran tersebut menginformasikan proses manufaktur.

Layanan kesehatan dan ilmu hayati

Perkembangan sensor dan perangkat sandangan telah menghasilkan data kesehatan yang signifikan. Program machine learning menganalisis informasi ini dan mendukung para dokter mendiagnosis serta merawat secara waktu nyata. Para peneliti machine learning sedang mengembangkan solusi yang mendeteksi tumor kanker dan mendiagnosis penyakit mata, yang memengaruhi hasil kondisi kesehatan manusia secara signifikan. Misalnya, Cambia Health Solutions menggunakan machine learning untuk mengotomatiskan dan menyesuaikan perawatan untuk wanita hamil.

Jasa keuangan

Proyek machine learning keuangan meningkatkan analitik dan regulasi risiko. Teknologi machine learning memungkinkan para investor untuk mengidentifikasi peluang baru dengan cara menganalisis pergerakan pasar saham, mengevaluasi pengelola investasi global, atau melakukan kalibrasi portofolio keuangan. Selain itu, teknologi machine learning dapat membantu mengidentifikasi klien pinjaman berisiko tinggi dan mengurangi tanda-tanda penipuan. Misalnya, NerdWallet, perusahaan keuangan pribadi, menggunakan machine learning untuk membandingkan produk keuangan seperti kartu kredit, perbankan, dan pinjaman.

Ritel

Retail dapat menggunakan machine learning untuk meningkatkan layanan pelanggan, manajemen stok, pemasaran upselling dan lintas saluran. Misalnya,Amazon Fulfillment (AFT) dapat memotong biaya infrastruktur hingga 40 persen menggunakan model machine learning untuk mengidentifikasi inventaris yang salah tempat. Hal ini membantu mereka, sesuai janji Amazon, untuk memastikan bahwa item akan tersedia bagi para pelanggan dan tiba tepat waktu, kendati mereka perlu memproses jutaan pengiriman global setiap tahun.

Media dan hiburan

Perusahaan hiburan beralih ke machine learning untuk lebih memahami audiens target mereka dan memberikan konten yang imersif, terpersonalisasi, dan sesuai permintaan. Algoritme machine learning dilakukan deployment untuk mendesain trailer serta iklan lainnya, memberikan rekomendasi konten yang dipersonalisasi kepada konsumen, dan bahkan menyederhanakan produksi. 

Misalnya, Disney menggunakan machine learning untuk mengarsipkan perpustakaan medianya. Alat machine learning secara otomatis menandai, mendeskripsikan, dan menyortir konten media, sehingga memungkinkan penulis dan animator Disney untuk mencari dan membiasakan diri dengan karakter Disney secara cepat.

Penglihatan komputer

Visi komputer adalah teknologi yang secara otomatis mengenali dan menjelaskan gambar secara akurat dan efisien. Saat ini, sistem komputer dapat mengakses banyak gambar dan video dari smartphone, kamera lalu lintas, sistem keamanan, dan perangkat lainnya. Aplikasi penglihatan komputer menggunakan machine learning untuk memproses data ini secara akurat untuk identifikasi objek dan pengenalan wajah, serta klasifikasi, rekomendasi, pemantauan, dan deteksi.

Misalnya, CampSite adalah platform perangkat lunak terkemuka untuk perkemahan musim panas. Kamp mereka mengunggah ribuan gambar setiap hari untuk menghubungkan orang tua dengan pengalaman kamp anak mereka. Menemukan foto kemping mereka menjadi tugas yang memakan waktu dan membuat frustrasi bagi orang tua. CampSite menggunakan machine learning untuk secara otomatis mengidentifikasi gambar dan memberi tahu orang tua ketika foto baru anak mereka diunggah.

Bagaimana cara kerja machine learning?

Gagasan utama di balik machine learning adalah hubungan matematis yang ada antara semua kombinasi data input dan output. Model machine learning tidak mengetahui hubungan ini sebelumnya, tetapi dapat menerka jika diberikan set data yang cukup. Hal ini berarti setiap algoritme machine learning dibangun di seputar fungsi matematika yang dapat dimodifikasi. Prinsip yang mendasarinya dapat dipahami seperti ini:

  1. Kami “melatih” algoritme tersebut dengan memberinya kombinasi input/output (i,o) berikut – (2,10), (5,19), dan (9,31)
  2. Algoritme tersebut mengomputasi hubungan antara input dan output menjadi: o=3*i+4
  3. Selanjutnya, kami memberinya input 7 dan memintanya untuk memprediksi output. Algoritme tersebut dapat secara otomatis menentukan output-nya menjadi 25.

Meskipun ini adalah pemahaman dasar, machine learning berfokus pada prinsip bahwa semua poin data kompleks dapat dihubungkan secara matematis oleh sistem komputer selama sistem komputer tersebut memiliki data dan daya komputasi yang cukup untuk memproses data tersebut. Oleh karena itu, keakuratan output tersebut secara langsung berkorelasi dengan besarnya input yang diberikan.

Apa saja tipe algoritme machine learning?

Algoritme dapat dikelompokkan berdasarkan empat gaya belajar yang berbeda tergantung pada output yang diperkirakan dan tipe input.

  1. Machine learning yang diawasi
  2. Machine learning yang tidak diawasi
  3. Pembelajaran yang semi-diawasi
  4. Machine learning penguatan

1. Machine learning yang diawasi

Ilmuwan data memasok algoritme dengan data pelatihan yang diberi label dan ditentukan untuk menilai korelasi. Sampel data menentukan baik input maupun output algoritme. Misalnya, gambar angka tulisan tangan diberi anotasi untuk menunjukkan angka yang sesuai. Sistem pembelajaran yang diawasi dapat mengenali klaster piksel dan bentuk yang terkait dengan setiap angka, jika diberikan contoh yang cukup. Sistem pembelajaran tersebut pada akhirnya akan mengenali angka tulisan tangan, yang dengan reliabel membedakan antara angka 9 dan 4 atau 6 dan 8. 

Kekuatan pembelajaran yang diawasi adalah kesederhananaan dan kemudahan desainnya. Sistem pembelajaran ini sangat berguna saat memprediksi kemungkinan set hasil yang terbatas, membagi data ke dalam kategori, atau mengombinasikan hasil dari dua algoritme machine learning lainnya. Namun, melabeli jutaan set data tidak berlabel adalah hal yang menantang. Mari lihat lebih dekat hal berikut:

Apa itu pelabelan data?

Pelabelan data adalah proses menggolongkan data input dengan nilai output ditentukan yang terkait. Data pelatihan berlabel diperlukan untuk pembelajaran yang diawasi. Misalnya, jutaan gambar apel dan pisang perlu ditandai dengan kata “apel” atau “pisang.” Kemudian, aplikasi machine learning dapat menggunakan data pelatihan ini untuk menerka nama buah saat diberi sebuah gambar buah. Namun, melabeli jutaan data yang baru mungkin menjadi tugas yang memakan waktu dan menantang. Layanan crowd-working seperti Amazon Mechanical Turk dapat mengatasi keterbatasan algoritme pembelajaran yang diawasi ini sampai batas tertentu. Layanan ini menyediakan akses ke kolam besar tenaga kerja terjangkau yang tersebar di seluruh dunia, sehingga dapat mengurangi kesulitan dalam akuisisi data.

2. Machine learning yang tidak diawasi

Algoritme pembelajaran yang tidak diawasi melatih data tidak berlabel. Algoritme ini memindai melalui data baru, yang berupaya membangun hubungan penting antara input dan output yang telah ditentukan. Algoritme ini dapat menemukan pola dan menggolongkan data. Misalnya, algoritme yang tidak diawasi dapat mengelompokkan artikel berita dari situs berita yang berbeda ke dalam kategori umum seperti olahraga, kriminal, dll. Algoritme ini dapat menggunakan pemrosesan bahasa alami untuk memahami makna dan emosi dalam artikel tersebut. Dalam retail, pembelajaran yang tidak diawasi dapat menemukan pola dalam pembelian pelanggan dan memberikan hasil analisis data seperti — pelanggan kemungkinan besar akan membeli roti jika membeli mentega juga.

Pembelajaran yang tidak diawasi berguna untuk rekognisi pola, deteksi anomali, dan mengelompokkan data secara otomatis ke dalam beberapa kategori. Karena data pelatihan tidak memerlukan pelabelan, pengaturannya menjadi mudah. Algoritme ini juga dapat digunakan untuk membersihkan dan memproses data untuk pemodelan lebih lanjut secara otomatis. Keterbatasan metode ini adalah tidak dapat memberikan prediksi yang presisi. Selain itu, metode ini tidak dapat memilih hasil data tipe tertentu secara independen.

3. Pembelajaran yang semi-diawasi

Seperti namanya, metode ini menggabungkan pembelajaran yang diawasi dan yang tidak diawasi. Teknik ini mengandalkan penggunaan sejumlah kecil data berlabel dan sejumlah besar data tidak berlabel untuk melatih sistem. Pertama, data berlabel digunakan untuk melatih algoritme machine-learning secara parsial. Setelah itu, algoritme yang dilatih secara parsial itu sendiri melabeli data yang tidak berlabel. Proses ini disebut pelabelan semu. Model tersebut kemudian dilatih kembali pada campuran data yang dihasilkan tanpa diprogram secara eksplisit.

Keuntungan metode ini adalah Anda tidak memerlukan data berlabel dalam jumlah besar. Metode ini berguna saat mengerjakan data seperti dokumen panjang yang akan terlalu memakan waktu dalam pembacaan dan pelabelan bagi manusia.

4. Pembelajaran penguatan

Pembelajaran penguatan adalah metode yang memiliki nilai penghargaan tersemat pada langkah-langkah berbeda yang harus dilalui oleh algoritme. Jadi, tujuan model ini adalah untuk mengakumulasi poin penghargaan sebanyak mungkin dan pada akhirnya mencapai tujuan akhir. Sebagian besar aplikasi praktis pembelajaran penguatan dalam dekade terakhir adalah berada di ranah gim video. Algoritme pembelajaran penguatan yang canggih telah mencapai hasil yang mengesankan dalam gim-gim klasik dan modern, yang sering kali secara signifikan mengalahkan pasangan manusia mereka. 

Meskipun metode ini paling baik bekerja dalam lingkungan data yang tidak pasti dan kompleks, metode ini jarang diterapkan dalam konteks bisnis. Metode ini tidak efisien untuk tugas yang terdefinisi dengan baik, dan bias developer dapat memengaruhi hasil. Karena ilmuwan data mendesain penghargaan, mereka dapat memengaruhi hasilnya.

Apakah model machine learning bersifat deterministik?

Jika sebuah output sistem dapat diprediksi, maka output sistem ini dapat dikatakan deterministik. Sebagian besar aplikasi perangkat lunak merespons tindakan pengguna dengan cara yang dapat diprediksi, sehingga Anda dapat berkata: “Jika pengguna melakukan ini, maka dia akan mendapatkan itu.” Namun, algoritme machine learning belajar melalui pengamatan beserta dengan pengalaman. Oleh karena itu, algoritme ini bersifat probabilistik. Pernyataan sekarang berubah menjadi: “Jika pengguna melakukan ini, ada kemungkinan X% hal itu terjadi.”

Dalam machine learning, determinisme adalah strategi yang digunakan saat menerapkan metode pembelajaran yang dijelaskan di atas. Salah satu metode pelatihan yang diawasi, tidak diawasi, dan metode pelatihan lainnya dapat dibuat deterministik tergantung pada hasil yang diinginkan bisnis. Rumusan masalah, pengambilan data, struktur, dan keputusan penyimpanan akan menentukan apakah strategi deterministik atau non-deterministik diadopsi.

Pendekatan deterministik vs. probabilistik

Pendekatan deterministik berfokus pada akurasi dan jumlah data yang dikumpulkan, sehingga efisiensi lebih diprioritaskan daripada ketidakpastian. Di sisi lain, proses non-deterministik (atau probabilistik) didesain untuk mengelola faktor peluang. Alat bawaan terintegrasi ke dalam algoritme machine learning untuk membantu menghitung, mengidentifikasi, serta mengukur ketidakpastian selama pembelajaran dan observasi.

Apa itu deep learning?

Deep learning adalah tipe teknik machine learning yang dimodelkan pada otak manusia. Algoritme deep learning menganalisis data dengan struktur logika yang mirip dengan yang digunakan oleh manusia. Deep learning menggunakan sistem cerdas yang disebut jaringan neural buatan untuk memproses informasi yang berlapis-lapis. Data mengalir dari lapisan input melalui beberapa lapisan jaringan neural tersembunyi yang “dalam” sebelum muncul ke lapisan output. Lapisan tersembunyi tambahan mendukung pembelajaran yang jauh lebih mampu dibandingkan model machine learning standar.

Apa itu jaringan neural buatan?

Lapisan deep learning adalah simpul jaringan neural buatan (ANN) yang beroperasi seperti neuron otak manusia. Simpul dapat berupa kombinasi perangkat keras dan perangkat lunak. Setiap lapisan dalam algoritme deep learning dibuat dari simpul ANN. Setiap simpul, atau neuron buatan, saling terhubung dengan yang lainnya dan memiliki angka nilai terkait dan nilai ambang batas. Sebuah simpul mengirimkan angka nilainya sebagai sebuah input ke simpul lapisan berikutnya saat diaktifkan. Simpul ini diaktifkan hanya jika output-nya di atas nilai ambang batas yang ditentukan. Jika tidak, tidak ada data yang akan diteruskan.

Apa itu penglihatan komputer?

Penglihatan komputer adalah aplikasi deep learning di dunia nyata. Seperti halnya kecerdasan buatan yang memungkinkan komputer untuk berpikir — penglihatan komputer memungkinkan komputer untuk melihat, mengamati, dan merespons. Mobil otonom menggunakan penglihatan komputer untuk "membaca" rambu-rambu jalan. Kamera mobil menangkap foto rambu-rambu tersebut. Foto tersebut dikirim ke algoritme deep learning dalam mobil. Lapisan tersembunyi yang pertama mendeteksi tepian, lapisan selanjutnya membedakan warna, sedangkan lapisan yang ketiga mengidentifikasi detail alfabet pada rambu-rambu. Algoritme memprediksi bahwa rambu-rambu terbaca STOP, dan mobil merespons dengan memicu mekanisme rem.

Apakah machine learning dan deep learning itu sama?

Deep learning adalah sub-kumpulan machine learning. Algoritme deep learning dapat dianggap sebagai evolusi algoritme machine learning yang canggih maupun kompleks secara matematis.

Apakah machine learning dan kecerdasan buatan itu sama?

Jawaban singkatnya adalah tidak. Meskipun istilah Machine learning dan Kecerdasan Buatan (AI) dapat digunakan secara bergantian, keduanya tidaklah sama. Kecerdasan Buatan adalah istilah payung untuk strategi dan teknik yang berbeda, yang digunakan untuk membuat mesin menjadi lebih mirip manusia. AI mencakup semua hal mulai dari asisten cerdas seperti Alexa hingga penyedot debu robotik dan mobil otonom. Machine learning adalah satu di antara banyak cabang Kecerdasan Buatan lainnya. Walaupun machine learning adalah AI, semua aktivitas AI tidak dapat disebut machine learning.

Apakah machine learning dan ilmu data itu sama?

Tidak, machine learning dan ilmu data tidaklah sama. Ilmu data adalah bidang studi yang menggunakan pendekatan ilmiah untuk mengekstraksi makna dan wawasan dari data. Ilmuwan data menggunakan berbagai alat untuk analisis data, dan machine learning adalah salah satu alat tersebut. Ilmuwan data memahami gambaran yang lebih besar seputar data seperti model bisnis, domain, dan pengumpulan data, sedangkan machine learning adalah proses komputasi yang hanya menangani data mentah.

Apa saja keuntungan dan kerugian machine learning?

Mari lihat beberapa hal yang dapat dilakukan dan yang tidak dapat dilakukan oleh machine learning:

Keuntungan model machine learning:

  • Dapat mengidentifikasi tren dan pola data yang mungkin dilewatkan manusia.
  • Dapat bekerja tanpa intervensi manusia setelah disiapkan. Misalnya, machine learning di perangkat lunak keamanan siber dapat memantau dan mengidentifikasi penyimpangan di lalu lintas jaringan tanpa input administrator.
  • Hasil dapat menjadi lebih akurat dari waktu ke waktu.
  • Dapat menangani berbagai format data dalam lingkungan data yang dinamis, bervolume tinggi, dan kompleks.

Kerugian model machine learning:

  • Pelatihan awal merupakan proses yang mahal dan memakan waktu. Mungkin sulit diimplementasikan jika tidak tersedia cukup data.
  • Ini adalah proses komputasi intensif yang membutuhkan investasi awal yang besar jika perangkat keras disiapkan di rumah.
  • Mungkin sulit untuk menginterpretasikan hasil dengan benar dan mengeliminasi ketidakpastian tanpa bantuan ahli.          

Bagaimana machine learning Amazon dapat membantu?

AWS menempatkan machine learning di tangan setiap developer, ilmuwan data, dan pengguna bisnis. Layanan Amazon Machine Learning menyediakan infrastruktur berperforma tinggi, hemat biaya, dan dapat diskalakan untuk memenuhi kebutuhan bisnis.

Baru memulai?

Pelajari machine learning dengan perangkat edukasi langsung kami seperti AWS DeepRacer, AWS DeepComposer dan AWS DeepLens.

Sudah memiliki arsip data?

Gunakan Amazon SageMaker Ground Truth untuk alur kerja pelabelan data bawaan yang mendukung video, gambar, dan teks.

Sudah memiliki sistem Machine Learning?

Gunakan Amazon SageMaker Clarify untuk mendeteksi bias dan Amazon SageMaker Debugger untuk memantau dan mengoptimalkan performa.

Ingin mengimplementasikan deep learning?

Gunakan Amazon SageMaker Distributed Training untuk melatih model deep learning yang besar secara otomatis. Daftar akun gratis untuk memulai perjalanan machine learning Anda sekarang juga!

Langkah berikutnya di machine learning