Machine Learning - Mendeteksi Transaksi Penipuan dengan Isolation Forests
Di dunia digital yang semakin terhubung, miliaran transaksi terjadi setiap hari melalui berbagai sistem, dari terminal point-of-sale di dalam toko tradisional hingga gateway pembayaran online. Sistem-sistem ini telah memberikan peluang besar dan membantu mendorong bisnis inovatif baru dengan model bisnis yang unik. Meskipun telah ada manfaat yang signifikan, juga terjadi peningkatan tajam dalam kejahatan dunia maya yang semakin canggih.
Salah satu bentuk kejahatan siber yang paling umum adalah penipuan kartu kredit, yang menyumbang miliaran dolar yang tercatat di sektor keuangan secara global. Mengingat jumlah transaksi yang terjadi setiap hari, menantang bagi institusi keuangan untuk memerangi penjahat siber; kemajuan terbaru dalam Machine Learning telah melahirkan metode baru untuk mengidentifikasi dan mendeteksi transaksi penipuan. Identifikasi penipuan yang akurat memungkinkan strategi mitigasi otomatis seperti memperingatkan pelanggan dan meminta konfirmasi lebih lanjut sebelum transaksi dilanjutkan.
Studi kasus ini mengeksplorasi pendekatan berorientasi pembelajaran mesin untuk identifikasi penipuan kartu kredit. Pembelajaran Mesin telah terbukti efektif dalam banyak pengaturan berbeda dan juga efisien dalam menjalankan volume data yang besar, pertimbangan penting bagi insinyur perangkat lunak yang menerapkan sistem perbankan.
Pendekatan baru dikembangkan pada tahun 2008 dalam [1] dengan memanfaatkan properti unik dari outlier, yaitu bahwa outlier biasanya terisolasi relatif terhadap mayoritas titik data. Mengingat properti ini, dimungkinkan untuk menghasilkan partisi acak di sekitar titik data untuk menutup sebuah titik data, semakin sedikit partisi yang diperlukan untuk mengisolasi sebuah titik data, semakin besar kemungkinan titik data tersebut adalah outlier. Algoritma yang dikembangkan memiliki kompleksitas waktu linear dan terbukti bekerja dengan baik bahkan ketika data pelatihan yang terbatas tersedia; ini berbeda dengan pendekatan tipikal yang meminta data pelatihan yang luas.

Ikhtisar Tantangan Organisasi
Mempertimbangkan bahwa miliaran transaksi terjadi setiap hari, mendeteksi outlier penipuan dan menjalankan model secara real-time merupakan tantangan. Pemeriksaan visual menyoroti bahwa mencari jarum dalam tumpukan jerami seperti mencari jarum. Gambar berikut menggambarkan transaksi perbankan dari waktu ke waktu, dengan yang sah berwarna hijau dan yang penipuan berwarna merah. Sangat menantang untuk mengisolasi transaksi penipuan. Lembaga keuangan diwajibkan untuk berupaya memerangi penipuan guna mematuhi peraturan. Hal ini juga merupakan ekspektasi pelanggan. Biasanya, ketika penipuan terjadi, lembaga keuangan menanggung biaya untuk menjaga kepuasan pelanggan.


Organisasi semakin beralih ke metode machine learning sebagai bagian dari perjalanan transformasi digital mereka untuk memecahkan masalah yang membutuhkan skala seperti deteksi penipuan. Banyak pembuat indikator untuk mendeteksi penipuan biasanya disimpan dalam gudang data. Teknik akuntansi forensik juga cukup canggih dalam menentukan metrik yang digunakan sebagai input untuk model machine learning.
Isolation forest telah diterapkan pada dataset kartu kredit Kaggle [2] dan telah terbukti 99% efektif dalam mendeteksi transaksi penipuan [3]. Mengingat bahwa pendekatan umum yang berhasil telah ditentukan, sebagian besar organisasi menghadapi tantangan implementasi yang bekerja dalam skala besar daripada harus melakukan penelitian & mengembangkan solusi.
Data Organisasional yang Tersedia sebagai Input ML
Sumber data yang digunakan oleh lembaga keuangan adalah sebagai berikut:
- Meta-data pelanggan.
- Stempel waktu dan jumlah transaksi.
- Riwayat transaksi pelanggan.
- Lokasi geografis transaksi.
- Hukum Benford.
Metodologi Integrasi
Berikut adalah ikhtisar proses yang akan kami lakukan pada tingkat tinggi untuk menganalisis umpan tersebut di dalam sebuah organisasi:
- Identifikasi metrik keuangan dari sistem ERP yang dapat digunakan sebagai input.
- Latih isolation forest pada dataset awal, dan terus latih model tersebut ke masa depan untuk memastikan model mendeteksi pola transaksi penipuan yang lebih baru.
- Dengan memanggil API Telemus AI™ untuk menjalankan Isolation Forest pada transaksi masuk, API mengembalikan estimasi probabilistik tentang kemungkinan transaksi penipuan berdasarkan model.
- Siapkan alur kerja dan proses yang disesuaikan untuk memperingatkan tim penipuan serta pelanggan tentang transaksi yang berpotensi curang
Telemus AI™ memiliki model machine learning yang kuat sehingga organisasi Anda dapat fokus pada logika bisnis daripada implementasi teknis.
Aplikasi Organisasional
Berikut ini mencantumkan aplikasi potensial lainnya untuk organisasi Anda:
- Mendeteksi transaksi curang.
- Mendeteksi klaim karyawan yang curang.
- Menentukan perilaku organisasi yang tidak biasa melalui sistem pelacakan sumber daya manusia.
Manfaat Potensial dan yang Terealisasi
Mengingat besarnya waktu dan biaya yang ditimbulkan oleh penipuan keuangan serta kerusakan reputasi dan ketidakpuasan pelanggan yang dapat ditimbulkannya, pencegahan penipuan secara aktif dapat menghemat hingga jutaan, bahkan miliaran dolar, tergantung pada skala operasi. Badan regulasi juga terus mengeluarkan pedoman kepatuhan yang lebih ketat. Ada ekspektasi bahwa lembaga keuangan memiliki proses, prosedur, dan sistem untuk mencegah dan memerangi penipuan. Teknologi regulasi, atau RegTech, adalah bidang yang sedang berkembang yang memiliki potensi untuk mendorong banyak inovasi di dalam departemen operasi banyak organisasi ke depannya.
Telemus AI™ adalah perusahaan kecerdasan buatan yang berbasis di Australia yang menyediakan solusi lanjutan untuk pemerintah dan perusahaan. Hubungi kami hari ini untuk konsultasi gratis tentang bagaimana Telemus AI™ dapat diintegrasikan ke dalam organisasi Anda.
Referensi
[1] - Isolation Forest - Fei Tony Liu, Kai Ming Ting, dan Zhi-Hua Zhou
[2] - Deteksi Penipuan Kartu Kredit - Kaggle
[3] - Machine Learning dalam Deteksi Penipuan Kartu Kredit - S Joel Franklin











