Jurnal Naive Bayes

  • View
    51

  • Download
    1

Embed Size (px)

Transcript

206 Jurnal Ilmiah KURSOR Vol. 5, No. 3, Januari 2009, hlm. 137-146

DETEKSI RESIKO PEMBERIAN KREDIT TERHADAP CALON NASABAH PADA BANK SWASTAIsyar Andika Harun

-Mail: *kawatdunia@gmail.comAbstrak

Dalam membantu perekonomian Negara, Bank berfungsi sebagai sumber dana bagi masyarakat yang membutuhkan dengan memberikan pinjaman kepada nasabahnya yang disebut dengan kredit. Ketika memberikan kredit kepada seseorang, Bank memiliki dua kemungkinan pengembalian dana yaitu baik dan buruk. Penentuan ini bisa dilihat dari data nasabah terdahulu tapi dengan data yang sangat banyak tentu tidak efektif untuk dilakukan pengecekan data secara manual. Maka dibutuhkanlah sebuah sistem yang dapat membantu untuk mengklasifikasikan resiko kredit kepada calon nasabah. Dengan melihat data data dan informasi lainnya dari calon nasabah serta data historis dari nasabah terdahulu maka sistem ini diharapkan mampu mengklasikasian nasabah tersebut ke dalam kelas baik atau buruk. Proses pengklasifikasian menggunakan metode nave bayes yang menggunakan perbandingan statistik dianggap mampu menyelesaikan permasalahan ini.Kata kunci: Bank, Klasifikasi, Kredit, Naive Bayes, Nasabah, Resiko.Abstract

In helping nations economy, Bank serves as a source of funds for the people by providing loans to its customer. This called credit. While giving credit to someone, Bank has two chances of a refund which is good and bad. To determine what is good and bad customer Banks can see from the previous customer data history. But the data is very much of course not effective to do checking of the data manually. So bank need a system that can help to classify the credit risk from a customers. By looking the previous data this system is expected to classify the customer in tho good or bad grade. The process of classification using Naive Byes Method that uses a statistical comparison are considered to be able to resolve this issue Keywords: Bank, Classification, Credit, Naive Bayes, Customer, Risk.

PENDAHULUAN

Perbankan merupakan salah satu lembaga yang berkewajiban untuk meperlancar arus kegiatan di bidang ekonomi dan pengembangan perekonomian. Aktivitas Bank tidak hanya menghimpun dana dari masyarakat tetapi berfungsi sebagai sumber dana bagi masyarakat yang membutuhkan dengan memberikan pinjaman bagi nasabahnya. Aktivitas ini disebut dengan kredit. Menurut Suyatno (2003) [1], kredit adalah penyediaan uang atau tagihan-tagihan yang dapat disamakan dengan itu berdasarkan persetujuan pinjam meminjam antara bank dengan pihak lain dalam hal mana pihak meminjam berkewajiban melunasi utangnya setelah jangka waktu tertentu dengan jumlah bunga yang telah ditetapkan. Dalam memberikan kredit, Bank harus mempunyai kepercayaan terhadap calon penerima kredit bahwa dana yang diberikan akan digunakan sesuai dengan tujuan yang diajukan oleh calon penerima kredit dan pada akhirnya akan dikembalikan lagi kepada Bank sesuai dengan perjanjian yang disepakati bersama. Namun kredit yang diberikan kepada para peminjam selalu ada resiko berupa kredit tidak dapat kembali tepat pada waktunya yang dinamakan kredit bermasalah. Kredit bermasalah selalu ada dalam kegiatan perkreditan Bank karena Bank tidak mungkin menghindari adanya kredit bermasalah [2]. Tindakan Bank dalam usaha menyelamatkan dan menyelesaikan kredit bermasalah ada beraneka ragam. Salah satunya dengan memperhatikan historis dari nasabah calon penerima kredit [3].

Permasalahannya adalah data historis Bank begitu banyak sehingga menyebabkan analisa data secara manual menjadi tidak praktis. Sehingga dibutuhkan suatu sistem komputer yang dapat mempelajari data historis dari peminjaman kredit di Bank. Banyak metode yang dapat digunakan untuk mempelajari data historis tersebut dan mengenali pola-pola yang ada. Salah satunya adalah Naive Bayes. Naive Bayes merupakan salah satu metode pengklasifikasian yang disusun dari sudut pandang statistik. Jika X melambangkan set atribut data dan Y melambangkan kelas variabel. Jika variabel kelas memiliki hubungan dengan atribut maka dapat diperkakukan X dan Y sebagai variabel acak dan menangkap hubungan peluang menggunakan P(X|Y). Selama fase training, perlu mepelajari peluang psoterior untuk seluruh kombinasi X dan Y berdasar informasi yang diperoleh dari training data. Dengan mengetahui peluang ini maka akan diketahui P(X1,X2,...Xn|Y1) dan P(X1,X2,...Xn|Y1) jika yang satu lebih besar dari yang lain maka pilihan atribut tersebut masuk ke kelas yang ada.NAIVE BAYESMenurut Rachli (2007) [4], sebelum mendeskripsikan bagaimana Naive Bayes digunakan untuk klasifikasi, disusun masalah klasifikasi dari sudut pandang statistika. Jika X melambangkan set atribut data dan Y . jika variabel kelas memiliki hubungan non deterministic dengan atirbut, maka diperlukan X dan Y sebagai variabel acak dan menangkap hubungan peluang menggunakan P(X|Y). Peluang bersyarat ini juga dikenal dengan posterior peluang untuk Y, dan sebaliknya prior P(Y). Selama fase training, perlu mempelajari peluang posterior untuk seluruh kombinasi X dan Y berdasar informasi yang diperoleh dari training data. Dengan mengetahui peluang ini, test record X dapat diklasifikasikan dengan menemukan kelas Y yang memaksimalkan peluang psoterior P(X|Y). Untuk mengilustrasikan pendekatan ini diberikan contoh memprediksi apakah seseorang gagal mengembalikan pinjamannya.[5]. Tabel 1 memperlihatkan data training dengan atribut Home Owner, Marital Status, dan Annual Income. Peminjam yang gagal membayar diklasifikasikan sebagai Yes, seseorang yang membayar kembali sebagai No.NoHome OwnerMarital StatusAnnual IncomeDefaulted Borrower

1YesSingle120KNo

2NoMarried100KNo

3NoSingle70KNo

4YesMarried120KNo

5NoDivorce95KYes

6NoMarried60KNo

7YesDivorce220KNo

8NoSingle85KYes

9NoMarried75KNo

10NoSingle90KYes

Tabel 1. Contoh Data TrainingJika diberkan test record dengan atribut berikut X = (Home Owner = No, Marital Status = Married, Annual Income = $120K). Maka untuk mengklasfikasi data tersebut masuk klasifikasi apa ,maka cara yang dilakukan adalah sebagai berikut :P(Yes) = 3/10, P(No) = 7/10P(Home Owner=No|Y=Yes) = 3/3 = 1

P(Home Owner=No|Y=No) = 4/7P(Marital Status=Married|Y=Yes) = 0/3

P(Marital Status=Married|Y=No) = 4/7P(Income=120|Y=Yes) = 0/3

P(Income=120|Y=No) = 1/7

P (No, Married, 120|Y=Yes) :=P(P(No|Y=Yes).P(Married|Y=Yes).P(120|Y=Yes).P(Yes)}

={(1).(0/3).(0/3).(3/10)}

= 0P (No,Married,120|Y=No) :

=P(P(No|Y=No).P(Married|Y=No).P(120|Y=No).P(Y=No)}

={(4/7).(4/7).(1/7).(7/10)}

= 0,032

Karena P (No,Married,120|Y=No) > P (No, Married, 120|Y=Yes) maka keputusannya adalah No.

METODOLOGI

Alur proses penelitian secara keseluruhan dapat dilihat pada gambar berikut :

Gambar 1. Alur PenelitianLangkah-langkah yang dilakukan dalam melakukan penelitian adalah pertama mengumpulkan data historis yang bersumber dari dari http://archive.ics.uci.edu/ml/machine-learning-databases/statlog/german/german.dataDataset tersebut berjumlah 1000 data. Ke-1000 data ini harus dikonfirmasi untuk menetukan data training dan data testing. Untuk menentukan data testing dan data training adalah data tersebut diurutkan terlebih dahulu berdasarkan kelasnya. Setelah terurut lalu diambil 100 data untuk dijadikan data testing. Cara pengambilannya dengan mengambil tiap data ke-10 dari 1000 data hingga berjumlah 100 buah. 900 data sisa menjadi data training.Tahap berikutnya adalah tahap training. Tahapan ini terdiri dari beberapa langkah :

1. Mencari nilai peluang bersyarat

Pada atribut kategori xi, peluang bersyarat P(X = xi | Y = y) dicari menurut pecahan data training

Pada atribut kontinyu dicari dengan menggunakan rumus

2. Mencari nilai peluang prior

Untuk mencari nilai peluang prior P(Y) tiap kelas, dapat dicari dengan menghitung pecahan tiap training record yang dimiliki tiap kelas.Tahap training dapat dilihat pada flowchart berikut

Gambar 2 Tahap TrainingTahap terakhir adalah menentukan klasifikasi

Klasifikasi merupakan proses penentuan kelas dari instance yang belum diketahui kelas sebelumnya. Dalam naive bayes classifier akan dihasilkan kelas resiko kredit baik dan buruk. Kelas resiko kredit yang digunakan adalah yang terbesar, yaitu baik didapatkan jika P(Baik|X) > P(Buruk|X) dimana X adalah atribut yang sudah dikethui. Sebaliknya buruk didapat jika P(Baik|X) < P(Buruk|X).

Langkah-langkah pada tahap ini adalah :

1. User menginputkan data

2. Penentuan peluang bersyarat P(Xi = xi | Y= y) sesuai dengan hasil training dimana Xi, sesuai dengan inputan user.3. Mencari hasil kali dari tiap peluang yang didapat dari nomor 14. Mencari peluang posterior P(Y|X)5. Untuk mengklasifikasi record, jika P(Y1|X) > P(Y2|X), maka record diklasifikasikan sebagai Y1, sebaliknya diklasifikasikan sebagai Y2

6. Jika record tidak dapat diklasifikasikan karena peluang posterior P(Y|X) =0 maka dilakukan pendekatan m-estimasi untuk mengestimasi peluang

Gambar 3 Tahap KlasifikasiHASIL DAN PEMBAHASANEksperimen dilakukan untuk menguji kinerja sistem prediksi resiko kredit calon nasabah. Data testing yang digunakan adalah data testing yang telah disebutkan sebelumnya. 1000 data yang telah diurutkan berdasarkan kelasnya, diambil satu data setiap 10 kelas. Hingga berjumlah 100. 100 data yang telah diambil ini akan ditesting pada program untuk melihat persentasi keakuratan dari program yang telah dibuat.Langkah yang dilakukan adalah memasukkan data satu persatu ke dalam sistem untuk menguji keakuratannya. Gambar berikut adalah contoh form penginputan data ke dalam sistem.

Gambar 4 Tampilan ProgramSetelah data dimasukkan semua maka pencet tombol Hitung Prediksi untuk melihat hasil prediksinya berdasarkan teori Naive Bayes. Jika perhitungan menghasilkan