Konsep   dasar  FCM  yaitu   menentukan  pusat cluster,  yang   akan  menandai  lokasi   rata-rata  untuk  setiap   cluster. Dengan  cara memperbaiki pusat cluster dan derajat keanggotaan setiap titik data  secara   berulang,  maka  akan   dapat  dilihat bahwa  pusat   cluster  akan  bergerak   smenuju lokasi  yang  tepat.   Perulangan  ini  didasarkan pada minimisasi  fungsi   obyektif  yang menggambarkan  jarak   dari  titik  data   yang diberikan  ke  pusat   cluster  yang  terbobot   oleh derajat  keanggotaan  titik  data  tersebut.



Output dari FCM bukan merupakan fuzzy inference system, namun merupakan deretan pusat cluster dan beberapa derajat keanggotaan untuk tiap-tiap titik data. Informasi ini dapat digunakan untuk membangun suatu fuzzy inference system.


Mekanisme Fuzzy C-Means Clustering

Menentukan:

Matriks X yang merupakan data yang akan dicluster, berukuran k x j, dengan k = jumlah data yang akan di-cluster dan j = jumlah variabel/atribut (kriteria).


  1. Menentukan
  2.  Jumlah cluster yang akan dibentuk (n >c ≥ 2).
  3. pembobot (w > 1).
  4. Maksimum iterasi (max n).
  5. Kriteria penghentian/treshold (ɛ = nilai positif yang sangat kecil).
  6. Menentukan fungsi obyektif awal (P0).

Membentuk matriks partisi awal U (derajat keanggotaan dalam cluster) dengan ukuran k x i; matriks partisi biasanya dibuat acak, , dengan k = jumlah data yang akan di-cluster dan i = jumlah cluster


Hitung pusat cluster (V) untuk setiap cluster, menggunakan rumus :


Keterangan:

Vij = pusat cluster pada cluster ke-i dan atribut ke-j

μik = data partisi (pada matriks U) pada cluster ke-i dan data ke-k.

Xkj = data (pada matriks U) pada atribut ke-j dan data ke-k.

w = pembobot.

Perbaiki derajat keanggotaan setiap data pada setiap cluster (perbaiki matriks partisi).

Keterangan:

μik = data partisi (pada matriks U) pada cluster ke-i dan data ke-k.

dik = fungsi ukuran  jarak untuk  jarak Euclidean pada pusat cluster ke-i dan data ke-k.

w = pembobot.

Pn = nilai obyektif pada iterasi ke-n.

Perbaiki derajat keanggotaan setiap data pada setiap cluster (perbaiki matriks partisi)


Keterangan:

μik = data partisi (pada matriks U) pada pusat cluster ke-i.

dik = fungsi ukuran  jarak untuk   jarak Euclidean pada pusat cluster ke-i dan data ke-k.

djk = fungsi ukuran  jarak untuk   jarak Euclidean pada pusat cluster ke-j dan data ke-k.

w = pembobot.

Xkj = data (pada matriks U) pada atribut ke-j dan data ke-k.


Menghentikan  iterasi   jika  pusat  cluster   V tidak  berubah.  Alternatif   kriteria penghentian  adalah  jika   perubahan  nilai error kurang dari treshold |Pn - Pn-1| < ɛ. Alternatif adalah ketika perulangan melebihi maksimum iterasi ( n > max n). Jika iterasi belum berhenti, kembali ke langkah 4.


Jika iterasi berhenti, ditentukan cluster dari tiap-tiap data. Cluster dipilih berdasarkan nilai matriks partisi terbesar.


Kelebihan C-Means

Tangguh terhadap training data yang memiliki banyak noise.

Efektif apabila training datanya besar.
 
 

Kelemahan C-Means

  1. C-Means perlu menentukan nilai dari parameter k (jumlah dari tetangga terdekat).
  2. Training berdasarkan jarak tidak jelas mengenai jenis jarak apa yang harus digunakan.
  3. Atribut mana yang harus digunakan untuk mendapatkan hasil terbaik.
  4. Biaya komputasi cukup tinggi karena diperlukan perhitungan jarak dari tiap query instance pada keseluruhan training sample.

Perhitungan Manual


Status atap

No

SATUS ATAP

BOBOT

1

Atap Daun

3

2

Atap Asbes

2

3

Atap Genting

1


Tabel 4.1 Bobot Status Atap

Status Dinding

No

STATUS DINDING

BOBOT

1

Diding Bambu

3

2

Dinding Kayu

2

3

Dinding Semen

1


Tabel 4.2 Bobot Status Dinding

Status Lantai

No

STATUS LANTAI

BOBOT

1

Lantai Tanah

3

2

Lantai Semen

2

3

Lantai Keramik

1


Tabel 4.3 Bobot Status Lantai


Kemudian masing-masing cluster berisi:

  1. C1 = Layak Huni
  2. C2 = Tinjau ulang
  3. C3 = Tidak Layak Huni


NO KK

NAMA

TANGGUNGAN

PENDAPATAN

STATUS ATAP

STATUS DINDING

STATUS LANTAI

1401030101090004

ADLAN BATU BARA

3

1.000.001,- <= x <= 2.000.000,-

2

2

Lantai Tanah

1401022306100016

AINUDDIN KASIHAN

3

5.000.001,- <= x <= 6.000.000,-

1

1

Lantai Tanah

1401010402090003

ANJASMARA

5

1.000.001,- <= x <= 2.000.000,-

3

2

Lantai Semen

1303101810110001

APRI YANDRA

3

2000.001,- <= x <= 3.000.000,-

3

3

Lantai Tanah

1401022108080001

BASRAN HADI

3

3000.001,- <= x <= 4.000.000,-

1

2

Lantai Tanah

1401030102100018

DULARI

3

2000.001,- <= x <= 3.000.000,-

3

2

Lantai Tanah

1401030102100013

EDWAR

5

>= 7000.000,-

2

3

Lantai Keramik

1401010610080019

HERIHJON

3

1.000.001,- <= x <= 2.000.000,-

3

3

Lantai Tanah

1223082701100005

HISAR SIANTURI

5

1.000.001,- <= x <= 2.000.000,-

2

3

Lantai Tanah

1401010305100006

IR. ENDRA S

2

>= 7000.000,-

3

1

Lantai Semen

1401022411080001

JAMARIS

4

2000.001,- <= x <= 3.000.000,-

1

2

Lantai Semen

1207211509093817

MARTIN YUSUF

4

4.000.000,- <= x <= 5.000.000,-

3

1

Lantai Semen

1306040804090001

OSKARNOF

2

2000.001,- <= x <= 3.000.000,-

3

3

Lantai Semen

1203031909120002

PANYAHATAN H

4

5.000.001,- <= x <= 6.000.000,-

2

3

Lantai Semen

1304100502090004

REFDES HENDRI

2

>= 7000.000,-

3

3

Lantai Semen

1401030102100017

RIYAN HIDAYAT

4

5.000.001,- <= x <= 6.000.000,-

1

3

Lantai Semen

1401020401082983

SUMADI

4

1.000.001,- <= x <= 2.000.000,-

3

3

Lantai Tanah

1401030102100012

SURI IRIANTI

3

2000.001,- <= x <= 3.000.000,-

2

3

Lantai Tanah

1401030102100014

SUTAN LAWEH

3

1.000.001,- <= x <= 2.000.000,-

1

3

Lantai Tanah

1401030102100016

TASLIM

6

1.000.001,- <= x <= 2.000.000

2

3

Lantai Tanah


Tabel 4.4 Sampel Data Latih

Kemudian selanjutnya kita tentukan nilai cluster awal pada tiap-tiap cluster.

  • c1 Memiliki Nilai Sebagai Berikut :



==> 2
 ==> 3
 ==> 9



  • c2 Memiliki Nilai Sebagai Berikut :

==> 1
 ==> 7
 ==> 6

  • c3 Memiliki Nilai Sebagai Berikut :

==> 3
 ==> 4
 ==> 9

Selanjutnya untuk mencari nilai pada setiap cluster kita menggunakan rumus sebagai berikut.

Keterangan:

μik = data partisi (pada matriks U) pada cluster ke-i dan data ke-k.

dik = fungsi ukuran  jarak untuk   jarak Euclidean pada pusat cluster ke-i dan data ke-k.

w = pembobot.

Pn = nilai obyektif pada iterasi ke-n.


Sehingga jika dijabarkan untuk mencari nilai cluster 1 pada data PANYAHATAN adalah sebagai berikut



Dari rumus diatas didapat hasil pada data PANYAHATAN adalah begitu terus sampai cluster ke-n dan data ke-n. Berikut tabel data yang sudah didapat.





No KK

Nama

Tanggungan

Pendapatan

Kondisi Rumah

CLUSTER1

CLUSTER2

CLUSTER3

C1

C2

C3

2

3

9

1

7

6

3

4

9

L.Huni

Tinjau Ulang

T.Layak

1203031909120000

PANYAHATAN H

4

2

7

3

5.92

3

C1


C3

1207211509093810

MARTIN YUSUF

4

3

6

3.61

5

3.32



C3

1223082701100000

HISAR SIANTURI

5

6

8

4.36

4.58

3



C3

1303101810110000

APRI YANDRA

3

5

9

2.24

4.12

1



C3

1304100502090000

REFDES HENDRI

2

1

8

2.24

6.4

3.32

C1



1306040804090000

OSKARNOF

2

5

8

2.24

3

1.73



C3

1401010305100000

IR. ENDRA S

2

1

6

3.61

6.08

4.36

C1



1401010402090000

ANJASMARA

5

6

7

4.69

4.24

3.46



C3

1401010610080010

HERIHJON

3

6

9

3.16

3.74

2



C3

1401020401082980

SUMADI

4

6

9

3.61

4.36

2.24



C3

1401022108080000

BASRAN HADI

3

4

6

3.32

3.61

3



C3

1401022306100010

AINUDDIN KASIHAN

3

2

5

4.24

5.48

4.47

C1



1401022411080000

JAMARIS

4

5

5

4.9

3.74

4.24


C2


1401030101090000

ADLAN BATU BARA

3

6

7

3.74

2.45

2.83


C2


1401030102100010

SURI IRIANTI

3

5

8

2.45

3.46

1.41



C3

1401030102100010

EDWAR

5

1

6

4.69

7.21

4.69

C1


C3

1401030102100010

SUTAN LAWEH

3

6

7

3.74

2.45

2.83


C2


1401030102100010

TASLIM

6

6

8

5.1

5.48

3.74



C3

1401030102100010

RIYAN HIDAYAT

4

2

6

3.74

5.83

3.74

C1


C3

1401030102100010

DULARI

3

5

8

2.45

3.46

1.41



C3



















Tabel 4.5 Perhitungan Iterasi Ke-1


Tabel diatas adalah hasil dari perhitungan algoritma c-means, selanjutnya nilai terkecil pada setiap cluster akan di masukan kedalam cluster tersebut. Selanjutnya membentuk nilai cluster baru.


Nilai dari stiap Cluster yang nantinya akan menjadi Cluster baru :


  • c1 Memiliki Nilai Sebagai Berikut :



==>20/6 = 3.33
 ==>9/6 = 1.5
 ==>38/6 = 6.33

  • c2 Memiliki Nilai Sebagai Berikut :

==>10/3 = 3.33
 ==>17/3 = 5.67
 ==>19/3 = 6.33

  • c3 Memiliki Nilai Sebagai Berikut :

==>54/14 = 3.86
 ==>62/14 = 4.43
 ==>105/14 = 7.5

Total nilai pada iterasi pertama adalah= 42.28


Ketika sudah didapat nilai cluster yang baru, kemudian dilanjutkan dengan iterasi ke-2, iterasi ini akan berhenti apabila nilai pada iterasi sama dengan nilai pada iterasi sebelumnya.

No KK

Nama

Tanggungan

Pendapatan

Kondisi Rumah

CLUSTER1

CLUSTER2

CLUSTER3

C1

C2

C3

3,33

1,3

6,33

3,33

5,67

6,33

3.86

4.43

7.5

L.Huni

Tinjau Ulang

T.Layak

1203031909120000

PANYAHATAN H

4

2

7

1.07

3.79

2.48

C1



1207211509093810

MARTIN YUSUF

4

3

6

1.68

2.77

2.08

C1 



1223082701100000

HISAR SIANTURI

5

6

8

5.08

2.38

2



C3

1303101810110000

APRI YANDRA

3

5

9

4.41

2.77

1.82



C3

1304100502090000

REFDES HENDRI

2

1

8

2.19

5.13

3.93

C1



1306040804090000

OSKARNOF

2

5

8

4.1

2.24

2.01



C3

1401010305100000

IR. ENDRA S

2

1

6

1.46

4.87

4.18

C1



1401010402090000

ANJASMARA

5

6

7

4.85

1.83

2


 C2


1401010610080010

HERIHJON

3

6

9

5.24

2.71

2.34



C3

1401020401082980

SUMADI

4

6

9

5.28

2.77

2.18



C3

1401022108080000

BASRAN HADI

3

4

6

2.54

1.73

1.78


 C2


1401022306100010

AINUDDIN KASIHAN

3

2

5

1.46

3.92

3.59

C1



1401022411080000

JAMARIS

4

5

5

3.8

1.63

2.57


C2


1401030101090000

ADLAN BATU BARA

3

6

7

4.56

0.82

1.86


C2


1401030102100010

SURI IRIANTI

3

5

8

3.89

1.83

1.15



C3

1401030102100010

EDWAR

5

1

6

1.77

4.97

3.91

C1



1401030102100010

SUTAN LAWEH

3

6

7

4.56

0.82

1.86


C2


1401030102100010

TASLIM

6

6

8

5.49

3.17

2.7



C3

1401030102100010

RIYAN HIDAYAT

4

2

6

0.9

3.75

2.86

C1



1401030102100010

DULARI

3

5

8

3.89

1.83

1.15



C3



















Tabel 4.6 Perhitungan Iterasi Ke-2

Nilai dari stiap Cluster yang nantinya akan menjadi Cluster baru :


  • c1 Memiliki Nilai Sebagai Berikut :

==>24/7 = 3.43
 ==>12/7 = 1.71
 ==>44/7 = 6.29


  • c2 Memiliki Nilai Sebagai Berikut :



==>18/5 = 3.6
 ==>27/5 = 5.4
 ==>32/5 = 6.4


  • c3 Memiliki Nilai Sebagai Berikut :



==>29/8 = 3.63
 ==>44/8 = 5.5
 ==>67/8 = 8.38



Total nilai pada iterasi kedua adalah= 44.34

No KK

Nama

Tanggungan

Pendapatan

Kondisi Rumah

CLUSTER1

CLUSTER2

CLUSTER3

C1

C2

C3

3,43

1,71

6,29

3,6

5,4

6,4

3,63

5,5

8,38

L.Huni

Tinjau Ulang

T.Layak

1203031909120000

PANYAHATAN H

4

2

7

0.96

3.48

3.78

C1



1207211509093810

MARTIN YUSUF

4

3

6

1.44

2.47

3.47

C1 



1223082701100000

HISAR SIANTURI

5

6

8

4.88

2.21

1.51



C3

1303101810110000

APRI YANDRA

3

5

9

4.28

2.7

1.02



C3

1304100502090000

REFDES HENDRI

2

1

8

2.34

4.95

4.8

C1



1306040804090000

OSKARNOF

2

5

8

3.97

2.3

1.75



C3

1401010305100000

IR. ENDRA S

2

1

6

1.62

4.7

5.35

C1



1401010402090000

ANJASMARA

5

6

7

4.62

1.64

2.01


 C2


1401010610080010

HERIHJON

3

6

9

5.09

2.73

1.02



C3

1401020401082980

SUMADI

4

6

9

5.11

2.7

0.88



C3

1401022108080000

BASRAN HADI

3

4

6

2.35

1.57

2.88


 C2


1401022306100010

AINUDDIN KASIHAN

3

2

5

1.39

3.73

4.91

C1



1401022411080000

JAMARIS

4

5

5

3.58

1.51

3.44


C2


1401030101090000

ADLAN BATU BARA

3

6

7

4.37

1.04

1.6


C2


1401030102100010

SURI IRIANTI

3

5

8

3.73

1.75

0.89



C3

1401030102100010

EDWAR

5

1

6

1.75

4.63

5.27

C1



1401030102100010

SUTAN LAWEH

3

6

7

4.37

1.04

1.6


C2


1401030102100010

TASLIM

6

6

8

5.29

2.95

2.45



C3

1401030102100010

RIYAN HIDAYAT

4

2

6

0.7

3.45

4.25

C1



1401030102100010

DULARI

3

5

8

3.73

1.75

0.89



C3



















Tabel 4.7 Perhitungan Iterasi Ke-3

Sampai iterasi ketiga tidak ada perubahan data, total dari nilai iterasi ke=3 sama dengan total iterasi ke-2 atau sebelumnya. Sampai disini iterasi berhenti dan hasil telah di dapatkan, dapat dilihat seperti tabel dibawah ini.

NO KK

NAMA

TANGGUNGAN

PENDAPATAN

STATUS ATAP

STATUS DINDING

STATUS LANTAI

1401030102100018

DULARI

3

2000.001,- <= x <= 3.000.000,-

3

2

Lantai Tanah

1401030102100013

EDWAR

5

>= 7000.000,-

2

3

Lantai Keramik

1401010610080019

HERIHJON

3

1.000.001,- <= x <= 2.000.000,-

3

3

Lantai Tanah

1306040804090001

OSKARNOF

2

2000.001,- <= x <= 3.000.000,-

3

3

Lantai Semen

1401020401082983

SUMADI

4

1.000.001,- <= x <= 2.000.000,-

3

3

Lantai Tanah

1401030102100012

SURI IRIANTI

3

2000.001,- <= x <= 3.000.000,-

2

3

Lantai Tanah

1401030102100016

TASLIM

6

1.000.001,- <= x <= 2.000.000

2

3

Lantai Tanah

;