Algoritma hash based yang digunakan dalam data mining adalah Apriori Algorithm. Langkah-langkah untuk mengaplikasikan algoritma ini pada data tabel transaksi penjualan adalah sebagai berikut:
Mengonversi data tabel ke dalam bentuk setiap transaksi berupa himpunan produk yang dibeli.
Transaksi Produk
T1 {Cabe merah, jeruk}
T2 {Asparagus, Jagung}
... ...
T10 {Alpukat, Tomat}
Membuat frequent itemset kandidat dari itemset dengan 1 produk.
Frequent Itemset Kandidat 1 Support Count
Cabe merah 1
Jeruk 1
Asparagus 1
Jagung 1
... ...
Alpukat 1
Tomat 1
Membuat frequent itemset dengan 2 produk dengan cara melakukan join antara frequent itemset kandidat 1 dengan dirinya sendiri dan memeriksa apakah itemset baru tersebut termasuk dalam setiap transaksi.
Frequent Itemset Kandidat 2 Support Count
{Cabe merah, Jeruk} 1
{Asparagus, Jagung} 1
... ...
{Alpukat, Tomat} 1
Membuat frequent itemset dengan 3 produk dengan cara melakukan join antara frequent itemset kandidat 2 dengan dirinya sendiri dan memeriksa apakah itemset baru tersebut termasuk dalam setiap transaksi.
Frequent Itemset Kandidat 3 Support Count
... ...
Menerapkan prinsip downward closure untuk mengeliminasi frequent itemset yang tidak memenuhi support count minimum yang ditetapkan.
Frequent Itemset Support Count
{Cabe merah} 1
{Jeruk} 1
{Asparagus} 1
{Jagung} 1
{Alpukat} 1
{Tomat} 1
{Cabe merah, Jeruk} 1
{Asparagus, Jagung} 1
Dari hasil tersebut, diperoleh frequent itemset yang terdiri dari satu produk dan frequent itemset yang terdiri dari dua produk dengan support count >= 2. Dapat disimpulkan bahwa produk-produk yang sering dibeli oleh pelanggan adalah Cabe merah, Jeruk, Asparagus, Jagung, Alpukat, dan Tomat. Sedangkan produk-produk yang sering dibeli secara bersamaan adalah Cabe merah dan Jeruk, serta Asparagus dan Jagung.
Verified answer
Jawaban:
Algoritma hash based yang digunakan dalam data mining adalah Apriori Algorithm. Langkah-langkah untuk mengaplikasikan algoritma ini pada data tabel transaksi penjualan adalah sebagai berikut:
Mengonversi data tabel ke dalam bentuk setiap transaksi berupa himpunan produk yang dibeli.
Transaksi Produk
T1 {Cabe merah, jeruk}
T2 {Asparagus, Jagung}
... ...
T10 {Alpukat, Tomat}
Membuat frequent itemset kandidat dari itemset dengan 1 produk.
Frequent Itemset Kandidat 1 Support Count
Cabe merah 1
Jeruk 1
Asparagus 1
Jagung 1
... ...
Alpukat 1
Tomat 1
Membuat frequent itemset dengan 2 produk dengan cara melakukan join antara frequent itemset kandidat 1 dengan dirinya sendiri dan memeriksa apakah itemset baru tersebut termasuk dalam setiap transaksi.
Frequent Itemset Kandidat 2 Support Count
{Cabe merah, Jeruk} 1
{Asparagus, Jagung} 1
... ...
{Alpukat, Tomat} 1
Membuat frequent itemset dengan 3 produk dengan cara melakukan join antara frequent itemset kandidat 2 dengan dirinya sendiri dan memeriksa apakah itemset baru tersebut termasuk dalam setiap transaksi.
Frequent Itemset Kandidat 3 Support Count
... ...
Menerapkan prinsip downward closure untuk mengeliminasi frequent itemset yang tidak memenuhi support count minimum yang ditetapkan.
Frequent Itemset Support Count
{Cabe merah} 1
{Jeruk} 1
{Asparagus} 1
{Jagung} 1
{Alpukat} 1
{Tomat} 1
{Cabe merah, Jeruk} 1
{Asparagus, Jagung} 1
Dari hasil tersebut, diperoleh frequent itemset yang terdiri dari satu produk dan frequent itemset yang terdiri dari dua produk dengan support count >= 2. Dapat disimpulkan bahwa produk-produk yang sering dibeli oleh pelanggan adalah Cabe merah, Jeruk, Asparagus, Jagung, Alpukat, dan Tomat. Sedangkan produk-produk yang sering dibeli secara bersamaan adalah Cabe merah dan Jeruk, serta Asparagus dan Jagung.