 |
 |
| |
|
Search Engine |
|
Manfaatkan Google untuk memperoleh sejumlah informasi
yang Anda inginkan dalam hansmichael.com.
|
|
| Kutipan |
Anyone who considers arithmetical methods of producing random numbers is, of course, in a state of sin.
John Louis von Neumann
|
|
|
Tokoh Hari Ini
|
|
Blaise Pascal
Blaise Pascal lahir pada 19 Juni 1623 di Rouen, Perancis. Ia meninggal dunia pada tahun 1666 di Perancis.
Pascal adalah ahli matematika, fisika, penulis prosa, dan dikenal sebagai salah satu filsuf Kristen abad pertengahan. Pascal menemukan mesin penjumlah yang mengatur penambahan carry antar digit dan segitiga Pascal yang memuat koefisien-koefisien deret binomial. Ia juga penemu roda gerobak sampai roda rolet. Pascal juga meletakkan dasar bagi teori modern probabilitas: hukum Pascal untuk Tekanan. Menariknya, walaupun ia ahli dalam berbagai bidang sains, pemikiran religiusnya sebagai filsuf Kristen menekankan doktrin yang lebih mengutamakan pengalaman dengan Tuhan lebih melalui hati daripada melalui nalar.
|
|
|
|
|
Knowledge Discovery in Databases (IS704)
dan Data Mining (CS704)
Contoh Soal
| 1. |
Tunjukkan kebenaran
pernyataan-pernyataan ini (Cukup tulis BENAR atau SALAH):
- Minimum confidence tidak diperlukan dalam fase
pencarian large item sets.
- Algoritma PRISM (Cendrowska) menghasilkan
classification rules, sedangkan pasangan APRIORI dan SIMPLE Algoritma (Agrawal)
menghasilkan association rules.
Jumlah dan elemen dari large itemsets L1,
L2, sampai Lk
yang dihasilkan algoritma Apriori akan tepat sama dengan yang dihasilkan
algoritma AIS.
Jika r1=0.35 dan r2=-0.65
masing-masing adalah nilai korelasi Pearson, maka r2 memiliki korelasi
yang lebih kuat (stronger correlation) dibanding r1.
Rule: age(X, "20…29")
AND buys(X,
"laptop") ---> buys(X, "color printer") termasuk dalam kategori
hybrid-dimension association rule.
Hirarki konsep digunakan untuk klasifikasi
association rules berdasarkan dimensi data.
Rule: buys(X, KodeBarang1) a buys(X,
KodeBarang2) termasuk dalam kategori intradimension dan single level
association rules, jika KodeBarang1 dan KodeBarang2 adalah primitive
(raw) data.
Rule: "Customer yang membeli LaserJet pada Juni 2001 cenderung
untuk memesan Cartridge baru dalam bulan Desember 2003i" termasuk
output Sequential Pattern Discovery dalam Link Analysis.
|
| 2. |
Sebutkan (tak perlu dijelaskan) 5 pendekatan
yang dapat dipakai dalam Data Transformation. |
| 3. |
Sebutkan dengan urut (tak perlu dijelaskan,
tetapi urutan yang salah tidak akan dinilai) 5 fase Sequential Pattern
Mining. |
| 4. |
Tulislah rumus yang digunakan untuk
Pearson Correlation Analysis. Jelaskan dengan singkat semua komponen
rumus tersebut, termasuk untuk mengukur apakah nilai yang diperoleh. |
|
5. |
Jika
attribute memiliki value-value : 28, 21, 26, 4, 34, 8, 9, 15, 29, 21, 25,
24 tulislah value-value baru dengan urutan yang sama setelah smoothing
diterapkan dengan menggunakan:
-
bin means, depth 3
-
bin medians, depth 3
-
bin boundaries, depth 4
|
| 6. |
Jika
sebuah attribute memiliki value-value : 1800, -27500, 800, 9900, -500, tulislah
value-value baru dengan urutan yang sama hasil normalisasi dengan
menggunakan:
-
Decimal scaling normalization
-
Min-Max normalization, dengan range baru [1..10]
-
z-score normalization
|
|
7. |
Dengan
minimum support = 60% dapatkan rule-rule yang memiliki nilai support yang
sama, tetapi dengan nilai confidence yang berbeda. Tulis rule-rule
tersebut lengkap dengan nilai confidence masing-masing. (Caranya terserah
Anda. Algoritma tidak penting. Hanya hasil akhir yang dilihat)
T1
: Hulk, Nemo, Shrek
T2
: Hulk, LiloStich, Nemo, Pinocchio, Shrek
T3
: Antz, Sinbad
T4
: Antz, Nemo
T5 : Antz, Hulk,
LiloStich, Nemo, Shrek |
|
8. |
Pada
pencarian large itemsets dengan menggunakan algoritma AIS dan minimum
supportnya = 30%, tunjukkan nilai-nilai L1
, Lt
, Ct ,
C2
,
dan L2
(masing-masing menggunakan tabel) untuk kumpulan transaksi di bawah ini:
T10 : 1, 2
T20 : 1, 2, 3
T30 : 1, 2, 3, 4
T40 : 1, 4
T50 : 2, 4 |
|
9. |
Algoritma Apriori diterapkan untuk kumpulan transaksi
di bawah dengan minimum support = 40%. Anda hanya diminta menulis semua
pruning yang terjadi, saat algoritma melakukan operasi join, atau (
Cn=
Lm
JOIN Lm
) untuk
semua nilai n yang mungkin, dimana m = n - 1. Setiap kali pruning harus
diawali dengan penomoran P1, P2, P3, dan seterusnya. Ingat: dalam
sebuah operasi join, mungkin terjadi lebih dari sebuah pruning.
T10 : 1, 3, 4
T20 : 2, 3, 5
T30 : 1, 2, 3, 5
T40 : 2, 5 |
|
10. |
Tulislah
Transformed Database Setelah Pemetaan untuk kumpulan transaksi di bawah
ini, ketika Sequential Pattern Mining dilakukan dengan minimum support =
25%. Anda tidak diminta mencari rulenya.
|
|
 |
 |