1- Etkin şekilde veriye ulaşmayı sağlayan belirli döneme ait konu odaklı ve bütünleşik veri tabanlarına ne ad verilmektedir?
A) veri martı
B) veri ambarı
C) olap
D) oltp
E) veri küpü
Cevap : b) veri ambarı
2- Aşağıdaki değerlere sahip müşteri yaş verisi için 1-10 aralığında doğrusal dönüşüm uygulanırsa, 32 değerinin veri dönüşümü sonrası yeni değeri aşağıdakilerden hangisidir? 24, 40, 36, 28, 32, 44, 25, 31, 50, 33
A) 4.769
B) 3.769
C) 0.307
D) 2.769
E) 1.769
Cevap : B) 3.769
3- veri ambarları üzerinde karar vermeye yardımcı olacak şekilde gerçekleştirilen sorgulama işlemlerine ne ad verilir?
A) oltp
B) veritabanı
C) olap
D) veri madenciliği
E) veri martı
Cevap : C) olap
4-
X1 |
X2 |
X3 |
Y |
1 |
1 |
1 |
0 |
1 |
1 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
1 |
0 |
0 |
1 |
0 |
0 |
1 |
0 |
1 |
0 |
1 |
1 |
0 |
1 |
1 |
0 |
1 |
1 |
1 |
Yukarıdaki tabloda eğitim verisi yer almaktadır. Bu veri kümesinde X1, X2, X3 nitelik değişkenleri ve Y ise sınıf etiketidir. Naive Bayes sınıflandırıcısını kullanarak X1=0, X2 =0, X3=0 verisi, Y=0 sınıfına hangi olasılıkla aittir?
A) %20.81
B) %63.32
C) %42.85
D) %58.18
E) %35.64
Cevap : C) %42.85
5- Bir ikili sınıflandırma probleminin çözümünde ID3 algoritması kullanılmak istenmektedir. Sınıf niteliği 2 “Evet” ve 8 “Hayır” dan oluşmaktadır. Bu durumda, sınıf niteliğinin entropisi aşağıdakilerden hangisidir?
A) 0.625
B) 0.811
C) 0,479
D) 0.909
E) 0.234
Cevap : C) 0,479
6-
Gelir |
Yaş |
Risk |
12000 |
48 |
düşük |
20000 |
98 |
yüksek |
14000 |
28 |
yüksek |
Bir sigorta şirketinin 3 müşterisi için yıllık gelir ve yaş değerlerine göre risk değerleri yukarıdaki tablodaki gibidir. Geliri 16000 ve yaşı 32 olan bir müsterinin risk değeri uzaklık aralık en yakın komşu algoritması (k-1) kullanılarak tahmin edilirse Yüksek sınıfın toplam ağırlığı ne olacaktır?
A) 20
B) 1,47
C) 12,5
D) 32,5
E) 21,47
Cevap : B) 1,47
7- Bir ıkili siniflandirma probleminde,sınıf niteliginin 7 örnek için Evet, 3 örnek için Hayır olduğu gözlemlenmiştir. Sınıf niteliğinin entropisi hesaplandığında aşağıdaki hangi değeri elde eder?
A) 0,881
B) 0,672
C) 0,970
D) 1
E) 0,785
Cevap : A) 0,881
8- Aşağıdakilerden hangisi bir sınıflandırıcının performansının değerlendirilmesinde kullanılan performans ölçütlerinden biri değildir?
A) Silhouette indeksi
B) Anma
C) Kesinlik
D) F-Ölçüsü
E) ROC Alanı
Cevap : A) Silhouette indeksi
9- Denetimli öğrenmeyi kullanan veri madenciliği fonksiyonları aşağıdakilerden hangisidir?
A) Kümeleme
B) Sınıflandırma-Birliktelik
C) Kümeleme- Sınıflandırma
D) kümeleme- Birliktelik
E) Sınıflandırma- Regresyon
Cevap : E) Sınıflandırma- Regresyon
10- Aşağıdaki listenen değerlere sahip sürekli bir nitelik eşit frekanslı olarak 4 bölüme ayrılır ise ilk bölüm kaç elemandan oluşur? 13,25,12,16,32,13,45,42,46, 32, 39, 64, 10, 14, 21, 17
A) 4
B) 6
C) 7
D) 3
E) 5
Cevap : A) 4
11- Bir ikili sınıflandırma problemi için bir sınıflandırma modelinin çalıştırılması sonucunda elde edilen karışıklık matrisinde doğru pozitif (TP) sayısı 400, yanlış pozitif sayısı (FP) 100, yanlış negatif sayısı (FN) 240 ve yanlış pozitif sayısı (TN) 1600 olarak belirlenmiştir. Bu sınıflandırma modelinin F-ölçüsünün değeri aşağıdakilerden hangisidir?
A) 0,736
B) 0,718
C) 0,702
D) 0,745
E) 0,724
Cevap : C) 0,702
12-
Gerçek tahmini |
+ |
– |
+ |
250 |
50 |
– |
10 |
200 |
Bir sınıflandırma probleminin çözümünde kullanılan sınıflandırma modelinin test kümesi üzerindeki performansına göre oluşturulan matrisi yukarıdaki şekildedir.
Bu sınıflandırma modelinin F ölçüsününün değeri nedir?
A) 0,909
B) 0,892
C) ,0981
D) 0,833
E) 0,962
Cevap : B) 0,892
13-
Yukarıdaki veri kümesi için Entropi (Y) değeri aşağıdakilerden hangisidir?
A) 1
B) 0.5
C) -0.5
D) -1
E) 0
Cevap : A) 1
14-
Gerçek sınıf/Tahmini sınıf |
Evet |
Hayır |
Evet |
40 |
240 |
Hayır |
160 |
9320 |
Dolandırıcılık riskinin tahmini için kullanılan bir ikili sınıflandırma modelinin uygulanması sonucunda elde edilen karışıklık matrisi yukarıdaki gibidir.
Bu sınıflandırıcının doğruluk oranı nedir?
A) %93.7
B) %99.1
C) %95.9
D) %91.5
E) %97.3
Cevap : C) %95.9
15-
Stok |
Fiyat |
Satış |
18 |
40 |
Orta |
20 |
28 |
Yüksek |
30 |
20 |
Yüksek |
26 |
14 |
Yüksek |
14 |
50 |
Düşük |
25 |
36 |
Orta |
6 Farklı ürün için stok adedi ve fiyatı bağlı olarak bir perakende mağazasının satış değerleri yukarıdaki tabloda sunulmkatadır. Uzaklık ağırlık k-en yakın komşusu uygulandığında (K=1), stok adedi 30 ve fiyatı 28 tl olan bir ürün için Satış=YÜKSEK sınıfının ağırlık değeri aşağıdakilerden hangisidir?
A) 5.12
B) 9.88
C) 10.56
D) 7.64
E) 0
Cevap : B) 9.88
|