Veri Madenciliği

Auzef Veri Madenciliği Deneme Sınavları

Vize Final
2023-24 Vize Soruları
2022-23 Vize Soruları

Öğrenci Dostu
Öğrenme Yönetim Sistemi – LOLONOLO

 

Veri Madenciliği 2022-2023 Vize soruları

1- Etkin şekilde veriye ulaşmayı sağlayan belirli döneme ait konu odaklı ve bütünleşik veri tabanlarına ne ad verilmektedir?

A) veri martı
B) veri ambarı
C) olap
D) oltp
E) veri küpü

Cevap : b) veri ambarı

2- Aşağıdaki değerlere sahip müşteri yaş verisi için 1-10 aralığında doğrusal dönüşüm uygulanırsa, 32 değerinin veri dönüşümü sonrası yeni değeri aşağıdakilerden hangisidir? 24, 40, 36, 28, 32, 44, 25, 31, 50, 33

A) 4.769
B) 3.769
C) 0.307
D) 2.769
E) 1.769

Cevap : B) 3.769

3- veri ambarları üzerinde karar vermeye yardımcı olacak şekilde gerçekleştirilen sorgulama işlemlerine ne ad verilir?

A) oltp
B) veritabanı
C) olap
D) veri madenciliği
E) veri martı

Cevap : C) olap

4-

X1 X2 X3 Y
1 1 1 0
1 1 0 0
0 0 0 0
0 1 0 0
1 0 0 1
0 1 0 1
1 0 1 1
0 1 1 1

Yukarıdaki tabloda eğitim verisi yer almaktadır. Bu veri kümesinde X1, X2, X3 nitelik değişkenleri ve Y ise sınıf etiketidir. Naive Bayes sınıflandırıcısını kullanarak X1=0, X2 =0, X3=0 verisi, Y=0 sınıfına hangi olasılıkla aittir?

A) %20.81
B) %63.32
C) %42.85
D) %58.18
E) %35.64

Cevap : C) %42.85

5- Bir ikili sınıflandırma probleminin çözümünde ID3 algoritması kullanılmak istenmektedir. Sınıf niteliği 2 “Evet” ve 8 “Hayır” dan oluşmaktadır. Bu durumda, sınıf niteliğinin entropisi aşağıdakilerden hangisidir?

A) 0.625
B) 0.811
C) 0,479
D) 0.909
E) 0.234

Cevap : C) 0,479

6-

Gelir Yaş Risk
12000 48 düşük
20000 98 yüksek
14000 28 yüksek

Bir sigorta şirketinin 3 müşterisi için yıllık gelir ve yaş değerlerine göre risk değerleri yukarıdaki tablodaki gibidir. Geliri 16000 ve yaşı 32 olan bir müsterinin risk değeri uzaklık aralık en yakın komşu algoritması (k-1) kullanılarak tahmin edilirse Yüksek sınıfın toplam ağırlığı ne olacaktır?

A) 20
B) 1,47
C) 12,5
D) 32,5
E) 21,47

Cevap : B) 1,47

7- Bir ıkili siniflandirma probleminde,sınıf niteliginin 7 örnek için Evet, 3 örnek için Hayır olduğu gözlemlenmiştir. Sınıf niteliğinin entropisi hesaplandığında aşağıdaki hangi değeri elde eder?

A) 0,881
B) 0,672
C) 0,970
D) 1
E) 0,785

Cevap : A) 0,881

8- Aşağıdakilerden hangisi bir sınıflandırıcının performansının değerlendirilmesinde kullanılan performans ölçütlerinden biri değildir?

A) Silhouette indeksi
B) Anma
C) Kesinlik
D) F-Ölçüsü
E) ROC Alanı

Cevap : A) Silhouette indeksi

9- Denetimli öğrenmeyi kullanan veri madenciliği fonksiyonları aşağıdakilerden hangisidir?

A) Kümeleme
B) Sınıflandırma-Birliktelik
C) Kümeleme- Sınıflandırma
D) kümeleme- Birliktelik
E) Sınıflandırma- Regresyon

Cevap : E) Sınıflandırma- Regresyon

10- Aşağıdaki listenen değerlere sahip sürekli bir nitelik eşit frekanslı olarak 4 bölüme ayrılır ise ilk bölüm kaç elemandan oluşur? 13,25,12,16,32,13,45,42,46, 32, 39, 64, 10, 14, 21, 17

A) 4
B) 6
C) 7
D) 3
E) 5

Cevap : A) 4

11- Bir ikili sınıflandırma problemi için bir sınıflandırma modelinin çalıştırılması sonucunda elde edilen karışıklık matrisinde doğru pozitif (TP) sayısı 400, yanlış pozitif sayısı (FP) 100, yanlış negatif sayısı (FN) 240 ve yanlış pozitif sayısı (TN) 1600 olarak belirlenmiştir. Bu sınıflandırma modelinin F-ölçüsünün değeri aşağıdakilerden hangisidir?

A) 0,736
B) 0,718
C) 0,702
D) 0,745
E) 0,724

Cevap : C) 0,702

12-

Gerçek tahmini +
+ 250 50
10 200

Bir sınıflandırma probleminin çözümünde kullanılan sınıflandırma modelinin test kümesi üzerindeki performansına göre oluşturulan matrisi yukarıdaki şekildedir.
Bu sınıflandırma modelinin F ölçüsününün değeri nedir?

A) 0,909
B) 0,892
C) ,0981
D) 0,833
E) 0,962

Cevap : B) 0,892

13-

X Y
1 +
0

Yukarıdaki veri kümesi için Entropi (Y) değeri aşağıdakilerden hangisidir?

A) 1
B) 0.5
C) -0.5
D) -1
E) 0

Cevap : A) 1

14-

Gerçek sınıf/Tahmini sınıf Evet Hayır
Evet 40 240
Hayır 160 9320

Dolandırıcılık riskinin tahmini için kullanılan bir ikili sınıflandırma modelinin uygulanması sonucunda elde edilen karışıklık matrisi yukarıdaki gibidir.
Bu sınıflandırıcının doğruluk oranı nedir?

A) %93.7
B) %99.1
C) %95.9
D) %91.5
E) %97.3

Cevap : C) %95.9

15-

Stok Fiyat Satış
18 40 Orta
20 28 Yüksek
30 20 Yüksek
26 14 Yüksek
14 50 Düşük
25 36 Orta

6 Farklı ürün için stok adedi ve fiyatı bağlı olarak bir perakende mağazasının satış değerleri yukarıdaki tabloda sunulmkatadır. Uzaklık ağırlık k-en yakın komşusu uygulandığında (K=1), stok adedi 30 ve fiyatı 28 tl olan bir ürün için Satış=YÜKSEK sınıfının ağırlık değeri aşağıdakilerden hangisidir?

A) 5.12
B) 9.88
C) 10.56
D) 7.64
E) 0

Cevap : B) 9.88

Veri Madenciliği

 

Üniteler

Veri Madenciliğine Giriş
Veri Madenciliği Fonksiyonları
Veri Önişleme
Sınıflandırmanın Temel Kavramları Ve Karar Ağaçları İle Sınıflandırma
Bayes Teoremi Ve Bayes Ağları İle Sınıflandırma
Örnek Tabanlı Sınıflandırma Ve Sınıflandırıcı Performansının Değerlendirilmesi
Kümeleme Analizine Giriş Ve Benzerlik Ve Uzaklık Ölçüleri
K Ortalamalar Algoritması İle Kümeleme
Hiyerarşik Kümeleme Ve Kümeleme Kalitesinin Ölçülmesi
Birliktelik Kurallarının Temel Kavramları
Appriori Algoritması İle Birliktelik Kuralları Madenciliği
Fp-Ağacı İle Birliktelik Kuralları Madenciliği Ve Çok Seviyeli Birliktelik Kuralları
Sıralı Desen Madenciliği
Weka Yazılımı İle Veri Madenciliği Uygulamaları

Auzef Yönetim Bilişim Sistemleri Lisans

Veri Madenciliği

 Veri Madenciliği Auzef Veri Madenciliği Ders kitabı pdf

Auzef Ders kitabı

Yönetim Bilişim Sistemleri Lisans Auzef Yönetim Bilişim Sistemleri Lisans Telegram-min
error: Kopyalamaya Karşı Korumalıdır!