Veri Madenciliği Final Deneme Sınavı -8

Haziran 14, 2024 Editor

Auzef Veri Madenciliği Final Deneme Sınavı -8

#1. Hangi değişken türü, sayısal bir ilişkiye sahip değildir ancak sıralanabilir?

A) Nominal Değişkenler

B) Sürekli Değişkenler

C) Kesikli Değişkenler

D) Ordinal Değişkenler

E) Yapısal Değişkenler

Cevap: D) Ordinal Değişkenler

Açıklama: Ordinal değişkenler, sayısal bir ilişkiye sahip olmadan sıralanabilir değişkenlerdir.

#2. Veri madenciliği sürecinde hangi adım veri setlerinin temizlenmesini, düzenlenmesini ve hazırlanmasını içerir?

A) Modelleme

B) Örüntü Tanıma

C) Doğrulama ve Değerlendirme

D) Tahmin ve Karar Destek

E) Ön İşleme

Cevap: E) Ön İşleme

Açıklama: Ön işleme, veri madenciliği sürecinde veri setlerinin temizlenmesi, düzenlenmesi ve hazırlanmasını içerir.

#3. Doğal dil işleme (NLP) ile ilgili olarak hangisi doğrudur?

A) Sadece sayısal verilerle çalışır.

B) İnsan dilini bilgisayar programlarının anlaması için bir yöntem içermez.

C) Metin madenciliğinin bir alt alanıdır.

D) Kelime türü etiketleme, metin bölümleme gibi zorlukları içerir.

E) Yalnızca yapılandırılmış metinsel veriyi analiz eder.

Cevap: D) Kelime türü etiketleme, metin bölümleme gibi zorlukları içerir.

Açıklama: Doğal dil işleme (NLP), kelime türü etiketleme ve metin bölümleme gibi zorlukları içerir ve insan dilini bilgisayar programlarının anlaması için çeşitli yöntemler içerir.

#4. Yaşlı ve genç yetişkinler arasındaki algılanan yaşam doyumunun farklarını incelemek amacıyla bir araştırma yapılmıştır. 10 kişilik iki gruptan oluşan, 70 yaş üstü yaşlı yetişkinlere ve 20 – 30 yaş arası genç yetişkinlere yüksek güvenilirlik ve geçerliliği olduğu bilinen bir yaşam memnuniyeti testi verilmiştir. Ölçüm puanları 0 (en düşük) – 60 (en yüksek) arasındadır. Yaşlı yetişkinlerin verdiği puanların ortalaması 44.5 ve varyansı 75.39 iken genç yetişkinlerin verdiği puanların ortalaması 28.1 ve varyansı 72.99 olarak hesaplanmıştır. Yaşlı ve genç yetişkinler arasındaki ortalama yaşam memnuniyetinin farklı olduğu iddiasını %5 anlam düzeyinde test ediniz ve yorumlayınız. - Yukarıdaki örneğe göre kritik test istatistiği değeri kaçtır?

A) 3,91

B) 3,59

C) 4,26

D) 3,02

E) 2,23

Cevap: E) 2,23

Açıklama: Kritik test istatistiği değeri %5 anlamlılık düzeyinde 2,23’tür.

#5. Hangisi veri, enformasyon ve bilgi arasındaki ilişkiyi doğru ifade eder?

A) Veri, enformasyonun işlenmiş haliyken, bilgi bu verilerin düzenlenmiş hali olarak tanımlanır.

B) Bilgi, enformasyonun daha detaylı bir versiyonudur ve veri en basit formudur.

C) Veri, ham ve işlenmemiş bilgileri ifade ederken, enformasyon bu verilerin işlenmiş ve düzenlenmiş hali olarak tanımlanır, bilgi ise enformasyonun işlenmiş ve kullanılabilir hali olarak tanımlanır.

D) Bilgi, verilerin anlamlı hale geldiği durumu temsil ederken, enformasyon bu verilerin anlam kazanmış hali olarak tanımlanır.

E) Veri, enformasyonun daha basit bir formu iken, bilgi bu verilerin en kapsamlı hali olarak tanımlanır.

Cevap: C) Veri, ham ve işlenmemiş bilgileri ifade ederken, enformasyon bu verilerin işlenmiş ve düzenlenmiş hali olarak tanımlanır, bilgi ise enformasyonun işlenmiş ve kullanılabilir hali olarak tanımlanır.

Açıklama: Veri, enformasyon ve bilgi arasındaki ilişki, verinin işlenerek enformasyona, enformasyonun da anlam kazanarak bilgiye dönüşmesi sürecini yansıtır.

#6. Metin madenciliği adımları arasında hangisi metni belirli parçalara böler?

A) Metin ön işleme

B) Model oluşturma

C) Özellik mühendisliği

D) Tokenizasyon

E) Doğal Dil İşleme

Cevap: D) Tokenizasyon

Açıklama: Tokenizasyon, metni belirli parçalara, genellikle kelimelere veya cümlelere bölen bir adımdır.

#7. Sınıflandırma teknikleri genellikle hangi tür veri kümeleri üzerinde etkilidir?

A) Sayısal veriler

B) Sıralı kategoriler

C) Metin verileri

D) İki kategorili veriler

E) Hiçbiri

Cevap: D) İki kategorili veriler

Açıklama: Sınıflandırma teknikleri, özellikle iki kategorili veriler üzerinde etkilidir, çünkü bu teknikler verileri belirli sınıflara ayırmayı amaçlar.

#8. Kosinüs mesafesi genellikle hangi tür veri kümesinde kullanılır?

A) Sayısal veriler

B) Metin verileri

C) Görüntü verileri

D) Sıralı kategoriler

E) Karmaşık yapıdaki veriler

Cevap: B) Metin verileri

Açıklama: Kosinüs mesafesi, metin verileri arasında benzerlik ölçmek için yaygın olarak kullanılır ve vektörlerin arasındaki açıyı ölçerek benzerlik derecesini belirler.

#9. Aşağıdaki durumlardan hangisi metin analitiği ile ilgili değildir?

A) Anahtar kelime çıkarma

B) Bilgi çıkarma

C) Hava durumu tahmini

D) Veri madenciliği

E) İlgili belge arama

Cevap: C) Hava durumu tahmini

Açıklama: Hava durumu tahmini, metin analitiği ile ilgili değildir. Metin analitiği, yapılandırılmamış metinsel verilerden anlam ve bilgi çıkarma ile ilgilidir.

#10. F1 skoru, neden hassasiyet ve duyarlılık metriklerinin harmonik ortalamasını kullanarak denge kurar?

A) Hassasiyet ve duyarlılık arasındaki doğrusal ilişkiyi vurgular.

B) Modelin yanlış pozitiflerine odaklanır, yanlış negatiflere dikkat etmez.

C) Hassasiyet ve duyarlılığın ortalamasını alarak dengeyi sağlar.

D) Yüksek F1 skoru, modelin sadece bir metriğe odaklandığını gösterir.

E) Modelin performansını değerlendirmek için uygun bir metrik değildir.

Cevap: C) Hassasiyet ve duyarlılığın ortalamasını alarak dengeyi sağlar.

Açıklama: F1 skoru, hassasiyet (precision) ve duyarlılık (recall) metriklerinin harmonik ortalamasını alarak denge kurar ve bu sayede modelin genel performansını daha dengeli bir şekilde değerlendirir.

#11. Aşağıdaki ifadelerin hangileri yanlıştır? - I. Veri madenciliğinde hipotez testleri, elde edilen veri örüntülerinin istatistiksel olarak anlamlı olup olmadığını değerlendirir. - II. Hipotez testleri, değişkenler arasındaki ilişkilerin istatistiksel anlamlılığını değerlendirmek için kullanılabilir. - III. Hipotez testleri, veri madenciliğinde kullanılan algoritmaların doğruluğunu belirlemek için kullanılır.

A) I-II-III

B) Hepsi doğru

C) Yalnız III

D) I-II

E) II-III

Cevap: C) Yalnız III

Açıklama: Hipotez testleri, veri madenciliğinde kullanılan algoritmaların doğruluğunu belirlemek için kullanılmaz. Bu testler, değişkenler arasındaki ilişkilerin ve elde edilen veri örüntülerinin istatistiksel anlamlılığını değerlendirir.

#12. Veri madenciliği ve bilgi keşfi arasındaki ilişkiyi doğru ifade eden aşağıdaki seçeneklerden hangisidir?

A) Veri madenciliği, bilgi keşfinin bir parçasıdır ve veri analizlerini içerir.

B) Veri madenciliği, bilgi keşfi ile eş anlamlıdır ve aynı süreci ifade eder.

C) Veri madenciliği, bilgi keşfi sürecindeki en zahmetli adımdır.

D) Veri madenciliğiyle bilgi keşfi arasında doğrudan bir ilişki yoktur.

E) Bilgi keşfi, veri madenciliği sürecinin son adımıdır.

Cevap: A) Veri madenciliği, bilgi keşfinin bir parçasıdır ve veri analizlerini içerir.

Açıklama: Veri madenciliği, bilgi keşfinin bir parçasıdır ve veri analizlerini içerir.

#13. Yaşlı ve genç yetişkinler arasındaki algılanan yaşam doyumunun farklarını incelemek amacıyla bir araştırma yapılmıştır. 10 kişilik iki gruptan oluşan, 70 yaş üstü yaşlı yetişkinlere ve 20 – 30 yaş arası genç yetişkinlere yüksek güvenilirlik ve geçerliliği olduğu bilinen bir yaşam memnuniyeti testi verilmiştir. Ölçüm puanları 0 (en düşük) – 60 (en yüksek) arasındadır. Yaşlı yetişkinlerin verdiği puanların ortalaması 44.5 ve varyansı 75.39 iken genç yetişkinlerin verdiği puanların ortalaması 28.1 ve varyansı 72.99 olarak hesaplanmıştır. Yaşlı ve genç yetişkinler arasındaki ortalama yaşam memnuniyetinin farklı olduğu iddiasını %5 anlam düzeyinde test ediniz ve yorumlayınız. - Yukarıdaki örnekte hangi test istatistiği kullanılmalıdır?

A) Z-testi

B) T-testi

C) G testi

D) Ki-kare

E) F testi

Cevap: B) T-testi

Açıklama: T-testi, küçük örneklem büyüklükleri ve bilinmeyen populasyon standart sapmaları için kullanılır.

#14. A firması tarafından üretilen ampullerden 80 adet seçilmiş ve ortalama 1258 saat çalıştığı görülmüştür. Ana kütleye ait standart sapma 94 saattir. B firması tarafından üretilen ampullerden 60 adet seçilmiş ve ortalama 1029 saat çalıştığı görülmüştür. Ana kütleye ait standart sapma 68 saattir. A firmasının ampul fiyatı daha fazla olduğu için bir test yapılacaktır. A firması tarafından üretilen ampullerin çalışma süresi, B firması tarafından üretilen ampullerin çalışma süresinden 200 saat fazlaysa, A firmasının ampulleri satın alınacaktır. 𝛼𝛼 = 0.011 için hangi firmanın ampullerinin satın alınacağını test ediniz. - Yukarıdaki örneğe göre hesaplanan test istatistiği değeri kaçtır?

A) 2,58

B) 2,12

C) 1,96

D) 3,02

E) 2,33

Cevap: B) 2,12

Açıklama: Z-testi kullanılarak hesaplanan test istatistiği değeri 2,12’dir.

#15. Nominal değişkenler hangi özelliğe sahiptir?

A) Kategoriler arasında belirli bir sıralama vardır.

B) Kategoriler arasında hiçbir sıralama yoktur.

C) Kesirli değerler alabilirler.

D) Yapısal veriye örnektirler.

E) Sayılar, metinler gibi sütun ve satırlardan oluşurlar.

Cevap: B) Kategoriler arasında hiçbir sıralama yoktur.

Açıklama: Nominal değişkenler, kategoriler arasında sıralama olmayan değişkenlerdir.

#16. Gizli dirichlet analizi ne işe yarar?

A) Konu modelleme için yaygın olarak kullanılan bir olasılık temelli modelleme tekniğidir.

B) Çevrimiçi alışverişlerde öneri sistemlerini güçlendiren bir algoritmadır.

C) Görüntü tanıma problemlerinde kullanılan bir derin öğrenme modelidir.

D) Konum tabanlı hizmetlerde harita oluşturmak için kullanılır.

E) Genetik algoritmaları temsil etmek için kullanılan bir modelleme tekniğidir.

Cevap: A) Konu modelleme için yaygın olarak kullanılan bir olasılık temelli modelleme tekniğidir.

Açıklama: Gizli Dirichlet Analizi (LDA), konu modelleme için yaygın olarak kullanılan bir olasılık temelli modelleme tekniğidir. Bu teknik, metin verilerindeki gizli konuları keşfetmek için kullanılır.

#17. Belli bir parçanın üretimi için gereken ortalama zamanın 11.5 dakika olduğu biliniyor. İşe alınan 10 işçinin bu mamulü üretim süreleri gözlemleniyor ve aşağıdaki sonuçlar elde ediliyor. %5 anlam düzeyinde yeni işe alınan işçilerin bu mamulü üretim süresinin eski işçilerden daha fazla olup olmadığını araştırınız. (İpucu: Bu soru için toplanan verilerin kendisi verilmiştir. Daha önceki örneklerde ve sorularda toplanan verilerden elde edilen ortalamalar veya standart sapmalar verilmişti.) - Yukarıdaki örneğe göre hesaplanan test istatistiği değeri kaçtır?

A) 2,91

B) 3,19

C) 2,26

D) 1,83

E) 2,06

Cevap: E) 2,06

Açıklama: T-testi kullanılarak hesaplanan test istatistiği değeri 2,06’dır.

#18. Hangi durum, duygu analizi için en uygun bir uygulama alanıdır?

A) Meteorolojik verilerin analizi

B) Hisse senedi piyasası tahminleri

C) Yemek tariflerinin sınıflandırılması

D) İç organların anatomik incelemesi

E) Galaksiler arası uzaklık ölçümleri

Cevap: C) Yemek tariflerinin sınıflandırılması

Açıklama: Duygu analizi, metin verilerinde ifade edilen duygusal tonları belirleme sürecidir ve genellikle müşteri yorumları, sosyal medya paylaşımları veya ürün incelemeleri gibi metinlerin duygusal yönlerini anlamak için kullanılır. Ancak, duygu analizi sadece ticari uygulamalarla sınırlı değildir. Yemek tariflerinin sınıflandırılması, insanların tariflere karşı duygusal tepkilerini analiz etmeyi ve hangi tariflerin daha çok beğenildiğini anlamayı içerir. Bu tür analiz, tariflerin popülerliğini belirlemede ve kullanıcıların hangi tür tariflere daha fazla ilgi gösterdiğini anlamada kullanılabilir

#19. Sınıflandırma teknikleri hangi durumda daha az etkili olabilir?

A) Dengesiz sınıfların olduğu veri kümelerinde

B) Sayısal veri kümelerinde

C) Küçük boyutlu veri setlerinde

D) Sıralı kategoriler içeren veri setlerinde

E) Hiçbiri

Cevap: D) Sıralı kategoriler içeren veri setlerinde

Açıklama: Sınıflandırma teknikleri, sıralı kategoriler içeren veri setlerinde daha az etkili olabilir, çünkü bu tür veri setlerinde sınıflar arasındaki sıralama bilgisi önemlidir.

#20. kNN'nin sınırlamalarından biri nedir?

A) Optimal k değerinin bulunması

B) Öklid Mesafesi'nin kullanımı

C) Dengesiz sınıfların etkisi

D) Çapraz doğrulama kullanımı

E) Karar ağaçları ile rekabet etme

Cevap: C) Dengesiz sınıfların etkisi

Açıklama: kNN algoritmasının sınırlamalarından biri, dengesiz sınıfların etkisidir. Bu durumda, azınlık sınıflar yeterince temsil edilmez ve bu da sınıflandırma performansını olumsuz etkiler.

TESTi BiTiR, PUANINI GÖR

SONUÇ

İstanbul Üniversitesi Açık ve Uzaktan Eğitim Fakültesi (Auzef)
Açık Öğretim Fakültesi
Bölüm : Yönetim Bilişim Sistemleri Lisans
4. Sınıf Veri Madenciliği Bahar Dönemi
Auzef Veri Madenciliği Final Deneme Sınavı -8

HD Quiz powered by harmonic design

Auzef Veri Madenciliği Final Deneme Sınavı -8

İstanbul Üniversitesi Açık ve Uzaktan Eğitim Fakültesi (Auzef) Açık Öğretim Fakültesi Bölüm : Yönetim Bilişim Sistemleri Lisans 4. Sınıf Veri Madenciliği Bahar Dönemi Auzef Veri Madenciliği Final Deneme Sınavı -8

Auzef Veri Madenciliği Final Deneme Sınavı -8

Kümeleme Yöntemleri – Ünite 8

Kümeleme yöntemleri, verileri benzerliklerine göre gruplara ayırmak için kullanılan istatistiksel tekniklerdir. Bu yöntemler, veri madenciliği, makine öğrenimi ve desen tanıma gibi alanlarda yaygın olarak kullanılır. Bu makalede, kümeleme yöntemlerinin temel kavramları ve yaygın kullanılan teknikler ele alınacaktır.

1. Kümeleme Türleri

Kümeleme yöntemleri, veriyi çeşitli şekillerde gruplara ayırabilir. Başlıca kümeleme türleri şunlardır:

Bölütlenmiş Kümeleme: Veriyi kesinlikle örtüşmeyen alt kümelere böler. Her nesne yalnızca bir kümeye ait olur. K-ortalamalar (k-means) bu türün en yaygın örneklerinden biridir.

Hiyerarşik Kümeleme: Veriyi ağaç yapısında alt kümelere böler. Bu tür kümeleme, kümeler arasında hiyerarşik bir ilişki oluşturur.

Örtüşen Kümeleme: Nesnelerin birden fazla kümeye ait olabileceği kümeleme türüdür. Bu sayede veri noktaları birden fazla kümeye dahil olabilir.

Bulanık Kümeleme: Nesnelerin kısmi üyelik dereceleri ile kümelere atanabileceği kümeleme türüdür. Bulanık c-means bu yöntemin bir örneğidir.

2. K-ortalamalar Kümeleme

K-ortalamalar kümeleme yöntemi, veri noktalarını k adet kümeye ayırmak için kullanılır. Bu yöntem, her bir kümenin merkezini (centroid) belirler ve veri noktalarını bu merkezlere olan uzaklıklarına göre kümelere atar.

Adımlar: K-ortalamalar algoritması, başlangıçta k adet merkezi rastgele seçer, ardından veri noktalarını en yakın merkeze atar. Bu işlem, kümelerin merkezleri güncellenene kadar tekrarlanır.

Kriter: Veri noktalarının kümelere atanmasında, küme merkezine olan uzaklık dikkate alınır. Bu, her bir veri noktasının en yakın merkezdeki kümeye atanmasını sağlar.

3. DBSCAN (Yoğunluk Tabanlı Kümeleme)

DBSCAN (Density-Based Spatial Clustering of Applications with Noise), yoğunluk tabanlı bir kümeleme yöntemidir. Bu yöntem, yüksek yoğunluklu bölgelerdeki veri noktalarını kümeleyerek aykırı değerleri saptar ve siler.

Parametreler: DBSCAN algoritması, epsilon (ε) ve minPts parametrelerine dayanır. Epsilon, bir veri noktasının komşuluğunu belirlerken, minPts bir kümenin minimum nokta sayısını belirler.

Özellikler: DBSCAN, özellikle karmaşık ve gürültülü veri setlerinde etkilidir. Aykırı değerleri tespit etme ve yoğunluk tabanlı kümeleme yapma yeteneği ile öne çıkar.

4. SOM (Kendi Kendini Düzenleyen Haritalar)

SOM (Self-Organizing Maps), verileri düşük boyutlu bir haritaya projekte eden bir kümeleme yöntemidir. Bu yöntem, verilerin yapısını koruyarak boyut azaltma işlemi yapar.

Öğrenme Süreci: SOM, rekabetçi öğrenme kullanarak ağırlıkları günceller ve verileri düşük boyutlu bir haritaya yerleştirir. Bu sayede verilerin yapısı korunur.

Avantajlar: SOM, yüksek boyutlu verileri düşük boyutlu bir haritaya indirger ve verilerin görselleştirilmesini sağlar. Ayrıca, verilerin yapısını koruyarak anlamlı gruplar oluşturur.

Sonuç

Kümeleme yöntemleri, verilerin benzerliklerine göre gruplara ayrılmasını sağlayarak, verilerin daha iyi anlaşılmasını ve analiz edilmesini sağlar. Bu yöntemler, veri madenciliği, makine öğrenimi ve desen tanıma gibi çeşitli alanlarda önemli bir rol oynar. Doğru kümeleme algoritmasının seçilmesi ve uygulanması, verilerin anlamlandırılmasında ve stratejik kararlar alınmasında büyük önem taşır.

Auzef Veri Madenciliği Final Deneme Sınavı -8

Kümeleme Yöntemleri – Ünite 8

1- Hangi kümeleme türü, veriyi kesinlikle örtüşmeyen alt kümelerine böler?

A) Hiyerarşik Kümeleme
B) Özel Kümeleme
C) Örtüşen Kümeleme
D) Bölütlenmiş Kümeleme
E) Bulanık Kümeleme

Cevap: D) Bölütlenmiş Kümeleme

Açıklama: Bölütlenmiş kümeleme, veriyi kesinlikle örtüşmeyen alt kümelere böler ve her nesne yalnızca bir kümeye ait olur.

2- Ağaç yapısında alt kümeler oluşturan kümeleme türü hangisidir?

A) Özel Kümeleme
B) Bulanık Kümeleme
C) Hiyerarşik Kümeleme
D) Örtüşen Kümeleme
E) Bölütlenmiş Kümeleme

Cevap: C) Hiyerarşik Kümeleme

Açıklama: Hiyerarşik kümeleme, veriyi ağaç yapısında alt kümelere böler ve bu sayede farklı seviyelerdeki alt kümeler oluşturur.

3- Hangi kümeleme türünde nesneler sadece bir kümeye ait olabilir?

A) Bulanık Kümeleme
B) Hiyerarşik Kümeleme
C) Örtüşen Kümeleme
D) Özel Kümeleme
E) Bölütlenmiş Kümeleme

Cevap: D) Özel Kümeleme

Açıklama: Özel kümeleme, nesnelerin sadece bir kümeye ait olabileceği kümeleme türüdür. Bu, veri noktalarının birden fazla kümeye dahil olmaması anlamına gelir.

4- Nesnelerin birden fazla kümeye ait olabileceği kümeleme türü hangisidir?

A) Hiyerarşik Kümeleme
B) Bölütlenmiş Kümeleme
C) Özel Kümeleme
D) Bulanık Kümeleme
E) Örtüşen Kümeleme

Cevap: E) Örtüşen Kümeleme

Açıklama: Örtüşen kümeleme, nesnelerin birden fazla kümeye ait olabileceği kümeleme türüdür. Bu sayede veri noktaları birden fazla kümeye dahil olabilir.

5- K-ortalamalar kümeleme yönteminde, merkezi prototip genellikle hangi tür veriler için kullanılır?

A) Nicel Veriler
B) Kategorik Veriler
C) Metin Verileri
D) Büyük veriler
E) Örnek veriler

Cevap: A) Nicel Veriler

Açıklama: K-ortalamalar kümeleme yönteminde, merkezi prototip genellikle nicel veriler için kullanılır, çünkü bu yöntem veri noktalarının aritmetik ortalamasını hesaplar.

6- K-ortalamalar kümeleme yönteminde, veri noktalarının kümelere atanmasında hangi kritere göre karar verilir?

A) En uzak noktaya göre
B) Küme merkezine olan uzaklığa göre
C) Rastgele seçime göre
D) Küme içi benzerliklere göre
E) Veri sıralamasına göre

Cevap: B) Küme merkezine olan uzaklığa göre

Açıklama: K-ortalamalar kümeleme yönteminde, veri noktalarının kümelere atanmasında küme merkezine olan uzaklığa göre karar verilir.

7- DBSCAN algoritmasının öne çıkan özellikleri nelerdir?

A) Veri setinin ortalamasını hesaplamak
B) Aykırı değerleri saptama ve silme yeteneği
C) Matematiksel denklemleri çözme kabiliyeti
D) Yalnızca dışbükey (konveks) veri kümeleriyle çalışma
E) Epsilon ve minPts parametrelerine bağlı olarak yoğunluk tabanlı kümeleme

Cevap: B) Aykırı değerleri saptama ve silme yeteneği

Açıklama: DBSCAN algoritması, aykırı değerleri saptama ve silme yeteneği ile öne çıkar ve yoğunluk tabanlı kümeleme yapar.

8- DBSCAN algoritmasında kullanılan epsilon (ε) nedir?

A) Matris determinantı
B) Yoğunluk eşiği
C) Veri setinin boyutu
D) Algoritmanın adım büyüklüğü
E) En küçük yoğunluğa sahip alan

Cevap: B) Yoğunluk eşiği

Açıklama: Epsilon (ε), DBSCAN algoritmasında yoğunluk eşiği olarak kullanılır ve bir veri noktasının komşuluğunu belirler.

9- SOM’un (Kendi Kendini Düzenleyen Haritalar) avantajları nelerdir?

A) Aykırı değerleri temizleme yeteneği
B) Boyut azaltma özelliği
C) Sadece sayısal verilerle çalışabilme
D) Yalnızca küresel kümeleri tanıma
E) Epsilon parametresine bağlı olarak çalışma

Cevap: B) Boyut azaltma özelliği

Açıklama: SOM (Kendi Kendini Düzenleyen Haritalar), boyut azaltma özelliği ile öne çıkar ve yüksek boyutlu verileri düşük boyutlu haritalara indirger.

10- SOM’un (Kendi Kendini Düzenleyen Haritalar) eğitim süreci nasıl işler?

A) Hataların geri yayılma prensibine dayanır.
B) Rekabetçi öğrenme kullanarak ağırlıkları günceller.
C) İleri beslemeli bir ağ mimarisine sahiptir.
D) Epsilon ve minPts parametrelerini kullanır.
E) Sadece sayısal verilerle çalışır.

Cevap: B) Rekabetçi öğrenme kullanarak ağırlıkları günceller.

Açıklama: SOM’un eğitim süreci, rekabetçi öğrenme kullanarak ağırlıkları günceller ve verileri düşük boyutlu bir haritaya projekte eder.

Auzef Veri Madenciliği Final Deneme Sınavı -8

Yönetim Bilişim Sistemleri Lisans

Yönetim Bilişim Sistemleri Lisans

Auzef Yönetim Bilişim Sistemleri Lisans 4. Sınıf Bahar Dönemi 2024 Final Soruları ve Deneme Sınavları, 2024 Sınav Soruları

#1. Hangi değişken türü, sayısal bir ilişkiye sahip değildir ancak sıralanabilir?

#2. Veri madenciliği sürecinde hangi adım veri setlerinin temizlenmesini, düzenlenmesini ve hazırlanmasını içerir?

#3. Doğal dil işleme (NLP) ile ilgili olarak hangisi doğrudur?

#5. Hangisi veri, enformasyon ve bilgi arasındaki ilişkiyi doğru ifade eder?

#6. Metin madenciliği adımları arasında hangisi metni belirli parçalara böler?

#7. Sınıflandırma teknikleri genellikle hangi tür veri kümeleri üzerinde etkilidir?

#8. Kosinüs mesafesi genellikle hangi tür veri kümesinde kullanılır?

#9. Aşağıdaki durumlardan hangisi metin analitiği ile ilgili değildir?

#10. F1 skoru, neden hassasiyet ve duyarlılık metriklerinin harmonik ortalamasını kullanarak denge kurar?

#12. Veri madenciliği ve bilgi keşfi arasındaki ilişkiyi doğru ifade eden aşağıdaki seçeneklerden hangisidir?

#15. Nominal değişkenler hangi özelliğe sahiptir?

#16. Gizli dirichlet analizi ne işe yarar?

#18. Hangi durum, duygu analizi için en uygun bir uygulama alanıdır?

#19. Sınıflandırma teknikleri hangi durumda daha az etkili olabilir?

#20. kNN'nin sınırlamalarından biri nedir?

SONUÇ

Bunu beğen:

Bunu beğen:

Auzef Veri Madenciliği Final Deneme Sınavı -8

Auzef Veri Madenciliği Final Deneme Sınavı -8

Kümeleme Yöntemleri – Ünite 8

1. Kümeleme Türleri

2. K-ortalamalar Kümeleme

3. DBSCAN (Yoğunluk Tabanlı Kümeleme)

4. SOM (Kendi Kendini Düzenleyen Haritalar)

Sonuç

Auzef Veri Madenciliği Final Deneme Sınavı -8

Kümeleme Yöntemleri – Ünite 8

1- Hangi kümeleme türü, veriyi kesinlikle örtüşmeyen alt kümelerine böler?

2- Ağaç yapısında alt kümeler oluşturan kümeleme türü hangisidir?

3- Hangi kümeleme türünde nesneler sadece bir kümeye ait olabilir?

4- Nesnelerin birden fazla kümeye ait olabileceği kümeleme türü hangisidir?

5- K-ortalamalar kümeleme yönteminde, merkezi prototip genellikle hangi tür veriler için kullanılır?

6- K-ortalamalar kümeleme yönteminde, veri noktalarının kümelere atanmasında hangi kritere göre karar verilir?

7- DBSCAN algoritmasının öne çıkan özellikleri nelerdir?

8- DBSCAN algoritmasında kullanılan epsilon (ε) nedir?

9- SOM’un (Kendi Kendini Düzenleyen Haritalar) avantajları nelerdir?

10- SOM’un (Kendi Kendini Düzenleyen Haritalar) eğitim süreci nasıl işler?

Auzef Veri Madenciliği Final Deneme Sınavı -8

Bunu paylaş:

Bunu beğen:

Editor