auzefVeri MadenciliğiYönetim Bilişim Sistemleri

Veri Madenciliği 2023-2024 Bütünleme Soruları

Veri Madenciliği 2023-2024 Bütünleme Soruları

#1. Doğrusal regresyonda hangi yöntemle en uygun çizgi bulmaya çalışılır?

Cevap : E) En küçük kareler

Açıklama : En küçük kareler yöntemi, doğrusal regresyonda en uygun çizgiyi bulmak için kullanılan bir yöntemdir.

#2. Min­Max Normalizasyonu hangi aralığa dönüştürme işlemi yapar?

Cevap : B) Değişken değerlerini 0 ile 1 arasında bir aralığa dönüştürme

Açıklama : Min­Max Normalizasyonu, değişken değerlerini 0 ile 1 arasında bir aralığa dönüştüren bir normalizasyon yöntemidir.

#3. I. Veri madenciliğinde hipotez testleri, elde edilen veri örüntülerinin istatistiksel olarak anlamlı olup olmadığını değerlendirir.
II. Hipotez testleri, değişkenler arasındaki ilişkilerin istatistiksel anlamlılığını değerlendirmek için kullanılabilir.
III. Hipotez testleri, veri madenciliğinde kullanılan algoritmaların doğruluğunu belirlemek için kullanılır.
Hipotez testleri ile ilgili aşağıdaki ifadelerden hangisi veya hangileri doğrudur?

Cevap : C) I ve II

Açıklama : Hipotez testleri, veri örüntülerinin ve değişkenler arasındaki ilişkilerin istatistiksel anlamlılığını değerlendirmek için kullanılır. Ancak, algoritmaların doğruluğunu belirlemek için kullanılmaz.

#4. Metin madenciliğinde belirli kategorilere sınıflandırmak veya doğal gruplara kümelendirmek için kullanılan ve kelimelerin sırasını veya dil bilgisini dikkate almayan temsil modeline ne ad verilir?

Cevap : D) Kelime torbası

Açıklama : Kelime torbası, kelimelerin sırası ve dil bilgisi dikkate alınmaksızın metni temsil eden bir modeldir.

#5. I={a,b,c,d,e} kümesinden oluşturulan {a,b,c}→{d} kuralı düşük güven oranlı bir kuralsa aşağıdakilerden hangisi düşük oranlı bir kuraldır?

Cevap : D) {a,b}→{c,d}

#6. Birliktelik analizinde güven oranı neyi ölçer?

Cevap : B) Bir kuralın güvenilirliğini

Açıklama : Birliktelik analizinde güven oranı, bir kuralın ne kadar güvenilir olduğunu ölçer.

#7. Lojistik regresyonda logit dönüşümü hangi amaçla kullanılır?

Cevap : D) Olasılıkların doğrusal bir şekilde modellemesini sağlamak için

Açıklama : Logit dönüşümü, lojistik regresyonda olasılıkların doğrusal bir şekilde modellenmesini sağlar.

#8. Sigmoid fonksiyonu hangi aralıkta değerler üretir?

Cevap : A) 0 ile 1 arasında

Açıklama : Sigmoid fonksiyonu, genellikle lojistik regresyonda kullanılan bir aktivasyon fonksiyonudur ve 0 ile 1 arasında değerler üretir.

#9. Kategorik bir özniteliğin ikili hâle getirilmesinde en yaygın kullanılan yöntem aşağıdakilerden hangisidir?

Cevap : B) Tek vuruş kodlaması

Açıklama : Tek vuruş kodlaması, kategorik bir özniteliği ikili hâle getirmenin en yaygın yöntemlerinden biridir.

#10. Veri birleştirme işlemi yapılırken detayların kaybolma riski hangi durumda daha yüksektir?

Cevap : A) Yıllık bazda verileri birleştirme

Açıklama : Yıllık bazda verileri birleştirme, veri detaylarını daha geniş bir zaman aralığında topladığı için detayların kaybolma riski daha yüksektir.

#11. Hangi kümeleme türünde veri noktaları belirsizliğe göre birden fazla kümeye ait olabilir?

Cevap : C) Bulanık kümeleme

Açıklama : Bulanık kümeleme, veri noktalarının belirsizliğe göre birden fazla kümeye ait olabileceği bir kümeleme türüdür.

#12. Metni küçük parçalara yani belirteçlere bölen bir işlemi ifade eden metin madenciliği adımı aşağıdakilerden hangisidir?

Cevap : E) Tokenizasyon

Açıklama : Tokenizasyon, metni küçük parçalara, yani belirteçlere bölen bir işlemdir.

#13. Çapraz doğrulama hangi amaçla kullanılır?

Cevap : E) Bir dizi bilinmeyen model parametresi için en uygun değerleri belirlemek için

#14. k­NN algoritması hangi türdeki tahmin görevleri için kullanılabilir?

Cevap : D) Hem sınıflandırma hem de regresyon türündeki tahmin görevleri için

Açıklama : k­NN algoritması, hem sınıflandırma hem de regresyon görevlerinde kullanılabilen esnek bir algoritmadır.

#15. Bir belgenin ana temalarını belirleme ve bu temellere dayalı olarak belgeyi önceden belirlenmiş bir kategori setine yerleştirmeyi içeren metin madenciliği adımı aşağıdakilerden hangisidir?

Cevap : A) Kategorizasyon

Açıklama : Kategorizasyon, bir belgenin ana temalarını belirleme ve bu temellere dayalı olarak belgeyi belirli kategorilere yerleştirme işlemidir.

#16. Örtüşen kümeleme türü hangi özelliği ifade eder?

Cevap : E) Her veri nesnesinin birden fazla küme içinde yer alabileceği model

Açıklama : Örtüşen kümeleme, bir veri nesnesinin birden fazla kümeye ait olabileceği durumu ifade eder.

#17. Lojistik regresyonun doğrusal regresyondan farkı nedir?

Cevap : B) Lojistik regresyon kategorik bir sonucun olasılığını hesaplar, doğrusal regresyon ise sürekli bir değeri tahmin eder.

Açıklama : Lojistik regresyon, sınıflandırma problemleri için uygundur ve kategorik sonuçların olasılığını hesaplar. Doğrusal regresyon ise sürekli değerlerin tahmini için kullanılır.

#18. Duyarlılık metriği neyi ölçer?

Cevap : C) Gerçekten pozitif olan örneklerin ne kadarını kaçırdığımızın olasılığını

Açıklama : Duyarlılık metriği, gerçek pozitif örneklerin ne kadarının model tarafından doğru bir şekilde tespit edilmediğini ölçer.

#19. Tam kümeleme türü hangi durumu ifade eder?

Cevap : A) Her veri nesnesini mutlaka bir kümeye atayan kümeleme türü

Açıklama : Tam kümeleme, her veri nesnesini mutlaka bir kümeye atayan bir kümeleme türüdür.

#20. I={a,b,c,d,e} kümesinde {b,d} ögelerinin seyrek öge kümesi olduğu durumda aşağıdakilerden hangisi sık öge kümesinde yer alır?

Cevap : C) {a,b,e}

Açıklama : {a,b,e} kümesi, b ve d öğelerinin seyrek olduğu bir durumda daha sık bir öge kümesi olabilir.

TESTi BiTiR, PUANINI GÖR

SONUÇ

-
Share your score!
Tweet your score!
Share to other

HD Quiz powered by harmonic design

Veri Madenciliği 2023-2024 Bütünleme Soruları

Veri Madenciliği 2023-2024 Bütünleme Soruları ve Yanıtları: Derinlemesine Bir İnceleme

Veri madenciliği, büyük veri yığınları içerisinden anlamlı desenlerin keşfedilmesi ve bu desenlerin iş kararları veya diğer süreçler için kullanılması sürecidir. Veri madenciliği konusundaki bilgi birikiminizi artırmak amacıyla, 2023-2024 eğitim yılı boyunca yapılan bütünleme sınavlarının sorularını ve bu sorulara verilen yanıtları ayrıntılı bir şekilde inceleyeceğiz.

Hipotez Testleri ve Veri Madenciliği

Hipotez testleri genellikle veri madenciliğinde önemli bir yere sahiptir. Hipotez testleri, elde edilen veri örüntülerinin ve değişkenler arasındaki ilişkilerin istatistiksel anlamlılığını değerlendirmek için kullanılır. Ancak, hipotez testleri algoritmaların doğruluğunu belirlemek amacıyla kullanılmaz. Bu durumda, I ve II ifadeleri doğru olup, III yanlıştır. (Cevap: I ve II)

Sigmoid Fonksiyonu ve Değer Aralığı

Sigmoid fonksiyonu, 0 ile 1 arasında değerler üreten bir aktivasyon fonksiyonudur ve genellikle lojistik regresyon gibi modellerde kullanılır. Bu fonksiyon, belirli bir giriş değeri için çıkışın 0 ile 1 arasında olmasını sağlar. (Cevap: 0 ile 1 arasında)

Veri Birleştirme ve Detayların Korunması

Veri birleştirme işlemi sırasında, veri detaylarının kaybolma riski zaman aralığı genişledikçe artar. Özellikle yıllık bazda verilerin birleştirilmesi, detayların kaybolma riskini artırır çünkü daha büyük zaman aralıkları, ince detayların gözden kaçmasına neden olabilir. (Cevap: Yıllık bazda verileri birleştirme)

k-NN Algoritması ve Kullanım Alanları

k-NN (K-en yakın komşu) algoritması, hem sınıflandırma hem de regresyon problemlerinde kullanılan bir algoritmadır. Bu esneklik, k-NN algoritmasını veri madenciliğinde popüler bir araç haline getirir. (Cevap: Hem sınıflandırma hem de regresyon türündeki tahmin görevleri için)

Kategorik Özniteliklerin İkili Hale Getirilmesi

Veri madenciliğinde kategorik özniteliklerin ikili hale getirilmesinde en yaygın yöntem tek vuruş kodlamasıdır (One-Hot Encoding). Bu yöntem, her kategoriyi ayrı bir sütun olarak temsil eder ve ilgili kategorideki değer 1, diğerlerinde 0 olarak kodlanır. (Cevap: Tek vuruş kodlaması)

Lojistik Regresyon ve Doğrusal Regresyon Arasındaki Farklar

Lojistik regresyon, kategorik bir sonucun olasılığını tahmin ederken, doğrusal regresyon sürekli bir değeri tahmin eder. Bu fark, iki modelin kullanım alanlarını belirleyen önemli bir özelliktir. (Cevap: Lojistik regresyon kategorik bir sonucun olasılığını hesaplar, doğrusal regresyon ise sürekli bir değeri tahmin eder.)

Min-Max Normalizasyonu ve Değişken Dönüşümü

Min-Max normalizasyonu, değişkenlerin değerlerini 0 ile 1 arasında bir aralığa dönüştüren bir tekniktir. Bu yöntem, özellikle veri madenciliği yöntemleri ile çalışırken kullanılır ve veri setindeki anormalliklerin etkisini azaltır. (Cevap: Değişken değerlerini 0 ile 1 arasında bir aralığa dönüştürme)


Sonuç ve Öneriler

Bu makalede, 2023-2024 eğitim yılı veri madenciliği bütünleme soruları üzerinden temel kavramlar ve yöntemler ele alındı. Özellikle veri madenciliği nedir, veri madenciliği yöntemleri, veri madenciliği ders notları gibi anahtar kelimeler çerçevesinde, konuya dair önemli bilgiler sunuldu. Veri madenciliği gibi karmaşık ve geniş bir alanda daha fazla bilgi edinmek için ders notlarını ve vize sorularını incelemeniz önerilir.

@lolonolo_com

Veri Madenciliği 2023-2024 Bütünleme Soruları

Veri Madenciliği 2023-2024 Bütünleme Soruları

1- I. Veri madenciliğinde hipotez testleri, elde edilen veri örüntülerinin istatistiksel olarak anlamlı olup olmadığını değerlendirir.
II. Hipotez testleri, değişkenler arasındaki ilişkilerin istatistiksel anlamlılığını değerlendirmek için kullanılabilir.
III. Hipotez testleri, veri madenciliğinde kullanılan algoritmaların doğruluğunu belirlemek için kullanılır.

Hipotez testleri ile ilgili aşağıdaki ifadelerden hangisi veya hangileri doğrudur?

A) I ve III
B) Yalnız III
C) I ve II
D) II ve III
E) Yalnız I

Cevap : C) I ve II

Açıklama : Hipotez testleri, veri örüntülerinin ve değişkenler arasındaki ilişkilerin istatistiksel anlamlılığını değerlendirmek için kullanılır. Ancak, algoritmaların doğruluğunu belirlemek için kullanılmaz.

2- Sigmoid fonksiyonu hangi aralıkta değerler üretir?

A) 0 ile 1 arasında
B) 0 ile 2 arasında
C) 1 ile 10 arasında
D) -1 ile 1 arasında
E) -∞ ile +∞ arasında

Cevap : A) 0 ile 1 arasında

Açıklama : Sigmoid fonksiyonu, genellikle lojistik regresyonda kullanılan bir aktivasyon fonksiyonudur ve 0 ile 1 arasında değerler üretir.

3- Veri birleştirme işlemi yapılırken detayların kaybolma riski hangi durumda daha yüksektir?

A) Yıllık bazda verileri birleştirme
B) Günlük bazda verileri birleştirme
C) Çeyreklik bazda verileri birleştirme
D) Aylık bazda verileri birleştirme
E) Haftalık bazda verileri birleştirme

Cevap : A) Yıllık bazda verileri birleştirme

Açıklama : Yıllık bazda verileri birleştirme, veri detaylarını daha geniş bir zaman aralığında topladığı için detayların kaybolma riski daha yüksektir.

4- I={a,b,c,d,e} kümesinden oluşturulan {a,b,c}→{d} kuralı düşük güven oranlı bir kuralsa aşağıdakilerden hangisi düşük oranlı bir kuraldır?

A) {b,d}→{a,c}
B) {a,d}→{b,c}
C) {a,b,d}→{c}
D) {a,b}→{c,d}
E) {d}→{a,b,c}

Cevap : D) {a,b}→{c,d}

5- k­NN algoritması hangi türdeki tahmin görevleri için kullanılabilir?

A) Yalnızca çapraz doğrulama türündeki tahmin görevleri için
B) Sadece sınıflandırma türündeki tahmin görevleri için
C) Karar ağaçlarının yetersiz kaldığı tahminler için
D) Hem sınıflandırma hem de regresyon türündeki tahmin görevleri için
E) Sadece regresyon türündeki tahmin görevleri için

Cevap : D) Hem sınıflandırma hem de regresyon türündeki tahmin görevleri için

Açıklama : k­NN algoritması, hem sınıflandırma hem de regresyon görevlerinde kullanılabilen esnek bir algoritmadır.

6- Örtüşen kümeleme türü hangi özelliği ifade eder?

A) Her veri nesnesinin sadece bir kümeye ait olduğu model
B) Her veri nesnesinin bir belirsizlik düzeyinde kümelere atandığı model
C) Bazı veri nesnelerini hiçbir kümeye atamayabilecek bir kümeleme türü
D) Her veri nesnesini bir kümeye atayan bir kümeleme türü
E) Her veri nesnesinin birden fazla küme içinde yer alabileceği model

Cevap : E) Her veri nesnesinin birden fazla küme içinde yer alabileceği model

Açıklama : Örtüşen kümeleme, bir veri nesnesinin birden fazla kümeye ait olabileceği durumu ifade eder.

7- Kategorik bir özniteliğin ikili hâle getirilmesinde en yaygın kullanılan yöntem aşağıdakilerden hangisidir?

A) Her kategori için bir sütun oluşturma
B) Tek vuruş kodlaması
C) Tüm kategorik değerleri bir sütunda birleştirme
D) Kategorik değerlerin sıralamasını kullanma
E) Her kategori için yalnızca bir sütun oluşturma

Cevap : B) Tek vuruş kodlaması

Açıklama : Tek vuruş kodlaması, kategorik bir özniteliği ikili hâle getirmenin en yaygın yöntemlerinden biridir.

8- I={a,b,c,d,e} kümesinde {b,d} ögelerinin seyrek öge kümesi olduğu durumda aşağıdakilerden hangisi sık öge kümesinde yer alır?

A) {a,b,c,d,e}
B) {a,b,c,d}
C) {a,b,e}
D) {b,c,d,e}
E) {a,b,d}

Cevap : C) {a,b,e}

Açıklama : {a,b,e} kümesi, b ve d öğelerinin seyrek olduğu bir durumda daha sık bir öge kümesi olabilir.

9- Lojistik regresyonun doğrusal regresyondan farkı nedir?

A) Lojistik regresyon daha karmaşık problemler için kullanılırken doğrusal regresyon hesaplaması kolay olan problemler için daha uygundur.
B) Lojistik regresyon kategorik bir sonucun olasılığını hesaplar, doğrusal regresyon ise sürekli bir değeri tahmin eder.
C) Lojistik regresyon ve doğrusal regresyon arasında bir fark yoktur.
D) Lojistik regresyon sadece bir bağımsız değişkene dayanır, doğrusal regresyon ise birden fazla bağımsız değişkene dayanır.
E) Doğrusal regresyon, lojistik regresyonun genelleştirilmiş hâlidir.

Cevap : B) Lojistik regresyon kategorik bir sonucun olasılığını hesaplar, doğrusal regresyon ise sürekli bir değeri tahmin eder.

Açıklama : Lojistik regresyon, sınıflandırma problemleri için uygundur ve kategorik sonuçların olasılığını hesaplar. Doğrusal regresyon ise sürekli değerlerin tahmini için kullanılır.

10- Bir belgenin ana temalarını belirleme ve bu temellere dayalı olarak belgeyi önceden belirlenmiş bir kategori setine yerleştirmeyi içeren metin madenciliği adımı aşağıdakilerden hangisidir?

A) Kategorizasyon
B) Özetleme
C) Enformasyon çıkarma
D) Konu takibi
E) Kümeleme

Cevap : A) Kategorizasyon

Açıklama : Kategorizasyon, bir belgenin ana temalarını belirleme ve bu temellere dayalı olarak belgeyi belirli kategorilere yerleştirme işlemidir.

11- Metin madenciliğinde belirli kategorilere sınıflandırmak veya doğal gruplara kümelendirmek için kullanılan ve kelimelerin sırasını veya dil bilgisini dikkate almayan temsil modeline ne ad verilir?

A) Terim frekansı-Ters belge frekansı (TF-IDF)
B) Kök çıkarma
C) Doğal dil işleme
D) Kelime torbası
E) Lemmatizasyon

Cevap : D) Kelime torbası

Açıklama : Kelime torbası, kelimelerin sırası ve dil bilgisi dikkate alınmaksızın metni temsil eden bir modeldir.

12- Çapraz doğrulama hangi amaçla kullanılır?

A) Veri setinin sınıflandırma performansını değerlendirmek için
B) Veri madenciliği algoritmalarının tarihçesini incelemek için
C) Veri madenciliği algoritmalarının matematiksel adımlarını açıklamak için
D) k-NN algoritmasının çalışma prensibini anlamak için
E) Bir dizi bilinmeyen model parametresi için en uygun değerleri belirlemek için

Cevap : E) Bir dizi bilinmeyen model parametresi için en uygun değerleri belirlemek için

13- Duyarlılık metriği neyi ölçer?

A) Yanlış negatiflerin sınırlanmasını
B) Yanlış pozitiflerin sınırlanmasını
C) Gerçekten pozitif olan örneklerin ne kadarını kaçırdığımızın olasılığını
D) Modelin toplam yanlış tahmin sayısını
E) Gerçekten negatif olan örneklerin doğru negatif olma olasılığını

Cevap : C) Gerçekten pozitif olan örneklerin ne kadarını kaçırdığımızın olasılığını

Açıklama : Duyarlılık metriği, gerçek pozitif örneklerin ne kadarının model tarafından doğru bir şekilde tespit edilmediğini ölçer.

14- Doğrusal regresyonda hangi yöntemle en uygun çizgi bulmaya çalışılır?

A) S-şeklindeki eğri
B) En olası tahmin
C) Logaritmik dönüşüm
D) Gradyan inişi
E) En küçük kareler

Cevap : E) En küçük kareler

Açıklama : En küçük kareler yöntemi, doğrusal regresyonda en uygun çizgiyi bulmak için kullanılan bir yöntemdir.

15- Tam kümeleme türü hangi durumu ifade eder?

A) Her veri nesnesini mutlaka bir kümeye atayan kümeleme türü
B) Veri nesnelerini tam olarak doğru kümeye atayan kümeleme türü
C) Özel kümeleme
D) Bazı veri nesnelerini hiçbir kümeye atamayabilecek bir kümeleme türü
E) Örtüşen kümeleme

Cevap : A) Her veri nesnesini mutlaka bir kümeye atayan kümeleme türü

Açıklama : Tam kümeleme, her veri nesnesini mutlaka bir kümeye atayan bir kümeleme türüdür.

16- Metni küçük parçalara yani belirteçlere bölen bir işlemi ifade eden metin madenciliği adımı aşağıdakilerden hangisidir?

A) Metin ön işleme
B) Model değerlendirmesi
C) Model oluşturma
D) Özellik mühendisliği
E) Tokenizasyon

Cevap : E) Tokenizasyon

Açıklama : Tokenizasyon, metni küçük parçalara, yani belirteçlere bölen bir işlemdir.

17- Birliktelik analizinde güven oranı neyi ölçer?

A) Bir kuralın verilen bir veri setine ne sıklıkta uygulandığını
B) Bir kuralın güvenilirliğini
C) Bir kuralın çıkarımını
D) Bir kuralın gücünü
E) Bir kuralın önemini

Cevap : B) Bir kuralın güvenilirliğini

Açıklama : Birliktelik analizinde güven oranı, bir kuralın ne kadar güvenilir olduğunu ölçer.

18- Lojistik regresyonda logit dönüşümü hangi amaçla kullanılır?

A) Modelin karmaşıklığını artırmak için
B) Yorumlama ve performans değerlendirmesini karmaşık hâle getirmek için
C) Sonuçları daha karmaşık hâle getirmek için
D) Olasılıkların doğrusal bir şekilde modellemesini sağlamak için
E) Modelin eğitimini zorlaştırmak için

Cevap : D) Olasılıkların doğrusal bir şekilde modellemesini sağlamak için

Açıklama : Logit dönüşümü, lojistik regresyonda olasılıkların doğrusal bir şekilde modellenmesini sağlar.

19- Hangi kümeleme türünde veri noktaları belirsizliğe göre birden fazla kümeye ait olabilir?

A) Örtüşen kümeleme
B) Hiyerarşik kümeleme
C) Bulanık kümeleme
D) Bölütlenmiş kümeleme
E) Özel kümeleme

Cevap : C) Bulanık kümeleme

Açıklama : Bulanık kümeleme, veri noktalarının belirsizliğe göre birden fazla kümeye ait olabileceği bir kümeleme türüdür.

20- Min­Max Normalizasyonu hangi aralığa dönüştürme işlemi yapar?

A) Değerleri ortalaması 0 ve standart sapması 1 olacak şekilde dönüştürme
B) Değişken değerlerini 0 ile 1 arasında bir aralığa dönüştürme
C) Değişkenleri logaritmik olarak dönüştürme
D) Değişkenlerin tersini alma
E) Değişkenlerin karekökünü alma

Cevap : B) Değişken değerlerini 0 ile 1 arasında bir aralığa dönüştürme

Açıklama : Min­Max Normalizasyonu, değişken değerlerini 0 ile 1 arasında bir aralığa dönüştüren bir normalizasyon yöntemidir.

@lolonolo_com

Yönetim Bilişim Sistemleri Lisans
Veri Madenciliği Yönetim Bilişim Sistemleri Lisans

Veri Madenciliği 2023-2024 Bütünleme Soruları

Yönetim Bilişim Sistemleri Lisans

Auzef Yönetim Bilişim Sistemleri Lisans 4. Sınıf Bahar Dönemi Final Soruları ve Deneme Sınavları, 2024 Sınav Soruları

Editor

Editör

error: Kopyalamaya Karşı Korumalıdır!