Veri Madenciliği Final Deneme Sınavı -3
Veri Madenciliği Final Deneme Sınavı -3
#1. Aşağıdakilerden hangisi birleştirme (aggregation) işleminin bir riskidir?
Cevap: C) Detaylardan bazılarının kaybolması
Açıklama: Birleştirme işlemi sırasında bazı detayların kaybolması riski vardır, bu da veri analizinde önemli bilgilere ulaşmayı zorlaştırabilir.
#2. A firması tarafından üretilen ampullerden 80 adet seçilmiş ve ortalama 1258 saat çalıştığı görülmüştür. Ana kütleye ait standart sapma 94 saattir. B firması tarafından üretilen ampullerden 60 adet seçilmiş ve ortalama 1029 saat çalıştığı görülmüştür. Ana kütleye ait standart sapma 68 saattir. A firmasının ampul fiyatı daha fazla olduğu için bir test yapılacaktır. A firması tarafından üretilen ampullerin çalışma süresi, B firması tarafından üretilen ampullerin çalışma süresinden 200 saat fazlaysa, A firmasının ampulleri satın alınacaktır. ???????? = 0.011 için hangi firmanın ampullerinin satın alınacağını test ediniz. - Yukarıdaki örneğe göre hesaplanan test istatistiği değeri kaçtır?
Cevap: B) 2,12
Açıklama: Z-testi kullanılarak hesaplanan test istatistiği değeri 2,12’dir.
#3. Hangi durumda Basit Fonksiyonel Dönüşümler veya Normalizasyon kullanılabilir?
Cevap: C) Veri setinin analizde daha anlamlı ve doğrusal bir şekle getirilmesi için
Açıklama: Basit fonksiyonel dönüşümler ve normalizasyon, veri setini analizde daha anlamlı ve doğrusal bir şekle getirmek için kullanılır.
#4. Destek tabanlı kesme neden önemlidir?
Cevap: E) Sık öge kümesini bulur
Açıklama: Destek tabanlı kesme, sık öge kümelerinin bulunmasında önemlidir. Yalnızca belirli bir destek eşiğinin üzerinde olan öge kümeleri sık öge kümeleri olarak kabul edilir.
#5. Lojistik regresyonda, çıktı değişkeni 0 ile 1 arasında olan olasılık değerini ifade eder. Eğer bir modelin hesapladığı olasılık değeri 0.7 ise, bu durum neyi öngörür?
Cevap: A) Eşik değerin üzerinde olduğu için olayın gerçekleşme olasılığının yüksek olduğunu öngörür
Açıklama: Lojistik regresyonda, hesaplanan olasılık değeri belirli bir eşik değerin üzerinde ise, bu olayın gerçekleşme olasılığının yüksek olduğunu öngörür.
#6. Lojistik regresyonun doğrusal regresyondan farkı nedir?
Cevap: A) Olasılık tahminlerini sağlaması
Açıklama: Lojistik regresyon, olasılık tahminleri yapar ve bu nedenle ikili ve kategorik sonuçları modellemek için uygundur.
#7. Aday öge kümesi sayısını azaltma ve karşılaştırmaların sayısını azaltma işlemleri hangi amaç için yapılır?<
Cevap: E) Sık öge kümelerini oluşturmak
Açıklama: Aday öge kümesi sayısını ve karşılaştırmaların sayısını azaltma işlemleri, sık öge kümelerinin daha verimli bir şekilde bulunmasını sağlar.
#8. I = {a, b, c, d, e} kümesinden oluşturulan {a, b} → {d} kuralı düşük güven oranlı bir kuralsa aşağıdaki kurallardan hangisi düşük oranlı bir kuraldır?
Cevap: A) {b} → {c}
Açıklama: {a, b} → {d} kuralı düşük güven oranlı bir kuralsa, benzer şekilde {b} → {c} kuralı da düşük güven oranlı bir kural olabilir, çünkü aynı veri setinde benzer düşük güvenli ilişkiler ortaya çıkabilir.
#9. Yaşlı ve genç yetişkinler arasındaki algılanan yaşam doyumunun farklarını incelemek amacıyla bir araştırma yapılmıştır. 10 kişilik iki gruptan oluşan, 70 yaş üstü yaşlı yetişkinlere ve 20 – 30 yaş arası genç yetişkinlere yüksek güvenilirlik ve geçerliliği olduğu bilinen bir yaşam memnuniyeti testi verilmiştir. Ölçüm puanları 0 (en düşük) – 60 (en yüksek) arasındadır. Yaşlı yetişkinlerin verdiği puanların ortalaması 44.5 ve varyansı 75.39 iken genç yetişkinlerin verdiği puanların ortalaması 28.1 ve varyansı 72.99 olarak hesaplanmıştır. Yaşlı ve genç yetişkinler arasındaki ortalama yaşam memnuniyetinin farklı olduğu iddiasını %5 anlam düzeyinde test ediniz ve yorumlayınız. - Yukarıdaki örneğe göre kritik test istatistiği değeri kaçtır?
Cevap: E) 2,23
Açıklama: Kritik test istatistiği değeri %5 anlamlılık düzeyinde 2,23’tür.
#10. Olasılıklar oranı neyi ifade eder?
Cevap: D) Bir olayın gerçekleşme olasılığının gerçekleşmeme olasılığına oranı
Açıklama: Olasılıklar oranı, bir olayın gerçekleşme olasılığının gerçekleşmeme olasılığına oranını ifade eder ve lojistik regresyonda önemli bir kavramdır.
#11. Hangi lojistik regresyon türü, "Kırmızı/Yeşil/Mavi" gibi sıralı kategorilere sahip bir yanıt değişkeni için kullanılır?
Cevap: B) Multinomial Lojistik Regresyon
Açıklama: Multinomial lojistik regresyon, sıralı olmayan kategorik sonuçlar için kullanılır, ancak sorudaki “Kırmızı/Yeşil/Mavi” gibi kategorilere sahip yanıt değişkeni için daha uygundur.
#12. Aşağıdaki ifadelerin hangileri yanlıştır? - I. Veri madenciliğinde hipotez testleri, elde edilen veri örüntülerinin istatistiksel olarak anlamlı olup olmadığını değerlendirir. - II. Hipotez testleri, değişkenler arasındaki ilişkilerin istatistiksel anlamlılığını değerlendirmek için kullanılabilir. - III. Hipotez testleri, veri madenciliğinde kullanılan algoritmaların doğruluğunu belirlemek için kullanılır.
Cevap: C) Yalnız III
Açıklama: Hipotez testleri, veri madenciliğinde kullanılan algoritmaların doğruluğunu belirlemek için kullanılmaz. Bu testler, değişkenler arasındaki ilişkilerin ve elde edilen veri örüntülerinin istatistiksel anlamlılığını değerlendirir.
#13. Bir birliktelik kuralının desteği nedir?
Cevap: C) X ve Y ögelerini içeren işlemlerin ne sıklıkta göründüğünü
Açıklama: Bir kuralın desteği, kuralı içeren işlemlerin toplam işlem sayısına oranıdır ve kuralın ne kadar yaygın olduğunu gösterir.
#14. Yaşlı ve genç yetişkinler arasındaki algılanan yaşam doyumunun farklarını incelemek amacıyla bir araştırma yapılmıştır. 10 kişilik iki gruptan oluşan, 70 yaş üstü yaşlı yetişkinlere ve 20 – 30 yaş arası genç yetişkinlere yüksek güvenilirlik ve geçerliliği olduğu bilinen bir yaşam memnuniyeti testi verilmiştir. Ölçüm puanları 0 (en düşük) – 60 (en yüksek) arasındadır. Yaşlı yetişkinlerin verdiği puanların ortalaması 44.5 ve varyansı 75.39 iken genç yetişkinlerin verdiği puanların ortalaması 28.1 ve varyansı 72.99 olarak hesaplanmıştır. Yaşlı ve genç yetişkinler arasındaki ortalama yaşam memnuniyetinin farklı olduğu iddiasını %5 anlam düzeyinde test ediniz ve yorumlayınız. - Yukarıdaki örnekte hangi test istatistiği kullanılmalıdır?
Cevap: B) T-testi
Açıklama: T-testi, küçük örneklem büyüklükleri ve bilinmeyen populasyon standart sapmaları için kullanılır.
#15. Apriori prensibine göre, bir sık öge kümesinin alt kümeleri hakkında hangisi doğrudur?
Cevap: C) Tüm alt kümeler sık olabilir
Açıklama: Apriori prensibine göre, bir sık öge kümesinin tüm alt kümeleri de sıktır. Bu, sık öge kümelerinin oluşturulmasında önemli bir temel oluşturur.
#16. Aşağıdaki yöntemlerden hangileri özellik oluşturma (feature creation) için kullanılabilir? - I. Öznitelik oluşturma - II. Veriyi yeni bir uzaya eşleme - III. Öznitelik inşası
Cevap: D) I-II-III
Açıklama: Öznitelik oluşturma, veriyi yeni bir uzaya eşleme ve öznitelik inşası, özellik oluşturma için kullanılan yöntemlerdir.
#17. Kategorik bir özniteliğin ikili hale getirilmesinde aşağıdakilerden hangileri yanlıştır? - I. Veri özelliği sıralı ise, atama yaparken sıralamayı korumak gerekir - II. Kategorik değerleri ikili formata dönüştürürken 0 ve 1'leri istenilen şekilde atanabilir - III. Kategori sayısı kadar sütun oluşturmak gerekir
Cevap: D) Yalnız III
Açıklama: Kategorik bir özniteliğin ikili hale getirilmesinde, kategori sayısı kadar sütun oluşturmak gerekmez. Bu işlem, genellikle bir sıcak kodlama (one-hot encoding) yöntemi ile gerçekleştirilir.
#18. Lojistik regresyonda en uygun eğriyi bulmak için hangi yöntem kullanılır?
Cevap: D) En Olası Tahmin Yöntemi
Açıklama: Lojistik regresyonda en uygun eğriyi bulmak için En Olası Tahmin (Maximum Likelihood Estimation) yöntemi kullanılır.
#19. Belli bir parçanın üretimi için gereken ortalama zamanın 11.5 dakika olduğu biliniyor. İşe alınan 10 işçinin bu mamulü üretim süreleri gözlemleniyor ve aşağıdaki sonuçlar elde ediliyor. %5 anlam düzeyinde yeni işe alınan işçilerin bu mamulü üretim süresinin eski işçilerden daha fazla olup olmadığını araştırınız. (İpucu: Bu soru için toplanan verilerin kendisi verilmiştir. Daha önceki örneklerde ve sorularda toplanan verilerden elde edilen ortalamalar veya standart sapmalar verilmişti.) - Yukarıdaki örneğe göre hesaplanan test istatistiği değeri kaçtır?
Cevap: E) 2,06
Açıklama: T-testi kullanılarak hesaplanan test istatistiği değeri 2,06’dır.
#20. Boyut azaltmanın avantajlarından hangisi doğrudur?
Cevap: B) Veri işleme sürelerini kısaltır
Açıklama: Boyut azaltma, veri işleme sürelerini kısaltarak analiz süreçlerini hızlandırır ve daha etkin hale getirir.
SONUÇ
İstanbul Üniversitesi Açık ve Uzaktan Eğitim Fakültesi (Auzef)
Açık Öğretim Fakültesi
Bölüm : Yönetim Bilişim Sistemleri Lisans
4. Sınıf Veri Madenciliği Bahar Dönemi
Veri Madenciliği Final Deneme Sınavı -3
İstanbul Üniversitesi Açık ve Uzaktan Eğitim Fakültesi (Auzef)
Açık Öğretim Fakültesi
Bölüm : Yönetim Bilişim Sistemleri Lisans
4. Sınıf Veri Madenciliği Bahar Dönemi
Veri Madenciliği Final Deneme Sınavı -3
HD Quiz powered by harmonic design
Veri Madenciliği Final Deneme Sınavı -3
İstanbul Üniversitesi Açık ve Uzaktan Eğitim Fakültesi (Auzef) Açık Öğretim Fakültesi Bölüm : Yönetim Bilişim Sistemleri Lisans 4. Sınıf Veri Madenciliği Bahar Dönemi Veri Madenciliği Final Deneme Sınavı -3 |
---|
Veri Madenciliği Final Deneme Sınavı -3
|
Veri Madenciliği Final Deneme Sınavı -3
|
Veri Madenciliği Final Deneme Sınavı -3
|
Yönetim Bilişim Sistemleri Lisans
Auzef Yönetim Bilişim Sistemleri Lisans 4. Sınıf Bahar Dönemi Final Sınav Soruları ve Deneme Sınavları, 2024 Sınav Soruları