Veri Madenciliği Final Deneme Sınavı -4
Auzef Veri Madenciliği Final Deneme Sınavı -4
#1. A firması tarafından üretilen ampullerden 80 adet seçilmiş ve ortalama 1258 saat çalıştığı görülmüştür. Ana kütleye ait standart sapma 94 saattir. B firması tarafından üretilen ampullerden 60 adet seçilmiş ve ortalama 1029 saat çalıştığı görülmüştür. Ana kütleye ait standart sapma 68 saattir. A firmasının ampul fiyatı daha fazla olduğu için bir test yapılacaktır. A firması tarafından üretilen ampullerin çalışma süresi, B firması tarafından üretilen ampullerin çalışma süresinden 200 saat fazlaysa, A firmasının ampulleri satın alınacaktır. ???????? = 0.011 için hangi firmanın ampullerinin satın alınacağını test ediniz. - Yukarıdaki örneğe göre kritik test istatistiği değeri kaçtır?
Cevap: E) 2,33
Açıklama: Kritik test istatistiği değeri %1 anlamlılık düzeyinde 2,33’tür.
#2. Lojistik regresyon, hangi tür veri setleri üzerinde çalışmaya daha uygundur?
Cevap: D) Kategorik ve ikili sonuçlar
Açıklama: Lojistik regresyon, özellikle kategorik ve ikili (binary) sonuçlar için uygundur, bu nedenle sınıflandırma problemlerinde yaygın olarak kullanılır.
#3. Hangisi Logaritmik dönüşüm yapılma gerekçesi değildir?
Cevap: D) Veri normal dağılıma sahip olduğu için
Açıklama: Logaritmik dönüşüm genellikle verileri normal dağılıma yaklaştırmak için yapılır, bu nedenle veri zaten normal dağılıma sahipse bu dönüşüm gerekli değildir.
#4. Belli bir parçanın üretimi için gereken ortalama zamanın 11.5 dakika olduğu biliniyor. İşe alınan 10 işçinin bu mamulü üretim süreleri gözlemleniyor ve aşağıdaki sonuçlar elde ediliyor. %5 anlam düzeyinde yeni işe alınan işçilerin bu mamulü üretim süresinin eski işçilerden daha fazla olup olmadığını araştırınız. (İpucu: Bu soru için toplanan verilerin kendisi verilmiştir. Daha önceki örneklerde ve sorularda toplanan verilerden elde edilen ortalamalar veya standart sapmalar verilmişti.) 7- Yukarıdaki örnekte hangi test istatistiği kullanılmalıdır?
Cevap: B) T-testi
Açıklama: T-testi, küçük örneklem büyüklükleri ve bilinmeyen populasyon standart sapmaları için kullanılır.
#5. Yaşlı ve genç yetişkinler arasındaki algılanan yaşam doyumunun farklarını incelemek amacıyla bir araştırma yapılmıştır. 10 kişilik iki gruptan oluşan, 70 yaş üstü yaşlı yetişkinlere ve 20 – 30 yaş arası genç yetişkinlere yüksek güvenilirlik ve geçerliliği olduğu bilinen bir yaşam memnuniyeti testi verilmiştir. Ölçüm puanları 0 (en düşük) – 60 (en yüksek) arasındadır. Yaşlı yetişkinlerin verdiği puanların ortalaması 44.5 ve varyansı 75.39 iken genç yetişkinlerin verdiği puanların ortalaması 28.1 ve varyansı 72.99 olarak hesaplanmıştır. Yaşlı ve genç yetişkinler arasındaki ortalama yaşam memnuniyetinin farklı olduğu iddiasını %5 anlam düzeyinde test ediniz ve yorumlayınız. - Yukarıdaki örneğe göre hesaplanan test istatistiği değeri kaçtır?
Cevap: C) 4,26
Açıklama: T-testi kullanılarak hesaplanan test istatistiği değeri 4,26’dir.
#6. Hangisi yapısal olmayan veri türüne örnektir?
Cevap: D) Ses dosyaları
Açıklama: Ses dosyaları yapısal olmayan veri türüdür.
#7. Sigmoid fonksiyonunun temel özelliklerinden biri nedir?
Cevap: B) Herhangi bir gerçel sayıyı 0 ile 1 arasında bir değere dönüştürür
Açıklama: Sigmoid fonksiyonu, giriş değerini 0 ile 1 arasında bir olasılık değerine dönüştürür, bu nedenle lojistik regresyon modellerinde kullanılır.
#8. Doğrusal regresyonun ikili sonuçlar için uygun olmamasının nedeni nedir?
Cevap: A) İkili sonuçların doğrusal olmayan doğasını göz ardı etmesi
Açıklama: Doğrusal regresyon, ikili sonuçların doğrusal olmayan doğasını göz ardı eder, bu yüzden bu tür veriler için lojistik regresyon daha uygundur.
#9. Veri madenciliği ve makine öğrenimi ile ilgili aşağıdakilerden hangisi doğrudur?
Cevap: C) Veri setlerindeki örüntüleri keşfetmeyi hedefler.
Açıklama: Veri madenciliği ve makine öğrenimi, veri setlerindeki örüntüleri keşfetmeyi hedefler.
#10. Logit dönüşümü, lojistik regresyon modelinde hangi olasılık değerini daha doğrusal ve düzgün bir şekilde modellemeyi sağlar?
Cevap: A) Olasılıklar oranını (odds ratio)
Açıklama: Logit dönüşümü, olasılıklar oranını (odds ratio) daha doğrusal ve düzgün bir şekilde modellemeyi sağlar.
#11. Bir birliktelik kuralının güveni nedir?
Cevap: B) X’i içeren işlemlerde X ve Y ögelerinin ne sıklıkta göründüğünü
Açıklama: Bir kuralın güveni, X’i içeren işlemlerde X ve Y’nin birlikte görülme olasılığını ölçer ve kuralın doğruluğunu gösterir.
#12. Hangisi yapısal bir veri türüdür?
Cevap: E) İlişkisel veritabanlarındaki tablolar
Açıklama: İlişkisel veritabanlarındaki tablolar yapısal veri türüdür.
#13. Güven tabanlı kesme stratejisi hangi durumu ele alır?
Cevap: D) Kural kümesini bulur
Açıklama: Güven tabanlı kesme stratejisi, belirli bir güven eşiğinin üzerinde olan kural kümesini bulmayı amaçlar.
#14. I = {a, b, c, d, e} kümesinde {b, d} ögelerinin seyrek öge kümesi olduğu durumda aşağıdakilerden hangisi sık öge kümesinde yer alır?
9- I = {a, b, c, d, e} kümesinde {b, d} ögelerinin seyrek öge kümesi olduğu durumda aşağıdakilerden hangisi sık öge kümesinde yer alır?
A) {a, b, d}
B) {a, b, e}
C) {a, b, c, d}
D) {b, c, d, e}
E) {b, c, d, e}
Açıklama:
Seçeneklerin Değerlendirilmesi:
A) {a, b, d} — Yanlış çünkü {b, d} öğeleri seyrek öğe kümesinde.
B) {a, b, e} — Yanlış çünkü {b} öğesi seyrek öğe kümesinde.
C) {a, b, c, d} — Yanlış çünkü {b, d} öğeleri seyrek öğe kümesinde.
D) {b, c, d, e} — Yanlış çünkü {b, d} öğeleri seyrek öğe kümesinde.
E) {b, c, d, e} — Yanlış çünkü {b, d} öğeleri seyrek öğe kümesinde.
Sonuç:
Verilen seçeneklerin hiçbirinde doğru cevap bulunmamaktadır. Doğru cevap, sık öğe kümesinde yer alması gereken {a, c, e} kümesidir. Bu nedenle, sorunun kitapta verilen şekliyle hatalı olduğunu ve doğru cevabın seçenekler arasında yer almadığını belirtmek doğru olacaktır.
Öneri:
Kitapta verilen sorunun doğru cevabı seçeneklerde bulunmadığı için, bu durumu belirtmek ve kitabın ilgili kısmında düzeltme yapılması gerektiğini önermek en uygun yaklaşım olacaktır.
#15. Belli bir parçanın üretimi için gereken ortalama zamanın 11.5 dakika olduğu biliniyor. İşe alınan 10 işçinin bu mamulü üretim süreleri gözlemleniyor ve aşağıdaki sonuçlar elde ediliyor. %5 anlam düzeyinde yeni işe alınan işçilerin bu mamulü üretim süresinin eski işçilerden daha fazla olup olmadığını araştırınız. (İpucu: Bu soru için toplanan verilerin kendisi verilmiştir. Daha önceki örneklerde ve sorularda toplanan verilerden elde edilen ortalamalar veya standart sapmalar verilmişti.) - Yukarıdaki örneğe göre kritik test istatistiği değeri kaçtır?
Cevap: D) 1,83
Açıklama: Kritik test istatistiği değeri %5 anlamlılık düzeyinde 1,83’tür.
#16. Hangi adım, veri madenciliği sürecindeki en zahmetli ve zaman alıcı adımdır?
Cevap: E) Ön İşleme
Açıklama: Ön işleme, veri madenciliği sürecinde en zahmetli ve zaman alıcı adımdır.
#17. Veri madenciliği sürecinde kullanılan modeller, hangi amaç(lar) için kullanılır? I. Veri setlerindeki gizli örüntüleri bulmak II. Çıktıları değerlendirmek III. Ön işleme IV. Tahmin yapmak
Cevap: B) I ve IV
Açıklama: Veri madenciliği sürecinde kullanılan modeller, veri setlerindeki gizli örüntüleri bulmak ve tahmin yapmak amacıyla kullanılır.
#18. Apriori algoritmasının amacı nedir?
Cevap: C) Sık öge kümelerini bulmak
Açıklama: Apriori algoritması, sık öge kümelerini bulmayı amaçlar. Bu, birliktelik kurallarının çıkarılmasında kullanılan temel bir adımdır.
#19. A firması tarafından üretilen ampullerden 80 adet seçilmiş ve ortalama 1258 saat çalıştığı görülmüştür. Ana kütleye ait standart sapma 94 saattir. B firması tarafından üretilen ampullerden 60 adet seçilmiş ve ortalama 1029 saat çalıştığı görülmüştür. Ana kütleye ait standart sapma 68 saattir. A firmasının ampul fiyatı daha fazla olduğu için bir test yapılacaktır. A firması tarafından üretilen ampullerin çalışma süresi, B firması tarafından üretilen ampullerin çalışma süresinden 200 saat fazlaysa, A firmasının ampulleri satın alınacaktır. ???????? = 0.011 için hangi firmanın ampullerinin satın alınacağını test ediniz. - Yukarıdaki örnekte hangi test istatistiği kullanılmalıdır?
Cevap: A) Z-testi
Açıklama: Z-testi, büyük örneklem büyüklükleri ve bilinen populasyon standart sapmaları için kullanılır.
#20. Birliktelik analizi için kullanılan destek ve güven oranları hangi bilgiyi sağlar?
Cevap: B) Bir kuralın ne sıklıkta uygulandığını ve çıkarımın güvenilirliğini
Açıklama: Destek ve güven oranları, birliktelik kurallarının sıklığını ve bu kuralların güvenilirliğini ölçer. Destek, kuralın ne sıklıkta görüldüğünü; güven ise kuralın doğruluğunu gösterir.
SONUÇ
İstanbul Üniversitesi Açık ve Uzaktan Eğitim Fakültesi (Auzef)
Açık Öğretim Fakültesi
Bölüm : Yönetim Bilişim Sistemleri Lisans
4. Sınıf Veri Madenciliği Bahar Dönemi
Auzef Veri Madenciliği Final Deneme Sınavı -4
İstanbul Üniversitesi Açık ve Uzaktan Eğitim Fakültesi (Auzef)
Açık Öğretim Fakültesi
Bölüm : Yönetim Bilişim Sistemleri Lisans
4. Sınıf Veri Madenciliği Bahar Dönemi
Auzef Veri Madenciliği Final Deneme Sınavı -4
HD Quiz powered by harmonic design
Auzef Veri Madenciliği Final Deneme Sınavı -4
İstanbul Üniversitesi Açık ve Uzaktan Eğitim Fakültesi (Auzef) Açık Öğretim Fakültesi Bölüm : Yönetim Bilişim Sistemleri Lisans 4. Sınıf Veri Madenciliği Bahar Dönemi Auzef Veri Madenciliği Final Deneme Sınavı -4 |
---|
Auzef Veri Madenciliği Final Deneme Sınavı -4
|
Auzef Veri Madenciliği Final Deneme Sınavı -4
Auzef Yönetim Bilişim Sistemleri Lisans 4. Sınıf Bahar Dönemi Final Soruları
|
Auzef Veri Madenciliği Final Deneme Sınavı -4
|
Yönetim Bilişim Sistemleri Lisans
Auzef Yönetim Bilişim Sistemleri Lisans 4. Sınıf Bahar Dönemi Final Soruları ve Deneme Sınavları, 2024 Sınav Soruları