Veri Madenciliği Vize Deneme Sınavı -1
Veri Madenciliği Vize Deneme Sınavı -1
#1. Regresyon analizindeki eş varyanslık (homoscedasticity) kavramı ne anlama gelir?
Cevap: A) Hataların sabit bir varyansa sahip olduğunu
Açıklama: Homoscedasticity, hataların sabit bir varyansa sahip olduğu durumu ifade eder. Bu, regresyon analizinde önemli bir varsayımdır.
#2. Katmanlı (stratified) örnekleme hangi durumda kullanılır?
Cevap: A) Tüm nesne tiplerini yeterince temsil etmeyen durumlarda
Açıklama: Katmanlı örnekleme, tüm nesne tiplerinin yeterince temsil edilmediği durumlarda kullanılır, böylece her bir kategoriye ait veri temsil edilir.
#3. Aşağıdaki ifadelerin hangileri yanlıştır? - I. Veri madenciliğinde hipotez testleri, elde edilen veri örüntülerinin istatistiksel olarak anlamlı olup olmadığını değerlendirir. - II. Hipotez testleri, değişkenler arasındaki ilişkilerin istatistiksel anlamlılığını değerlendirmek için kullanılabilir. - III. Hipotez testleri, veri madenciliğinde kullanılan algoritmaların doğruluğunu belirlemek için kullanılır.
Cevap: C) Yalnız III
Açıklama: Hipotez testleri, veri madenciliğinde kullanılan algoritmaların doğruluğunu belirlemek için kullanılmaz. Bu testler, değişkenler arasındaki ilişkilerin ve elde edilen veri örüntülerinin istatistiksel anlamlılığını değerlendirir.
![Veri Madenciliği Ünite 5 Soru 7](https://lolonolo.com/wp-content/uploads/2024/06/Veri-Madenciligi-Unite-5-Soru-7.png)
#4. Reklam için harcanan miktara bağlı olarak bir ürünün satışlarını tahmin etmek istediğimizi varsayalım. - Sabit katsayı (a) kaçtır?
Cevap: D) 66,86
Açıklama: Regresyon denkleminin sabit katsayısı, modelin kesişim noktası olarak bulunur ve bu örnekte 66,86 olarak hesaplanmıştır.
#5. Öznitelik ayrıklaştırması aşağıdakilerden hangisini içerir?
Cevap: B) Sürekli bir değişkenin kategorik bir değişkene dönüştürülmesi
Açıklama: Öznitelik ayrıklaştırması, sürekli bir değişkenin belirli aralıklara veya kategorilere dönüştürülmesini içerir.
#6. Hangisi yapısal olmayan veri türüne örnektir?
Cevap: D) Ses dosyaları
Açıklama: Ses dosyaları yapısal olmayan veri türüdür.
![Veri Madenciliği Ünite 4 Soru 7](https://lolonolo.com/wp-content/uploads/2024/06/Veri-Madenciligi-Unite-4-Soru-7.png)
#7. Belli bir parçanın üretimi için gereken ortalama zamanın 11.5 dakika olduğu biliniyor. İşe alınan 10 işçinin bu mamulü üretim süreleri gözlemleniyor ve aşağıdaki sonuçlar elde ediliyor. %5 anlam düzeyinde yeni işe alınan işçilerin bu mamulü üretim süresinin eski işçilerden daha fazla olup olmadığını araştırınız. (İpucu: Bu soru için toplanan verilerin kendisi verilmiştir. Daha önceki örneklerde ve sorularda toplanan verilerden elde edilen ortalamalar veya standart sapmalar verilmişti.) - Yukarıdaki örneğe göre hesaplanan test istatistiği değeri kaçtır?
Cevap: E) 2,06
Açıklama: T-testi kullanılarak hesaplanan test istatistiği değeri 2,06’dır.
![Veri Madenciliği Ünite 5 Soru 7](https://lolonolo.com/wp-content/uploads/2024/06/Veri-Madenciligi-Unite-5-Soru-7.png)
#8. Reklam için harcanan miktara bağlı olarak bir ürünün satışlarını tahmin etmek istediğimizi varsayalım. - 150 TL’lik reklam harcaması yapıldığı durumdaki tahmini satış miktarı ne kadar olur?
Cevap: E) 223
Açıklama: Regresyon denklemi Y = 66,86 1,04X olduğuna göre, Y = 66,86 1,04(150) = 223 olacaktır.
#9. Veri madenciliği sürecinde kullanılan modeller, hangi amaç(lar) için kullanılır? I. Veri setlerindeki gizli örüntüleri bulmak II. Çıktıları değerlendirmek III. Ön işleme IV. Tahmin yapmak
Cevap: B) I ve IV
Açıklama: Veri madenciliği sürecinde kullanılan modeller, veri setlerindeki gizli örüntüleri bulmak ve tahmin yapmak amacıyla kullanılır.
#10. Hangi yaklaşım özniteliklerin, veri madenciliği algoritması çalıştırılmadan önce, veri madenciliği görevinden bağımsız bir şekilde seçilmesini benimser?
Cevap: A) Filtre yaklaşım
Açıklama: Filtre yaklaşım, özniteliklerin veri madenciliği görevinden bağımsız olarak seçilmesini benimser ve bu sayede daha genel ve esnek bir seçim süreci sağlar.
#11. Yaşlı ve genç yetişkinler arasındaki algılanan yaşam doyumunun farklarını incelemek amacıyla bir araştırma yapılmıştır. 10 kişilik iki gruptan oluşan, 70 yaş üstü yaşlı yetişkinlere ve 20 – 30 yaş arası genç yetişkinlere yüksek güvenilirlik ve geçerliliği olduğu bilinen bir yaşam memnuniyeti testi verilmiştir. Ölçüm puanları 0 (en düşük) – 60 (en yüksek) arasındadır. Yaşlı yetişkinlerin verdiği puanların ortalaması 44.5 ve varyansı 75.39 iken genç yetişkinlerin verdiği puanların ortalaması 28.1 ve varyansı 72.99 olarak hesaplanmıştır. Yaşlı ve genç yetişkinler arasındaki ortalama yaşam memnuniyetinin farklı olduğu iddiasını %5 anlam düzeyinde test ediniz ve yorumlayınız. - Yukarıdaki örnekte hangi test istatistiği kullanılmalıdır?
Cevap: B) T-testi
Açıklama: T-testi, küçük örneklem büyüklükleri ve bilinmeyen populasyon standart sapmaları için kullanılır.
#12. A firması tarafından üretilen ampullerden 80 adet seçilmiş ve ortalama 1258 saat çalıştığı görülmüştür. Ana kütleye ait standart sapma 94 saattir. B firması tarafından üretilen ampullerden 60 adet seçilmiş ve ortalama 1029 saat çalıştığı görülmüştür. Ana kütleye ait standart sapma 68 saattir. A firmasının ampul fiyatı daha fazla olduğu için bir test yapılacaktır. A firması tarafından üretilen ampullerin çalışma süresi, B firması tarafından üretilen ampullerin çalışma süresinden 200 saat fazlaysa, A firmasının ampulleri satın alınacaktır. 𝛼𝛼 = 0.011 için hangi firmanın ampullerinin satın alınacağını test ediniz. - Yukarıdaki örneğe göre hesaplanan test istatistiği değeri kaçtır?
Cevap: B) 2,12
Açıklama: Z-testi kullanılarak hesaplanan test istatistiği değeri 2,12’dir.
#13. Z-Skor Normalizasyonu nedir?
Cevap: D) Değerleri ortalaması 0 ve standart sapması 1 olacak şekilde dönüştürme
Açıklama: Z-skor normalizasyonu, verileri ortalaması 0 ve standart sapması 1 olacak şekilde dönüştürerek, farklı ölçeklerdeki verilerin karşılaştırılmasını kolaylaştırır.
#14. Hangisi yapısal bir veri türüdür?
Cevap: E) İlişkisel veritabanlarındaki tablolar
Açıklama: İlişkisel veritabanlarındaki tablolar yapısal veri türüdür.
#15. Yaşlı ve genç yetişkinler arasındaki algılanan yaşam doyumunun farklarını incelemek amacıyla bir araştırma yapılmıştır. 10 kişilik iki gruptan oluşan, 70 yaş üstü yaşlı yetişkinlere ve 20 – 30 yaş arası genç yetişkinlere yüksek güvenilirlik ve geçerliliği olduğu bilinen bir yaşam memnuniyeti testi verilmiştir. Ölçüm puanları 0 (en düşük) – 60 (en yüksek) arasındadır. Yaşlı yetişkinlerin verdiği puanların ortalaması 44.5 ve varyansı 75.39 iken genç yetişkinlerin verdiği puanların ortalaması 28.1 ve varyansı 72.99 olarak hesaplanmıştır. Yaşlı ve genç yetişkinler arasındaki ortalama yaşam memnuniyetinin farklı olduğu iddiasını %5 anlam düzeyinde test ediniz ve yorumlayınız. - Yukarıdaki örneğe göre kritik test istatistiği değeri kaçtır?
Cevap: E) 2,23
Açıklama: Kritik test istatistiği değeri %5 anlamlılık düzeyinde 2,23’tür.
#16. Korelasyon katsayısı hangi durumda sıfıra eşit olur?
Cevap: C) Herhangi bir ilişki olmadığında
Açıklama: Korelasyon katsayısı, iki değişken arasında herhangi bir ilişki olmadığında sıfıra eşit olur.
#17. Veri madenciliği ve makine öğrenimi ile ilgili aşağıdakilerden hangisi doğrudur?
Cevap: C) Veri setlerindeki örüntüleri keşfetmeyi hedefler.
Açıklama: Veri madenciliği ve makine öğrenimi, veri setlerindeki örüntüleri keşfetmeyi hedefler.
#18. Hangi adım, veri madenciliği sürecindeki en zahmetli ve zaman alıcı adımdır?
Cevap: E) Ön İşleme
Açıklama: Ön işleme, veri madenciliği sürecinde en zahmetli ve zaman alıcı adımdır.
#19. Bir regresyon analizinde bağımsız değişkenin katsayısının 2,16 bulunması neyi ifade eder?
Cevap: B) Bağımsız değişkenin bağımlı değişken üzerindeki etkisinin bir birim artışla 2,16 birim arttığını gösterir.
Açıklama: Regresyon analizinde bağımsız değişkenin katsayısı, bağımsız değişkendeki bir birimlik artışın bağımlı değişkende ne kadar bir artışa neden olduğunu gösterir.
#20. Bir veri madenciliği analizi için ihtiyacımız olan tüm verileri toplamak ve işlemek için yeterli zamanımız olmadığında, örneklem büyüklüğü nasıl belirlenir?
Cevap: C) Uyarlanabilir örneklemeyle
Açıklama: Uyarlanabilir örnekleme, sınırlı zaman ve kaynaklarla veri toplama ve işleme işlemini optimize etmek için kullanılır.
SONUÇ
İstanbul Üniversitesi Açık ve Uzaktan Eğitim Fakültesi (Auzef)
Açık Öğretim Fakültesi
Bölüm : Yönetim Bilişim Sistemleri Lisans
4. Sınıf Veri Madenciliği Bahar Dönemi
Veri Madenciliği Vize Deneme Sınavı -1
İstanbul Üniversitesi Açık ve Uzaktan Eğitim Fakültesi (Auzef)
Açık Öğretim Fakültesi
Bölüm : Yönetim Bilişim Sistemleri Lisans
4. Sınıf Veri Madenciliği Bahar Dönemi
Veri Madenciliği Vize Deneme Sınavı -1
HD Quiz powered by harmonic design
Veri Madenciliği Vize Deneme Sınavı -1
İstanbul Üniversitesi Açık ve Uzaktan Eğitim Fakültesi (Auzef) Açık Öğretim Fakültesi Bölüm : Yönetim Bilişim Sistemleri Lisans 4. Sınıf Veri Madenciliği Bahar Dönemi Veri Madenciliği Vize Deneme Sınavı -1 |
---|
Veri Madenciliği Vize Deneme Sınavı -1
|
|
Veri Madenciliği Vize Deneme Sınavı -1
|
Yönetim Bilişim Sistemleri Lisans
Auzef Yönetim Bilişim Sistemleri Lisans 4. Sınıf Bahar Dönemi Vize Soruları ve Deneme Sınavları, 2024 Sınav Soruları