Veri Madenciliği Vize Deneme Sınavı -2
Veri Madenciliği Vize Deneme Sınavı -2
#1. Hangisi yapısal bir veri türüdür?
Cevap: E) İlişkisel veritabanlarındaki tablolar
Açıklama: İlişkisel veritabanlarındaki tablolar yapısal veri türüdür.
![Veri Madenciliği Ünite 4 Soru 7](https://lolonolo.com/wp-content/uploads/2024/06/Veri-Madenciligi-Unite-4-Soru-7.png)
#2. Belli bir parçanın üretimi için gereken ortalama zamanın 11.5 dakika olduğu biliniyor. İşe alınan 10 işçinin bu mamulü üretim süreleri gözlemleniyor ve aşağıdaki sonuçlar elde ediliyor. %5 anlam düzeyinde yeni işe alınan işçilerin bu mamulü üretim süresinin eski işçilerden daha fazla olup olmadığını araştırınız. (İpucu: Bu soru için toplanan verilerin kendisi verilmiştir. Daha önceki örneklerde ve sorularda toplanan verilerden elde edilen ortalamalar veya standart sapmalar verilmişti.) 7- Yukarıdaki örnekte hangi test istatistiği kullanılmalıdır?
Cevap: B) T-testi
Açıklama: T-testi, küçük örneklem büyüklükleri ve bilinmeyen populasyon standart sapmaları için kullanılır.
![Veri Madenciliği Ünite 5 Soru 7](https://lolonolo.com/wp-content/uploads/2024/06/Veri-Madenciligi-Unite-5-Soru-7.png)
#3. Reklam için harcanan miktara bağlı olarak bir ürünün satışlarını tahmin etmek istediğimizi varsayalım. - 200'lük bir satış miktarı elde etmek için kaç TL harcanmalıdır?
Cevap: C) 128
Açıklama: Regresyon denklemi Y = 66,86 1,04X olduğuna göre, 200 = 66,86 1,04X denklemini çözerek X’i buluruz: X ≈ 128 TL olacaktır.
#4. Histogram hangi veri özelliklerini göstermek için kullanılır?
Cevap: A) Belli bir aralıktaki dağılım
Açıklama: Histogram, veri setindeki değerlerin belli bir aralıktaki dağılımını göstermek için kullanılır ve frekans dağılımını görselleştirir.
#5. Hangi adım, veri madenciliği sürecindeki en zahmetli ve zaman alıcı adımdır?
Cevap: E) Ön İşleme
Açıklama: Ön işleme, veri madenciliği sürecinde en zahmetli ve zaman alıcı adımdır.
#6. Veri madenciliği ve makine öğrenimi ile ilgili aşağıdakilerden hangisi doğrudur?
Cevap: C) Veri setlerindeki örüntüleri keşfetmeyi hedefler.
Açıklama: Veri madenciliği ve makine öğrenimi, veri setlerindeki örüntüleri keşfetmeyi hedefler.
#7. A firması tarafından üretilen ampullerden 80 adet seçilmiş ve ortalama 1258 saat çalıştığı görülmüştür. Ana kütleye ait standart sapma 94 saattir. B firması tarafından üretilen ampullerden 60 adet seçilmiş ve ortalama 1029 saat çalıştığı görülmüştür. Ana kütleye ait standart sapma 68 saattir. A firmasının ampul fiyatı daha fazla olduğu için bir test yapılacaktır. A firması tarafından üretilen ampullerin çalışma süresi, B firması tarafından üretilen ampullerin çalışma süresinden 200 saat fazlaysa, A firmasının ampulleri satın alınacaktır. 𝛼𝛼 = 0.011 için hangi firmanın ampullerinin satın alınacağını test ediniz. - Yukarıdaki örnekte hangi test istatistiği kullanılmalıdır?
Cevap: A) Z-testi
Açıklama: Z-testi, büyük örneklem büyüklükleri ve bilinen populasyon standart sapmaları için kullanılır.
#8. Bir regresyon modelinde bağımlı değişken ile bir bağımsız değişken arasında bulunan katsayı (b) 2, sabit terim (a) ise 5 olarak bulunmuştur. Bu durumda, bağımlı değişkenin değeri 4 olduğunda tahmini sonuç ne olur?
Cevap: B) 13
Açıklama: Regresyon denklemi Y = a bX olduğuna göre, Y = 5 2(4) = 13 olacaktır.
#9. Aşırı değerlerin bulunduğu bir veri setinde hangi merkezi eğilim ölçüsü, genellikle yanıltıcı olabilir?
Cevap: B) Medyan
Açıklama: Aşırı değerlerin bulunduğu bir veri setinde, medyan merkezi eğilim ölçüsü olarak genellikle yanıltıcı olabilir, çünkü aşırı değerler medyanı etkileyebilir.
#10. Veri madenciliği sürecinde kullanılan modeller, hangi amaç(lar) için kullanılır? I. Veri setlerindeki gizli örüntüleri bulmak II. Çıktıları değerlendirmek III. Ön işleme IV. Tahmin yapmak
Cevap: B) I ve IV
Açıklama: Veri madenciliği sürecinde kullanılan modeller, veri setlerindeki gizli örüntüleri bulmak ve tahmin yapmak amacıyla kullanılır.
#11. Regresyon analizinde kullanılan en küçük kareler yöntemi neyi amaçlar?
Cevap: B) Gerçek ve tahmin edilen değerler arasındaki farkı en aza indirmeyi
Açıklama: En küçük kareler yöntemi, tahmin edilen değerler ile gerçek değerler arasındaki farkların karelerinin toplamını en aza indirmeyi amaçlar.
![Veri Madenciliği Ünite 4 Soru 7](https://lolonolo.com/wp-content/uploads/2024/06/Veri-Madenciligi-Unite-4-Soru-7.png)
#12. Belli bir parçanın üretimi için gereken ortalama zamanın 11.5 dakika olduğu biliniyor. İşe alınan 10 işçinin bu mamulü üretim süreleri gözlemleniyor ve aşağıdaki sonuçlar elde ediliyor. %5 anlam düzeyinde yeni işe alınan işçilerin bu mamulü üretim süresinin eski işçilerden daha fazla olup olmadığını araştırınız. (İpucu: Bu soru için toplanan verilerin kendisi verilmiştir. Daha önceki örneklerde ve sorularda toplanan verilerden elde edilen ortalamalar veya standart sapmalar verilmişti.) - Yukarıdaki örneğe göre kritik test istatistiği değeri kaçtır?
Cevap: D) 1,83
Açıklama: Kritik test istatistiği değeri %5 anlamlılık düzeyinde 1,83’tür.
![Veri Madenciliği Ünite 5 Soru 6](https://lolonolo.com/wp-content/uploads/2024/06/Veri-Madenciligi-Unite-5-Soru-6.png)
#13. Aşağıdaki tabloda bir veri setinde değişkenler arasındaki korelasyon katsayıları verilmiştir. Buna göre ifadelerden hangileri doğrudur? - I. Y değişkeni ile X1 arasında güçlü bir ilişki vardır. - II. Y değişkeni ile X2 arasında doğrusal bir ilişki yoktur. - III. Y değişkeni ile X3 arasında negatif yönlü bir ilişki vardır. - IV. X1 ve X2 arasında güçlü bir pozitif ilişki bulunmaktadır. - V. X2 değişkeni ile X3 arasında negatif bir ilişki vardır.
Cevap: C) I-III
Açıklama: Y değişkeni ile X1 arasında güçlü bir pozitif ilişki (0,997) ve Y değişkeni ile X3 arasında zayıf bir negatif ilişki (-0,038) vardır. X1 ve X2 arasında doğrudan bir korelasyon katsayısı verilmemiştir.
![Veri Madenciliği Ünite 5 Soru 7](https://lolonolo.com/wp-content/uploads/2024/06/Veri-Madenciligi-Unite-5-Soru-7.png)
#14. Reklam için harcanan miktara bağlı olarak bir ürünün satışlarını tahmin etmek istediğimizi varsayalım. - Bağımsız değişkenin katsayısı (b) kaçtır?
Cevap: B) 1,04
Açıklama: Bağımsız değişkenin katsayısı (b), bağımsız değişkendeki bir birimlik artışın bağımlı değişkende 1,04 birimlik bir artışa neden olduğunu gösterir.
#15. Pasta grafiği hangi tür verilerin görsel analizi için kullanılır?
Cevap: B) Kategorik veriler
Açıklama: Pasta grafiği, kategorik verilerin oranlarını ve yüzdelerini görsel olarak temsil etmek için kullanılır.
#16. Yaşlı ve genç yetişkinler arasındaki algılanan yaşam doyumunun farklarını incelemek amacıyla bir araştırma yapılmıştır. 10 kişilik iki gruptan oluşan, 70 yaş üstü yaşlı yetişkinlere ve 20 – 30 yaş arası genç yetişkinlere yüksek güvenilirlik ve geçerliliği olduğu bilinen bir yaşam memnuniyeti testi verilmiştir. Ölçüm puanları 0 (en düşük) – 60 (en yüksek) arasındadır. Yaşlı yetişkinlerin verdiği puanların ortalaması 44.5 ve varyansı 75.39 iken genç yetişkinlerin verdiği puanların ortalaması 28.1 ve varyansı 72.99 olarak hesaplanmıştır. Yaşlı ve genç yetişkinler arasındaki ortalama yaşam memnuniyetinin farklı olduğu iddiasını %5 anlam düzeyinde test ediniz ve yorumlayınız. - Yukarıdaki örneğe göre hesaplanan test istatistiği değeri kaçtır?
Cevap: C) 4,26
Açıklama: T-testi kullanılarak hesaplanan test istatistiği değeri 4,26’dir.
#17. Veri setindeki en büyük ve en küçük değer arasındaki farkı gösteren istatistik hangisidir?
Cevap: B) Aralık
Açıklama: Aralık, veri setindeki en büyük ve en küçük değer arasındaki farkı ifade eder ve veri dağılımının genişliğini gösterir.
#18. A firması tarafından üretilen ampullerden 80 adet seçilmiş ve ortalama 1258 saat çalıştığı görülmüştür. Ana kütleye ait standart sapma 94 saattir. B firması tarafından üretilen ampullerden 60 adet seçilmiş ve ortalama 1029 saat çalıştığı görülmüştür. Ana kütleye ait standart sapma 68 saattir. A firmasının ampul fiyatı daha fazla olduğu için bir test yapılacaktır. A firması tarafından üretilen ampullerin çalışma süresi, B firması tarafından üretilen ampullerin çalışma süresinden 200 saat fazlaysa, A firmasının ampulleri satın alınacaktır. 𝛼𝛼 = 0.011 için hangi firmanın ampullerinin satın alınacağını test ediniz. - Yukarıdaki örneğe göre kritik test istatistiği değeri kaçtır?
Cevap: E) 2,33
Açıklama: Kritik test istatistiği değeri %1 anlamlılık düzeyinde 2,33’tür.
#19. Hangisi yapısal olmayan veri türüne örnektir?
Cevap: D) Ses dosyaları
Açıklama: Ses dosyaları yapısal olmayan veri türüdür.
#20. Veri setinde en sık tekrar eden değeri ifade eden istatistik hangisidir?
Cevap: D) Mod
Açıklama: Mod, veri setinde en sık tekrar eden değeri ifade eder ve veri dağılımında tepe noktasını temsil eder.
SONUÇ
İstanbul Üniversitesi Açık ve Uzaktan Eğitim Fakültesi (Auzef)
Açık Öğretim Fakültesi
Bölüm : Yönetim Bilişim Sistemleri Lisans
4. Sınıf Veri Madenciliği Bahar Dönemi
Veri Madenciliği Vize Deneme Sınavı -2
İstanbul Üniversitesi Açık ve Uzaktan Eğitim Fakültesi (Auzef)
Açık Öğretim Fakültesi
Bölüm : Yönetim Bilişim Sistemleri Lisans
4. Sınıf Veri Madenciliği Bahar Dönemi
Veri Madenciliği Vize Deneme Sınavı -2
HD Quiz powered by harmonic design
Veri Madenciliği Vize Deneme Sınavı -2
İstanbul Üniversitesi Açık ve Uzaktan Eğitim Fakültesi (Auzef) Açık Öğretim Fakültesi Bölüm : Yönetim Bilişim Sistemleri Lisans 4. Sınıf Veri Madenciliği Bahar Dönemi Veri Madenciliği Vize Deneme Sınavı -2 |
---|
Veri Madenciliği Vize Deneme Sınavı -2
|
Veri Madenciliği Vize Deneme Sınavı -2
|
|
Veri Madenciliği Vize Deneme Sınavı -2
Yönetim Bilişim Sistemleri Lisans
Auzef Yönetim Bilişim Sistemleri Lisans 4. Sınıf Bahar Dönemi Vze Sınav Soruları ve Deneme Sınavları, 2024 Sınav Soruları