Veri Madenciliği Final Deneme Sınavı -8
Auzef Veri Madenciliği Final Deneme Sınavı -8
#1. kNN'nin sınırlamalarından biri nedir?
Cevap: C) Dengesiz sınıfların etkisi
Açıklama: kNN algoritmasının sınırlamalarından biri, dengesiz sınıfların etkisidir. Bu durumda, azınlık sınıflar yeterince temsil edilmez ve bu da sınıflandırma performansını olumsuz etkiler.
#2. Kosinüs mesafesi genellikle hangi tür veri kümesinde kullanılır?
Cevap: B) Metin verileri
Açıklama: Kosinüs mesafesi, metin verileri arasında benzerlik ölçmek için yaygın olarak kullanılır ve vektörlerin arasındaki açıyı ölçerek benzerlik derecesini belirler.
#3. Sınıflandırma teknikleri genellikle hangi tür veri kümeleri üzerinde etkilidir?
Cevap: D) İki kategorili veriler
Açıklama: Sınıflandırma teknikleri, özellikle iki kategorili veriler üzerinde etkilidir, çünkü bu teknikler verileri belirli sınıflara ayırmayı amaçlar.
#4. Yaşlı ve genç yetişkinler arasındaki algılanan yaşam doyumunun farklarını incelemek amacıyla bir araştırma yapılmıştır. 10 kişilik iki gruptan oluşan, 70 yaş üstü yaşlı yetişkinlere ve 20 – 30 yaş arası genç yetişkinlere yüksek güvenilirlik ve geçerliliği olduğu bilinen bir yaşam memnuniyeti testi verilmiştir. Ölçüm puanları 0 (en düşük) – 60 (en yüksek) arasındadır. Yaşlı yetişkinlerin verdiği puanların ortalaması 44.5 ve varyansı 75.39 iken genç yetişkinlerin verdiği puanların ortalaması 28.1 ve varyansı 72.99 olarak hesaplanmıştır. Yaşlı ve genç yetişkinler arasındaki ortalama yaşam memnuniyetinin farklı olduğu iddiasını %5 anlam düzeyinde test ediniz ve yorumlayınız. - Yukarıdaki örnekte hangi test istatistiği kullanılmalıdır?
Cevap: B) T-testi
Açıklama: T-testi, küçük örneklem büyüklükleri ve bilinmeyen populasyon standart sapmaları için kullanılır.
#5. Yaşlı ve genç yetişkinler arasındaki algılanan yaşam doyumunun farklarını incelemek amacıyla bir araştırma yapılmıştır. 10 kişilik iki gruptan oluşan, 70 yaş üstü yaşlı yetişkinlere ve 20 – 30 yaş arası genç yetişkinlere yüksek güvenilirlik ve geçerliliği olduğu bilinen bir yaşam memnuniyeti testi verilmiştir. Ölçüm puanları 0 (en düşük) – 60 (en yüksek) arasındadır. Yaşlı yetişkinlerin verdiği puanların ortalaması 44.5 ve varyansı 75.39 iken genç yetişkinlerin verdiği puanların ortalaması 28.1 ve varyansı 72.99 olarak hesaplanmıştır. Yaşlı ve genç yetişkinler arasındaki ortalama yaşam memnuniyetinin farklı olduğu iddiasını %5 anlam düzeyinde test ediniz ve yorumlayınız. - Yukarıdaki örneğe göre kritik test istatistiği değeri kaçtır?
Cevap: E) 2,23
Açıklama: Kritik test istatistiği değeri %5 anlamlılık düzeyinde 2,23’tür.
#6. Metin madenciliği adımları arasında hangisi metni belirli parçalara böler?
Cevap: D) Tokenizasyon
Açıklama: Tokenizasyon, metni belirli parçalara, genellikle kelimelere veya cümlelere bölen bir adımdır.
#7. A firması tarafından üretilen ampullerden 80 adet seçilmiş ve ortalama 1258 saat çalıştığı görülmüştür. Ana kütleye ait standart sapma 94 saattir. B firması tarafından üretilen ampullerden 60 adet seçilmiş ve ortalama 1029 saat çalıştığı görülmüştür. Ana kütleye ait standart sapma 68 saattir. A firmasının ampul fiyatı daha fazla olduğu için bir test yapılacaktır. A firması tarafından üretilen ampullerin çalışma süresi, B firması tarafından üretilen ampullerin çalışma süresinden 200 saat fazlaysa, A firmasının ampulleri satın alınacaktır. 𝛼𝛼 = 0.011 için hangi firmanın ampullerinin satın alınacağını test ediniz. - Yukarıdaki örneğe göre hesaplanan test istatistiği değeri kaçtır?
Cevap: B) 2,12
Açıklama: Z-testi kullanılarak hesaplanan test istatistiği değeri 2,12’dir.
#8. F1 skoru, neden hassasiyet ve duyarlılık metriklerinin harmonik ortalamasını kullanarak denge kurar?
Cevap: C) Hassasiyet ve duyarlılığın ortalamasını alarak dengeyi sağlar.
Açıklama: F1 skoru, hassasiyet (precision) ve duyarlılık (recall) metriklerinin harmonik ortalamasını alarak denge kurar ve bu sayede modelin genel performansını daha dengeli bir şekilde değerlendirir.
#9. Aşağıdaki ifadelerin hangileri yanlıştır? - I. Veri madenciliğinde hipotez testleri, elde edilen veri örüntülerinin istatistiksel olarak anlamlı olup olmadığını değerlendirir. - II. Hipotez testleri, değişkenler arasındaki ilişkilerin istatistiksel anlamlılığını değerlendirmek için kullanılabilir. - III. Hipotez testleri, veri madenciliğinde kullanılan algoritmaların doğruluğunu belirlemek için kullanılır.
Cevap: C) Yalnız III
Açıklama: Hipotez testleri, veri madenciliğinde kullanılan algoritmaların doğruluğunu belirlemek için kullanılmaz. Bu testler, değişkenler arasındaki ilişkilerin ve elde edilen veri örüntülerinin istatistiksel anlamlılığını değerlendirir.
#10. Gizli dirichlet analizi ne işe yarar?
Cevap: A) Konu modelleme için yaygın olarak kullanılan bir olasılık temelli modelleme tekniğidir.
Açıklama: Gizli Dirichlet Analizi (LDA), konu modelleme için yaygın olarak kullanılan bir olasılık temelli modelleme tekniğidir. Bu teknik, metin verilerindeki gizli konuları keşfetmek için kullanılır.
#11. Nominal değişkenler hangi özelliğe sahiptir?
Cevap: B) Kategoriler arasında hiçbir sıralama yoktur.
Açıklama: Nominal değişkenler, kategoriler arasında sıralama olmayan değişkenlerdir.
#12. Veri madenciliği sürecinde hangi adım veri setlerinin temizlenmesini, düzenlenmesini ve hazırlanmasını içerir?
Cevap: E) Ön İşleme
Açıklama: Ön işleme, veri madenciliği sürecinde veri setlerinin temizlenmesi, düzenlenmesi ve hazırlanmasını içerir.
#13. Aşağıdaki durumlardan hangisi metin analitiği ile ilgili değildir?
Cevap: C) Hava durumu tahmini
Açıklama: Hava durumu tahmini, metin analitiği ile ilgili değildir. Metin analitiği, yapılandırılmamış metinsel verilerden anlam ve bilgi çıkarma ile ilgilidir.
![Veri Madenciliği Ünite 4 Soru 7](https://lolonolo.com/wp-content/uploads/2024/06/Veri-Madenciligi-Unite-4-Soru-7.png)
#14. Belli bir parçanın üretimi için gereken ortalama zamanın 11.5 dakika olduğu biliniyor. İşe alınan 10 işçinin bu mamulü üretim süreleri gözlemleniyor ve aşağıdaki sonuçlar elde ediliyor. %5 anlam düzeyinde yeni işe alınan işçilerin bu mamulü üretim süresinin eski işçilerden daha fazla olup olmadığını araştırınız. (İpucu: Bu soru için toplanan verilerin kendisi verilmiştir. Daha önceki örneklerde ve sorularda toplanan verilerden elde edilen ortalamalar veya standart sapmalar verilmişti.) - Yukarıdaki örneğe göre hesaplanan test istatistiği değeri kaçtır?
Cevap: E) 2,06
Açıklama: T-testi kullanılarak hesaplanan test istatistiği değeri 2,06’dır.
#15. Hangisi veri, enformasyon ve bilgi arasındaki ilişkiyi doğru ifade eder?
Cevap: C) Veri, ham ve işlenmemiş bilgileri ifade ederken, enformasyon bu verilerin işlenmiş ve düzenlenmiş hali olarak tanımlanır, bilgi ise enformasyonun işlenmiş ve kullanılabilir hali olarak tanımlanır.
Açıklama: Veri, enformasyon ve bilgi arasındaki ilişki, verinin işlenerek enformasyona, enformasyonun da anlam kazanarak bilgiye dönüşmesi sürecini yansıtır.
#16. Doğal dil işleme (NLP) ile ilgili olarak hangisi doğrudur?
Cevap: D) Kelime türü etiketleme, metin bölümleme gibi zorlukları içerir.
Açıklama: Doğal dil işleme (NLP), kelime türü etiketleme ve metin bölümleme gibi zorlukları içerir ve insan dilini bilgisayar programlarının anlaması için çeşitli yöntemler içerir.
#17. Veri madenciliği ve bilgi keşfi arasındaki ilişkiyi doğru ifade eden aşağıdaki seçeneklerden hangisidir?
Cevap: A) Veri madenciliği, bilgi keşfinin bir parçasıdır ve veri analizlerini içerir.
Açıklama: Veri madenciliği, bilgi keşfinin bir parçasıdır ve veri analizlerini içerir.
#18. Sınıflandırma teknikleri hangi durumda daha az etkili olabilir?
Cevap: D) Sıralı kategoriler içeren veri setlerinde
Açıklama: Sınıflandırma teknikleri, sıralı kategoriler içeren veri setlerinde daha az etkili olabilir, çünkü bu tür veri setlerinde sınıflar arasındaki sıralama bilgisi önemlidir.
#19. Hangi durum, duygu analizi için en uygun bir uygulama alanıdır?
Cevap: C) Yemek tariflerinin sınıflandırılması
Açıklama: Duygu analizi, metin verilerinde ifade edilen duygusal tonları belirleme sürecidir ve genellikle müşteri yorumları, sosyal medya paylaşımları veya ürün incelemeleri gibi metinlerin duygusal yönlerini anlamak için kullanılır. Ancak, duygu analizi sadece ticari uygulamalarla sınırlı değildir. Yemek tariflerinin sınıflandırılması, insanların tariflere karşı duygusal tepkilerini analiz etmeyi ve hangi tariflerin daha çok beğenildiğini anlamayı içerir. Bu tür analiz, tariflerin popülerliğini belirlemede ve kullanıcıların hangi tür tariflere daha fazla ilgi gösterdiğini anlamada kullanılabilir
#20. Hangi değişken türü, sayısal bir ilişkiye sahip değildir ancak sıralanabilir?
Cevap: D) Ordinal Değişkenler
Açıklama: Ordinal değişkenler, sayısal bir ilişkiye sahip olmadan sıralanabilir değişkenlerdir.
SONUÇ
İstanbul Üniversitesi Açık ve Uzaktan Eğitim Fakültesi (Auzef)
Açık Öğretim Fakültesi
Bölüm : Yönetim Bilişim Sistemleri Lisans
4. Sınıf Veri Madenciliği Bahar Dönemi
Auzef Veri Madenciliği Final Deneme Sınavı -8
İstanbul Üniversitesi Açık ve Uzaktan Eğitim Fakültesi (Auzef)
Açık Öğretim Fakültesi
Bölüm : Yönetim Bilişim Sistemleri Lisans
4. Sınıf Veri Madenciliği Bahar Dönemi
Auzef Veri Madenciliği Final Deneme Sınavı -8
HD Quiz powered by harmonic design
Auzef Veri Madenciliği Final Deneme Sınavı -8
İstanbul Üniversitesi Açık ve Uzaktan Eğitim Fakültesi (Auzef) Açık Öğretim Fakültesi Bölüm : Yönetim Bilişim Sistemleri Lisans 4. Sınıf Veri Madenciliği Bahar Dönemi Auzef Veri Madenciliği Final Deneme Sınavı -8 |
---|
Auzef Veri Madenciliği Final Deneme Sınavı -8
|
Auzef Veri Madenciliği Final Deneme Sınavı -8
|
Auzef Veri Madenciliği Final Deneme Sınavı -8
|
Yönetim Bilişim Sistemleri Lisans
Auzef Yönetim Bilişim Sistemleri Lisans 4. Sınıf Bahar Dönemi 2024 Final Soruları ve Deneme Sınavları, 2024 Sınav Soruları