Veri Madenciliği Final Deneme Sınavı -1
Veri Madenciliği Final Deneme Sınavı -1
![Veri Madenciliği Ünite 5 Soru 7](https://lolonolo.com/wp-content/uploads/2024/06/Veri-Madenciligi-Unite-5-Soru-7.png)
#1. Reklam için harcanan miktara bağlı olarak bir ürünün satışlarını tahmin etmek istediğimizi varsayalım. - 200'lük bir satış miktarı elde etmek için kaç TL harcanmalıdır?
Cevap: C) 128
Açıklama: Regresyon denklemi Y = 66,86 1,04X olduğuna göre, 200 = 66,86 1,04X denklemini çözerek X’i buluruz: X ≈ 128 TL olacaktır.
#2. K-ortalamalar kümeleme yönteminde, merkezi prototip genellikle hangi tür veriler için kullanılır?
Cevap: A) Nicel Veriler
Açıklama: K-ortalamalar kümeleme yönteminde, merkezi prototip genellikle nicel veriler için kullanılır, çünkü bu yöntem veri noktalarının aritmetik ortalamasını hesaplar.
#3. Veri setinde en sık tekrar eden değeri ifade eden istatistik hangisidir?
Cevap: D) Mod
Açıklama: Mod, veri setinde en sık tekrar eden değeri ifade eder ve veri dağılımında tepe noktasını temsil eder.
#4. Hangi kümeleme türü, veriyi kesinlikle örtüşmeyen alt kümelerine böler?
Cevap: D) Bölütlenmiş Kümeleme
Açıklama: Bölütlenmiş kümeleme, veriyi kesinlikle örtüşmeyen alt kümelere böler ve her nesne yalnızca bir kümeye ait olur.
#5. Pasta grafiği hangi tür verilerin görsel analizi için kullanılır?
Cevap: B) Kategorik veriler
Açıklama: Pasta grafiği, kategorik verilerin oranlarını ve yüzdelerini görsel olarak temsil etmek için kullanılır.
#6. DBSCAN algoritmasının öne çıkan özellikleri nelerdir?
Cevap: B) Aykırı değerleri saptama ve silme yeteneği
Açıklama: DBSCAN algoritması, aykırı değerleri saptama ve silme yeteneği ile öne çıkar ve yoğunluk tabanlı kümeleme yapar.
#7. Veri setindeki en büyük ve en küçük değer arasındaki farkı gösteren istatistik hangisidir?
Cevap: B) Aralık
Açıklama: Aralık, veri setindeki en büyük ve en küçük değer arasındaki farkı ifade eder ve veri dağılımının genişliğini gösterir.
![Veri Madenciliği Ünite 5 Soru 6](https://lolonolo.com/wp-content/uploads/2024/06/Veri-Madenciligi-Unite-5-Soru-6.png)
#8. Aşağıdaki tabloda bir veri setinde değişkenler arasındaki korelasyon katsayıları verilmiştir. Buna göre ifadelerden hangileri doğrudur? - I. Y değişkeni ile X1 arasında güçlü bir ilişki vardır. - II. Y değişkeni ile X2 arasında doğrusal bir ilişki yoktur. - III. Y değişkeni ile X3 arasında negatif yönlü bir ilişki vardır. - IV. X1 ve X2 arasında güçlü bir pozitif ilişki bulunmaktadır. - V. X2 değişkeni ile X3 arasında negatif bir ilişki vardır.
Cevap: C) I-III
Açıklama: Y değişkeni ile X1 arasında güçlü bir pozitif ilişki (0,997) ve Y değişkeni ile X3 arasında zayıf bir negatif ilişki (-0,038) vardır. X1 ve X2 arasında doğrudan bir korelasyon katsayısı verilmemiştir.
#9. Regresyon analizinde kullanılan en küçük kareler yöntemi neyi amaçlar?
Cevap: B) Gerçek ve tahmin edilen değerler arasındaki farkı en aza indirmeyi
Açıklama: En küçük kareler yöntemi, tahmin edilen değerler ile gerçek değerler arasındaki farkların karelerinin toplamını en aza indirmeyi amaçlar.
#10. SOM'un (Kendi Kendini Düzenleyen Haritalar) avantajları nelerdir?
Cevap: B) Boyut azaltma özelliği
Açıklama: SOM (Kendi Kendini Düzenleyen Haritalar), boyut azaltma özelliği ile öne çıkar ve yüksek boyutlu verileri düşük boyutlu haritalara indirger.
#11. Hangi kümeleme türünde nesneler sadece bir kümeye ait olabilir?
Cevap: D) Özel Kümeleme
Açıklama: Özel kümeleme, nesnelerin sadece bir kümeye ait olabileceği kümeleme türüdür. Bu, veri noktalarının birden fazla kümeye dahil olmaması anlamına gelir.
#12. Bir regresyon modelinde bağımlı değişken ile bir bağımsız değişken arasında bulunan katsayı (b) 2, sabit terim (a) ise 5 olarak bulunmuştur. Bu durumda, bağımlı değişkenin değeri 4 olduğunda tahmini sonuç ne olur?
Cevap: B) 13
Açıklama: Regresyon denklemi Y = a bX olduğuna göre, Y = 5 2(4) = 13 olacaktır.
#13. Histogram hangi veri özelliklerini göstermek için kullanılır?
Cevap: A) Belli bir aralıktaki dağılım
Açıklama: Histogram, veri setindeki değerlerin belli bir aralıktaki dağılımını göstermek için kullanılır ve frekans dağılımını görselleştirir.
#14. Metin madenciliği adımları arasında hangisi metni belirli parçalara böler?
Cevap: D) Tokenizasyon
Açıklama: Tokenizasyon, metni belirli parçalara, genellikle kelimelere veya cümlelere bölen bir adımdır.
#15. Aşırı değerlerin bulunduğu bir veri setinde hangi merkezi eğilim ölçüsü, genellikle yanıltıcı olabilir?
Cevap: B) Medyan
Açıklama: Aşırı değerlerin bulunduğu bir veri setinde, medyan merkezi eğilim ölçüsü olarak genellikle yanıltıcı olabilir, çünkü aşırı değerler medyanı etkileyebilir.
#16. Doğal dil işleme (NLP) ile ilgili olarak hangisi doğrudur?
Cevap: D) Kelime türü etiketleme, metin bölümleme gibi zorlukları içerir.
Açıklama: Doğal dil işleme (NLP), kelime türü etiketleme ve metin bölümleme gibi zorlukları içerir ve insan dilini bilgisayar programlarının anlaması için çeşitli yöntemler içerir.
#17. Hangi durum, duygu analizi için en uygun bir uygulama alanıdır?
Cevap: C) Yemek tariflerinin sınıflandırılması
Açıklama: Duygu analizi, metin verilerinde ifade edilen duygusal tonları belirleme sürecidir ve genellikle müşteri yorumları, sosyal medya paylaşımları veya ürün incelemeleri gibi metinlerin duygusal yönlerini anlamak için kullanılır. Ancak, duygu analizi sadece ticari uygulamalarla sınırlı değildir. Yemek tariflerinin sınıflandırılması, insanların tariflere karşı duygusal tepkilerini analiz etmeyi ve hangi tariflerin daha çok beğenildiğini anlamayı içerir. Bu tür analiz, tariflerin popülerliğini belirlemede ve kullanıcıların hangi tür tariflere daha fazla ilgi gösterdiğini anlamada kullanılabilir
#18. Gizli dirichlet analizi ne işe yarar?
Cevap: A) Konu modelleme için yaygın olarak kullanılan bir olasılık temelli modelleme tekniğidir.
Açıklama: Gizli Dirichlet Analizi (LDA), konu modelleme için yaygın olarak kullanılan bir olasılık temelli modelleme tekniğidir. Bu teknik, metin verilerindeki gizli konuları keşfetmek için kullanılır.
#19. Aşağıdaki durumlardan hangisi metin analitiği ile ilgili değildir?
Cevap: C) Hava durumu tahmini
Açıklama: Hava durumu tahmini, metin analitiği ile ilgili değildir. Metin analitiği, yapılandırılmamış metinsel verilerden anlam ve bilgi çıkarma ile ilgilidir.
![Veri Madenciliği Ünite 5 Soru 7](https://lolonolo.com/wp-content/uploads/2024/06/Veri-Madenciligi-Unite-5-Soru-7.png)
#20. Reklam için harcanan miktara bağlı olarak bir ürünün satışlarını tahmin etmek istediğimizi varsayalım. - Bağımsız değişkenin katsayısı (b) kaçtır?
Cevap: B) 1,04
Açıklama: Bağımsız değişkenin katsayısı (b), bağımsız değişkendeki bir birimlik artışın bağımlı değişkende 1,04 birimlik bir artışa neden olduğunu gösterir.
SONUÇ
İstanbul Üniversitesi Açık ve Uzaktan Eğitim Fakültesi (Auzef)
Açık Öğretim Fakültesi
Bölüm : Yönetim Bilişim Sistemleri Lisans
4. Sınıf Veri Madenciliği Bahar Dönemi
Veri Madenciliği Final Deneme Sınavı -1
İstanbul Üniversitesi Açık ve Uzaktan Eğitim Fakültesi (Auzef)
Açık Öğretim Fakültesi
Bölüm : Yönetim Bilişim Sistemleri Lisans
4. Sınıf Veri Madenciliği Bahar Dönemi
Veri Madenciliği Final Deneme Sınavı -1
HD Quiz powered by harmonic design
Veri Madenciliği Final Deneme Sınavı -1
İstanbul Üniversitesi Açık ve Uzaktan Eğitim Fakültesi (Auzef) Açık Öğretim Fakültesi Bölüm : Yönetim Bilişim Sistemleri Lisans 4. Sınıf Veri Madenciliği Bahar Dönemi Veri Madenciliği Final Deneme Sınavı -1 |
---|
Veri Madenciliği Final Deneme Sınavı -1
|
|
Veri Madenciliği Final Deneme Sınavı -1
|
Yönetim Bilişim Sistemleri Lisans
Auzef Yönetim Bilişim Sistemleri Lisans 4. Sınıf Bahar Dönemi Final Soruları ve Deneme Sınavları, 2024 Sınav Soruları