Veri Madenciliği 2023-2024 Vize Soruları
#1. Bir üretim hattında çalışan mavi yakalıların işleri konusunda aldıkları eğitimin süresinin (saat cinsinden), günde hatasız ürettikleri parça sayısı üzerindeki etkisi tahmin edilmek isteniyor. Bu amaçla örneklem alınan 8 çalışan için toplanan veriler yukarıdaki gibidir Yukarıdaki bilgilere göre basit doğrusal regresyon denklemi aşağıdakilerden hangisidir?
Cevap : D) Y=0,625 1,5X
#2. Veri birleştirme işlemi aşağıdaki amaçlardan hangisini hedefler?
Cevap : C) Yüksek seviyeli bir bakış açısı elde etmek ve ölçeği değiştirmek
Veri birleştirme işlemi (aggregation), farklı veri noktalarını daha geniş kategoriler altında birleştirerek daha yüksek seviyeli bir bakış açısı elde etmek ve ölçeği değiştirmek amacıyla yapılır. Bu genellikle daha büyük eğilimleri ve örüntüleri görmek için veri boyutunu küçültmek ve analizleri basitleştirmek için kullanılır. Bu nedenle doğru cevap:
C) Yüksek seviyeli bir bakış açısı elde etmek ve ölçeği değiştirmek
#3. Saçılım grafiği ile ilgili aşağıdakilerden hangisi yanlıştır?
Cevap : D) Aykırı değerleri görmek için kullanılamaz.
Saçılım grafiği, veri noktalarını görselleştirerek iki değişken arasındaki ilişkiyi incelemek için kullanılan bir araçtır. Ayrıca, aykırı değerleri tanımlamak ve belirlemek için kullanılabilir.
Bu nedenle, verilen ifadeler arasında yanlış olan:
D) Aykırı değerleri görmek için kullanılamaz.
#4. Bir araştırmacı, bir otomobilin hızı ile yakıt tüketimi arasındaki ilişkiyi incelemek için korelasyon analizi yapmaktadır. Araştırmacı bu iki değişken arasında pozitif bir korelasyon olduğunu bulursa bunun anlamı aşağıdakilerden hangisidir?
Cevap : A) Otomobilin hızı arttıkça yakıt tüketimi de artar.
Bir korelasyon analizinde iki değişken arasında pozitif bir korelasyon bulunduğunda, bir değişken arttığında diğer değişkenin de arttığı anlamına gelir. Dolayısıyla, bu durumda otomobilin hızı arttıkça yakıt tüketiminin de arttığını söyleyebiliriz. Bu nedenle doğru cevap:
A) Otomobilin hızı arttıkça yakıt tüketimi de artar.
#5. Normalizasyon neden önemlidir?
Cevap : B) Ölçekler arasındaki farklılıkları dengelemek için
Normalizasyon, veri setindeki farklı değişkenlerin farklı ölçekteki değerlerini aynı ölçekte (genellikle 0 ile 1 arasında) olacak şekilde dönüştürmek için yapılır. Bu, farklı ölçekteki verilerin algoritmalar tarafından işlenirken ağırlıklı olarak kullanılması durumunu engelleyerek, daha adil ve karşılaştırılabilir bir analiz sağlar. Dolayısıyla, doğru cevap:
B) Ölçekler arasındaki farklılıkları dengelemek için
#6. Veri madenciliği dersini alan 200 öğrencinin dönem sonu başarı notu, ortalaması 55 ve standart sapmasının 15 olduğu normal dağılıma uymaktadır. Yönetmelik gereği 85 ve yukarı puana sahip olan öğrencilerin harf notu AA olacağına göre, yaklaşık kaç öğrenci AA almıştır?
Cevap : A) 5
Bu soruyu çözmek için, 85 ve üzeri puana sahip olan öğrencilerin ortalamanın ne kadar üzerinde olduğunu bulmak gerekir. Normal dağılımın ortalaması 55 ve standart sapması 15 olduğundan, 85 puan ortalamanın 2 standart sapma üstündedir.
Yuvarlayınca yaklaşık 5 öğrenci AA alır. Bu nedenle doğru cevap:
A) 5
#7. Öznitelik ayrıklaştırması aşağıdakilerden hangisini içerir?
Cevap : B) Sürekli bir değişkenin kategorik bir değişkene dönüştürülmesi
Öznitelik ayrıklaştırması, sürekli bir değişkenin kategorik bir değişkene dönüştürülmesi sürecidir. Bu nedenle, doğru cevap:
B) Sürekli bir değişkenin kategorik bir değişkene dönüştürülmesi
#8. Veri madenciliği, aşağıdakilerden hangisini ifade eder?
Cevap : E) Veri setlerinden değerli bilgilerin çıkarılması için kullanılan bir dizi teknik ve yöntem bütünü
Veri madenciliği, veri setlerinden değerli bilgilerin çıkarılması için kullanılan bir dizi teknik ve yöntem bütününü ifade eder. Bu nedenle doğru cevap:
E) Veri setlerinden değerli bilgilerin çıkarılması için kullanılan bir dizi teknik ve yöntem bütünü
#9. Aşağıdakilerden hangisi yapısal veri örneği değildir?
Cevap : C) Bir blog yazısının metni
Yapısal veri, genellikle belirli bir formatta veya yapıda düzenlenmiş ve kolayca analiz edilebilen veridir. Örneğin, bir veritabanında saklanan veriler gibi. Öte yandan, yapılandırılmamış veri, belirli bir format veya yapı içermeyen veridir. Metin, resim, ses ve video dosyaları genellikle yapılandırılmamış verilerdir.
Bu nedenle, yukarıdaki seçenekler arasında yapısal veri örneği olmayan:
C) Bir blog yazısının metni
#10. Örneklem almanın motivasyonu aşağıdakilerden hangisidir?
Cevap : B) Maliyetli veya zaman alıcı analizleri kolaylaştırmak
Örneklem alma, genellikle büyük veri kümelerindeki analizleri maliyet veya zaman açısından daha kolay ve hızlı bir şekilde yapmak için kullanılır. Bu, verinin tümünü analiz etmek yerine, doğru bir örnekleme ile daha küçük bir veri setini analiz ederek genelleştirilebilir sonuçlar elde etmeye olanak tanır. Bu nedenle doğru cevap:
B) Maliyetli veya zaman alıcı analizleri kolaylaştırmak
#11. Aşağıdakilerden hangisi çoklu doğrusal regresyon analizinin bir özelliğidir?
Cevap : B) Birden fazla bağımsız değişkenin bağımlı değişken üzerindeki etkilerini incelemek için kullanılır.
Çoklu doğrusal regresyon analizi, birden fazla bağımsız değişkenin bağımlı değişken üzerindeki etkilerini incelemek için kullanılan bir istatistiksel tekniktir. Bu nedenle doğru cevap:
B) Birden fazla bağımsız değişkenin bağımlı değişken üzerindeki etkilerini incelemek için kullanılır.
#12. Bir eticaret platformu, kullanıcılarının alışveriş geçmişlerini analiz etmek ve öneri sistemlerini geliştirmek istiyor. Ancak, kullanıcı veri setlerinde eksik veya bozuk veriler bulunmaktadır. Şirket, hangi veri madenciliği aşamasını uygulamalıdır?
Cevap : E) Ön İşleme
Eksik veya bozuk verilerin bulunduğu bir veri setinde analiz yapmadan önce, verilerin temizlenmesi, eksik verilerin tamamlanması ve dönüştürülmesi gibi işlemler gereklidir. Bu işlemler, veri madenciliğinde Ön İşleme aşamasının bir parçasıdır.
Bu nedenle doğru cevap:
E) Ön İşleme
#13. Bir şirket, pazarlama stratejilerini optimize etmek için veri madenciliği yöntemlerini kullanıyor. Yeni bir reklam kampanyası başlatmadan önce, müşterilerin geçmiş alışveriş alışkanlıklarını analiz etmek istiyorlar. Bu amaçla, mevcut müşteri veri seti üzerinde bir model oluşturulmuştur. Şirket, oluşturulan modelin gerçek dünya verileriyle ne kadar uyumlu olduğunu belirlemek için hangi teknikleri kullanmalıdır?
Cevap : E) Doğrulama ve Değerlendirme
Şirket, oluşturulan modelin gerçek dünya verileriyle ne kadar uyumlu olduğunu belirlemek istiyorsa, modelin doğruluğunu ve performansını değerlendirmek için doğrulama ve değerlendirme tekniklerini kullanmalıdır. Bu teknikler, modelin öngörüleri ile gerçek veriler arasındaki uyumu ölçmek için kullanılır.
Bu nedenle doğru cevap:
E) Doğrulama ve Değerlendirme
#14. Aşağıdaki özet istatistiklerden hangisi veri setinin genel dağılımı hakkında temel bir fikir verir, ancak tüm değerleri dikkate almaz?
Cevap : D) Aralık
Bir veri setinin aralığı (range), setin en küçük ve en büyük değerleri arasındaki farkı verir ve veri setinin genel dağılımı hakkında temel bir fikir sağlar. Ancak, aralık sadece en küçük ve en büyük değerleri dikkate alır, aradaki diğer veri noktalarını hesaba katmaz.
Bu nedenle doğru cevap:
D) Aralık
#15. Aşağıdaki ifadelerden hangisi tanımlayıcı istatistiklerde frekans ve mod ile ilgili doğrudur?
Cevap : B) Frekans, bir veri setinde belirli bir değerin kaç kez tekrarlandığını gösterir.
Tanımlayıcı istatistiklerde frekans, bir veri setinde belirli bir değerin kaç kez tekrarlandığını gösterir. Mod ise, veri setinde en sık görülen değeri temsil eder. Bu nedenle doğru cevap:
B) Frekans, bir veri setinde belirli bir değerin kaç kez tekrarlandığını gösterir.
#16. Değiştirme olmadan örneklem alma yöntemi nedir?
Cevap : B) Seçilen her öğenin veri kümesinden çıkarıldığı yöntem
Değiştirme olmadan örneklem alma yöntemi, örnekleme sürecinde seçilen her öğenin veri kümesinden çıkarıldığı yöntemi ifade eder. Bu nedenle doğru cevap:
B) Seçilen her öğenin veri kümesinden çıkarıldığı yöntem
#17. Aşağıdakilerden hangisi kök ve yaprak grafiklerinin bir özelliğidir?
Cevap : B) Eşit genişlikte bölümlere ayrılır ve her bölümdeki değerler sayılır.
#18. Özellik oluşturma, hangi durumda orijinal veri setindeki özniteliklerden daha faydalı olabilir?
Cevap : A) Orijinal veri setindeki öznitelikler, analiz için uygun bir formda değilse
Özellik oluşturma, orijinal veri setindeki özniteliklerin analiz için uygun bir formda olmaması durumunda daha faydalı olabilir. Örneğin, ham verilerin dönüştürülmesi, gruplandırılması veya çeşitli işlemler uygulanması gerekebilir. Bu, modellerin daha doğru ve verimli çalışmasını sağlar.
Bu nedenle doğru cevap:
A) Orijinal veri setindeki öznitelikler, analiz için uygun bir formda değilse
#19. Bir üretim hattında çalışan mavi yakalıların işleri konusunda aldıkları eğitimin süresinin (saat cinsinden), günde hatasız ürettikleri parça sayısı üzerindeki etkisi tahmin edilmek isteniyor. Bu amaçla örneklem alınan 8 çalışan için toplanan veriler yukarıdaki gibidir. Yukarıdaki bilgilere göre 6 saat eğitim alan bir çalışanın üreteceği hatasız ürün sayısı, regresyon analiziyle tahmin edildiğinde aşağıdakilerden hangisi doğru olur?
Cevap : C) 10
#20. Yukarıda bir öğrenci grubundaki kişilerin boy ve ağırlık ölçümleri verilmektedir. Ağırlık gözlem değerleri, en büyük değer 1 olacak şekilde normalize edildiğinde 72 kg'lık gözlem değerinin normalize edilmiş yeni değeri kaç olur?
Cevap : E) 0,80
SONUÇ
HD Quiz powered by harmonic design
Veri Madenciliği 2023-2024 Vize Soruları
Veri Madenciliği Veri Madenciliği 2023-2024 Vize Soruları |
Veri Madenciliği 2023-2024 Vize Soruları