auzefVeri MadenciliğiYönetim Bilişim Sistemleri

Veri Madenciliği 2023-2024 Vize Soruları

#1. Bir üretim hattında çalışan mavi yakalıların işleri konusunda aldıkları eğitimin süresinin (saat cinsinden), günde hatasız ürettikleri parça sayısı üzerindeki etkisi tahmin edilmek isteniyor. Bu amaçla örneklem alınan 8 çalışan için toplanan veriler yukarıdaki gibidir Yukarıdaki bilgilere göre basit doğrusal regresyon denklemi aşağıdakilerden hangisidir?

Cevap : D) Y=0,625 1,5X

#2. Veri birleştirme işlemi aşağıdaki amaçlardan hangisini hedefler?

Cevap : C) Yüksek seviyeli bir bakış açısı elde etmek ve ölçeği değiştirmek

Veri birleştirme işlemi (aggregation), farklı veri noktalarını daha geniş kategoriler altında birleştirerek daha yüksek seviyeli bir bakış açısı elde etmek ve ölçeği değiştirmek amacıyla yapılır. Bu genellikle daha büyük eğilimleri ve örüntüleri görmek için veri boyutunu küçültmek ve analizleri basitleştirmek için kullanılır. Bu nedenle doğru cevap:
C) Yüksek seviyeli bir bakış açısı elde etmek ve ölçeği değiştirmek

#3. Saçılım grafiği ile ilgili aşağıdakilerden hangisi yanlıştır?

Cevap : D) Aykırı değerleri görmek için kullanılamaz.

Saçılım grafiği, veri noktalarını görselleştirerek iki değişken arasındaki ilişkiyi incelemek için kullanılan bir araçtır. Ayrıca, aykırı değerleri tanımlamak ve belirlemek için kullanılabilir.
Bu nedenle, verilen ifadeler arasında yanlış olan:
D) Aykırı değerleri görmek için kullanılamaz.

#4. Bir araştırmacı, bir otomobilin hızı ile yakıt tüketimi arasındaki ilişkiyi incelemek için korelasyon analizi yapmaktadır. Araştırmacı bu iki değişken arasında pozitif bir korelasyon olduğunu bulursa bunun anlamı aşağıdakilerden hangisidir?

Cevap : A) Otomobilin hızı arttıkça yakıt tüketimi de artar.

Bir korelasyon analizinde iki değişken arasında pozitif bir korelasyon bulunduğunda, bir değişken arttığında diğer değişkenin de arttığı anlamına gelir. Dolayısıyla, bu durumda otomobilin hızı arttıkça yakıt tüketiminin de arttığını söyleyebiliriz. Bu nedenle doğru cevap:
A) Otomobilin hızı arttıkça yakıt tüketimi de artar.

#5. Normalizasyon neden önemlidir?

Cevap : B) Ölçekler arasındaki farklılıkları dengelemek için

Normalizasyon, veri setindeki farklı değişkenlerin farklı ölçekteki değerlerini aynı ölçekte (genellikle 0 ile 1 arasında) olacak şekilde dönüştürmek için yapılır. Bu, farklı ölçekteki verilerin algoritmalar tarafından işlenirken ağırlıklı olarak kullanılması durumunu engelleyerek, daha adil ve karşılaştırılabilir bir analiz sağlar. Dolayısıyla, doğru cevap:
B) Ölçekler arasındaki farklılıkları dengelemek için

#6. Veri madenciliği dersini alan 200 öğrencinin dönem sonu başarı notu, ortalaması 55 ve standart sapmasının 15 olduğu normal dağılıma uymaktadır. Yönetmelik gereği 85 ve yukarı puana sahip olan öğrencilerin harf notu AA olacağına göre, yaklaşık kaç öğrenci AA almıştır?

Cevap : A) 5

Bu soruyu çözmek için, 85 ve üzeri puana sahip olan öğrencilerin ortalamanın ne kadar üzerinde olduğunu bulmak gerekir. Normal dağılımın ortalaması 55 ve standart sapması 15 olduğundan, 85 puan ortalamanın 2 standart sapma üstündedir.

veri madenciliği 6. soru

Yuvarlayınca yaklaşık 5 öğrenci AA alır. Bu nedenle doğru cevap:
A) 5

#7. Öznitelik ayrıklaştırması aşağıdakilerden hangisini içerir?

Cevap : B) Sürekli bir değişkenin kategorik bir değişkene dönüştürülmesi

Öznitelik ayrıklaştırması, sürekli bir değişkenin kategorik bir değişkene dönüştürülmesi sürecidir. Bu nedenle, doğru cevap:
B) Sürekli bir değişkenin kategorik bir değişkene dönüştürülmesi

#8. Veri madenciliği, aşağıdakilerden hangisini ifade eder?

Cevap : E) Veri setlerinden değerli bilgilerin çıkarılması için kullanılan bir dizi teknik ve yöntem bütünü

Veri madenciliği, veri setlerinden değerli bilgilerin çıkarılması için kullanılan bir dizi teknik ve yöntem bütününü ifade eder. Bu nedenle doğru cevap:
E) Veri setlerinden değerli bilgilerin çıkarılması için kullanılan bir dizi teknik ve yöntem bütünü

#9. Aşağıdakilerden hangisi yapısal veri örneği değildir?

Cevap : C) Bir blog yazısının metni

Yapısal veri, genellikle belirli bir formatta veya yapıda düzenlenmiş ve kolayca analiz edilebilen veridir. Örneğin, bir veritabanında saklanan veriler gibi. Öte yandan, yapılandırılmamış veri, belirli bir format veya yapı içermeyen veridir. Metin, resim, ses ve video dosyaları genellikle yapılandırılmamış verilerdir.
Bu nedenle, yukarıdaki seçenekler arasında yapısal veri örneği olmayan:
C) Bir blog yazısının metni

#10. Örneklem almanın motivasyonu aşağıdakilerden hangisidir?

Cevap : B) Maliyetli veya zaman alıcı analizleri kolaylaştırmak

Örneklem alma, genellikle büyük veri kümelerindeki analizleri maliyet veya zaman açısından daha kolay ve hızlı bir şekilde yapmak için kullanılır. Bu, verinin tümünü analiz etmek yerine, doğru bir örnekleme ile daha küçük bir veri setini analiz ederek genelleştirilebilir sonuçlar elde etmeye olanak tanır. Bu nedenle doğru cevap:
B) Maliyetli veya zaman alıcı analizleri kolaylaştırmak

#11. Aşağıdakilerden hangisi çoklu doğrusal regresyon analizinin bir özelliğidir?

Cevap : B) Birden fazla bağımsız değişkenin bağımlı değişken üzerindeki etkilerini incelemek için kullanılır.

Çoklu doğrusal regresyon analizi, birden fazla bağımsız değişkenin bağımlı değişken üzerindeki etkilerini incelemek için kullanılan bir istatistiksel tekniktir. Bu nedenle doğru cevap:
B) Birden fazla bağımsız değişkenin bağımlı değişken üzerindeki etkilerini incelemek için kullanılır.

#12. Bir e­ticaret platformu, kullanıcılarının alışveriş geçmişlerini analiz etmek ve öneri sistemlerini geliştirmek istiyor. Ancak, kullanıcı veri setlerinde eksik veya bozuk veriler bulunmaktadır. Şirket, hangi veri madenciliği aşamasını uygulamalıdır?

Cevap : E) Ön İşleme

Eksik veya bozuk verilerin bulunduğu bir veri setinde analiz yapmadan önce, verilerin temizlenmesi, eksik verilerin tamamlanması ve dönüştürülmesi gibi işlemler gereklidir. Bu işlemler, veri madenciliğinde Ön İşleme aşamasının bir parçasıdır.
Bu nedenle doğru cevap:
E) Ön İşleme

#13. Bir şirket, pazarlama stratejilerini optimize etmek için veri madenciliği yöntemlerini kullanıyor. Yeni bir reklam kampanyası başlatmadan önce, müşterilerin geçmiş alışveriş alışkanlıklarını analiz etmek istiyorlar. Bu amaçla, mevcut müşteri veri seti üzerinde bir model oluşturulmuştur. Şirket, oluşturulan modelin gerçek dünya verileriyle ne kadar uyumlu olduğunu belirlemek için hangi teknikleri kullanmalıdır?

Cevap : E) Doğrulama ve Değerlendirme

Şirket, oluşturulan modelin gerçek dünya verileriyle ne kadar uyumlu olduğunu belirlemek istiyorsa, modelin doğruluğunu ve performansını değerlendirmek için doğrulama ve değerlendirme tekniklerini kullanmalıdır. Bu teknikler, modelin öngörüleri ile gerçek veriler arasındaki uyumu ölçmek için kullanılır.
Bu nedenle doğru cevap:
E) Doğrulama ve Değerlendirme

#14. Aşağıdaki özet istatistiklerden hangisi veri setinin genel dağılımı hakkında temel bir fikir verir, ancak tüm değerleri dikkate almaz?

Cevap : D) Aralık

Bir veri setinin aralığı (range), setin en küçük ve en büyük değerleri arasındaki farkı verir ve veri setinin genel dağılımı hakkında temel bir fikir sağlar. Ancak, aralık sadece en küçük ve en büyük değerleri dikkate alır, aradaki diğer veri noktalarını hesaba katmaz.
Bu nedenle doğru cevap:
D) Aralık

#15. Aşağıdaki ifadelerden hangisi tanımlayıcı istatistiklerde frekans ve mod ile ilgili doğrudur?

Cevap : B) Frekans, bir veri setinde belirli bir değerin kaç kez tekrarlandığını gösterir.

Tanımlayıcı istatistiklerde frekans, bir veri setinde belirli bir değerin kaç kez tekrarlandığını gösterir. Mod ise, veri setinde en sık görülen değeri temsil eder. Bu nedenle doğru cevap:
B) Frekans, bir veri setinde belirli bir değerin kaç kez tekrarlandığını gösterir.

#16. Değiştirme olmadan örneklem alma yöntemi nedir?

Cevap : B) Seçilen her öğenin veri kümesinden çıkarıldığı yöntem

Değiştirme olmadan örneklem alma yöntemi, örnekleme sürecinde seçilen her öğenin veri kümesinden çıkarıldığı yöntemi ifade eder. Bu nedenle doğru cevap:
B) Seçilen her öğenin veri kümesinden çıkarıldığı yöntem

#17. Aşağıdakilerden hangisi kök ve yaprak grafiklerinin bir özelliğidir?

Cevap : B) Eşit genişlikte bölümlere ayrılır ve her bölümdeki değerler sayılır.

#18. Özellik oluşturma, hangi durumda orijinal veri setindeki özniteliklerden daha faydalı olabilir?

Cevap : A) Orijinal veri setindeki öznitelikler, analiz için uygun bir formda değilse

Özellik oluşturma, orijinal veri setindeki özniteliklerin analiz için uygun bir formda olmaması durumunda daha faydalı olabilir. Örneğin, ham verilerin dönüştürülmesi, gruplandırılması veya çeşitli işlemler uygulanması gerekebilir. Bu, modellerin daha doğru ve verimli çalışmasını sağlar.
Bu nedenle doğru cevap:
A) Orijinal veri setindeki öznitelikler, analiz için uygun bir formda değilse

#19. Bir üretim hattında çalışan mavi yakalıların işleri konusunda aldıkları eğitimin süresinin (saat cinsinden), günde hatasız ürettikleri parça sayısı üzerindeki etkisi tahmin edilmek isteniyor. Bu amaçla örneklem alınan 8 çalışan için toplanan veriler yukarıdaki gibidir. Yukarıdaki bilgilere göre 6 saat eğitim alan bir çalışanın üreteceği hatasız ürün sayısı, regresyon analiziyle tahmin edildiğinde aşağıdakilerden hangisi doğru olur?

Cevap : C) 10

#20. Yukarıda bir öğrenci grubundaki kişilerin boy ve ağırlık ölçümleri verilmektedir. Ağırlık gözlem değerleri, en büyük değer 1 olacak şekilde normalize edildiğinde 72 kg'lık gözlem değerinin normalize edilmiş yeni değeri kaç olur?

Cevap : E) 0,80

TESTi BiTiR, PUANINI GÖR

SONUÇ

-
Share your score!
Tweet your score!
Share to other

HD Quiz powered by harmonic design

Veri Madenciliği 2023-2024 Vize Soruları

1. Öznitelik ayrıklaştırması aşağıdakilerden hangisini içerir?

A) Sürekli değişkenleri ikili hale getirme
B) Sürekli bir değişkenin kategorik bir değişkene dönüştürülmesi
C) Kategorik bir değişkenin sürekli hale getirilmesi
D) Veri setindeki her değeri bir aralığa atama
E) Veri setindeki her kategorik değeri bir sayıya eşleme

Cevap : B) Sürekli bir değişkenin kategorik bir değişkene dönüştürülmesi

Öznitelik ayrıklaştırması, sürekli bir değişkenin kategorik bir değişkene dönüştürülmesi sürecidir. Bu nedenle, doğru cevap:
B) Sürekli bir değişkenin kategorik bir değişkene dönüştürülmesi

2. Veri madenciliği, aşağıdakilerden hangisini ifade eder?

A) Sadece sağlık sektöründe kullanılan bir yöntem
B) Veri analizinde kullanılan tek bir teknik
C) Sadece işletmelerin stratejik kararları için kullanılan bir araç
D) Sadece yapısal verilerin analiz edilmesi
E) Veri setlerinden değerli bilgilerin çıkarılması için kullanılan bir dizi teknik ve yöntem bütünü

Cevap : E) Veri setlerinden değerli bilgilerin çıkarılması için kullanılan bir dizi teknik ve yöntem bütünü

Veri madenciliği, veri setlerinden değerli bilgilerin çıkarılması için kullanılan bir dizi teknik ve yöntem bütününü ifade eder. Bu nedenle doğru cevap:
E) Veri setlerinden değerli bilgilerin çıkarılması için kullanılan bir dizi teknik ve yöntem bütünü

3. Aşağıdakilerden hangisi kök ve yaprak grafiklerinin bir özelliğidir?

A) Değerlerin yoğunluğunu belirtmek için alan oranlarına dayanır.
B) Eşit genişlikte bölümlere ayrılır ve her bölümdeki değerler sayılır.
C) Yalnızca kategorik veriler için uygundur.
D) Her bir değer kendi grubunu oluşturur.
E) Sadece sürekli veriler için kullanılır.

Cevap : B) Eşit genişlikte bölümlere ayrılır ve her bölümdeki değerler sayılır.

4. Değiştirme olmadan örneklem alma yöntemi nedir?

A) Öğelerin eşit sayıda seçildiği yöntem
B) Seçilen her öğenin veri kümesinden çıkarıldığı yöntem
C) Öğelerin değerlerinin değiştirmeden kullanıldığı yöntem
D) Örneklemde her bir öğenin seçilme olasılığının eşit olduğu yöntem
E) Öğelerin veri kümesinden çıkarılmadığı, aynı öğenin birden fazla seçilebildiği yöntem

Cevap : B) Seçilen her öğenin veri kümesinden çıkarıldığı yöntem

Değiştirme olmadan örneklem alma yöntemi, örnekleme sürecinde seçilen her öğenin veri kümesinden çıkarıldığı yöntemi ifade eder. Bu nedenle doğru cevap:
B) Seçilen her öğenin veri kümesinden çıkarıldığı yöntem

5. Veri birleştirme işlemi aşağıdaki amaçlardan hangisini hedefler?

A) Detayları koruyarak istikrarlı bir genel bakış sağlamak
B) Grupların davranışlarını daha değişken hale getirmek
C) Yüksek seviyeli bir bakış açısı elde etmek ve ölçeği değiştirmek
D) Veri boyutunu artırmak ve detaylandırmak
E) Bellek kullanımını azaltmak ve işlem süresini artırmak

Cevap : C) Yüksek seviyeli bir bakış açısı elde etmek ve ölçeği değiştirmek

Veri birleştirme işlemi (aggregation), farklı veri noktalarını daha geniş kategoriler altında birleştirerek daha yüksek seviyeli bir bakış açısı elde etmek ve ölçeği değiştirmek amacıyla yapılır. Bu genellikle daha büyük eğilimleri ve örüntüleri görmek için veri boyutunu küçültmek ve analizleri basitleştirmek için kullanılır. Bu nedenle doğru cevap:
C) Yüksek seviyeli bir bakış açısı elde etmek ve ölçeği değiştirmek

6. Veri madenciliği dersini alan 200 öğrencinin dönem sonu başarı notu, ortalaması 55 ve standart sapmasının 15 olduğu normal dağılıma uymaktadır. Yönetmelik gereği 85 ve yukarı puana sahip olan öğrencilerin harf notu AA olacağına göre, yaklaşık kaç öğrenci AA almıştır?

A) 5
B) 4
C) 6
D) 3
E) 7

Cevap : A) 5

Bu soruyu çözmek için, 85 ve üzeri puana sahip olan öğrencilerin ortalamanın ne kadar üzerinde olduğunu bulmak gerekir. Normal dağılımın ortalaması 55 ve standart sapması 15 olduğundan, 85 puan ortalamanın 2 standart sapma üstündedir.

Yuvarlayınca yaklaşık 5 öğrenci AA alır. Bu nedenle doğru cevap:
A) 5

7. Bir araştırmacı, bir otomobilin hızı ile yakıt tüketimi arasındaki ilişkiyi incelemek için korelasyon analizi yapmaktadır. Araştırmacı bu iki değişken arasında pozitif bir korelasyon olduğunu bulursa bunun anlamı aşağıdakilerden hangisidir?

A) Otomobilin hızı arttıkça yakıt tüketimi de artar.
B) Otomobilin hızı arttıkça yakıt tüketimi azalır.
C) Otomobilin hızı düştükçe yakıt tüketimi artar.
D) Otomobilin hızı ile yakıt tüketimi arasındaki ilişki tamamen rastlantısaldır.
E) Otomobilin hızı ile yakıt tüketimi arasında herhangi bir ilişki yoktur.

Cevap : A) Otomobilin hızı arttıkça yakıt tüketimi de artar.

Bir korelasyon analizinde iki değişken arasında pozitif bir korelasyon bulunduğunda, bir değişken arttığında diğer değişkenin de arttığı anlamına gelir. Dolayısıyla, bu durumda otomobilin hızı arttıkça yakıt tüketiminin de arttığını söyleyebiliriz. Bu nedenle doğru cevap:
A) Otomobilin hızı arttıkça yakıt tüketimi de artar.

8. Normalizasyon neden önemlidir?

A) Değişkenler arasındaki korelasyonu azaltmak için
B) Ölçekler arasındaki farklılıkları dengelemek için
C) Algoritmaların duyarlılığını azaltmak için
D) Veri setindeki tüm değişkenleri aynı aralığa sıkıştırmak için
E) Değişkenleri farklı bir dağılımında temsil etmek için

Cevap : B) Ölçekler arasındaki farklılıkları dengelemek için

Normalizasyon, veri setindeki farklı değişkenlerin farklı ölçekteki değerlerini aynı ölçekte (genellikle 0 ile 1 arasında) olacak şekilde dönüştürmek için yapılır. Bu, farklı ölçekteki verilerin algoritmalar tarafından işlenirken ağırlıklı olarak kullanılması durumunu engelleyerek, daha adil ve karşılaştırılabilir bir analiz sağlar. Dolayısıyla, doğru cevap:
B) Ölçekler arasındaki farklılıkları dengelemek için

9. Örneklem almanın motivasyonu aşağıdakilerden hangisidir?

A) Veri kümesini karmaşık hale getirmek
B) Maliyetli veya zaman alıcı analizleri kolaylaştırmak
C) Veri madenciliği algoritmalarını artırmak
D) Veri analizini örneklerle daha kolay anlamak
E) Küçük veri setlerini işleme gerekliliği

Cevap : B) Maliyetli veya zaman alıcı analizleri kolaylaştırmak

Örneklem alma, genellikle büyük veri kümelerindeki analizleri maliyet veya zaman açısından daha kolay ve hızlı bir şekilde yapmak için kullanılır. Bu, verinin tümünü analiz etmek yerine, doğru bir örnekleme ile daha küçük bir veri setini analiz ederek genelleştirilebilir sonuçlar elde etmeye olanak tanır. Bu nedenle doğru cevap:
B) Maliyetli veya zaman alıcı analizleri kolaylaştırmak

10. Aşağıdaki özet istatistiklerden hangisi veri setinin genel dağılımı hakkında temel bir fikir verir, ancak tüm değerleri dikkate almaz?

A) Medyan
B) Mod
C) Ortalama
D) Aralık
E) Varyans

Cevap : D) Aralık

Bir veri setinin aralığı (range), setin en küçük ve en büyük değerleri arasındaki farkı verir ve veri setinin genel dağılımı hakkında temel bir fikir sağlar. Ancak, aralık sadece en küçük ve en büyük değerleri dikkate alır, aradaki diğer veri noktalarını hesaba katmaz.
Bu nedenle doğru cevap:
D) Aralık

11. Özellik oluşturma, hangi durumda orijinal veri setindeki özniteliklerden daha faydalı olabilir?

A) Orijinal veri setindeki öznitelikler, analiz için uygun bir formda değilse
B) Orijinal veri seti çok az öznitelik içeriyorsa
C) Orijinal veri setindeki öznitelikler, diğer veri setlerinde de mevcutsa
D) Orijinal veri seti çok sayıda öznitelik içeriyorsa
E) Orijinal veri seti yalnızca sayısal değerler içeriyorsa

Cevap : A) Orijinal veri setindeki öznitelikler, analiz için uygun bir formda değilse

Özellik oluşturma, orijinal veri setindeki özniteliklerin analiz için uygun bir formda olmaması durumunda daha faydalı olabilir. Örneğin, ham verilerin dönüştürülmesi, gruplandırılması veya çeşitli işlemler uygulanması gerekebilir. Bu, modellerin daha doğru ve verimli çalışmasını sağlar.
Bu nedenle doğru cevap:
A) Orijinal veri setindeki öznitelikler, analiz için uygun bir formda değilse

12. Veri Madenciliği 2023-2024 Vize Soruları 12. SORU-min
Yukarıda bir öğrenci grubundaki kişilerin boy ve ağırlık ölçümleri verilmektedir. Ağırlık gözlem değerleri, en büyük değer 1 olacak şekilde normalize edildiğinde 72 kg’lık gözlem değerinin normalize edilmiş yeni değeri kaç olur?

A) 0,78
B) 0,67
C) 0,83
D) 0,89
E) 0,80

Cevap : E) 0,80

Veri Madenciliği 2023-2024 Vize Soruları

13. Aşağıdakilerden hangisi çoklu doğrusal regresyon analizinin bir özelliğidir?

A) Sadece bağımlı değişkenin değerlerini kullanarak tahminler yapar.
B) Birden fazla bağımsız değişkenin bağımlı değişken üzerindeki etkilerini incelemek için kullanılır.
C) Yalnızca sürekli değişkenlerle çalışır.
D) Yalnızca bir bağımsız değişkenin bağımlı değişken üzerindeki etkisini incelemek için kullanılır.
E) Sadece kategorik değişkenlerle çalışır.

Cevap : B) Birden fazla bağımsız değişkenin bağımlı değişken üzerindeki etkilerini incelemek için kullanılır.

Çoklu doğrusal regresyon analizi, birden fazla bağımsız değişkenin bağımlı değişken üzerindeki etkilerini incelemek için kullanılan bir istatistiksel tekniktir. Bu nedenle doğru cevap:
B) Birden fazla bağımsız değişkenin bağımlı değişken üzerindeki etkilerini incelemek için kullanılır.

14. Bir şirket, pazarlama stratejilerini optimize etmek için veri madenciliği yöntemlerini kullanıyor. Yeni bir reklam kampanyası başlatmadan önce, müşterilerin geçmiş alışveriş alışkanlıklarını analiz etmek istiyorlar. Bu amaçla, mevcut müşteri veri seti üzerinde bir model oluşturulmuştur. Şirket, oluşturulan modelin gerçek dünya verileriyle ne kadar uyumlu olduğunu belirlemek için hangi teknikleri kullanmalıdır?

A) Ön İşleme
B) Modelleme
C) Tahmin ve Karar Destek
D) Örüntü Tanıma
E) Doğrulama ve Değerlendirme

Cevap : E) Doğrulama ve Değerlendirme

Şirket, oluşturulan modelin gerçek dünya verileriyle ne kadar uyumlu olduğunu belirlemek istiyorsa, modelin doğruluğunu ve performansını değerlendirmek için doğrulama ve değerlendirme tekniklerini kullanmalıdır. Bu teknikler, modelin öngörüleri ile gerçek veriler arasındaki uyumu ölçmek için kullanılır.
Bu nedenle doğru cevap:
E) Doğrulama ve Değerlendirme

15. Bir e­ticaret platformu, kullanıcılarının alışveriş geçmişlerini analiz etmek ve öneri sistemlerini geliştirmek istiyor. Ancak, kullanıcı veri setlerinde eksik veya bozuk veriler bulunmaktadır. Şirket, hangi veri madenciliği aşamasını uygulamalıdır?

A) Örüntü Tanıma
B) Modelleme
C) Tahmin ve Karar Destek
D) Doğrulama ve Değerlendirme
E) Ön İşleme

Cevap : E) Ön İşleme

Eksik veya bozuk verilerin bulunduğu bir veri setinde analiz yapmadan önce, verilerin temizlenmesi, eksik verilerin tamamlanması ve dönüştürülmesi gibi işlemler gereklidir. Bu işlemler, veri madenciliğinde Ön İşleme aşamasının bir parçasıdır.
Bu nedenle doğru cevap:
E) Ön İşleme

 

16. Veri Madenciliği 2023-2024 Vize Soruları 16. SORU-min

Bir üretim hattında çalışan mavi yakalıların işleri konusunda aldıkları eğitimin süresinin (saat cinsinden), günde hatasız ürettikleri parça sayısı üzerindeki etkisi tahmin edilmek isteniyor. Bu amaçla örneklem alınan 8 çalışan için toplanan veriler yukarıdaki gibidir.
Yukarıdaki bilgilere göre 6 saat eğitim alan bir çalışanın üreteceği hatasız ürün sayısı, regresyon analiziyle tahmin edildiğinde aşağıdakilerden hangisi doğru olur?

A) 9
B) 7
C) 10
D) 8
E) 6

Cevap : C) 10

17.

Veri Madenciliği 2023-2024 Vize Soruları 16. SORU-min

Bir üretim hattında çalışan mavi yakalıların işleri konusunda aldıkları eğitimin süresinin (saat cinsinden), günde hatasız ürettikleri parça sayısı üzerindeki etkisi tahmin edilmek isteniyor. Bu amaçla örneklem alınan 8 çalışan için toplanan veriler yukarıdaki gibidir

Yukarıdaki bilgilere göre basit doğrusal regresyon denklemi aşağıdakilerden hangisidir?

A) Y=0,25+2,5X
B) X=0,25+2,5Y
C) X=1,725+2Y
D) Y=0,625+1,5X
E) Y=1,725+2X

Cevap : D) Y=0,625+1,5X

18. Aşağıdakilerden hangisi yapısal veri örneği değildir?

A) Bir müşterinin telefon numarası
B) Bir müşterinin adı ve soyadı
C) Bir blog yazısının metni
D) Bir öğrencinin doğum tarihi
E) Bir ürünün fiyatı

Cevap : C) Bir blog yazısının metni

Yapısal veri, genellikle belirli bir formatta veya yapıda düzenlenmiş ve kolayca analiz edilebilen veridir. Örneğin, bir veritabanında saklanan veriler gibi. Öte yandan, yapılandırılmamış veri, belirli bir format veya yapı içermeyen veridir. Metin, resim, ses ve video dosyaları genellikle yapılandırılmamış verilerdir.
Bu nedenle, yukarıdaki seçenekler arasında yapısal veri örneği olmayan:
C) Bir blog yazısının metni

19. Aşağıdaki ifadelerden hangisi tanımlayıcı istatistiklerde frekans ve mod ile ilgili doğrudur?

A) Mod, veri setinde en az sık görülen değerin frekans değeridir.
B) Frekans, bir veri setinde belirli bir değerin kaç kez tekrarlandığını gösterir.
C) Mod, veri setinde bir değerin en az sık (seyrek) görülen değeridir.
D) Frekans, veri setindeki en küçük değeri ifade eder.
E) Mod, veri setindeki tüm değerlerin ortalamasıdır.

Cevap : B) Frekans, bir veri setinde belirli bir değerin kaç kez tekrarlandığını gösterir.

Tanımlayıcı istatistiklerde frekans, bir veri setinde belirli bir değerin kaç kez tekrarlandığını gösterir. Mod ise, veri setinde en sık görülen değeri temsil eder. Bu nedenle doğru cevap:
B) Frekans, bir veri setinde belirli bir değerin kaç kez tekrarlandığını gösterir.

20. Saçılım grafiği ile ilgili aşağıdakilerden hangisi yanlıştır?

A) Doğru boyunca düzenlenmiş noktalar, değişkenler arasında bir ilişki olduğunu gösterir.
B) Noktaların rastgele dağılması, değişkenler arasında bir ilişki olmadığını gösterir.
C) Y ekseni bağımlı değişkeni temsil eder.
D) Aykırı değerleri görmek için kullanılamaz.
E) X ekseni bağımsız değişkeni temsil eder.

Cevap : D) Aykırı değerleri görmek için kullanılamaz.

Saçılım grafiği, veri noktalarını görselleştirerek iki değişken arasındaki ilişkiyi incelemek için kullanılan bir araçtır. Ayrıca, aykırı değerleri tanımlamak ve belirlemek için kullanılabilir.
Bu nedenle, verilen ifadeler arasında yanlış olan:
D) Aykırı değerleri görmek için kullanılamaz.

Veri Madenciliği

Veri Madenciliği 2023-2024 Vize Soruları

Yönetim Bilişim Sistemleri

Veri Madenciliği 2023-2024 Vize Soruları

Editor

Editör

error: Kopyalamaya Karşı Korumalıdır!