auzefVeri MadenciliğiYönetim Bilişim Sistemleri

Veri Madenciliği Vize Deneme Sınavı -2

Veri Madenciliği Vize Deneme Sınavı -2

#1. Yaşlı ve genç yetişkinler arasındaki algılanan yaşam doyumunun farklarını incelemek amacıyla bir araştırma yapılmıştır. 10 kişilik iki gruptan oluşan, 70 yaş üstü yaşlı yetişkinlere ve 20 – 30 yaş arası genç yetişkinlere yüksek güvenilirlik ve geçerliliği olduğu bilinen bir yaşam memnuniyeti testi verilmiştir. Ölçüm puanları 0 (en düşük) – 60 (en yüksek) arasındadır. Yaşlı yetişkinlerin verdiği puanların ortalaması 44.5 ve varyansı 75.39 iken genç yetişkinlerin verdiği puanların ortalaması 28.1 ve varyansı 72.99 olarak hesaplanmıştır. Yaşlı ve genç yetişkinler arasındaki ortalama yaşam memnuniyetinin farklı olduğu iddiasını %5 anlam düzeyinde test ediniz ve yorumlayınız. - Yukarıdaki örneğe göre hesaplanan test istatistiği değeri kaçtır?

Cevap: C) 4,26

Açıklama: T-testi kullanılarak hesaplanan test istatistiği değeri 4,26’dir.

#2. Veri madenciliği ve makine öğrenimi ile ilgili aşağıdakilerden hangisi doğrudur?

Cevap: C) Veri setlerindeki örüntüleri keşfetmeyi hedefler.

Açıklama: Veri madenciliği ve makine öğrenimi, veri setlerindeki örüntüleri keşfetmeyi hedefler.

#3. Veri setindeki en büyük ve en küçük değer arasındaki farkı gösteren istatistik hangisidir?

Cevap: B) Aralık

Açıklama: Aralık, veri setindeki en büyük ve en küçük değer arasındaki farkı ifade eder ve veri dağılımının genişliğini gösterir.

#4. Histogram hangi veri özelliklerini göstermek için kullanılır?

Cevap: A) Belli bir aralıktaki dağılım

Açıklama: Histogram, veri setindeki değerlerin belli bir aralıktaki dağılımını göstermek için kullanılır ve frekans dağılımını görselleştirir.

#5. Reklam için harcanan miktara bağlı olarak bir ürünün satışlarını tahmin etmek istediğimizi varsayalım. - Bağımsız değişkenin katsayısı (b) kaçtır?

Cevap: B) 1,04

Açıklama: Bağımsız değişkenin katsayısı (b), bağımsız değişkendeki bir birimlik artışın bağımlı değişkende 1,04 birimlik bir artışa neden olduğunu gösterir.

#6. Pasta grafiği hangi tür verilerin görsel analizi için kullanılır?

Cevap: B) Kategorik veriler

Açıklama: Pasta grafiği, kategorik verilerin oranlarını ve yüzdelerini görsel olarak temsil etmek için kullanılır.

#7. Belli bir parçanın üretimi için gereken ortalama zamanın 11.5 dakika olduğu biliniyor. İşe alınan 10 işçinin bu mamulü üretim süreleri gözlemleniyor ve aşağıdaki sonuçlar elde ediliyor. %5 anlam düzeyinde yeni işe alınan işçilerin bu mamulü üretim süresinin eski işçilerden daha fazla olup olmadığını araştırınız. (İpucu: Bu soru için toplanan verilerin kendisi verilmiştir. Daha önceki örneklerde ve sorularda toplanan verilerden elde edilen ortalamalar veya standart sapmalar verilmişti.) 7- Yukarıdaki örnekte hangi test istatistiği kullanılmalıdır?

Cevap: B) T-testi

Açıklama: T-testi, küçük örneklem büyüklükleri ve bilinmeyen populasyon standart sapmaları için kullanılır.

#8. Aşağıdaki tabloda bir veri setinde değişkenler arasındaki korelasyon katsayıları verilmiştir. Buna göre ifadelerden hangileri doğrudur? - I. Y değişkeni ile X1 arasında güçlü bir ilişki vardır. - II. Y değişkeni ile X2 arasında doğrusal bir ilişki yoktur. - III. Y değişkeni ile X3 arasında negatif yönlü bir ilişki vardır. - IV. X1 ve X2 arasında güçlü bir pozitif ilişki bulunmaktadır. - V. X2 değişkeni ile X3 arasında negatif bir ilişki vardır.

Cevap: C) I-III

Açıklama: Y değişkeni ile X1 arasında güçlü bir pozitif ilişki (0,997) ve Y değişkeni ile X3 arasında zayıf bir negatif ilişki (-0,038) vardır. X1 ve X2 arasında doğrudan bir korelasyon katsayısı verilmemiştir.

#9. Belli bir parçanın üretimi için gereken ortalama zamanın 11.5 dakika olduğu biliniyor. İşe alınan 10 işçinin bu mamulü üretim süreleri gözlemleniyor ve aşağıdaki sonuçlar elde ediliyor. %5 anlam düzeyinde yeni işe alınan işçilerin bu mamulü üretim süresinin eski işçilerden daha fazla olup olmadığını araştırınız. (İpucu: Bu soru için toplanan verilerin kendisi verilmiştir. Daha önceki örneklerde ve sorularda toplanan verilerden elde edilen ortalamalar veya standart sapmalar verilmişti.) - Yukarıdaki örneğe göre kritik test istatistiği değeri kaçtır?

Cevap: D) 1,83

Açıklama: Kritik test istatistiği değeri %5 anlamlılık düzeyinde 1,83’tür.

#10. Hangisi yapısal bir veri türüdür?

Cevap: E) İlişkisel veritabanlarındaki tablolar

Açıklama: İlişkisel veritabanlarındaki tablolar yapısal veri türüdür.

#11. A firması tarafından üretilen ampullerden 80 adet seçilmiş ve ortalama 1258 saat çalıştığı görülmüştür. Ana kütleye ait standart sapma 94 saattir. B firması tarafından üretilen ampullerden 60 adet seçilmiş ve ortalama 1029 saat çalıştığı görülmüştür. Ana kütleye ait standart sapma 68 saattir. A firmasının ampul fiyatı daha fazla olduğu için bir test yapılacaktır. A firması tarafından üretilen ampullerin çalışma süresi, B firması tarafından üretilen ampullerin çalışma süresinden 200 saat fazlaysa, A firmasının ampulleri satın alınacaktır. 𝛼𝛼 = 0.011 için hangi firmanın ampullerinin satın alınacağını test ediniz. - Yukarıdaki örneğe göre kritik test istatistiği değeri kaçtır?

Cevap: E) 2,33

Açıklama: Kritik test istatistiği değeri %1 anlamlılık düzeyinde 2,33’tür.

#12. Regresyon analizinde kullanılan en küçük kareler yöntemi neyi amaçlar?

Cevap: B) Gerçek ve tahmin edilen değerler arasındaki farkı en aza indirmeyi

Açıklama: En küçük kareler yöntemi, tahmin edilen değerler ile gerçek değerler arasındaki farkların karelerinin toplamını en aza indirmeyi amaçlar.

#13. Bir regresyon modelinde bağımlı değişken ile bir bağımsız değişken arasında bulunan katsayı (b) 2, sabit terim (a) ise 5 olarak bulunmuştur. Bu durumda, bağımlı değişkenin değeri 4 olduğunda tahmini sonuç ne olur?

Cevap: B) 13

Açıklama: Regresyon denklemi Y = a bX olduğuna göre, Y = 5 2(4) = 13 olacaktır.

#14. A firması tarafından üretilen ampullerden 80 adet seçilmiş ve ortalama 1258 saat çalıştığı görülmüştür. Ana kütleye ait standart sapma 94 saattir. B firması tarafından üretilen ampullerden 60 adet seçilmiş ve ortalama 1029 saat çalıştığı görülmüştür. Ana kütleye ait standart sapma 68 saattir. A firmasının ampul fiyatı daha fazla olduğu için bir test yapılacaktır. A firması tarafından üretilen ampullerin çalışma süresi, B firması tarafından üretilen ampullerin çalışma süresinden 200 saat fazlaysa, A firmasının ampulleri satın alınacaktır. 𝛼𝛼 = 0.011 için hangi firmanın ampullerinin satın alınacağını test ediniz. - Yukarıdaki örnekte hangi test istatistiği kullanılmalıdır?

Cevap: A) Z-testi

Açıklama: Z-testi, büyük örneklem büyüklükleri ve bilinen populasyon standart sapmaları için kullanılır.

#15. Veri setinde en sık tekrar eden değeri ifade eden istatistik hangisidir?

Cevap: D) Mod

Açıklama: Mod, veri setinde en sık tekrar eden değeri ifade eder ve veri dağılımında tepe noktasını temsil eder.

#16. Hangi adım, veri madenciliği sürecindeki en zahmetli ve zaman alıcı adımdır?

Cevap: E) Ön İşleme

Açıklama: Ön işleme, veri madenciliği sürecinde en zahmetli ve zaman alıcı adımdır.

#17. Veri madenciliği sürecinde kullanılan modeller, hangi amaç(lar) için kullanılır? I. Veri setlerindeki gizli örüntüleri bulmak II. Çıktıları değerlendirmek III. Ön işleme IV. Tahmin yapmak

Cevap: B) I ve IV

Açıklama: Veri madenciliği sürecinde kullanılan modeller, veri setlerindeki gizli örüntüleri bulmak ve tahmin yapmak amacıyla kullanılır.

#18. Hangisi yapısal olmayan veri türüne örnektir?

Cevap: D) Ses dosyaları

Açıklama: Ses dosyaları yapısal olmayan veri türüdür.

#19. Reklam için harcanan miktara bağlı olarak bir ürünün satışlarını tahmin etmek istediğimizi varsayalım. - 200'lük bir satış miktarı elde etmek için kaç TL harcanmalıdır?

Cevap: C) 128

Açıklama: Regresyon denklemi Y = 66,86 1,04X olduğuna göre, 200 = 66,86 1,04X denklemini çözerek X’i buluruz: X ≈ 128 TL olacaktır.

#20. Aşırı değerlerin bulunduğu bir veri setinde hangi merkezi eğilim ölçüsü, genellikle yanıltıcı olabilir?

Cevap: B) Medyan

Açıklama: Aşırı değerlerin bulunduğu bir veri setinde, medyan merkezi eğilim ölçüsü olarak genellikle yanıltıcı olabilir, çünkü aşırı değerler medyanı etkileyebilir.

TESTi BiTiR, PUANINI GÖR

SONUÇ

-

İstanbul Üniversitesi Açık ve Uzaktan Eğitim Fakültesi (Auzef)
Açık Öğretim Fakültesi
Bölüm : Yönetim Bilişim Sistemleri Lisans
4. Sınıf  Veri Madenciliği Bahar Dönemi
Veri Madenciliği Vize Deneme Sınavı -2

İstanbul Üniversitesi Açık ve Uzaktan Eğitim Fakültesi (Auzef)
Açık Öğretim Fakültesi
Bölüm : Yönetim Bilişim Sistemleri Lisans
4. Sınıf  Veri Madenciliği Bahar Dönemi
Veri Madenciliği Vize Deneme Sınavı -2

Share your score!
Tweet your score!
Share to other

HD Quiz powered by harmonic design

Veri Madenciliği Vize Deneme Sınavı -2

İstanbul Üniversitesi Açık ve Uzaktan Eğitim Fakültesi (Auzef)
Açık Öğretim Fakültesi
Bölüm : Yönetim Bilişim Sistemleri Lisans
4. Sınıf  Veri Madenciliği Bahar Dönemi
Veri Madenciliği Vize Deneme Sınavı -2

Veri Madenciliği Vize Deneme Sınavı -2

Veri Ön İşleme – Ünite 2

Veri ön işleme, veri madenciliği sürecinde ham verilerin temizlenmesi, dönüştürülmesi ve analiz için hazırlanması aşamasıdır. Bu süreç, verinin doğruluğunu ve kalitesini artırarak analiz sonuçlarının güvenilirliğini sağlar. Veri ön işleme, eksik verilerin doldurulması, aykırı değerlerin tespit edilmesi ve düzeltilmesi, veri dönüşümleri ve öznitelik mühendisliği gibi çeşitli adımları içerir.

1. Veri Temizleme

Veri temizleme, veri setindeki eksik, tutarsız veya hatalı verilerin düzeltilmesini içerir. Eksik veriler, ortalama değerle doldurma, tahminleme veya eksik veri içeren kayıtların silinmesi gibi yöntemlerle işlenebilir. Aykırı değerler ise, veri setindeki alışılmadık veya uç noktadaki değerlerdir ve veri analizini yanıltabilir. Bu nedenle, aykırı değerlerin tespit edilip düzeltilmesi önemlidir.

2. Veri Dönüşümleri

Veri dönüşümleri, verilerin analiz için uygun formata getirilmesi işlemidir. Bu süreçte, veri normalizasyonu, standartlaştırma ve logaritmik dönüşümler gibi yöntemler kullanılır. Örneğin, Z-skor normalizasyonu, verilerin ortalamasını 0 ve standart sapmasını 1 olacak şekilde dönüştürmeyi içerir.

3. Öznitelik Mühendisliği

Öznitelik mühendisliği, veri madenciliği algoritmalarının performansını artırmak için yeni öznitelikler oluşturma ve mevcut öznitelikleri dönüştürme sürecidir. Bu süreç, öznitelik seçimi ve öznitelik oluşturma gibi adımları içerir. Öznitelik seçimi, veri setindeki gereksiz veya düşük öneme sahip özniteliklerin elenmesini sağlar. Öznitelik oluşturma ise, mevcut özniteliklerden yeni öznitelikler türetmeyi içerir.

4. Boyut Azaltma

Boyut azaltma, veri setindeki öznitelik sayısını azaltarak veri analizi sürecini hızlandırma ve model performansını artırma işlemidir. Bu süreçte, ana bileşen analizi (PCA) ve faktör analizi gibi teknikler kullanılır. Boyut azaltma, veri setindeki gürültüyü azaltarak daha anlamlı ve doğru sonuçlar elde etmeyi sağlar.

5. Örnekleme

Örnekleme, büyük veri setlerinden temsilci bir alt küme seçme işlemidir. Bu süreçte, rastgele örnekleme, katmanlı örnekleme ve uyarlanabilir örnekleme gibi yöntemler kullanılır. Katmanlı örnekleme, veri setindeki farklı alt grupların yeterince temsil edilmesini sağlar ve analiz sonuçlarının doğruluğunu artırır.

Veri ön işleme, veri madenciliği sürecinin en önemli adımlarından biridir ve başarılı bir analiz için kritik öneme sahiptir. Bu süreç, verinin kalitesini artırarak daha doğru ve güvenilir sonuçlar elde etmeyi sağlar.

Veri Madenciliği Vize Deneme Sınavı -2

Veri Ön İşleme – Ünite 2

1- Aşağıdakilerden hangisi birleştirme (aggregation) işleminin bir riskidir?

A) Veri kaynaklarının karmaşıklığının artması
B) Ölçeklerin değişmesi
C) Detaylardan bazılarının kaybolması
D) Veri boyutlarının artması
E) Hiçbiri

Cevap: C) Detaylardan bazılarının kaybolması

Açıklama: Birleştirme işlemi sırasında bazı detayların kaybolması riski vardır, bu da veri analizinde önemli bilgilere ulaşmayı zorlaştırabilir.

2- Katmanlı (stratified) örnekleme hangi durumda kullanılır?

A) Tüm nesne tiplerini yeterince temsil etmeyen durumlarda
B) Öğelerin eşit sayıda seçildiği durumlarda
C) Örneklem büyüklüğünü belirlemek için
D) Küçük veri setlerini işlemek için
E) Örneklemde her bir öğenin seçilme olasılığını artırmak için

Cevap: A) Tüm nesne tiplerini yeterince temsil etmeyen durumlarda

Açıklama: Katmanlı örnekleme, tüm nesne tiplerinin yeterince temsil edilmediği durumlarda kullanılır, böylece her bir kategoriye ait veri temsil edilir.

3- Boyut azaltmanın avantajlarından hangisi doğrudur?

A) Model performansını azaltır
B) Veri işleme sürelerini kısaltır
C) Depolama alanı gereksinimlerini artırır
D) Gürültüyü artırır
E) Veri manipülasyonunu zorlaştırır

Cevap: B) Veri işleme sürelerini kısaltır

Açıklama: Boyut azaltma, veri işleme sürelerini kısaltarak analiz süreçlerini hızlandırır ve daha etkin hale getirir.

4- Hangi yaklaşım özniteliklerin, veri madenciliği algoritması çalıştırılmadan önce, veri madenciliği görevinden bağımsız bir şekilde seçilmesini benimser?

A) Filtre yaklaşım
B) Sarıcı yaklaşım
C) Gömülü yaklaşım
D) Veriyi yeni bir uzaya eşleme yaklaşımı
E) Örneklem alma yaklaşımı

Cevap: A) Filtre yaklaşım

Açıklama: Filtre yaklaşım, özniteliklerin veri madenciliği görevinden bağımsız olarak seçilmesini benimser ve bu sayede daha genel ve esnek bir seçim süreci sağlar.

5- Aşağıdaki yöntemlerden hangileri özellik oluşturma (feature creation) için kullanılabilir?

I. Öznitelik oluşturma
II. Veriyi yeni bir uzaya eşleme
III. Öznitelik inşası
A) I-II
B) II-III
C) I-III
D) I-II-III
E) Yalnız I

Cevap: D) I-II-III

Açıklama: Öznitelik oluşturma, veriyi yeni bir uzaya eşleme ve öznitelik inşası, özellik oluşturma için kullanılan yöntemlerdir.

6- Öznitelik ayrıklaştırması aşağıdakilerden hangisini içerir?

A) Sürekli değişkenleri ikili hale getirme
B) Sürekli bir değişkenin kategorik bir değişkene dönüştürülmesi
C) Kategorik bir değişkenin sürekli hale getirilmesi
D) Veri setindeki her değeri bir aralığa atama
E) Veri setindeki her kategorik değeri bir sayıya eşleme

Cevap: B) Sürekli bir değişkenin kategorik bir değişkene dönüştürülmesi

Açıklama: Öznitelik ayrıklaştırması, sürekli bir değişkenin belirli aralıklara veya kategorilere dönüştürülmesini içerir.

7- Hangi durumda Basit Fonksiyonel Dönüşümler veya Normalizasyon kullanılabilir?

A) Veri setindeki değişkenlerin sayısını artırmak için
B) Veri setindeki değişkenlerin değerlerini bozmak için
C) Veri setinin analizde daha anlamlı ve doğrusal bir şekle getirilmesi için
D) Veri setindeki değişkenlerin orijinal dağılımını korumak için
E) Veri setindeki değişkenlerin arasındaki ilişkiyi kesmek için

Cevap: C) Veri setinin analizde daha anlamlı ve doğrusal bir şekle getirilmesi için

Açıklama: Basit fonksiyonel dönüşümler ve normalizasyon, veri setini analizde daha anlamlı ve doğrusal bir şekle getirmek için kullanılır.

8- Z-Skor Normalizasyonu nedir?

A) Değişken değerlerini 0 ile 1 arasında bir aralığa dönüştürme
B) Değişkenleri logaritmik olarak dönüştürme
C) Değişkenlerin tersini alma
D) Değerleri ortalaması 0 ve standart sapması 1 olacak şekilde dönüştürme
E) Değişkenlerin karekökünü alma

Cevap: D) Değerleri ortalaması 0 ve standart sapması 1 olacak şekilde dönüştürme

Açıklama: Z-skor normalizasyonu, verileri ortalaması 0 ve standart sapması 1 olacak şekilde dönüştürerek, farklı ölçeklerdeki verilerin karşılaştırılmasını kolaylaştırır.

9- Kategorik bir özniteliğin ikili hale getirilmesinde aşağıdakilerden hangileri yanlıştır?

I. Veri özelliği sıralı ise, atama yaparken sıralamayı korumak gerekir
II. Kategorik değerleri ikili formata dönüştürürken 0 ve 1’leri istenilen şekilde atanabilir
III. Kategori sayısı kadar sütun oluşturmak gerekir
A) I-II
B) II-III
C) Yalnız II
D) Yalnız III
E) Hiçbiri

Cevap: D) Yalnız III

Açıklama: Kategorik bir özniteliğin ikili hale getirilmesinde, kategori sayısı kadar sütun oluşturmak gerekmez. Bu işlem, genellikle bir sıcak kodlama (one-hot encoding) yöntemi ile gerçekleştirilir.

10- Bir veri madenciliği analizi için ihtiyacımız olan tüm verileri toplamak ve işlemek için yeterli zamanımız olmadığında, örneklem büyüklüğü nasıl belirlenir?

A) Deneme yanılma yoluyla
B) Katmanlı örneklemeyle
C) Uyarlanabilir örneklemeyle
D) Uzman görüşleriyle
E) Değiştirme olmadan yapılan örneklemeyle

Cevap: C) Uyarlanabilir örneklemeyle

Açıklama: Uyarlanabilir örnekleme, sınırlı zaman ve kaynaklarla veri toplama ve işleme işlemini optimize etmek için kullanılır.

Yönetim Bilişim Sistemleri Lisans
Veri Madenciliği Yönetim Bilişim Sistemleri Lisans

Veri Madenciliği Vize Deneme Sınavı -2

Yönetim Bilişim Sistemleri Lisans

Auzef Yönetim Bilişim Sistemleri Lisans 4. Sınıf Bahar Dönemi Vze Sınav Soruları ve Deneme Sınavları, 2024 Sınav Soruları

Editor

Editör

error: Kopyalamaya Karşı Korumalıdır!