auzefVeri MadenciliğiYönetim Bilişim Sistemleri

Veri Madenciliği Vize Deneme Sınavı -5

Auzef Veri Madenciliği Vize Deneme Sınavı -5

#1. Korelasyon katsayısı hangi durumda sıfıra eşit olur?

Cevap: C) Herhangi bir ilişki olmadığında

Açıklama: Korelasyon katsayısı, iki değişken arasında herhangi bir ilişki olmadığında sıfıra eşit olur.

#2. Regresyon analizindeki eş varyanslık (homoscedasticity) kavramı ne anlama gelir?

Cevap: A) Hataların sabit bir varyansa sahip olduğunu

Açıklama: Homoscedasticity, hataların sabit bir varyansa sahip olduğu durumu ifade eder. Bu, regresyon analizinde önemli bir varsayımdır.

#3. Veri madenciliği ve bilgi keşfi arasındaki ilişkiyi doğru ifade eden aşağıdaki seçeneklerden hangisidir?

Cevap: A) Veri madenciliği, bilgi keşfinin bir parçasıdır ve veri analizlerini içerir.

Açıklama: Veri madenciliği, bilgi keşfinin bir parçasıdır ve veri analizlerini içerir.

#4. Belli bir parçanın üretimi için gereken ortalama zamanın 11.5 dakika olduğu biliniyor. İşe alınan 10 işçinin bu mamulü üretim süreleri gözlemleniyor ve aşağıdaki sonuçlar elde ediliyor. %5 anlam düzeyinde yeni işe alınan işçilerin bu mamulü üretim süresinin eski işçilerden daha fazla olup olmadığını araştırınız. (İpucu: Bu soru için toplanan verilerin kendisi verilmiştir. Daha önceki örneklerde ve sorularda toplanan verilerden elde edilen ortalamalar veya standart sapmalar verilmişti.) - Yukarıdaki örneğe göre kritik test istatistiği değeri kaçtır?

Cevap: D) 1,83

Açıklama: Kritik test istatistiği değeri %5 anlamlılık düzeyinde 1,83’tür.

#5. Hangi değişken türü, sayısal bir ilişkiye sahip değildir ancak sıralanabilir?

Cevap: D) Ordinal Değişkenler

Açıklama: Ordinal değişkenler, sayısal bir ilişkiye sahip olmadan sıralanabilir değişkenlerdir.

#6. Aşağıdakilerden hangisi birleştirme (aggregation) işleminin bir riskidir?

Cevap: C) Detaylardan bazılarının kaybolması

Açıklama: Birleştirme işlemi sırasında bazı detayların kaybolması riski vardır, bu da veri analizinde önemli bilgilere ulaşmayı zorlaştırabilir.

#7. Belli bir parçanın üretimi için gereken ortalama zamanın 11.5 dakika olduğu biliniyor. İşe alınan 10 işçinin bu mamulü üretim süreleri gözlemleniyor ve aşağıdaki sonuçlar elde ediliyor. %5 anlam düzeyinde yeni işe alınan işçilerin bu mamulü üretim süresinin eski işçilerden daha fazla olup olmadığını araştırınız. (İpucu: Bu soru için toplanan verilerin kendisi verilmiştir. Daha önceki örneklerde ve sorularda toplanan verilerden elde edilen ortalamalar veya standart sapmalar verilmişti.) 7- Yukarıdaki örnekte hangi test istatistiği kullanılmalıdır?

Cevap: B) T-testi

Açıklama: T-testi, küçük örneklem büyüklükleri ve bilinmeyen populasyon standart sapmaları için kullanılır.

#8. Hangi durumda Basit Fonksiyonel Dönüşümler veya Normalizasyon kullanılabilir?

Cevap: C) Veri setinin analizde daha anlamlı ve doğrusal bir şekle getirilmesi için

Açıklama: Basit fonksiyonel dönüşümler ve normalizasyon, veri setini analizde daha anlamlı ve doğrusal bir şekle getirmek için kullanılır.

#9. Kategorik bir özniteliğin ikili hale getirilmesinde aşağıdakilerden hangileri yanlıştır? - I. Veri özelliği sıralı ise, atama yaparken sıralamayı korumak gerekir - II. Kategorik değerleri ikili formata dönüştürürken 0 ve 1'leri istenilen şekilde atanabilir - III. Kategori sayısı kadar sütun oluşturmak gerekir

Cevap: D) Yalnız III

Açıklama: Kategorik bir özniteliğin ikili hale getirilmesinde, kategori sayısı kadar sütun oluşturmak gerekmez. Bu işlem, genellikle bir sıcak kodlama (one-hot encoding) yöntemi ile gerçekleştirilir.

#10. Nominal değişkenler hangi özelliğe sahiptir?

Cevap: B) Kategoriler arasında hiçbir sıralama yoktur.

Açıklama: Nominal değişkenler, kategoriler arasında sıralama olmayan değişkenlerdir.

#11. Yaşlı ve genç yetişkinler arasındaki algılanan yaşam doyumunun farklarını incelemek amacıyla bir araştırma yapılmıştır. 10 kişilik iki gruptan oluşan, 70 yaş üstü yaşlı yetişkinlere ve 20 – 30 yaş arası genç yetişkinlere yüksek güvenilirlik ve geçerliliği olduğu bilinen bir yaşam memnuniyeti testi verilmiştir. Ölçüm puanları 0 (en düşük) – 60 (en yüksek) arasındadır. Yaşlı yetişkinlerin verdiği puanların ortalaması 44.5 ve varyansı 75.39 iken genç yetişkinlerin verdiği puanların ortalaması 28.1 ve varyansı 72.99 olarak hesaplanmıştır. Yaşlı ve genç yetişkinler arasındaki ortalama yaşam memnuniyetinin farklı olduğu iddiasını %5 anlam düzeyinde test ediniz ve yorumlayınız. - Yukarıdaki örneğe göre hesaplanan test istatistiği değeri kaçtır?

Cevap: C) 4,26

Açıklama: T-testi kullanılarak hesaplanan test istatistiği değeri 4,26’dir.

#12. Hangisi veri, enformasyon ve bilgi arasındaki ilişkiyi doğru ifade eder?

Cevap: C) Veri, ham ve işlenmemiş bilgileri ifade ederken, enformasyon bu verilerin işlenmiş ve düzenlenmiş hali olarak tanımlanır, bilgi ise enformasyonun işlenmiş ve kullanılabilir hali olarak tanımlanır.

Açıklama: Veri, enformasyon ve bilgi arasındaki ilişki, verinin işlenerek enformasyona, enformasyonun da anlam kazanarak bilgiye dönüşmesi sürecini yansıtır.

#13. A firması tarafından üretilen ampullerden 80 adet seçilmiş ve ortalama 1258 saat çalıştığı görülmüştür. Ana kütleye ait standart sapma 94 saattir. B firması tarafından üretilen ampullerden 60 adet seçilmiş ve ortalama 1029 saat çalıştığı görülmüştür. Ana kütleye ait standart sapma 68 saattir. A firmasının ampul fiyatı daha fazla olduğu için bir test yapılacaktır. A firması tarafından üretilen ampullerin çalışma süresi, B firması tarafından üretilen ampullerin çalışma süresinden 200 saat fazlaysa, A firmasının ampulleri satın alınacaktır. 𝛼𝛼 = 0.011 için hangi firmanın ampullerinin satın alınacağını test ediniz. - Yukarıdaki örneğe göre kritik test istatistiği değeri kaçtır?

Cevap: E) 2,33

Açıklama: Kritik test istatistiği değeri %1 anlamlılık düzeyinde 2,33’tür.

#14. A firması tarafından üretilen ampullerden 80 adet seçilmiş ve ortalama 1258 saat çalıştığı görülmüştür. Ana kütleye ait standart sapma 94 saattir. B firması tarafından üretilen ampullerden 60 adet seçilmiş ve ortalama 1029 saat çalıştığı görülmüştür. Ana kütleye ait standart sapma 68 saattir. A firmasının ampul fiyatı daha fazla olduğu için bir test yapılacaktır. A firması tarafından üretilen ampullerin çalışma süresi, B firması tarafından üretilen ampullerin çalışma süresinden 200 saat fazlaysa, A firmasının ampulleri satın alınacaktır. 𝛼𝛼 = 0.011 için hangi firmanın ampullerinin satın alınacağını test ediniz. - Yukarıdaki örnekte hangi test istatistiği kullanılmalıdır?

Cevap: A) Z-testi

Açıklama: Z-testi, büyük örneklem büyüklükleri ve bilinen populasyon standart sapmaları için kullanılır.

#15. Veri madenciliği sürecinde hangi adım veri setlerinin temizlenmesini, düzenlenmesini ve hazırlanmasını içerir?

Cevap: E) Ön İşleme

Açıklama: Ön işleme, veri madenciliği sürecinde veri setlerinin temizlenmesi, düzenlenmesi ve hazırlanmasını içerir.

#16. Bir regresyon analizinde bağımsız değişkenin katsayısının 2,16 bulunması neyi ifade eder?

Cevap: B) Bağımsız değişkenin bağımlı değişken üzerindeki etkisinin bir birim artışla 2,16 birim arttığını gösterir.

Açıklama: Regresyon analizinde bağımsız değişkenin katsayısı, bağımsız değişkendeki bir birimlik artışın bağımlı değişkende ne kadar bir artışa neden olduğunu gösterir.

#17. Aşağıdaki yöntemlerden hangileri özellik oluşturma (feature creation) için kullanılabilir? - I. Öznitelik oluşturma - II. Veriyi yeni bir uzaya eşleme - III. Öznitelik inşası

Cevap: D) I-II-III

Açıklama: Öznitelik oluşturma, veriyi yeni bir uzaya eşleme ve öznitelik inşası, özellik oluşturma için kullanılan yöntemlerdir.

#18. Reklam için harcanan miktara bağlı olarak bir ürünün satışlarını tahmin etmek istediğimizi varsayalım. - Sabit katsayı (a) kaçtır?

Cevap: D) 66,86

Açıklama: Regresyon denkleminin sabit katsayısı, modelin kesişim noktası olarak bulunur ve bu örnekte 66,86 olarak hesaplanmıştır.

#19. Reklam için harcanan miktara bağlı olarak bir ürünün satışlarını tahmin etmek istediğimizi varsayalım. - 150 TL’lik reklam harcaması yapıldığı durumdaki tahmini satış miktarı ne kadar olur?

Cevap: E) 223

Açıklama: Regresyon denklemi Y = 66,86 1,04X olduğuna göre, Y = 66,86 1,04(150) = 223 olacaktır.

#20. Boyut azaltmanın avantajlarından hangisi doğrudur?

Cevap: B) Veri işleme sürelerini kısaltır

Açıklama: Boyut azaltma, veri işleme sürelerini kısaltarak analiz süreçlerini hızlandırır ve daha etkin hale getirir.

TESTi BiTiR, PUANINI GÖR

SONUÇ

-

İstanbul Üniversitesi Açık ve Uzaktan Eğitim Fakültesi (Auzef)
Açık Öğretim Fakültesi
Bölüm : Yönetim Bilişim Sistemleri Lisans
4. Sınıf  Veri Madenciliği Bahar Dönemi
Veri Madenciliği Vize Deneme Sınavı -5

İstanbul Üniversitesi Açık ve Uzaktan Eğitim Fakültesi (Auzef)
Açık Öğretim Fakültesi
Bölüm : Yönetim Bilişim Sistemleri Lisans
4. Sınıf  Veri Madenciliği Bahar Dönemi
Veri Madenciliği Vize Deneme Sınavı -5

Share your score!
Tweet your score!
Share to other

HD Quiz powered by harmonic design

Auzef Veri Madenciliği Vize Deneme Sınavı -5

İstanbul Üniversitesi Açık ve Uzaktan Eğitim Fakültesi (Auzef)
Açık Öğretim Fakültesi
Bölüm : Yönetim Bilişim Sistemleri Lisans
4. Sınıf  Veri Madenciliği Bahar Dönemi
Auzef Veri Madenciliği Vize Deneme Sınavı -5

Auzef Veri Madenciliği Vize Deneme Sınavı -5

Tahmin Yöntemleri-1 – Ünite 5

Tahmin Yöntemleri-1

Tahmin yöntemleri, veriler arasındaki ilişkileri anlamak ve gelecekteki değerleri tahmin etmek için kullanılan istatistiksel tekniklerdir. Bu yöntemler, özellikle işletme, ekonomi, mühendislik ve sosyal bilimler gibi çeşitli alanlarda yaygın olarak kullanılmaktadır. Bu makalede, tahmin yöntemlerinin temel kavramları ve regresyon analizi hakkında bilgi verilecektir.

1. Regresyon Analizi

Regresyon analizi, bağımlı bir değişken ile bir veya daha fazla bağımsız değişken arasındaki ilişkiyi modellemek için kullanılan bir istatistiksel tekniktir. Regresyon analizi, bu ilişkiyi matematiksel bir denklem ile ifade ederek gelecekteki değerleri tahmin etmeyi sağlar.

Doğrusal Regresyon: Bağımlı değişken ile bağımsız değişkenler arasındaki ilişkiyi doğrusal bir model ile ifade eder. Temel regresyon denklemi Y = a + bX şeklindedir. Burada Y bağımlı değişkeni, X bağımsız değişkeni, a sabit terim ve b eğim katsayısıdır.

Çoklu Doğrusal Regresyon: Birden fazla bağımsız değişkenin bağımlı değişken üzerindeki etkisini analiz eder. Model, Y = a + b1X1 + b2X2 + … + bnXn şeklinde ifade edilir.

2. En Küçük Kareler Yöntemi (OLS)

En küçük kareler yöntemi, regresyon analizinde yaygın olarak kullanılan bir tekniktir. Bu yöntem, tahmin edilen değerler ile gerçek değerler arasındaki farkların karelerinin toplamını en aza indirmeyi amaçlar. Bu farkların karelerinin toplamı, hata terimlerinin varyansını ifade eder.

3. Korelasyon Katsayısı

Korelasyon katsayısı, iki değişken arasındaki doğrusal ilişkiyi ölçen bir istatistiksel değerdir. Korelasyon katsayısı -1 ile +1 arasında değer alır. +1, pozitif doğrusal ilişkiyi, -1 negatif doğrusal ilişkiyi ve 0 hiçbir ilişki olmadığını gösterir.

4. Regresyon Analizinde Varsayımlar

Doğrusallık: Bağımlı ve bağımsız değişkenler arasındaki ilişki doğrusal olmalıdır.

Eş Varyanslık (Homoscedasticity): Hata terimlerinin varyansı sabit olmalıdır.

Bağımsızlık: Hata terimleri birbirinden bağımsız olmalıdır.

Normal Dağılım: Hata terimleri normal dağılım göstermelidir.

5. Regresyon Modelinin Değerlendirilmesi

Regresyon modelinin doğruluğunu ve geçerliliğini değerlendirmek için çeşitli istatistiksel testler ve kriterler kullanılır:

R² (Determinasyon Katsayısı): Modelin bağımlı değişkenin toplam varyansını ne kadar açıkladığını gösterir. R² değeri 0 ile 1 arasında değişir ve 1’e yakın değerler modelin yüksek doğrulukta olduğunu gösterir.

t-Testi: Bağımsız değişkenlerin katsayılarının istatistiksel olarak anlamlı olup olmadığını test eder.

F-Testi: Modelin genel anlamda anlamlı olup olmadığını test eder.

Sonuç

Tahmin yöntemleri, veriler arasındaki ilişkileri anlamak ve gelecekteki değerleri tahmin etmek için güçlü araçlardır. Regresyon analizi, bu yöntemler arasında en yaygın olarak kullanılanıdır ve bağımlı ve bağımsız değişkenler arasındaki ilişkileri modellemekte etkili bir tekniktir. Doğru uygulandığında, tahmin yöntemleri işletmeler ve araştırmacılar için değerli bilgiler sağlar ve stratejik kararlar alınmasına yardımcı olur.

Tahmin Yöntemleri-1 – Ünite 5

1- Regresyon analizindeki eş varyanslık (homoscedasticity) kavramı ne anlama gelir?

A) Hataların sabit bir varyansa sahip olduğunu
B) Değişkenler arasındaki doğrusal ilişkiyi
C) Hata terimlerinin normal dağıldığını
D) Değişkenlerin eşit ağırlıklarla katkıda bulunduğunu
E) Hiçbiri

Cevap: A) Hataların sabit bir varyansa sahip olduğunu

Açıklama: Homoscedasticity, hataların sabit bir varyansa sahip olduğu durumu ifade eder. Bu, regresyon analizinde önemli bir varsayımdır.

2- Regresyon analizinde kullanılan en küçük kareler yöntemi neyi amaçlar?

A) Hata terimlerinin varyansını maksimize etmeyi
B) Gerçek ve tahmin edilen değerler arasındaki farkı en aza indirmeyi
C) Korelasyon katsayısını hesaplamayı
D) Bağımsız değişkenler arasındaki ilişkiyi belirlemeyi
E) Hiçbir şık doğru değil

Cevap: B) Gerçek ve tahmin edilen değerler arasındaki farkı en aza indirmeyi

Açıklama: En küçük kareler yöntemi, tahmin edilen değerler ile gerçek değerler arasındaki farkların karelerinin toplamını en aza indirmeyi amaçlar.

3- Korelasyon katsayısı hangi durumda sıfıra eşit olur?

A) Tam ters orantılı ilişkide
B) Doğrusal ilişkide
C) Herhangi bir ilişki olmadığında
D) Hiçbir şık doğru değil
E) Her durumda farklı bir değer alır

Cevap: C) Herhangi bir ilişki olmadığında

Açıklama: Korelasyon katsayısı, iki değişken arasında herhangi bir ilişki olmadığında sıfıra eşit olur.

4- Bir regresyon modelinde bağımlı değişken ile bir bağımsız değişken arasında bulunan katsayı (b) 2, sabit terim (a) ise 5 olarak bulunmuştur. Bu durumda, bağımlı değişkenin değeri 4 olduğunda tahmini sonuç ne olur?

A) 22
B) 13
C) 9
D) 3
E) 12

Cevap: B) 13

Açıklama: Regresyon denklemi Y = a + bX olduğuna göre, Y = 5 + 2(4) = 13 olacaktır.

5- Bir regresyon analizinde bağımsız değişkenin katsayısının 2,16 bulunması neyi ifade eder?

A) Bağımsız değişken ile bağımlı değişken arasındaki ilişkinin güçlü olduğunu gösterir.
B) Bağımsız değişkenin bağımlı değişken üzerindeki etkisinin bir birim artışla 2,16 birim arttığını gösterir.
C) Modelin anlamsız olduğunu gösterir.
D) Bağımsız değişkenin bağımlı değişken üzerindeki etkisinin olmadığını gösterir.
E) Bağımsız değişkenin bağımlı değişken üzerindeki etkisinin bir birim artışla 2,16 birim azaldığını gösterir.

Cevap: B) Bağımsız değişkenin bağımlı değişken üzerindeki etkisinin bir birim artışla 2,16 birim arttığını gösterir.

Açıklama: Regresyon analizinde bağımsız değişkenin katsayısı, bağımsız değişkendeki bir birimlik artışın bağımlı değişkende ne kadar bir artışa neden olduğunu gösterir.

6- Aşağıdaki tabloda bir veri setinde değişkenler arasındaki korelasyon katsayıları verilmiştir. Buna göre ifadelerden hangileri doğrudur?

Veri Madenciliği Ünite 5 Soru 6 Tahmin Yöntemleri -1

X1 X2 X3
Y 0,997 0,396 -0,038

I. Y değişkeni ile X1 arasında güçlü bir ilişki vardır.
II. Y değişkeni ile X2 arasında doğrusal bir ilişki yoktur.
III. Y değişkeni ile X3 arasında negatif yönlü bir ilişki vardır.
IV. X1 ve X2 arasında güçlü bir pozitif ilişki bulunmaktadır.
V. X2 değişkeni ile X3 arasında negatif bir ilişki vardır.
A) I-III-IV
B) I-IV
C) I-III
D) II-IV
E) IV-V

Cevap: C) I-III

Açıklama: Y değişkeni ile X1 arasında güçlü bir pozitif ilişki (0,997) ve Y değişkeni ile X3 arasında zayıf bir negatif ilişki (-0,038) vardır. X1 ve X2 arasında doğrudan bir korelasyon katsayısı verilmemiştir.

Reklam için harcanan miktara bağlı olarak bir ürünün satışlarını tahmin etmek istediğimizi varsayalım.

Veri Madenciliği Ünite 5 Soru 7

7- Sabit katsayı (a) kaçtır?

A) 41,90
B) 48,96
C) 54,30
D) 66,86
E) 33,43

Cevap: D) 66,86

Açıklama: Regresyon denkleminin sabit katsayısı, modelin kesişim noktası olarak bulunur ve bu örnekte 66,86 olarak hesaplanmıştır.

Reklam için harcanan miktara bağlı olarak bir ürünün satışlarını tahmin etmek istediğimizi varsayalım.

Veri Madenciliği Ünite 5 Soru 7 Tahmin Yöntemleri -1

8- Bağımsız değişkenin katsayısı (b) kaçtır?

A) 1,90
B) 1,04
C) 5,40
D) 1,60
E) 3,30

Cevap: B) 1,04

Açıklama: Bağımsız değişkenin katsayısı (b), bağımsız değişkendeki bir birimlik artışın bağımlı değişkende 1,04 birimlik bir artışa neden olduğunu gösterir.

Reklam için harcanan miktara bağlı olarak bir ürünün satışlarını tahmin etmek istediğimizi varsayalım.

Auzef Veri Madenciliği Vize Deneme Sınavı -5

9- 150 TL’lik reklam harcaması yapıldığı durumdaki tahmini satış miktarı ne kadar olur?

A) 290
B) 145
C) 240
D) 260
E) 223

Cevap: E) 223

Açıklama: Regresyon denklemi Y = 66,86 + 1,04X olduğuna göre, Y = 66,86 + 1,04(150) = 223 olacaktır.

Reklam için harcanan miktara bağlı olarak bir ürünün satışlarını tahmin etmek istediğimizi varsayalım.

Auzef Veri Madenciliği Vize Deneme Sınavı -5

10- 200’lük bir satış miktarı elde etmek için kaç TL harcanmalıdır?

A) 150
B) 112
C) 128
D) 98
E) 136

Cevap: C) 128

Açıklama: Regresyon denklemi Y = 66,86 + 1,04X olduğuna göre, 200 = 66,86 + 1,04X denklemini çözerek X’i buluruz: X ≈ 128 TL olacaktır.

Auzef Veri Madenciliği Vize Deneme Sınavı -5

Yönetim Bilişim Sistemleri Lisans
Veri Madenciliği Yönetim Bilişim Sistemleri Lisans

 

Auzef Veri Madenciliği Vize Deneme Sınavı -5

Yönetim Bilişim Sistemleri Lisans

Auzef Yönetim Bilişim Sistemleri Lisans 4. Sınıf Bahar Dönemi Vize Soruları ve Deneme Sınavları, 2024 Sınav Soruları

Editor

Editör

error: Kopyalamaya Karşı Korumalıdır!