auzefVeri MadenciliğiYönetim Bilişim Sistemleri

Veri Madenciliği Vize Deneme Sınavı -3

Veri Madenciliği Vize Deneme Sınavı -3

#1. Kategorik bir özniteliğin ikili hale getirilmesinde aşağıdakilerden hangileri yanlıştır? - I. Veri özelliği sıralı ise, atama yaparken sıralamayı korumak gerekir - II. Kategorik değerleri ikili formata dönüştürürken 0 ve 1'leri istenilen şekilde atanabilir - III. Kategori sayısı kadar sütun oluşturmak gerekir

Cevap: D) Yalnız III

Açıklama: Kategorik bir özniteliğin ikili hale getirilmesinde, kategori sayısı kadar sütun oluşturmak gerekmez. Bu işlem, genellikle bir sıcak kodlama (one-hot encoding) yöntemi ile gerçekleştirilir.

#2. Aşağıdaki yöntemlerden hangileri özellik oluşturma (feature creation) için kullanılabilir? - I. Öznitelik oluşturma - II. Veriyi yeni bir uzaya eşleme - III. Öznitelik inşası

Cevap: D) I-II-III

Açıklama: Öznitelik oluşturma, veriyi yeni bir uzaya eşleme ve öznitelik inşası, özellik oluşturma için kullanılan yöntemlerdir.

#3. Saçılım grafiği hangi tür ilişkileri görsel olarak göstermek için kullanılır?

Cevap: D) İki değişken arasındaki ilişkiler

Açıklama: Saçılım grafiği, iki değişken arasındaki ilişkileri ve bu ilişkinin yönünü ve gücünü görsel olarak göstermek için kullanılır.

#4. Aşağıdaki tabloda bir veri setinde değişkenler arasındaki korelasyon katsayıları verilmiştir. Buna göre ifadelerden hangileri doğrudur? - I. Y değişkeni ile X1 arasında güçlü bir ilişki vardır. - II. Y değişkeni ile X2 arasında doğrusal bir ilişki yoktur. - III. Y değişkeni ile X3 arasında negatif yönlü bir ilişki vardır. - IV. X1 ve X2 arasında güçlü bir pozitif ilişki bulunmaktadır. - V. X2 değişkeni ile X3 arasında negatif bir ilişki vardır.

Cevap: C) I-III

Açıklama: Y değişkeni ile X1 arasında güçlü bir pozitif ilişki (0,997) ve Y değişkeni ile X3 arasında zayıf bir negatif ilişki (-0,038) vardır. X1 ve X2 arasında doğrudan bir korelasyon katsayısı verilmemiştir.

#5. Reklam için harcanan miktara bağlı olarak bir ürünün satışlarını tahmin etmek istediğimizi varsayalım. - Bağımsız değişkenin katsayısı (b) kaçtır?

Cevap: B) 1,04

Açıklama: Bağımsız değişkenin katsayısı (b), bağımsız değişkendeki bir birimlik artışın bağımlı değişkende 1,04 birimlik bir artışa neden olduğunu gösterir.

#6. Hangi yaklaşım özniteliklerin, veri madenciliği algoritması çalıştırılmadan önce, veri madenciliği görevinden bağımsız bir şekilde seçilmesini benimser?

Cevap: A) Filtre yaklaşım

Açıklama: Filtre yaklaşım, özniteliklerin veri madenciliği görevinden bağımsız olarak seçilmesini benimser ve bu sayede daha genel ve esnek bir seçim süreci sağlar.

#7. Bir veri madenciliği analizi için ihtiyacımız olan tüm verileri toplamak ve işlemek için yeterli zamanımız olmadığında, örneklem büyüklüğü nasıl belirlenir?

Cevap: C) Uyarlanabilir örneklemeyle

Açıklama: Uyarlanabilir örnekleme, sınırlı zaman ve kaynaklarla veri toplama ve işleme işlemini optimize etmek için kullanılır.

#8. Katmanlı (stratified) örnekleme hangi durumda kullanılır?

Cevap: A) Tüm nesne tiplerini yeterince temsil etmeyen durumlarda

Açıklama: Katmanlı örnekleme, tüm nesne tiplerinin yeterince temsil edilmediği durumlarda kullanılır, böylece her bir kategoriye ait veri temsil edilir.

#9. Kutu grafiği hangi istatistikleri görsel olarak temsil eder?

Cevap: C) Çeyreklikler

Açıklama: Kutu grafiği, veri setindeki çeyreklikleri, medyanı ve olası aykırı değerleri görsel olarak temsil eder.

#10. Reklam için harcanan miktara bağlı olarak bir ürünün satışlarını tahmin etmek istediğimizi varsayalım. - 200'lük bir satış miktarı elde etmek için kaç TL harcanmalıdır?

Cevap: C) 128

Açıklama: Regresyon denklemi Y = 66,86 1,04X olduğuna göre, 200 = 66,86 1,04X denklemini çözerek X’i buluruz: X ≈ 128 TL olacaktır.

#11. Veri setindeki değerlerin ortalama etrafındaki yayılımı ölçen istatistik hangisidir?

Cevap: B) Varyans

Açıklama: Varyans, veri setindeki değerlerin ortalama etrafındaki yayılımını ölçer ve değerlerin ne kadar dağıldığını gösterir.

#12. Bir regresyon modelinde bağımlı değişken ile bir bağımsız değişken arasında bulunan katsayı (b) 2, sabit terim (a) ise 5 olarak bulunmuştur. Bu durumda, bağımlı değişkenin değeri 4 olduğunda tahmini sonuç ne olur?

Cevap: B) 13

Açıklama: Regresyon denklemi Y = a bX olduğuna göre, Y = 5 2(4) = 13 olacaktır.

#13. Aşağıdakilerden hangisi birleştirme (aggregation) işleminin bir riskidir?

Cevap: C) Detaylardan bazılarının kaybolması

Açıklama: Birleştirme işlemi sırasında bazı detayların kaybolması riski vardır, bu da veri analizinde önemli bilgilere ulaşmayı zorlaştırabilir.

#14. Boyut azaltmanın avantajlarından hangisi doğrudur?

Cevap: B) Veri işleme sürelerini kısaltır

Açıklama: Boyut azaltma, veri işleme sürelerini kısaltarak analiz süreçlerini hızlandırır ve daha etkin hale getirir.

#15. Hangi durumda Basit Fonksiyonel Dönüşümler veya Normalizasyon kullanılabilir?

Cevap: C) Veri setinin analizde daha anlamlı ve doğrusal bir şekle getirilmesi için

Açıklama: Basit fonksiyonel dönüşümler ve normalizasyon, veri setini analizde daha anlamlı ve doğrusal bir şekle getirmek için kullanılır.

#16. Kök ve yaprak diyagramı hangi amaçla kullanılır?

Cevap: B) Sürekli verilerin dağılımını göstermek için

Açıklama: Kök ve yaprak diyagramı, sürekli verilerin dağılımını ve veri setindeki bireysel değerlerin frekansını görselleştirmek için kullanılır.

#17. Regresyon analizinde kullanılan en küçük kareler yöntemi neyi amaçlar?

Cevap: B) Gerçek ve tahmin edilen değerler arasındaki farkı en aza indirmeyi

Açıklama: En küçük kareler yöntemi, tahmin edilen değerler ile gerçek değerler arasındaki farkların karelerinin toplamını en aza indirmeyi amaçlar.

#18. Öznitelik ayrıklaştırması aşağıdakilerden hangisini içerir?

Cevap: B) Sürekli bir değişkenin kategorik bir değişkene dönüştürülmesi

Açıklama: Öznitelik ayrıklaştırması, sürekli bir değişkenin belirli aralıklara veya kategorilere dönüştürülmesini içerir.

#19. Veri setindeki değerlerin yarısından fazlasını/ortasını belirten istatistik hangisidir?

Cevap: C) Medyan

Açıklama: Medyan, veri setindeki değerlerin ortasını belirten ve veri setini iki eşit parçaya bölen istatistiktir.

#20. Z-Skor Normalizasyonu nedir?

Cevap: D) Değerleri ortalaması 0 ve standart sapması 1 olacak şekilde dönüştürme

Açıklama: Z-skor normalizasyonu, verileri ortalaması 0 ve standart sapması 1 olacak şekilde dönüştürerek, farklı ölçeklerdeki verilerin karşılaştırılmasını kolaylaştırır.

TESTi BiTiR, PUANINI GÖR

SONUÇ

-

İstanbul Üniversitesi Açık ve Uzaktan Eğitim Fakültesi (Auzef)
Açık Öğretim Fakültesi
Bölüm : Yönetim Bilişim Sistemleri Lisans
4. Sınıf  Veri Madenciliği Bahar Dönemi
Veri Madenciliği Vize Deneme Sınavı -3

İstanbul Üniversitesi Açık ve Uzaktan Eğitim Fakültesi (Auzef)
Açık Öğretim Fakültesi
Bölüm : Yönetim Bilişim Sistemleri Lisans
4. Sınıf  Veri Madenciliği Bahar Dönemi
Veri Madenciliği Vize Deneme Sınavı -3

Share your score!
Tweet your score!
Share to other

HD Quiz powered by harmonic design

Veri Madenciliği Vize Deneme Sınavı -3

İstanbul Üniversitesi Açık ve Uzaktan Eğitim Fakültesi (Auzef)
Açık Öğretim Fakültesi
Bölüm : Yönetim Bilişim Sistemleri Lisans
4. Sınıf  Veri Madenciliği Bahar Dönemi
Veri Madenciliği Vize Deneme Sınavı -3

Veri Madenciliği Vize Deneme Sınavı -3

Veri Keşfi ve Görselleştirme – Ünite 3

Veri Keşfi ve Görselleştirme

Veri keşfi ve görselleştirme, veri analizi sürecinin kritik aşamalarından biridir. Bu süreç, ham verilerin incelenmesi, anlamlı bilgiler elde edilmesi ve verilerin görsel temsil edilmesi yoluyla karar verme sürecine katkıda bulunur. Veri keşfi, verilerin özelliklerini anlamak, örüntüleri tespit etmek ve anormallikleri belirlemek için kullanılırken, veri görselleştirme bu bilgilerin anlaşılır bir şekilde sunulmasını sağlar.

1. Merkezi Eğilim Ölçüleri

Merkezi eğilim ölçüleri, veri setinin merkezi bir değer etrafında nasıl dağıldığını gösterir. En yaygın merkezi eğilim ölçüleri ortalama, medyan ve moddur:

Ortalama: Veri setindeki tüm değerlerin toplamının, değerlerin sayısına bölünmesiyle elde edilir. Aşırı değerler ortalamayı etkileyebilir.

Medyan: Veri setindeki ortanca değeri temsil eder. Aşırı değerlerden etkilenmez ve verilerin yarısını üstünde, yarısını altında bırakır.

Mod: Veri setinde en sık tekrar eden değerdir. Veri setinde birden fazla mod olabilir.

2. Yayılım Ölçüleri

Yayılım ölçüleri, veri setindeki değerlerin ne kadar geniş bir alana yayıldığını gösterir. En yaygın yayılım ölçüleri aralık, varyans ve standart sapmadır:

Aralık: Veri setindeki en büyük ve en küçük değer arasındaki farktır.

Varyans: Değerlerin ortalama etrafındaki dağılımını ölçer ve değerlerin ortalamadan ne kadar saptığını gösterir.

Standart Sapma: Varyansın kareköküdür ve veri setindeki değerlerin ortalama etrafında ne kadar dağıldığını gösterir.

3. Görselleştirme Teknikleri

Veri görselleştirme, verilerin grafikler ve diğer görsel araçlar kullanılarak temsil edilmesidir. Yaygın görselleştirme teknikleri şunlardır:

Histogram: Veri setindeki değerlerin frekans dağılımını göstermek için kullanılır. Veriler belirli aralıklara bölünerek sütun grafiği şeklinde gösterilir.

Kutu Grafiği (Box Plot): Veri setindeki çeyreklikleri, medyanı ve olası aykırı değerleri görsel olarak temsil eder.

Pasta Grafiği: Kategorik verilerin oranlarını ve yüzdelerini görsel olarak temsil eder. Her dilim, toplamın belirli bir yüzdesini temsil eder.

Saçılım Grafiği (Scatter Plot): İki değişken arasındaki ilişkiyi görsel olarak göstermek için kullanılır. Noktalar, iki değişkenin değerlerine göre konumlandırılır.

Kök ve Yaprak Diyagramı: Sürekli verilerin dağılımını ve frekansını göstermek için kullanılır.

4. Veri Görselleştirmenin Önemi

Veri görselleştirme, karmaşık verilerin anlaşılmasını kolaylaştırır ve verilerdeki örüntüleri, trendleri ve anormallikleri hızlı bir şekilde tespit etmeyi sağlar. Ayrıca, görselleştirmeler, verilerin daha etkili bir şekilde sunulmasına yardımcı olur ve karar verme sürecinde önemli bir rol oynar.

Sonuç olarak, veri keşfi ve görselleştirme, veri analizi sürecinin ayrılmaz bir parçasıdır ve verilerin anlamlandırılmasında, yorumlanmasında ve sunulmasında kritik bir rol oynar. Bu süreçler, verilerin daha etkili bir şekilde kullanılmasını ve karar verme süreçlerinin iyileştirilmesini sağlar.

Veri Madenciliği Vize Deneme Sınavı -3

Veri Keşfi ve Görselleştirme – Ünite 3

1- Veri setinde en sık tekrar eden değeri ifade eden istatistik hangisidir?

A) Ortalama
B) Standart Sapma
C) Medyan
D) Mod
E) Varyans

Cevap: D) Mod

Açıklama: Mod, veri setinde en sık tekrar eden değeri ifade eder ve veri dağılımında tepe noktasını temsil eder.

2- Veri setindeki değerlerin yarısından fazlasını/ortasını belirten istatistik hangisidir?

A) Ortalama
B) Standart Sapma
C) Medyan
D) Mod
E) Aralık

Cevap: C) Medyan

Açıklama: Medyan, veri setindeki değerlerin ortasını belirten ve veri setini iki eşit parçaya bölen istatistiktir.

3- Veri setindeki en büyük ve en küçük değer arasındaki farkı gösteren istatistik hangisidir?

A) Mod
B) Aralık
C) Medyan
D) Ortalama
E) Standart Sapma

Cevap: B) Aralık

Açıklama: Aralık, veri setindeki en büyük ve en küçük değer arasındaki farkı ifade eder ve veri dağılımının genişliğini gösterir.

4- Veri setindeki değerlerin ortalama etrafındaki yayılımı ölçen istatistik hangisidir?

A) Medyan
B) Varyans
C) Mod
D) Aralık
E) Standart Sapma

Cevap: B) Varyans

Açıklama: Varyans, veri setindeki değerlerin ortalama etrafındaki yayılımını ölçer ve değerlerin ne kadar dağıldığını gösterir.

5- Aşırı değerlerin bulunduğu bir veri setinde hangi merkezi eğilim ölçüsü, genellikle yanıltıcı olabilir?

A) Mod
B) Medyan
C) Standart Sapma
D) Varyans
E) Aralık

Cevap: B) Medyan

Açıklama: Aşırı değerlerin bulunduğu bir veri setinde, medyan merkezi eğilim ölçüsü olarak genellikle yanıltıcı olabilir, çünkü aşırı değerler medyanı etkileyebilir.

6- Kök ve yaprak diyagramı hangi amaçla kullanılır?

A) İki değişken arasındaki ilişkiyi göstermek için
B) Sürekli verilerin dağılımını göstermek için
C) Aşırı değerleri belirlemek için
D) Veri setinin merkezi eğilimini göstermek için
E) Kategorik verilerin oransal dağılımını göstermek için

Cevap: B) Sürekli verilerin dağılımını göstermek için

Açıklama: Kök ve yaprak diyagramı, sürekli verilerin dağılımını ve veri setindeki bireysel değerlerin frekansını görselleştirmek için kullanılır.

7- Histogram hangi veri özelliklerini göstermek için kullanılır?

A) Belli bir aralıktaki dağılım
B) Medyan
C) Çeyreklikler
D) Aykırı değerler
E) Ortalama

Cevap: A) Belli bir aralıktaki dağılım

Açıklama: Histogram, veri setindeki değerlerin belli bir aralıktaki dağılımını göstermek için kullanılır ve frekans dağılımını görselleştirir.

8- Kutu grafiği hangi istatistikleri görsel olarak temsil eder?

A) Oransal dağılım
B) Standart Sapma
C) Çeyreklikler
D) Medyan
E) Varyans

Cevap: C) Çeyreklikler

Açıklama: Kutu grafiği, veri setindeki çeyreklikleri, medyanı ve olası aykırı değerleri görsel olarak temsil eder.

9- Pasta grafiği hangi tür verilerin görsel analizi için kullanılır?

A) Sürekli veriler
B) Kategorik veriler
C) Dağılım verileri
D) Aritmetik veriler
E) Her tür veri

Cevap: B) Kategorik veriler

Açıklama: Pasta grafiği, kategorik verilerin oranlarını ve yüzdelerini görsel olarak temsil etmek için kullanılır.

10- Saçılım grafiği hangi tür ilişkileri görsel olarak göstermek için kullanılır?

A) Lineer ilişkiler
B) Kategorik ilişkiler
C) Karmaşık ilişkiler
D) İki değişken arasındaki ilişkiler
E) Eşzamanlı ilişkiler

Cevap: D) İki değişken arasındaki ilişkiler

Açıklama: Saçılım grafiği, iki değişken arasındaki ilişkileri ve bu ilişkinin yönünü ve gücünü görsel olarak göstermek için kullanılır.

Veri Madenciliği Vize Deneme Sınavı -3

Yönetim Bilişim Sistemleri Lisans
Veri Madenciliği Yönetim Bilişim Sistemleri Lisans

Yönetim Bilişim Sistemleri Lisans

Auzef Yönetim Bilişim Sistemleri Lisans 4. Sınıf Bahar Dönemi Vize Sınav Soruları ve Deneme Sınavları, 2024 Sınav Soruları

Editor

Editör

error: Kopyalamaya Karşı Korumalıdır!