auzefVeri MadenciliğiYönetim Bilişim Sistemleri

Veri Madenciliği Final Deneme Sınavı -2

Veri Madenciliği Final Deneme Sınavı -2

#1. Katmanlı (stratified) örnekleme hangi durumda kullanılır?

Cevap: A) Tüm nesne tiplerini yeterince temsil etmeyen durumlarda

Açıklama: Katmanlı örnekleme, tüm nesne tiplerinin yeterince temsil edilmediği durumlarda kullanılır, böylece her bir kategoriye ait veri temsil edilir.

#2. kNN'nin sınırlamalarından biri nedir?

Cevap: C) Dengesiz sınıfların etkisi

Açıklama: kNN algoritmasının sınırlamalarından biri, dengesiz sınıfların etkisidir. Bu durumda, azınlık sınıflar yeterince temsil edilmez ve bu da sınıflandırma performansını olumsuz etkiler.

#3. Reklam için harcanan miktara bağlı olarak bir ürünün satışlarını tahmin etmek istediğimizi varsayalım. - 150 TL’lik reklam harcaması yapıldığı durumdaki tahmini satış miktarı ne kadar olur?

Cevap: E) 223

Açıklama: Regresyon denklemi Y = 66,86 1,04X olduğuna göre, Y = 66,86 1,04(150) = 223 olacaktır.

#4. Z-Skor Normalizasyonu nedir?

Cevap: D) Değerleri ortalaması 0 ve standart sapması 1 olacak şekilde dönüştürme

Açıklama: Z-skor normalizasyonu, verileri ortalaması 0 ve standart sapması 1 olacak şekilde dönüştürerek, farklı ölçeklerdeki verilerin karşılaştırılmasını kolaylaştırır.

#5. F1 skoru, neden hassasiyet ve duyarlılık metriklerinin harmonik ortalamasını kullanarak denge kurar?

Cevap: C) Hassasiyet ve duyarlılığın ortalamasını alarak dengeyi sağlar.

Açıklama: F1 skoru, hassasiyet (precision) ve duyarlılık (recall) metriklerinin harmonik ortalamasını alarak denge kurar ve bu sayede modelin genel performansını daha dengeli bir şekilde değerlendirir.

#6. Korelasyon katsayısı hangi durumda sıfıra eşit olur?

Cevap: C) Herhangi bir ilişki olmadığında

Açıklama: Korelasyon katsayısı, iki değişken arasında herhangi bir ilişki olmadığında sıfıra eşit olur.

#7. Metin madenciliği hangi adımda gürültüyü azaltarak veri kalitesini artırmayı amaçlar?

Cevap: D) Metin ön işleme

Açıklama: Metin ön işleme, metin madenciliği sürecinde gürültüyü azaltarak veri kalitesini artırmayı amaçlar. Bu adım, veriyi temizlemek ve analiz için hazırlamak için önemlidir.

#8. Kosinüs mesafesi genellikle hangi tür veri kümesinde kullanılır?

Cevap: B) Metin verileri

Açıklama: Kosinüs mesafesi, metin verileri arasında benzerlik ölçmek için yaygın olarak kullanılır ve vektörlerin arasındaki açıyı ölçerek benzerlik derecesini belirler.

#9. Sınıflandırma teknikleri genellikle hangi tür veri kümeleri üzerinde etkilidir?

Cevap: D) İki kategorili veriler

Açıklama: Sınıflandırma teknikleri, özellikle iki kategorili veriler üzerinde etkilidir, çünkü bu teknikler verileri belirli sınıflara ayırmayı amaçlar.

#10. Bir regresyon analizinde bağımsız değişkenin katsayısının 2,16 bulunması neyi ifade eder?

Cevap: B) Bağımsız değişkenin bağımlı değişken üzerindeki etkisinin bir birim artışla 2,16 birim arttığını gösterir.

Açıklama: Regresyon analizinde bağımsız değişkenin katsayısı, bağımsız değişkendeki bir birimlik artışın bağımlı değişkende ne kadar bir artışa neden olduğunu gösterir.

#11. Öznitelik ayrıklaştırması aşağıdakilerden hangisini içerir?

Cevap: B) Sürekli bir değişkenin kategorik bir değişkene dönüştürülmesi

Açıklama: Öznitelik ayrıklaştırması, sürekli bir değişkenin belirli aralıklara veya kategorilere dönüştürülmesini içerir.

#12. Reklam için harcanan miktara bağlı olarak bir ürünün satışlarını tahmin etmek istediğimizi varsayalım. - Sabit katsayı (a) kaçtır?

Cevap: D) 66,86

Açıklama: Regresyon denkleminin sabit katsayısı, modelin kesişim noktası olarak bulunur ve bu örnekte 66,86 olarak hesaplanmıştır.

#13. Sınıflandırma teknikleri hangi durumda daha az etkili olabilir?

Cevap: D) Sıralı kategoriler içeren veri setlerinde

Açıklama: Sınıflandırma teknikleri, sıralı kategoriler içeren veri setlerinde daha az etkili olabilir, çünkü bu tür veri setlerinde sınıflar arasındaki sıralama bilgisi önemlidir.

#14. Regresyon analizindeki eş varyanslık (homoscedasticity) kavramı ne anlama gelir?

Cevap: A) Hataların sabit bir varyansa sahip olduğunu

Açıklama: Homoscedasticity, hataların sabit bir varyansa sahip olduğu durumu ifade eder. Bu, regresyon analizinde önemli bir varsayımdır.

#15. Bir veri madenciliği analizi için ihtiyacımız olan tüm verileri toplamak ve işlemek için yeterli zamanımız olmadığında, örneklem büyüklüğü nasıl belirlenir?

Cevap: C) Uyarlanabilir örneklemeyle

Açıklama: Uyarlanabilir örnekleme, sınırlı zaman ve kaynaklarla veri toplama ve işleme işlemini optimize etmek için kullanılır.

#16. Hangi yaklaşım özniteliklerin, veri madenciliği algoritması çalıştırılmadan önce, veri madenciliği görevinden bağımsız bir şekilde seçilmesini benimser?

Cevap: A) Filtre yaklaşım

Açıklama: Filtre yaklaşım, özniteliklerin veri madenciliği görevinden bağımsız olarak seçilmesini benimser ve bu sayede daha genel ve esnek bir seçim süreci sağlar.

#17. Duygu analizi neyi amaçlar?

Cevap: B) Pozitif, negatif veya nötr duygusal kategorilere ayırmayı

Açıklama: Duygu analizi, metin verilerini pozitif, negatif veya nötr duygusal kategorilere ayırmayı amaçlar.

#18. Gizli anlam çözümlemesi (LSA) nedir?

Cevap: B) Bir metin kümesindeki ana fikirleri çıkarmak ve temsil etmek için kullanılan bir istatistiksel yöntemdir.

Açıklama: Gizli anlam çözümlemesi (LSA), bir metin kümesindeki ana fikirleri çıkarmak ve temsil etmek için kullanılan bir istatistiksel yöntemdir.

#19. Metin analitiği ile ilgili olarak aşağıdakilerden hangisi yanlıştır?

Cevap: D) Nominal veri türleriyle sınırlıdır.

Açıklama: Metin analitiği, yalnızca nominal veri türleriyle sınırlı değildir; yapılandırılmamış metinsel veriyi anlamak ve bilgi çıkarmak için çeşitli veri türlerini kullanır.

#20. Metin madenciliği ile ilgili olarak hangisi yanlıştır?

Cevap: D) Doğal dil işlemede yapılanları kapsar.

Açıklama: Metin madenciliği, yapılandırılmamış metin verilerini analiz etmek ve bu verilerden anlamlı bilgileri çıkarmak için kullanılan bir tekniktir. Metin madenciliği adımları arasında metnin belirli parçalara bölünmesi (tokenizasyon), metin verilerinin sayısal formata dönüştürülmesi için özellikler eklenmesi (özellik mühendisliği) ve model oluşturma gibi işlemler yer alır. Doğal dil işleme (NLP) ise, metin madenciliğinin önemli bir bileşeni olarak kabul edilmekle birlikte, metin madenciliği doğrudan NLP’de yapılan tüm işlemleri kapsamaz. Bu nedenle, “Doğal dil işlemede yapılanları kapsar” ifadesi yanlıştır. Metin madenciliği, metin verilerini anlamak için özel teknikleri içerir ve bu teknikler, doğal dil işlemenin ötesine geçerek metin verilerinden anlamlı bilgileri çıkarmaya odaklanır

TESTi BiTiR, PUANINI GÖR

SONUÇ

-

İstanbul Üniversitesi Açık ve Uzaktan Eğitim Fakültesi (Auzef)
Açık Öğretim Fakültesi
Bölüm : Yönetim Bilişim Sistemleri Lisans
4. Sınıf  Veri Madenciliği Bahar Dönemi
Veri Madenciliği Final Deneme Sınavı -2

İstanbul Üniversitesi Açık ve Uzaktan Eğitim Fakültesi (Auzef)
Açık Öğretim Fakültesi
Bölüm : Yönetim Bilişim Sistemleri Lisans
4. Sınıf  Veri Madenciliği Bahar Dönemi
Veri Madenciliği Final Deneme Sınavı -2

Share your score!
Tweet your score!
Share to other

HD Quiz powered by harmonic design

Veri Madenciliği Final Deneme Sınavı -2

İstanbul Üniversitesi Açık ve Uzaktan Eğitim Fakültesi (Auzef)
Açık Öğretim Fakültesi
Bölüm : Yönetim Bilişim Sistemleri Lisans
4. Sınıf  Veri Madenciliği Bahar Dönemi
Veri Madenciliği Final Deneme Sınavı -2

Veri Madenciliği Final Deneme Sınavı -2

Veri Ön İşleme – Ünite 2

Veri ön işleme, veri madenciliği sürecinde ham verilerin temizlenmesi, dönüştürülmesi ve analiz için hazırlanması aşamasıdır. Bu süreç, verinin doğruluğunu ve kalitesini artırarak analiz sonuçlarının güvenilirliğini sağlar. Veri ön işleme, eksik verilerin doldurulması, aykırı değerlerin tespit edilmesi ve düzeltilmesi, veri dönüşümleri ve öznitelik mühendisliği gibi çeşitli adımları içerir.

1. Veri Temizleme

Veri temizleme, veri setindeki eksik, tutarsız veya hatalı verilerin düzeltilmesini içerir. Eksik veriler, ortalama değerle doldurma, tahminleme veya eksik veri içeren kayıtların silinmesi gibi yöntemlerle işlenebilir. Aykırı değerler ise, veri setindeki alışılmadık veya uç noktadaki değerlerdir ve veri analizini yanıltabilir. Bu nedenle, aykırı değerlerin tespit edilip düzeltilmesi önemlidir.

2. Veri Dönüşümleri

Veri dönüşümleri, verilerin analiz için uygun formata getirilmesi işlemidir. Bu süreçte, veri normalizasyonu, standartlaştırma ve logaritmik dönüşümler gibi yöntemler kullanılır. Örneğin, Z-skor normalizasyonu, verilerin ortalamasını 0 ve standart sapmasını 1 olacak şekilde dönüştürmeyi içerir.

3. Öznitelik Mühendisliği

Öznitelik mühendisliği, veri madenciliği algoritmalarının performansını artırmak için yeni öznitelikler oluşturma ve mevcut öznitelikleri dönüştürme sürecidir. Bu süreç, öznitelik seçimi ve öznitelik oluşturma gibi adımları içerir. Öznitelik seçimi, veri setindeki gereksiz veya düşük öneme sahip özniteliklerin elenmesini sağlar. Öznitelik oluşturma ise, mevcut özniteliklerden yeni öznitelikler türetmeyi içerir.

4. Boyut Azaltma

Boyut azaltma, veri setindeki öznitelik sayısını azaltarak veri analizi sürecini hızlandırma ve model performansını artırma işlemidir. Bu süreçte, ana bileşen analizi (PCA) ve faktör analizi gibi teknikler kullanılır. Boyut azaltma, veri setindeki gürültüyü azaltarak daha anlamlı ve doğru sonuçlar elde etmeyi sağlar.

5. Örnekleme

Örnekleme, büyük veri setlerinden temsilci bir alt küme seçme işlemidir. Bu süreçte, rastgele örnekleme, katmanlı örnekleme ve uyarlanabilir örnekleme gibi yöntemler kullanılır. Katmanlı örnekleme, veri setindeki farklı alt grupların yeterince temsil edilmesini sağlar ve analiz sonuçlarının doğruluğunu artırır.

Veri ön işleme, veri madenciliği sürecinin en önemli adımlarından biridir ve başarılı bir analiz için kritik öneme sahiptir. Bu süreç, verinin kalitesini artırarak daha doğru ve güvenilir sonuçlar elde etmeyi sağlar.

Veri Madenciliği Final Deneme Sınavı -2

Veri Ön İşleme – Ünite 2

1- Aşağıdakilerden hangisi birleştirme (aggregation) işleminin bir riskidir?

A) Veri kaynaklarının karmaşıklığının artması
B) Ölçeklerin değişmesi
C) Detaylardan bazılarının kaybolması
D) Veri boyutlarının artması
E) Hiçbiri

Cevap: C) Detaylardan bazılarının kaybolması

Açıklama: Birleştirme işlemi sırasında bazı detayların kaybolması riski vardır, bu da veri analizinde önemli bilgilere ulaşmayı zorlaştırabilir.

2- Katmanlı (stratified) örnekleme hangi durumda kullanılır?

A) Tüm nesne tiplerini yeterince temsil etmeyen durumlarda
B) Öğelerin eşit sayıda seçildiği durumlarda
C) Örneklem büyüklüğünü belirlemek için
D) Küçük veri setlerini işlemek için
E) Örneklemde her bir öğenin seçilme olasılığını artırmak için

Cevap: A) Tüm nesne tiplerini yeterince temsil etmeyen durumlarda

Açıklama: Katmanlı örnekleme, tüm nesne tiplerinin yeterince temsil edilmediği durumlarda kullanılır, böylece her bir kategoriye ait veri temsil edilir.

3- Boyut azaltmanın avantajlarından hangisi doğrudur?

A) Model performansını azaltır
B) Veri işleme sürelerini kısaltır
C) Depolama alanı gereksinimlerini artırır
D) Gürültüyü artırır
E) Veri manipülasyonunu zorlaştırır

Cevap: B) Veri işleme sürelerini kısaltır

Açıklama: Boyut azaltma, veri işleme sürelerini kısaltarak analiz süreçlerini hızlandırır ve daha etkin hale getirir.

4- Hangi yaklaşım özniteliklerin, veri madenciliği algoritması çalıştırılmadan önce, veri madenciliği görevinden bağımsız bir şekilde seçilmesini benimser?

A) Filtre yaklaşım
B) Sarıcı yaklaşım
C) Gömülü yaklaşım
D) Veriyi yeni bir uzaya eşleme yaklaşımı
E) Örneklem alma yaklaşımı

Cevap: A) Filtre yaklaşım

Açıklama: Filtre yaklaşım, özniteliklerin veri madenciliği görevinden bağımsız olarak seçilmesini benimser ve bu sayede daha genel ve esnek bir seçim süreci sağlar.

5- Aşağıdaki yöntemlerden hangileri özellik oluşturma (feature creation) için kullanılabilir?

I. Öznitelik oluşturma
II. Veriyi yeni bir uzaya eşleme
III. Öznitelik inşası
A) I-II
B) II-III
C) I-III
D) I-II-III
E) Yalnız I

Cevap: D) I-II-III

Açıklama: Öznitelik oluşturma, veriyi yeni bir uzaya eşleme ve öznitelik inşası, özellik oluşturma için kullanılan yöntemlerdir.

6- Öznitelik ayrıklaştırması aşağıdakilerden hangisini içerir?

A) Sürekli değişkenleri ikili hale getirme
B) Sürekli bir değişkenin kategorik bir değişkene dönüştürülmesi
C) Kategorik bir değişkenin sürekli hale getirilmesi
D) Veri setindeki her değeri bir aralığa atama
E) Veri setindeki her kategorik değeri bir sayıya eşleme

Cevap: B) Sürekli bir değişkenin kategorik bir değişkene dönüştürülmesi

Açıklama: Öznitelik ayrıklaştırması, sürekli bir değişkenin belirli aralıklara veya kategorilere dönüştürülmesini içerir.

7- Hangi durumda Basit Fonksiyonel Dönüşümler veya Normalizasyon kullanılabilir?

A) Veri setindeki değişkenlerin sayısını artırmak için
B) Veri setindeki değişkenlerin değerlerini bozmak için
C) Veri setinin analizde daha anlamlı ve doğrusal bir şekle getirilmesi için
D) Veri setindeki değişkenlerin orijinal dağılımını korumak için
E) Veri setindeki değişkenlerin arasındaki ilişkiyi kesmek için

Cevap: C) Veri setinin analizde daha anlamlı ve doğrusal bir şekle getirilmesi için

Açıklama: Basit fonksiyonel dönüşümler ve normalizasyon, veri setini analizde daha anlamlı ve doğrusal bir şekle getirmek için kullanılır.

8- Z-Skor Normalizasyonu nedir?

A) Değişken değerlerini 0 ile 1 arasında bir aralığa dönüştürme
B) Değişkenleri logaritmik olarak dönüştürme
C) Değişkenlerin tersini alma
D) Değerleri ortalaması 0 ve standart sapması 1 olacak şekilde dönüştürme
E) Değişkenlerin karekökünü alma

Cevap: D) Değerleri ortalaması 0 ve standart sapması 1 olacak şekilde dönüştürme

Açıklama: Z-skor normalizasyonu, verileri ortalaması 0 ve standart sapması 1 olacak şekilde dönüştürerek, farklı ölçeklerdeki verilerin karşılaştırılmasını kolaylaştırır.

9- Kategorik bir özniteliğin ikili hale getirilmesinde aşağıdakilerden hangileri yanlıştır?

I. Veri özelliği sıralı ise, atama yaparken sıralamayı korumak gerekir
II. Kategorik değerleri ikili formata dönüştürürken 0 ve 1’leri istenilen şekilde atanabilir
III. Kategori sayısı kadar sütun oluşturmak gerekir
A) I-II
B) II-III
C) Yalnız II
D) Yalnız III
E) Hiçbiri

Cevap: D) Yalnız III

Açıklama: Kategorik bir özniteliğin ikili hale getirilmesinde, kategori sayısı kadar sütun oluşturmak gerekmez. Bu işlem, genellikle bir sıcak kodlama (one-hot encoding) yöntemi ile gerçekleştirilir.

10- Bir veri madenciliği analizi için ihtiyacımız olan tüm verileri toplamak ve işlemek için yeterli zamanımız olmadığında, örneklem büyüklüğü nasıl belirlenir?

A) Deneme yanılma yoluyla
B) Katmanlı örneklemeyle
C) Uyarlanabilir örneklemeyle
D) Uzman görüşleriyle
E) Değiştirme olmadan yapılan örneklemeyle

Cevap: C) Uyarlanabilir örneklemeyle

Açıklama: Uyarlanabilir örnekleme, sınırlı zaman ve kaynaklarla veri toplama ve işleme işlemini optimize etmek için kullanılır.

Yönetim Bilişim Sistemleri Lisans
Veri Madenciliği Yönetim Bilişim Sistemleri Lisans

Veri Madenciliği Final Deneme Sınavı -2

Yönetim Bilişim Sistemleri Lisans

Auzef Yönetim Bilişim Sistemleri Lisans 4. Sınıf Bahar Dönemi Final Sınav Soruları ve Deneme Sınavları, 2024 Sınav Soruları

Editor

Editör

error: Kopyalamaya Karşı Korumalıdır!