auzefVeri MadenciliğiYönetim Bilişim Sistemleri

Veri Madenciliği Ünite -2

Veri Ön İşleme

#1. Hangi durumda Basit Fonksiyonel Dönüşümler veya Normalizasyon kullanılabilir?

Cevap: C) Veri setinin analizde daha anlamlı ve doğrusal bir şekle getirilmesi için

Açıklama: Basit fonksiyonel dönüşümler ve normalizasyon, veri setini analizde daha anlamlı ve doğrusal bir şekle getirmek için kullanılır.

#2. Katmanlı (stratified) örnekleme hangi durumda kullanılır?

Cevap: A) Tüm nesne tiplerini yeterince temsil etmeyen durumlarda

Açıklama: Katmanlı örnekleme, tüm nesne tiplerinin yeterince temsil edilmediği durumlarda kullanılır, böylece her bir kategoriye ait veri temsil edilir.

#3. Öznitelik ayrıklaştırması aşağıdakilerden hangisini içerir?

Cevap: B) Sürekli bir değişkenin kategorik bir değişkene dönüştürülmesi

Açıklama: Öznitelik ayrıklaştırması, sürekli bir değişkenin belirli aralıklara veya kategorilere dönüştürülmesini içerir.

#4. Z-Skor Normalizasyonu nedir?

Cevap: D) Değerleri ortalaması 0 ve standart sapması 1 olacak şekilde dönüştürme

Açıklama: Z-skor normalizasyonu, verileri ortalaması 0 ve standart sapması 1 olacak şekilde dönüştürerek, farklı ölçeklerdeki verilerin karşılaştırılmasını kolaylaştırır.

#5. Kategorik bir özniteliğin ikili hale getirilmesinde aşağıdakilerden hangileri yanlıştır? - I. Veri özelliği sıralı ise, atama yaparken sıralamayı korumak gerekir - II. Kategorik değerleri ikili formata dönüştürürken 0 ve 1'leri istenilen şekilde atanabilir - III. Kategori sayısı kadar sütun oluşturmak gerekir

Cevap: D) Yalnız III

Açıklama: Kategorik bir özniteliğin ikili hale getirilmesinde, kategori sayısı kadar sütun oluşturmak gerekmez. Bu işlem, genellikle bir sıcak kodlama (one-hot encoding) yöntemi ile gerçekleştirilir.

#6. Aşağıdakilerden hangisi birleştirme (aggregation) işleminin bir riskidir?

Cevap: C) Detaylardan bazılarının kaybolması

Açıklama: Birleştirme işlemi sırasında bazı detayların kaybolması riski vardır, bu da veri analizinde önemli bilgilere ulaşmayı zorlaştırabilir.

#7. Hangi yaklaşım özniteliklerin, veri madenciliği algoritması çalıştırılmadan önce, veri madenciliği görevinden bağımsız bir şekilde seçilmesini benimser?

Cevap: A) Filtre yaklaşım

Açıklama: Filtre yaklaşım, özniteliklerin veri madenciliği görevinden bağımsız olarak seçilmesini benimser ve bu sayede daha genel ve esnek bir seçim süreci sağlar.

#8. Boyut azaltmanın avantajlarından hangisi doğrudur?

Cevap: B) Veri işleme sürelerini kısaltır

Açıklama: Boyut azaltma, veri işleme sürelerini kısaltarak analiz süreçlerini hızlandırır ve daha etkin hale getirir.

#9. Aşağıdaki yöntemlerden hangileri özellik oluşturma (feature creation) için kullanılabilir? - I. Öznitelik oluşturma - II. Veriyi yeni bir uzaya eşleme - III. Öznitelik inşası

Cevap: D) I-II-III

Açıklama: Öznitelik oluşturma, veriyi yeni bir uzaya eşleme ve öznitelik inşası, özellik oluşturma için kullanılan yöntemlerdir.

#10. Bir veri madenciliği analizi için ihtiyacımız olan tüm verileri toplamak ve işlemek için yeterli zamanımız olmadığında, örneklem büyüklüğü nasıl belirlenir?

Cevap: C) Uyarlanabilir örneklemeyle

Açıklama: Uyarlanabilir örnekleme, sınırlı zaman ve kaynaklarla veri toplama ve işleme işlemini optimize etmek için kullanılır.

TESTi BiTiR, PUANINI GÖR

SONUÇ

-

İstanbul Üniversitesi Açık ve Uzaktan Eğitim Fakültesi (Auzef)
Açık Öğretim Fakültesi
Bölüm : Yönetim Bilişim Sistemleri Lisans
4. Sınıf  Veri Madenciliği Bahar Dönemi
Ünite 2 :  Veri Ön İşleme

İstanbul Üniversitesi Açık ve Uzaktan Eğitim Fakültesi (Auzef)
Açık Öğretim Fakültesi
Bölüm : Yönetim Bilişim Sistemleri Lisans
4. Sınıf  Veri Madenciliği Bahar Dönemi
Ünite 2 :  Veri Ön İşleme

Share your score!
Tweet your score!
Share to other

HD Quiz powered by harmonic design

Veri Ön İşleme

İstanbul Üniversitesi Açık ve Uzaktan Eğitim Fakültesi (Auzef)
Açık Öğretim Fakültesi
Bölüm : Yönetim Bilişim Sistemleri Lisans
4. Sınıf  Veri Madenciliği Bahar Dönemi
Ünite 2 :  Veri Ön İşleme

Veri Ön İşleme – Ünite 2

Veri ön işleme, veri madenciliği sürecinde ham verilerin temizlenmesi, dönüştürülmesi ve analiz için hazırlanması aşamasıdır. Bu süreç, verinin doğruluğunu ve kalitesini artırarak analiz sonuçlarının güvenilirliğini sağlar. Veri ön işleme, eksik verilerin doldurulması, aykırı değerlerin tespit edilmesi ve düzeltilmesi, veri dönüşümleri ve öznitelik mühendisliği gibi çeşitli adımları içerir.

1. Veri Temizleme

Veri temizleme, veri setindeki eksik, tutarsız veya hatalı verilerin düzeltilmesini içerir. Eksik veriler, ortalama değerle doldurma, tahminleme veya eksik veri içeren kayıtların silinmesi gibi yöntemlerle işlenebilir. Aykırı değerler ise, veri setindeki alışılmadık veya uç noktadaki değerlerdir ve veri analizini yanıltabilir. Bu nedenle, aykırı değerlerin tespit edilip düzeltilmesi önemlidir.

2. Veri Dönüşümleri

Veri dönüşümleri, verilerin analiz için uygun formata getirilmesi işlemidir. Bu süreçte, veri normalizasyonu, standartlaştırma ve logaritmik dönüşümler gibi yöntemler kullanılır. Örneğin, Z-skor normalizasyonu, verilerin ortalamasını 0 ve standart sapmasını 1 olacak şekilde dönüştürmeyi içerir.

3. Öznitelik Mühendisliği

Öznitelik mühendisliği, veri madenciliği algoritmalarının performansını artırmak için yeni öznitelikler oluşturma ve mevcut öznitelikleri dönüştürme sürecidir. Bu süreç, öznitelik seçimi ve öznitelik oluşturma gibi adımları içerir. Öznitelik seçimi, veri setindeki gereksiz veya düşük öneme sahip özniteliklerin elenmesini sağlar. Öznitelik oluşturma ise, mevcut özniteliklerden yeni öznitelikler türetmeyi içerir.

4. Boyut Azaltma

Boyut azaltma, veri setindeki öznitelik sayısını azaltarak veri analizi sürecini hızlandırma ve model performansını artırma işlemidir. Bu süreçte, ana bileşen analizi (PCA) ve faktör analizi gibi teknikler kullanılır. Boyut azaltma, veri setindeki gürültüyü azaltarak daha anlamlı ve doğru sonuçlar elde etmeyi sağlar.

5. Örnekleme

Örnekleme, büyük veri setlerinden temsilci bir alt küme seçme işlemidir. Bu süreçte, rastgele örnekleme, katmanlı örnekleme ve uyarlanabilir örnekleme gibi yöntemler kullanılır. Katmanlı örnekleme, veri setindeki farklı alt grupların yeterince temsil edilmesini sağlar ve analiz sonuçlarının doğruluğunu artırır.

Veri ön işleme, veri madenciliği sürecinin en önemli adımlarından biridir ve başarılı bir analiz için kritik öneme sahiptir. Bu süreç, verinin kalitesini artırarak daha doğru ve güvenilir sonuçlar elde etmeyi sağlar.

Veri Ön İşleme – Ünite 2

1- Aşağıdakilerden hangisi birleştirme (aggregation) işleminin bir riskidir?

A) Veri kaynaklarının karmaşıklığının artması
B) Ölçeklerin değişmesi
C) Detaylardan bazılarının kaybolması
D) Veri boyutlarının artması
E) Hiçbiri

Cevap: C) Detaylardan bazılarının kaybolması

Açıklama: Birleştirme işlemi sırasında bazı detayların kaybolması riski vardır, bu da veri analizinde önemli bilgilere ulaşmayı zorlaştırabilir.

2- Katmanlı (stratified) örnekleme hangi durumda kullanılır?

A) Tüm nesne tiplerini yeterince temsil etmeyen durumlarda
B) Öğelerin eşit sayıda seçildiği durumlarda
C) Örneklem büyüklüğünü belirlemek için
D) Küçük veri setlerini işlemek için
E) Örneklemde her bir öğenin seçilme olasılığını artırmak için

Cevap: A) Tüm nesne tiplerini yeterince temsil etmeyen durumlarda

Açıklama: Katmanlı örnekleme, tüm nesne tiplerinin yeterince temsil edilmediği durumlarda kullanılır, böylece her bir kategoriye ait veri temsil edilir.

3- Boyut azaltmanın avantajlarından hangisi doğrudur?

A) Model performansını azaltır
B) Veri işleme sürelerini kısaltır
C) Depolama alanı gereksinimlerini artırır
D) Gürültüyü artırır
E) Veri manipülasyonunu zorlaştırır

Cevap: B) Veri işleme sürelerini kısaltır

Açıklama: Boyut azaltma, veri işleme sürelerini kısaltarak analiz süreçlerini hızlandırır ve daha etkin hale getirir.

4- Hangi yaklaşım özniteliklerin, veri madenciliği algoritması çalıştırılmadan önce, veri madenciliği görevinden bağımsız bir şekilde seçilmesini benimser?

A) Filtre yaklaşım
B) Sarıcı yaklaşım
C) Gömülü yaklaşım
D) Veriyi yeni bir uzaya eşleme yaklaşımı
E) Örneklem alma yaklaşımı

Cevap: A) Filtre yaklaşım

Açıklama: Filtre yaklaşım, özniteliklerin veri madenciliği görevinden bağımsız olarak seçilmesini benimser ve bu sayede daha genel ve esnek bir seçim süreci sağlar.

5- Aşağıdaki yöntemlerden hangileri özellik oluşturma (feature creation) için kullanılabilir?

I. Öznitelik oluşturma
II. Veriyi yeni bir uzaya eşleme
III. Öznitelik inşası
A) I-II
B) II-III
C) I-III
D) I-II-III
E) Yalnız I

Cevap: D) I-II-III

Açıklama: Öznitelik oluşturma, veriyi yeni bir uzaya eşleme ve öznitelik inşası, özellik oluşturma için kullanılan yöntemlerdir.

6- Öznitelik ayrıklaştırması aşağıdakilerden hangisini içerir?

A) Sürekli değişkenleri ikili hale getirme
B) Sürekli bir değişkenin kategorik bir değişkene dönüştürülmesi
C) Kategorik bir değişkenin sürekli hale getirilmesi
D) Veri setindeki her değeri bir aralığa atama
E) Veri setindeki her kategorik değeri bir sayıya eşleme

Cevap: B) Sürekli bir değişkenin kategorik bir değişkene dönüştürülmesi

Açıklama: Öznitelik ayrıklaştırması, sürekli bir değişkenin belirli aralıklara veya kategorilere dönüştürülmesini içerir.

7- Hangi durumda Basit Fonksiyonel Dönüşümler veya Normalizasyon kullanılabilir?

A) Veri setindeki değişkenlerin sayısını artırmak için
B) Veri setindeki değişkenlerin değerlerini bozmak için
C) Veri setinin analizde daha anlamlı ve doğrusal bir şekle getirilmesi için
D) Veri setindeki değişkenlerin orijinal dağılımını korumak için
E) Veri setindeki değişkenlerin arasındaki ilişkiyi kesmek için

Cevap: C) Veri setinin analizde daha anlamlı ve doğrusal bir şekle getirilmesi için

Açıklama: Basit fonksiyonel dönüşümler ve normalizasyon, veri setini analizde daha anlamlı ve doğrusal bir şekle getirmek için kullanılır.

8- Z-Skor Normalizasyonu nedir?

A) Değişken değerlerini 0 ile 1 arasında bir aralığa dönüştürme
B) Değişkenleri logaritmik olarak dönüştürme
C) Değişkenlerin tersini alma
D) Değerleri ortalaması 0 ve standart sapması 1 olacak şekilde dönüştürme
E) Değişkenlerin karekökünü alma

Cevap: D) Değerleri ortalaması 0 ve standart sapması 1 olacak şekilde dönüştürme

Açıklama: Z-skor normalizasyonu, verileri ortalaması 0 ve standart sapması 1 olacak şekilde dönüştürerek, farklı ölçeklerdeki verilerin karşılaştırılmasını kolaylaştırır.

9- Kategorik bir özniteliğin ikili hale getirilmesinde aşağıdakilerden hangileri yanlıştır?

I. Veri özelliği sıralı ise, atama yaparken sıralamayı korumak gerekir
II. Kategorik değerleri ikili formata dönüştürürken 0 ve 1’leri istenilen şekilde atanabilir
III. Kategori sayısı kadar sütun oluşturmak gerekir
A) I-II
B) II-III
C) Yalnız II
D) Yalnız III
E) Hiçbiri

Cevap: D) Yalnız III

Açıklama: Kategorik bir özniteliğin ikili hale getirilmesinde, kategori sayısı kadar sütun oluşturmak gerekmez. Bu işlem, genellikle bir sıcak kodlama (one-hot encoding) yöntemi ile gerçekleştirilir.

10- Bir veri madenciliği analizi için ihtiyacımız olan tüm verileri toplamak ve işlemek için yeterli zamanımız olmadığında, örneklem büyüklüğü nasıl belirlenir?

A) Deneme yanılma yoluyla
B) Katmanlı örneklemeyle
C) Uyarlanabilir örneklemeyle
D) Uzman görüşleriyle
E) Değiştirme olmadan yapılan örneklemeyle

Cevap: C) Uyarlanabilir örneklemeyle

Açıklama: Uyarlanabilir örnekleme, sınırlı zaman ve kaynaklarla veri toplama ve işleme işlemini optimize etmek için kullanılır.

Yönetim Bilişim Sistemleri Lisans
Veri Madenciliği Yönetim Bilişim Sistemleri Lisans

Yönetim Bilişim Sistemleri Lisans

Auzef Yönetim Bilişim Sistemleri Lisans 4. Sınıf Bahar Dönemi Ünite Soruları ve Deneme Sınavları, 2024 Sınav Soruları

Editor

Editör

error: Kopyalamaya Karşı Korumalıdır!