Veri Madenciliği Final Deneme Sınavı -2

Haziran 14, 2024 Editor

#1. Katmanlı (stratified) örnekleme hangi durumda kullanılır?

A) Tüm nesne tiplerini yeterince temsil etmeyen durumlarda

B) Öğelerin eşit sayıda seçildiği durumlarda

C) Örneklem büyüklüğünü belirlemek için

D) Küçük veri setlerini işlemek için

E) Örneklemde her bir öğenin seçilme olasılığını artırmak için

Cevap: A) Tüm nesne tiplerini yeterince temsil etmeyen durumlarda

Açıklama: Katmanlı örnekleme, tüm nesne tiplerinin yeterince temsil edilmediği durumlarda kullanılır, böylece her bir kategoriye ait veri temsil edilir.

#2. kNN'nin sınırlamalarından biri nedir?

A) Optimal k değerinin bulunması

B) Öklid Mesafesi'nin kullanımı

C) Dengesiz sınıfların etkisi

D) Çapraz doğrulama kullanımı

E) Karar ağaçları ile rekabet etme

Cevap: C) Dengesiz sınıfların etkisi

Açıklama: kNN algoritmasının sınırlamalarından biri, dengesiz sınıfların etkisidir. Bu durumda, azınlık sınıflar yeterince temsil edilmez ve bu da sınıflandırma performansını olumsuz etkiler.

#3. Reklam için harcanan miktara bağlı olarak bir ürünün satışlarını tahmin etmek istediğimizi varsayalım. - 150 TL’lik reklam harcaması yapıldığı durumdaki tahmini satış miktarı ne kadar olur?

A) 290

B) 145

C) 240

D) 260

E) 223

Cevap: E) 223

Açıklama: Regresyon denklemi Y = 66,86 1,04X olduğuna göre, Y = 66,86 1,04(150) = 223 olacaktır.

#4. Z-Skor Normalizasyonu nedir?

A) Değişken değerlerini 0 ile 1 arasında bir aralığa dönüştürme

B) Değişkenleri logaritmik olarak dönüştürme

C) Değişkenlerin tersini alma

D) Değerleri ortalaması 0 ve standart sapması 1 olacak şekilde dönüştürme

E) Değişkenlerin karekökünü alma

Cevap: D) Değerleri ortalaması 0 ve standart sapması 1 olacak şekilde dönüştürme

Açıklama: Z-skor normalizasyonu, verileri ortalaması 0 ve standart sapması 1 olacak şekilde dönüştürerek, farklı ölçeklerdeki verilerin karşılaştırılmasını kolaylaştırır.

#5. F1 skoru, neden hassasiyet ve duyarlılık metriklerinin harmonik ortalamasını kullanarak denge kurar?

A) Hassasiyet ve duyarlılık arasındaki doğrusal ilişkiyi vurgular.

B) Modelin yanlış pozitiflerine odaklanır, yanlış negatiflere dikkat etmez.

C) Hassasiyet ve duyarlılığın ortalamasını alarak dengeyi sağlar.

D) Yüksek F1 skoru, modelin sadece bir metriğe odaklandığını gösterir.

E) Modelin performansını değerlendirmek için uygun bir metrik değildir.

Cevap: C) Hassasiyet ve duyarlılığın ortalamasını alarak dengeyi sağlar.

Açıklama: F1 skoru, hassasiyet (precision) ve duyarlılık (recall) metriklerinin harmonik ortalamasını alarak denge kurar ve bu sayede modelin genel performansını daha dengeli bir şekilde değerlendirir.

#6. Korelasyon katsayısı hangi durumda sıfıra eşit olur?

A) Tam ters orantılı ilişkide

B) Doğrusal ilişkide

C) Herhangi bir ilişki olmadığında

D) Hiçbir şık doğru değil

E) Her durumda farklı bir değer alır

Cevap: C) Herhangi bir ilişki olmadığında

Açıklama: Korelasyon katsayısı, iki değişken arasında herhangi bir ilişki olmadığında sıfıra eşit olur.

#7. Metin madenciliği hangi adımda gürültüyü azaltarak veri kalitesini artırmayı amaçlar?

A) Model oluşturma

B) Tokenizasyon

C) Özellik mühendisliği

D) Metin ön işleme

E) Doğal dil işleme

Cevap: D) Metin ön işleme

Açıklama: Metin ön işleme, metin madenciliği sürecinde gürültüyü azaltarak veri kalitesini artırmayı amaçlar. Bu adım, veriyi temizlemek ve analiz için hazırlamak için önemlidir.

#8. Kosinüs mesafesi genellikle hangi tür veri kümesinde kullanılır?

A) Sayısal veriler

B) Metin verileri

C) Görüntü verileri

D) Sıralı kategoriler

E) Karmaşık yapıdaki veriler

Cevap: B) Metin verileri

Açıklama: Kosinüs mesafesi, metin verileri arasında benzerlik ölçmek için yaygın olarak kullanılır ve vektörlerin arasındaki açıyı ölçerek benzerlik derecesini belirler.

#9. Sınıflandırma teknikleri genellikle hangi tür veri kümeleri üzerinde etkilidir?

A) Sayısal veriler

B) Sıralı kategoriler

C) Metin verileri

D) İki kategorili veriler

E) Hiçbiri

Cevap: D) İki kategorili veriler

Açıklama: Sınıflandırma teknikleri, özellikle iki kategorili veriler üzerinde etkilidir, çünkü bu teknikler verileri belirli sınıflara ayırmayı amaçlar.

#10. Bir regresyon analizinde bağımsız değişkenin katsayısının 2,16 bulunması neyi ifade eder?

A) Bağımsız değişken ile bağımlı değişken arasındaki ilişkinin güçlü olduğunu gösterir.

B) Bağımsız değişkenin bağımlı değişken üzerindeki etkisinin bir birim artışla 2,16 birim arttığını gösterir.

C) Modelin anlamsız olduğunu gösterir.

D) Bağımsız değişkenin bağımlı değişken üzerindeki etkisinin olmadığını gösterir.

E) Bağımsız değişkenin bağımlı değişken üzerindeki etkisinin bir birim artışla 2,16 birim azaldığını gösterir.

Cevap: B) Bağımsız değişkenin bağımlı değişken üzerindeki etkisinin bir birim artışla 2,16 birim arttığını gösterir.

Açıklama: Regresyon analizinde bağımsız değişkenin katsayısı, bağımsız değişkendeki bir birimlik artışın bağımlı değişkende ne kadar bir artışa neden olduğunu gösterir.

#11. Öznitelik ayrıklaştırması aşağıdakilerden hangisini içerir?

A) Sürekli değişkenleri ikili hale getirme

B) Sürekli bir değişkenin kategorik bir değişkene dönüştürülmesi

C) Kategorik bir değişkenin sürekli hale getirilmesi

D) Veri setindeki her değeri bir aralığa atama

E) Veri setindeki her kategorik değeri bir sayıya eşleme

Cevap: B) Sürekli bir değişkenin kategorik bir değişkene dönüştürülmesi

Açıklama: Öznitelik ayrıklaştırması, sürekli bir değişkenin belirli aralıklara veya kategorilere dönüştürülmesini içerir.

#12. Reklam için harcanan miktara bağlı olarak bir ürünün satışlarını tahmin etmek istediğimizi varsayalım. - Sabit katsayı (a) kaçtır?

A) 41,90

B) 48,96

C) 54,30

D) 66,86

E) 33,43

Cevap: D) 66,86

Açıklama: Regresyon denkleminin sabit katsayısı, modelin kesişim noktası olarak bulunur ve bu örnekte 66,86 olarak hesaplanmıştır.

#13. Sınıflandırma teknikleri hangi durumda daha az etkili olabilir?

A) Dengesiz sınıfların olduğu veri kümelerinde

B) Sayısal veri kümelerinde

C) Küçük boyutlu veri setlerinde

D) Sıralı kategoriler içeren veri setlerinde

E) Hiçbiri

Cevap: D) Sıralı kategoriler içeren veri setlerinde

Açıklama: Sınıflandırma teknikleri, sıralı kategoriler içeren veri setlerinde daha az etkili olabilir, çünkü bu tür veri setlerinde sınıflar arasındaki sıralama bilgisi önemlidir.

#14. Regresyon analizindeki eş varyanslık (homoscedasticity) kavramı ne anlama gelir?

A) Hataların sabit bir varyansa sahip olduğunu

B) Değişkenler arasındaki doğrusal ilişkiyi

C) Hata terimlerinin normal dağıldığını

D) Değişkenlerin eşit ağırlıklarla katkıda bulunduğunu

E) Hiçbiri

Cevap: A) Hataların sabit bir varyansa sahip olduğunu

Açıklama: Homoscedasticity, hataların sabit bir varyansa sahip olduğu durumu ifade eder. Bu, regresyon analizinde önemli bir varsayımdır.

#15. Bir veri madenciliği analizi için ihtiyacımız olan tüm verileri toplamak ve işlemek için yeterli zamanımız olmadığında, örneklem büyüklüğü nasıl belirlenir?

A) Deneme yanılma yoluyla

B) Katmanlı örneklemeyle

C) Uyarlanabilir örneklemeyle

D) Uzman görüşleriyle

E) Değiştirme olmadan yapılan örneklemeyle

Cevap: C) Uyarlanabilir örneklemeyle

Açıklama: Uyarlanabilir örnekleme, sınırlı zaman ve kaynaklarla veri toplama ve işleme işlemini optimize etmek için kullanılır.

#16. Hangi yaklaşım özniteliklerin, veri madenciliği algoritması çalıştırılmadan önce, veri madenciliği görevinden bağımsız bir şekilde seçilmesini benimser?

A) Filtre yaklaşım

B) Sarıcı yaklaşım

C) Gömülü yaklaşım

D) Veriyi yeni bir uzaya eşleme yaklaşımı

E) Örneklem alma yaklaşımı

Cevap: A) Filtre yaklaşım

Açıklama: Filtre yaklaşım, özniteliklerin veri madenciliği görevinden bağımsız olarak seçilmesini benimser ve bu sayede daha genel ve esnek bir seçim süreci sağlar.

#17. Duygu analizi neyi amaçlar?

A) Metin verilerini sadece sayısal formata dönüştürmeyi

B) Pozitif, negatif veya nötr duygusal kategorilere ayırmayı

C) Sadece finansal verileri analiz etmeyi

D) Tokenizasyon işlemini gerçekleştirmeyi

E) Metin ön işleme adımını atlamayı

Cevap: B) Pozitif, negatif veya nötr duygusal kategorilere ayırmayı

Açıklama: Duygu analizi, metin verilerini pozitif, negatif veya nötr duygusal kategorilere ayırmayı amaçlar.

#18. Gizli anlam çözümlemesi (LSA) nedir?

A) Bir dilin kökenini inceleyen bir dilbilim teorisidir.

B) Bir metin kümesindeki ana fikirleri çıkarmak ve temsil etmek için kullanılan bir istatistiksel yöntemdir.

C) Bir belgenin anlamını yorumlamak için kullanılan bir dil işleme tekniğidir.

D) Yalnızca kelime frekansını değil, aynı zamanda metindeki yazım hatalarını düzeltir.

E) LSA, anlamsal olarak bağlantılı kelimeleri gruplandırmak için kullanılan bir semantik ağdır.

Cevap: B) Bir metin kümesindeki ana fikirleri çıkarmak ve temsil etmek için kullanılan bir istatistiksel yöntemdir.

Açıklama: Gizli anlam çözümlemesi (LSA), bir metin kümesindeki ana fikirleri çıkarmak ve temsil etmek için kullanılan bir istatistiksel yöntemdir.

#19. Metin analitiği ile ilgili olarak aşağıdakilerden hangisi yanlıştır?

A) Yapılandırılmamış metinsel veriyi anlamak ve bilgi çıkarmayı hedefler.

B) Metin madenciliğini içinde barındırır.

C) Müşteri geri bildirimleri üzerinde etkili bir şekilde çalışır.

D) Nominal veri türleriyle sınırlıdır.

E) Metin verilerini anlamak için özel teknikleri içerir.

Cevap: D) Nominal veri türleriyle sınırlıdır.

Açıklama: Metin analitiği, yalnızca nominal veri türleriyle sınırlı değildir; yapılandırılmamış metinsel veriyi anlamak ve bilgi çıkarmak için çeşitli veri türlerini kullanır.

#20. Metin madenciliği ile ilgili olarak hangisi yanlıştır?

A) Tokenizasyon metni belirli parçalara böler.

B) Özellik mühendisliği, metni sayısal formata dönüştürmek için özellikler ekler.

C) Model oluşturma, metni analiz etmek için kullanılan bir adımdır.

D) Doğal dil işlemede yapılanları kapsar.

E) Metin verilerini anlamak için özel teknikleri içermez.

Cevap: D) Doğal dil işlemede yapılanları kapsar.

Açıklama: Metin madenciliği, yapılandırılmamış metin verilerini analiz etmek ve bu verilerden anlamlı bilgileri çıkarmak için kullanılan bir tekniktir. Metin madenciliği adımları arasında metnin belirli parçalara bölünmesi (tokenizasyon), metin verilerinin sayısal formata dönüştürülmesi için özellikler eklenmesi (özellik mühendisliği) ve model oluşturma gibi işlemler yer alır. Doğal dil işleme (NLP) ise, metin madenciliğinin önemli bir bileşeni olarak kabul edilmekle birlikte, metin madenciliği doğrudan NLP’de yapılan tüm işlemleri kapsamaz. Bu nedenle, “Doğal dil işlemede yapılanları kapsar” ifadesi yanlıştır. Metin madenciliği, metin verilerini anlamak için özel teknikleri içerir ve bu teknikler, doğal dil işlemenin ötesine geçerek metin verilerinden anlamlı bilgileri çıkarmaya odaklanır

TESTi BiTiR, PUANINI GÖR

SONUÇ

İstanbul Üniversitesi Açık ve Uzaktan Eğitim Fakültesi (Auzef)
Açık Öğretim Fakültesi
Bölüm : Yönetim Bilişim Sistemleri Lisans
4. Sınıf Veri Madenciliği Bahar Dönemi
Veri Madenciliği Final Deneme Sınavı -2

HD Quiz powered by harmonic design

Veri Madenciliği Final Deneme Sınavı -2

İstanbul Üniversitesi Açık ve Uzaktan Eğitim Fakültesi (Auzef) Açık Öğretim Fakültesi Bölüm : Yönetim Bilişim Sistemleri Lisans 4. Sınıf Veri Madenciliği Bahar Dönemi Veri Madenciliği Final Deneme Sınavı -2

Veri Madenciliği Final Deneme Sınavı -2

Veri Ön İşleme – Ünite 2

Veri ön işleme, veri madenciliği sürecinde ham verilerin temizlenmesi, dönüştürülmesi ve analiz için hazırlanması aşamasıdır. Bu süreç, verinin doğruluğunu ve kalitesini artırarak analiz sonuçlarının güvenilirliğini sağlar. Veri ön işleme, eksik verilerin doldurulması, aykırı değerlerin tespit edilmesi ve düzeltilmesi, veri dönüşümleri ve öznitelik mühendisliği gibi çeşitli adımları içerir.

1. Veri Temizleme

Veri temizleme, veri setindeki eksik, tutarsız veya hatalı verilerin düzeltilmesini içerir. Eksik veriler, ortalama değerle doldurma, tahminleme veya eksik veri içeren kayıtların silinmesi gibi yöntemlerle işlenebilir. Aykırı değerler ise, veri setindeki alışılmadık veya uç noktadaki değerlerdir ve veri analizini yanıltabilir. Bu nedenle, aykırı değerlerin tespit edilip düzeltilmesi önemlidir.

2. Veri Dönüşümleri

Veri dönüşümleri, verilerin analiz için uygun formata getirilmesi işlemidir. Bu süreçte, veri normalizasyonu, standartlaştırma ve logaritmik dönüşümler gibi yöntemler kullanılır. Örneğin, Z-skor normalizasyonu, verilerin ortalamasını 0 ve standart sapmasını 1 olacak şekilde dönüştürmeyi içerir.

3. Öznitelik Mühendisliği

Öznitelik mühendisliği, veri madenciliği algoritmalarının performansını artırmak için yeni öznitelikler oluşturma ve mevcut öznitelikleri dönüştürme sürecidir. Bu süreç, öznitelik seçimi ve öznitelik oluşturma gibi adımları içerir. Öznitelik seçimi, veri setindeki gereksiz veya düşük öneme sahip özniteliklerin elenmesini sağlar. Öznitelik oluşturma ise, mevcut özniteliklerden yeni öznitelikler türetmeyi içerir.

4. Boyut Azaltma

Boyut azaltma, veri setindeki öznitelik sayısını azaltarak veri analizi sürecini hızlandırma ve model performansını artırma işlemidir. Bu süreçte, ana bileşen analizi (PCA) ve faktör analizi gibi teknikler kullanılır. Boyut azaltma, veri setindeki gürültüyü azaltarak daha anlamlı ve doğru sonuçlar elde etmeyi sağlar.

5. Örnekleme

Örnekleme, büyük veri setlerinden temsilci bir alt küme seçme işlemidir. Bu süreçte, rastgele örnekleme, katmanlı örnekleme ve uyarlanabilir örnekleme gibi yöntemler kullanılır. Katmanlı örnekleme, veri setindeki farklı alt grupların yeterince temsil edilmesini sağlar ve analiz sonuçlarının doğruluğunu artırır.

Veri ön işleme, veri madenciliği sürecinin en önemli adımlarından biridir ve başarılı bir analiz için kritik öneme sahiptir. Bu süreç, verinin kalitesini artırarak daha doğru ve güvenilir sonuçlar elde etmeyi sağlar.

Veri Madenciliği Final Deneme Sınavı -2

Veri Ön İşleme – Ünite 2

1- Aşağıdakilerden hangisi birleştirme (aggregation) işleminin bir riskidir?

A) Veri kaynaklarının karmaşıklığının artması
B) Ölçeklerin değişmesi
C) Detaylardan bazılarının kaybolması
D) Veri boyutlarının artması
E) Hiçbiri

Cevap: C) Detaylardan bazılarının kaybolması

Açıklama: Birleştirme işlemi sırasında bazı detayların kaybolması riski vardır, bu da veri analizinde önemli bilgilere ulaşmayı zorlaştırabilir.

2- Katmanlı (stratified) örnekleme hangi durumda kullanılır?

A) Tüm nesne tiplerini yeterince temsil etmeyen durumlarda
B) Öğelerin eşit sayıda seçildiği durumlarda
C) Örneklem büyüklüğünü belirlemek için
D) Küçük veri setlerini işlemek için
E) Örneklemde her bir öğenin seçilme olasılığını artırmak için

Cevap: A) Tüm nesne tiplerini yeterince temsil etmeyen durumlarda

Açıklama: Katmanlı örnekleme, tüm nesne tiplerinin yeterince temsil edilmediği durumlarda kullanılır, böylece her bir kategoriye ait veri temsil edilir.

3- Boyut azaltmanın avantajlarından hangisi doğrudur?

A) Model performansını azaltır
B) Veri işleme sürelerini kısaltır
C) Depolama alanı gereksinimlerini artırır
D) Gürültüyü artırır
E) Veri manipülasyonunu zorlaştırır

Cevap: B) Veri işleme sürelerini kısaltır

Açıklama: Boyut azaltma, veri işleme sürelerini kısaltarak analiz süreçlerini hızlandırır ve daha etkin hale getirir.

4- Hangi yaklaşım özniteliklerin, veri madenciliği algoritması çalıştırılmadan önce, veri madenciliği görevinden bağımsız bir şekilde seçilmesini benimser?

A) Filtre yaklaşım
B) Sarıcı yaklaşım
C) Gömülü yaklaşım
D) Veriyi yeni bir uzaya eşleme yaklaşımı
E) Örneklem alma yaklaşımı

Cevap: A) Filtre yaklaşım

Açıklama: Filtre yaklaşım, özniteliklerin veri madenciliği görevinden bağımsız olarak seçilmesini benimser ve bu sayede daha genel ve esnek bir seçim süreci sağlar.

5- Aşağıdaki yöntemlerden hangileri özellik oluşturma (feature creation) için kullanılabilir?

I. Öznitelik oluşturma
II. Veriyi yeni bir uzaya eşleme
III. Öznitelik inşası
A) I-II
B) II-III
C) I-III
D) I-II-III
E) Yalnız I

Cevap: D) I-II-III

Açıklama: Öznitelik oluşturma, veriyi yeni bir uzaya eşleme ve öznitelik inşası, özellik oluşturma için kullanılan yöntemlerdir.

6- Öznitelik ayrıklaştırması aşağıdakilerden hangisini içerir?

A) Sürekli değişkenleri ikili hale getirme
B) Sürekli bir değişkenin kategorik bir değişkene dönüştürülmesi
C) Kategorik bir değişkenin sürekli hale getirilmesi
D) Veri setindeki her değeri bir aralığa atama
E) Veri setindeki her kategorik değeri bir sayıya eşleme

Cevap: B) Sürekli bir değişkenin kategorik bir değişkene dönüştürülmesi

Açıklama: Öznitelik ayrıklaştırması, sürekli bir değişkenin belirli aralıklara veya kategorilere dönüştürülmesini içerir.

7- Hangi durumda Basit Fonksiyonel Dönüşümler veya Normalizasyon kullanılabilir?

A) Veri setindeki değişkenlerin sayısını artırmak için
B) Veri setindeki değişkenlerin değerlerini bozmak için
C) Veri setinin analizde daha anlamlı ve doğrusal bir şekle getirilmesi için
D) Veri setindeki değişkenlerin orijinal dağılımını korumak için
E) Veri setindeki değişkenlerin arasındaki ilişkiyi kesmek için

Cevap: C) Veri setinin analizde daha anlamlı ve doğrusal bir şekle getirilmesi için

Açıklama: Basit fonksiyonel dönüşümler ve normalizasyon, veri setini analizde daha anlamlı ve doğrusal bir şekle getirmek için kullanılır.

8- Z-Skor Normalizasyonu nedir?

A) Değişken değerlerini 0 ile 1 arasında bir aralığa dönüştürme
B) Değişkenleri logaritmik olarak dönüştürme
C) Değişkenlerin tersini alma
D) Değerleri ortalaması 0 ve standart sapması 1 olacak şekilde dönüştürme
E) Değişkenlerin karekökünü alma

Cevap: D) Değerleri ortalaması 0 ve standart sapması 1 olacak şekilde dönüştürme

Açıklama: Z-skor normalizasyonu, verileri ortalaması 0 ve standart sapması 1 olacak şekilde dönüştürerek, farklı ölçeklerdeki verilerin karşılaştırılmasını kolaylaştırır.

9- Kategorik bir özniteliğin ikili hale getirilmesinde aşağıdakilerden hangileri yanlıştır?

I. Veri özelliği sıralı ise, atama yaparken sıralamayı korumak gerekir
II. Kategorik değerleri ikili formata dönüştürürken 0 ve 1’leri istenilen şekilde atanabilir
III. Kategori sayısı kadar sütun oluşturmak gerekir
A) I-II
B) II-III
C) Yalnız II
D) Yalnız III
E) Hiçbiri

Cevap: D) Yalnız III

Açıklama: Kategorik bir özniteliğin ikili hale getirilmesinde, kategori sayısı kadar sütun oluşturmak gerekmez. Bu işlem, genellikle bir sıcak kodlama (one-hot encoding) yöntemi ile gerçekleştirilir.

10- Bir veri madenciliği analizi için ihtiyacımız olan tüm verileri toplamak ve işlemek için yeterli zamanımız olmadığında, örneklem büyüklüğü nasıl belirlenir?

A) Deneme yanılma yoluyla
B) Katmanlı örneklemeyle
C) Uyarlanabilir örneklemeyle
D) Uzman görüşleriyle
E) Değiştirme olmadan yapılan örneklemeyle

Cevap: C) Uyarlanabilir örneklemeyle

Açıklama: Uyarlanabilir örnekleme, sınırlı zaman ve kaynaklarla veri toplama ve işleme işlemini optimize etmek için kullanılır.

Yönetim Bilişim Sistemleri Lisans

Veri Madenciliği Final Deneme Sınavı -2

Yönetim Bilişim Sistemleri Lisans

Auzef Yönetim Bilişim Sistemleri Lisans 4. Sınıf Bahar Dönemi Final Sınav Soruları ve Deneme Sınavları, 2024 Sınav Soruları

#1. Katmanlı (stratified) örnekleme hangi durumda kullanılır?

#2. kNN'nin sınırlamalarından biri nedir?

#3. Reklam için harcanan miktara bağlı olarak bir ürünün satışlarını tahmin etmek istediğimizi varsayalım. - 150 TL’lik reklam harcaması yapıldığı durumdaki tahmini satış miktarı ne kadar olur?

#4. Z-Skor Normalizasyonu nedir?

#5. F1 skoru, neden hassasiyet ve duyarlılık metriklerinin harmonik ortalamasını kullanarak denge kurar?

#6. Korelasyon katsayısı hangi durumda sıfıra eşit olur?

#7. Metin madenciliği hangi adımda gürültüyü azaltarak veri kalitesini artırmayı amaçlar?

#8. Kosinüs mesafesi genellikle hangi tür veri kümesinde kullanılır?

#9. Sınıflandırma teknikleri genellikle hangi tür veri kümeleri üzerinde etkilidir?

#10. Bir regresyon analizinde bağımsız değişkenin katsayısının 2,16 bulunması neyi ifade eder?

#11. Öznitelik ayrıklaştırması aşağıdakilerden hangisini içerir?

#12. Reklam için harcanan miktara bağlı olarak bir ürünün satışlarını tahmin etmek istediğimizi varsayalım. - Sabit katsayı (a) kaçtır?

#13. Sınıflandırma teknikleri hangi durumda daha az etkili olabilir?

#14. Regresyon analizindeki eş varyanslık (homoscedasticity) kavramı ne anlama gelir?

#15. Bir veri madenciliği analizi için ihtiyacımız olan tüm verileri toplamak ve işlemek için yeterli zamanımız olmadığında, örneklem büyüklüğü nasıl belirlenir?

#16. Hangi yaklaşım özniteliklerin, veri madenciliği algoritması çalıştırılmadan önce, veri madenciliği görevinden bağımsız bir şekilde seçilmesini benimser?

#17. Duygu analizi neyi amaçlar?

#18. Gizli anlam çözümlemesi (LSA) nedir?

#19. Metin analitiği ile ilgili olarak aşağıdakilerden hangisi yanlıştır?

#20. Metin madenciliği ile ilgili olarak hangisi yanlıştır?

SONUÇ

Bunu beğen:

Bunu beğen:

Veri Madenciliği Final Deneme Sınavı -2

Veri Madenciliği Final Deneme Sınavı -2

Veri Ön İşleme – Ünite 2

1. Veri Temizleme

2. Veri Dönüşümleri

3. Öznitelik Mühendisliği

4. Boyut Azaltma

5. Örnekleme

Veri Madenciliği Final Deneme Sınavı -2

Veri Ön İşleme – Ünite 2

1- Aşağıdakilerden hangisi birleştirme (aggregation) işleminin bir riskidir?

2- Katmanlı (stratified) örnekleme hangi durumda kullanılır?

3- Boyut azaltmanın avantajlarından hangisi doğrudur?

4- Hangi yaklaşım özniteliklerin, veri madenciliği algoritması çalıştırılmadan önce, veri madenciliği görevinden bağımsız bir şekilde seçilmesini benimser?

5- Aşağıdaki yöntemlerden hangileri özellik oluşturma (feature creation) için kullanılabilir?

6- Öznitelik ayrıklaştırması aşağıdakilerden hangisini içerir?

7- Hangi durumda Basit Fonksiyonel Dönüşümler veya Normalizasyon kullanılabilir?

8- Z-Skor Normalizasyonu nedir?

9- Kategorik bir özniteliğin ikili hale getirilmesinde aşağıdakilerden hangileri yanlıştır?

10- Bir veri madenciliği analizi için ihtiyacımız olan tüm verileri toplamak ve işlemek için yeterli zamanımız olmadığında, örneklem büyüklüğü nasıl belirlenir?

Veri Madenciliği Final Deneme Sınavı -2

Bunu paylaş:

Bunu beğen:

Editor