auzefVeri MadenciliğiYönetim Bilişim Sistemleri

Veri Madenciliği Final Deneme Sınavı -9

Auzef Veri Madenciliği Final Deneme Sınavı -9

#1. Apriori algoritmasının amacı nedir?

Cevap: C) Sık öge kümelerini bulmak

Açıklama: Apriori algoritması, sık öge kümelerini bulmayı amaçlar. Bu, birliktelik kurallarının çıkarılmasında kullanılan temel bir adımdır.

#2. Aşırı değerlerin bulunduğu bir veri setinde hangi merkezi eğilim ölçüsü, genellikle yanıltıcı olabilir?

Cevap: B) Medyan

Açıklama: Aşırı değerlerin bulunduğu bir veri setinde, medyan merkezi eğilim ölçüsü olarak genellikle yanıltıcı olabilir, çünkü aşırı değerler medyanı etkileyebilir.

#3. Güven tabanlı kesme stratejisi hangi durumu ele alır?

Cevap: D) Kural kümesini bulur

Açıklama: Güven tabanlı kesme stratejisi, belirli bir güven eşiğinin üzerinde olan kural kümesini bulmayı amaçlar.

#4. Bir birliktelik kuralının güveni nedir?

Cevap: B) X’i içeren işlemlerde X ve Y ögelerinin ne sıklıkta göründüğünü

Açıklama: Bir kuralın güveni, X’i içeren işlemlerde X ve Y’nin birlikte görülme olasılığını ölçer ve kuralın doğruluğunu gösterir.

#5. Sınıflandırma modelinin performansı nasıl değerlendirilir?

Cevap: B) Karışıklık matrisi ile

Açıklama: Karışıklık matrisi, sınıflandırma modelinin performansını değerlendirmek için kullanılır ve modelin doğru ve yanlış sınıflandırmalarını özetler.

#6. Birliktelik analizi için kullanılan destek ve güven oranları hangi bilgiyi sağlar?

Cevap: B) Bir kuralın ne sıklıkta uygulandığını ve çıkarımın güvenilirliğini

Açıklama: Destek ve güven oranları, birliktelik kurallarının sıklığını ve bu kuralların güvenilirliğini ölçer. Destek, kuralın ne sıklıkta görüldüğünü; güven ise kuralın doğruluğunu gösterir.

#7. Performans metrikleri arasında doğruluk (accuracy) neyi ölçer?

Cevap: C) Modelin doğru tahmin ettiği kayıtların oranını

Açıklama: Doğruluk (accuracy), modelin doğru tahmin ettiği kayıtların toplam kayıtlar içindeki oranını ölçer ve sınıflandırma modelinin performansını değerlendirir.

#8. Histogram hangi veri özelliklerini göstermek için kullanılır?

Cevap: A) Belli bir aralıktaki dağılım

Açıklama: Histogram, veri setindeki değerlerin belli bir aralıktaki dağılımını göstermek için kullanılır ve frekans dağılımını görselleştirir.

#9. Reklam için harcanan miktara bağlı olarak bir ürünün satışlarını tahmin etmek istediğimizi varsayalım. - 150 TL’lik reklam harcaması yapıldığı durumdaki tahmini satış miktarı ne kadar olur?

Cevap: E) 223

Açıklama: Regresyon denklemi Y = 66,86 1,04X olduğuna göre, Y = 66,86 1,04(150) = 223 olacaktır.

#10. Korelasyon katsayısı hangi durumda sıfıra eşit olur?

Cevap: C) Herhangi bir ilişki olmadığında

Açıklama: Korelasyon katsayısı, iki değişken arasında herhangi bir ilişki olmadığında sıfıra eşit olur.

#11. Veri setinde en sık tekrar eden değeri ifade eden istatistik hangisidir?

Cevap: D) Mod

Açıklama: Mod, veri setinde en sık tekrar eden değeri ifade eder ve veri dağılımında tepe noktasını temsil eder.

#12. Pasta grafiği hangi tür verilerin görsel analizi için kullanılır?

Cevap: B) Kategorik veriler

Açıklama: Pasta grafiği, kategorik verilerin oranlarını ve yüzdelerini görsel olarak temsil etmek için kullanılır.

#13. Karar ağaçları hangi tür düğümleri içerir?

Cevap: B) Yaprak düğümleri ve iç düğümler

Açıklama: Karar ağaçları, yaprak düğümleri ve iç düğümler içerir. Yaprak düğümleri, nihai sınıflandırma kararlarını temsil ederken, iç düğümler veri bölme kararlarını temsil eder.

#14. Veri setindeki en büyük ve en küçük değer arasındaki farkı gösteren istatistik hangisidir?

Cevap: B) Aralık

Açıklama: Aralık, veri setindeki en büyük ve en küçük değer arasındaki farkı ifade eder ve veri dağılımının genişliğini gösterir.

#15. Reklam için harcanan miktara bağlı olarak bir ürünün satışlarını tahmin etmek istediğimizi varsayalım. - Sabit katsayı (a) kaçtır?

Cevap: D) 66,86

Açıklama: Regresyon denkleminin sabit katsayısı, modelin kesişim noktası olarak bulunur ve bu örnekte 66,86 olarak hesaplanmıştır.

#16. Bir regresyon analizinde bağımsız değişkenin katsayısının 2,16 bulunması neyi ifade eder?

Cevap: B) Bağımsız değişkenin bağımlı değişken üzerindeki etkisinin bir birim artışla 2,16 birim arttığını gösterir.

Açıklama: Regresyon analizinde bağımsız değişkenin katsayısı, bağımsız değişkendeki bir birimlik artışın bağımlı değişkende ne kadar bir artışa neden olduğunu gösterir.

#17. Regresyon analizindeki eş varyanslık (homoscedasticity) kavramı ne anlama gelir?

Cevap: A) Hataların sabit bir varyansa sahip olduğunu

Açıklama: Homoscedasticity, hataların sabit bir varyansa sahip olduğu durumu ifade eder. Bu, regresyon analizinde önemli bir varsayımdır.

#18. kNN algoritmasının temel prensibi nedir?

Cevap: B) Komşuların çoğunluk oyunu kullanma

Açıklama: kNN (k-Nearest Neighbors) algoritması, bir veri noktasının sınıfını belirlerken en yakın komşularının çoğunluk oyunu kullanır. Bu komşuların sınıfları, yeni veri noktasının sınıfını belirler.

#19. I = {a, b, c, d, e} kümesinde {b, d} ögelerinin seyrek öge kümesi olduğu durumda aşağıdakilerden hangisi sık öge kümesinde yer alır?

9- I = {a, b, c, d, e} kümesinde {b, d} ögelerinin seyrek öge kümesi olduğu durumda aşağıdakilerden hangisi sık öge kümesinde yer alır?

A) {a, b, d}
B) {a, b, e}
C) {a, b, c, d}
D) {b, c, d, e}
E) {b, c, d, e}

Açıklama:

Seçeneklerin Değerlendirilmesi:

A) {a, b, d} — Yanlış çünkü {b, d} öğeleri seyrek öğe kümesinde.
B) {a, b, e} — Yanlış çünkü {b} öğesi seyrek öğe kümesinde.
C) {a, b, c, d} — Yanlış çünkü {b, d} öğeleri seyrek öğe kümesinde.
D) {b, c, d, e} — Yanlış çünkü {b, d} öğeleri seyrek öğe kümesinde.
E) {b, c, d, e} — Yanlış çünkü {b, d} öğeleri seyrek öğe kümesinde.

Sonuç:

Verilen seçeneklerin hiçbirinde doğru cevap bulunmamaktadır. Doğru cevap, sık öğe kümesinde yer alması gereken {a, c, e} kümesidir. Bu nedenle, sorunun kitapta verilen şekliyle hatalı olduğunu ve doğru cevabın seçenekler arasında yer almadığını belirtmek doğru olacaktır.

Öneri:

Kitapta verilen sorunun doğru cevabı seçeneklerde bulunmadığı için, bu durumu belirtmek ve kitabın ilgili kısmında düzeltme yapılması gerektiğini önermek en uygun yaklaşım olacaktır.

#20. Sınıflandırma görevi nedir?

Cevap: A) Bir nesneyi belirli bir kategoriye atama işlemi

Açıklama: Sınıflandırma, verileri belirli kategorilere ayırma işlemi olup, genellikle veri madenciliği ve makine öğrenimi alanında kullanılır.

TESTi BiTiR, PUANINI GÖR

SONUÇ

-

İstanbul Üniversitesi Açık ve Uzaktan Eğitim Fakültesi (Auzef)
Açık Öğretim Fakültesi
Bölüm : Yönetim Bilişim Sistemleri Lisans
4. Sınıf  Veri Madenciliği Bahar Dönemi
Auzef Veri Madenciliği Final Deneme Sınavı -9

İstanbul Üniversitesi Açık ve Uzaktan Eğitim Fakültesi (Auzef)
Açık Öğretim Fakültesi
Bölüm : Yönetim Bilişim Sistemleri Lisans
4. Sınıf  Veri Madenciliği Bahar Dönemi
Auzef Veri Madenciliği Final Deneme Sınavı -9

Share your score!
Tweet your score!
Share to other

HD Quiz powered by harmonic design

Auzef Veri Madenciliği Final Deneme Sınavı -9

İstanbul Üniversitesi Açık ve Uzaktan Eğitim Fakültesi (Auzef)
Açık Öğretim Fakültesi
Bölüm : Yönetim Bilişim Sistemleri Lisans
4. Sınıf  Veri Madenciliği Bahar Dönemi
Auzef Veri Madenciliği Final Deneme Sınavı -9

Auzef Veri Madenciliği Final Deneme Sınavı -9

Birliktelik Analizi – Ünite 9

Birliktelik analizi, büyük veri setlerinde öğeler arasındaki ilişkileri keşfetmek için kullanılan bir veri madenciliği tekniğidir. Bu analiz, özellikle pazarlama, perakende ve e-ticaret gibi alanlarda yaygın olarak kullanılır. Bu makalede, birliktelik analizi kavramları, Apriori algoritması ve destek-güven gibi temel metrikler ele alınacaktır.

1. Birliktelik Kuralları

Birliktelik kuralları, belirli bir öğenin veya öğe grubunun varlığının, başka bir öğenin varlığıyla ilişkili olduğunu gösterir. Örneğin, market sepeti analizinde, “Eğer müşteri süt alıyorsa, ekmek de alır” şeklindeki bir kural, birliktelik kuralıdır. Bu kurallar, veriler arasındaki gizli kalıpları ve ilişkileri ortaya çıkarır.

2. Destek ve Güven

Destek (Support): Belirli bir kuralın veri setinde ne sıklıkta ortaya çıktığını gösterir. Destek, kuralın genel geçerliliğini ve yaygınlığını belirler. Örneğin, “süt ve ekmek” kuralı, tüm işlemlerin %30’unda bulunuyorsa, desteği %30’dur.

Güven (Confidence): X öğesinin varlığında Y öğesinin bulunma olasılığını gösterir. Güven, kuralın doğruluğunu ve güvenilirliğini ölçer. Örneğin, “süt alındığında ekmek de alınıyor” kuralının güveni %70 ise, süt alan müşterilerin %70’i aynı zamanda ekmek de alır.

3. Apriori Algoritması

Apriori algoritması, birliktelik kurallarını bulmak için kullanılan temel algoritmalardan biridir. Bu algoritma, sık öge kümelerini keşfetmek için aşamalı bir yaklaşım kullanır ve destek tabanlı kesme yöntemini uygular.

Adımlar: Apriori algoritması, başlangıçta tek öğelerden oluşan öge kümelerini belirler ve ardından bu kümeleri genişleterek daha büyük sık öge kümelerini bulur. Bu süreç, belirli bir destek eşiğinin altındaki öge kümelerinin elenmesiyle devam eder.

Özellikler: Apriori algoritması, sık öge kümelerini bulmak için alt kümelerinin de sık olması gerektiği prensibini kullanır. Bu, algoritmanın verimli çalışmasını sağlar.

4. Uygulama Alanları

Birliktelik analizi, çeşitli sektörlerde geniş bir uygulama yelpazesine sahiptir:

Perakende: Market sepeti analizi ile müşteri alışveriş alışkanlıklarını belirlemek ve çapraz satış stratejileri geliştirmek.

E-ticaret: Ürün öneri sistemleri oluşturarak müşteri deneyimini ve satışları artırmak.

Pazarlama: Müşteri segmentasyonu yaparak hedeflenmiş pazarlama kampanyaları oluşturmak.

Sağlık: Hastalık ve tedavi yöntemleri arasındaki ilişkileri analiz etmek.

5. Destek ve Güven Tabanlı Kesme

Destek tabanlı kesme, yalnızca belirli bir destek eşiğinin üzerindeki öge kümelerinin dikkate alınmasını sağlar. Bu, gereksiz ve düşük frekanslı kuralların elenmesini kolaylaştırır. Güven tabanlı kesme ise belirli bir güven eşiğinin altındaki kuralların elenmesini sağlar, böylece daha güvenilir ve anlamlı kurallar elde edilir.

Sonuç

Birliktelik analizi, veri setlerindeki gizli kalıpları ve ilişkileri keşfetmek için güçlü bir araçtır. Apriori algoritması ve destek-güven metrikleri, bu ilişkilerin belirlenmesinde önemli rol oynar. Doğru uygulandığında, birliktelik analizi işletmelere değerli bilgiler sağlar ve stratejik kararlar alınmasına yardımcı olur.

Auzef Veri Madenciliği Final Deneme Sınavı -9

Birliktelik Analizi – Ünite 9

1- Birliktelik analizi için kullanılan destek ve güven oranları hangi bilgiyi sağlar?

A) Ürünlerin fiyat değişimlerini
B) Bir kuralın ne sıklıkta uygulandığını ve çıkarımın güvenilirliğini
C) Ürünlerin stok durumlarını
D) Bir ürünün popülerliğini
E) Reklam kampanyalarının etkisini

Cevap: B) Bir kuralın ne sıklıkta uygulandığını ve çıkarımın güvenilirliğini

Açıklama: Destek ve güven oranları, birliktelik kurallarının sıklığını ve bu kuralların güvenilirliğini ölçer. Destek, kuralın ne sıklıkta görüldüğünü; güven ise kuralın doğruluğunu gösterir.

2- Apriori prensibine göre, bir sık öge kümesinin alt kümeleri hakkında hangisi doğrudur?

A) Alt kümelerin hiçbiri sık olamaz
B) Sadece bir alt küme sık olabilir
C) Tüm alt kümeler sık olabilir
D) Yalnızca en büyük alt küme sık olabilir
E) Hiçbir alt küme sık olamaz

Cevap: C) Tüm alt kümeler sık olabilir

Açıklama: Apriori prensibine göre, bir sık öge kümesinin tüm alt kümeleri de sıktır. Bu, sık öge kümelerinin oluşturulmasında önemli bir temel oluşturur.

3- Apriori algoritmasının amacı nedir?

A) Veri setini düzenlemek
B) Minimum destek eşiğini belirlemek
C) Sık öge kümelerini bulmak
D) Güven tabanlı kesmeyi uygulamak
E) Kuralları görselleştirmek

Cevap: C) Sık öge kümelerini bulmak

Açıklama: Apriori algoritması, sık öge kümelerini bulmayı amaçlar. Bu, birliktelik kurallarının çıkarılmasında kullanılan temel bir adımdır.

4- Bir birliktelik kuralının desteği nedir?

A) Bir kuralın ne sıklıkta uygulandığını
B) X’i içeren işlemlerde X ve Y ögelerinin ne sıklıkta göründüğünü
C) X ve Y ögelerini içeren işlemlerin ne sıklıkta göründüğünü
D) Bir öge setini içeren işlem sayısı
E) Veri setindeki işlem genişliği

Cevap: C) X ve Y ögelerini içeren işlemlerin ne sıklıkta göründüğünü

Açıklama: Bir kuralın desteği, kuralı içeren işlemlerin toplam işlem sayısına oranıdır ve kuralın ne kadar yaygın olduğunu gösterir.

5- Bir birliktelik kuralının güveni nedir?

A) Bir kuralın ne sıklıkta uygulandığını
B) X’i içeren işlemlerde X ve Y ögelerinin ne sıklıkta göründüğünü
C) X ve Y ögelerini içeren işlemlerin ne sıklıkta göründüğünü
D) Bir öge setini içeren işlem sayısı
E) Veri setindeki işlem genişliği

Cevap: B) X’i içeren işlemlerde X ve Y ögelerinin ne sıklıkta göründüğünü

Açıklama: Bir kuralın güveni, X’i içeren işlemlerde X ve Y’nin birlikte görülme olasılığını ölçer ve kuralın doğruluğunu gösterir.

6- Destek tabanlı kesme neden önemlidir?

A) Tüm kuralları eler
B) Güveni artırır
C) Alt küme oluşturur
D) Kural kümesini bulur
E) Sık öge kümesini bulur

Cevap: E) Sık öge kümesini bulur

Açıklama: Destek tabanlı kesme, sık öge kümelerinin bulunmasında önemlidir. Yalnızca belirli bir destek eşiğinin üzerinde olan öge kümeleri sık öge kümeleri olarak kabul edilir.

7- Güven tabanlı kesme stratejisi hangi durumu ele alır?

A) Tüm kuralları eler
B) Güveni artırır
C) Alt küme oluşturur
D) Kural kümesini bulur
E) Sık öge kümesini bulur

Cevap: D) Kural kümesini bulur

Açıklama: Güven tabanlı kesme stratejisi, belirli bir güven eşiğinin üzerinde olan kural kümesini bulmayı amaçlar.

8- Aday öge kümesi sayısını azaltma ve karşılaştırmaların sayısını azaltma işlemleri hangi amaç için yapılır?

A) Gereksiz kuralları kesmek
B) Yüksek güvenli kurallar oluşturmak
C) Alt küme oluşturmak
D) Kurallar oluşturmak
E) Sık öge kümelerini oluşturmak

Cevap: E) Sık öge kümelerini oluşturmak

Açıklama: Aday öge kümesi sayısını ve karşılaştırmaların sayısını azaltma işlemleri, sık öge kümelerinin daha verimli bir şekilde bulunmasını sağlar.

9- I = {a, b, c, d, e} kümesinde {b, d} ögelerinin seyrek öge kümesi olduğu durumda aşağıdakilerden hangisi sık öge kümesinde yer alır?

A) {a, b}
B) {a, d}
C) {a, b, c}
D) {b, c, d}
E) {b, c, e}
9- I = {a, b, c, d, e} kümesinde {b, d} ögelerinin seyrek öge kümesi olduğu durumda aşağıdakilerden hangisi sık öge kümesinde yer alır?

A) {a, b, d}
B) {a, b, e}
C) {a, b, c, d}
D) {b, c, d, e}
E) {b, c, d, e}

Açıklama:

Seçeneklerin Değerlendirilmesi:

A) {a, b, d} — Yanlış çünkü \{b, d\} öğeleri seyrek öğe kümesinde.
B) {a, b, e} — Yanlış çünkü \{b\} öğesi seyrek öğe kümesinde.
C) {a, b, c, d} — Yanlış çünkü \{b, d\} öğeleri seyrek öğe kümesinde.
D) {b, c, d, e} — Yanlış çünkü \{b, d\} öğeleri seyrek öğe kümesinde.
E) {b, c, d, e} — Yanlış çünkü \{b, d\} öğeleri seyrek öğe kümesinde.

Sonuç:

Verilen seçeneklerin hiçbirinde doğru cevap bulunmamaktadır. Doğru cevap, sık öğe kümesinde yer alması gereken \{a, c, e\} kümesidir. Bu nedenle, sorunun kitapta verilen şekliyle hatalı olduğunu ve doğru cevabın seçenekler arasında yer almadığını belirtmek doğru olacaktır.

Öneri:

Kitapta verilen sorunun doğru cevabı seçeneklerde bulunmadığı için, bu durumu belirtmek ve kitabın ilgili kısmında düzeltme yapılması gerektiğini önermek en uygun yaklaşım olacaktır.

10- I = {a, b, c, d, e} kümesinden oluşturulan {a, b} → {d} kuralı düşük güven oranlı bir kuralsa aşağıdaki kurallardan hangisi düşük oranlı bir kuraldır?

A) {b} → {c}
B) {a} → {b}
C) {d} → {b}
D) {c} → {e}
E) {b} → {e}

Cevap: A) {b} → {c}

Açıklama: {a, b} → {d} kuralı düşük güven oranlı bir kuralsa, benzer şekilde {b} → {c} kuralı da düşük güven oranlı bir kural olabilir, çünkü aynı veri setinde benzer düşük güvenli ilişkiler ortaya çıkabilir.

Auzef Veri Madenciliği Final Deneme Sınavı -9

Yönetim Bilişim Sistemleri Lisans
Veri Madenciliği Yönetim Bilişim Sistemleri Lisans

Yönetim Bilişim Sistemleri Lisans

Auzef Yönetim Bilişim Sistemleri Lisans 4. Sınıf Bahar Dönemi 2024 Final Soruları ve Deneme Sınavları, 2024 Sınav Soruları

Editor

Editör

error: Kopyalamaya Karşı Korumalıdır!