auzefVeri MadenciliğiYönetim Bilişim Sistemleri

Veri Madenciliği Final Deneme Sınavı -6

Auzef Veri Madenciliği Final Deneme Sınavı -6

#1. Saçılım grafiği hangi tür ilişkileri görsel olarak göstermek için kullanılır?

Cevap: D) İki değişken arasındaki ilişkiler

Açıklama: Saçılım grafiği, iki değişken arasındaki ilişkileri ve bu ilişkinin yönünü ve gücünü görsel olarak göstermek için kullanılır.

#2. Hangi lojistik regresyon türü, "Kırmızı/Yeşil/Mavi" gibi sıralı kategorilere sahip bir yanıt değişkeni için kullanılır?

Cevap: B) Multinomial Lojistik Regresyon

Açıklama: Multinomial lojistik regresyon, sıralı olmayan kategorik sonuçlar için kullanılır, ancak sorudaki “Kırmızı/Yeşil/Mavi” gibi kategorilere sahip yanıt değişkeni için daha uygundur.

#3. Hangisi yapısal olmayan veri türüne örnektir?

Cevap: D) Ses dosyaları

Açıklama: Ses dosyaları yapısal olmayan veri türüdür.

#4. Apriori prensibine göre, bir sık öge kümesinin alt kümeleri hakkında hangisi doğrudur?

Cevap: C) Tüm alt kümeler sık olabilir

Açıklama: Apriori prensibine göre, bir sık öge kümesinin tüm alt kümeleri de sıktır. Bu, sık öge kümelerinin oluşturulmasında önemli bir temel oluşturur.

#5. Lojistik regresyonun doğrusal regresyondan farkı nedir?

Cevap: A) Olasılık tahminlerini sağlaması

Açıklama: Lojistik regresyon, olasılık tahminleri yapar ve bu nedenle ikili ve kategorik sonuçları modellemek için uygundur.

#6. Hangi adım, veri madenciliği sürecindeki en zahmetli ve zaman alıcı adımdır?

Cevap: E) Ön İşleme

Açıklama: Ön işleme, veri madenciliği sürecinde en zahmetli ve zaman alıcı adımdır.

#7. Bir birliktelik kuralının desteği nedir?

Cevap: C) X ve Y ögelerini içeren işlemlerin ne sıklıkta göründüğünü

Açıklama: Bir kuralın desteği, kuralı içeren işlemlerin toplam işlem sayısına oranıdır ve kuralın ne kadar yaygın olduğunu gösterir.

#8. Hangisi yapısal bir veri türüdür?

Cevap: E) İlişkisel veritabanlarındaki tablolar

Açıklama: İlişkisel veritabanlarındaki tablolar yapısal veri türüdür.

#9. Olasılıklar oranı neyi ifade eder?

Cevap: D) Bir olayın gerçekleşme olasılığının gerçekleşmeme olasılığına oranı

Açıklama: Olasılıklar oranı, bir olayın gerçekleşme olasılığının gerçekleşmeme olasılığına oranını ifade eder ve lojistik regresyonda önemli bir kavramdır.

#10. Aday öge kümesi sayısını azaltma ve karşılaştırmaların sayısını azaltma işlemleri hangi amaç için yapılır?<

Cevap: E) Sık öge kümelerini oluşturmak

Açıklama: Aday öge kümesi sayısını ve karşılaştırmaların sayısını azaltma işlemleri, sık öge kümelerinin daha verimli bir şekilde bulunmasını sağlar.

#11. Lojistik regresyonda en uygun eğriyi bulmak için hangi yöntem kullanılır?

Cevap: D) En Olası Tahmin Yöntemi

Açıklama: Lojistik regresyonda en uygun eğriyi bulmak için En Olası Tahmin (Maximum Likelihood Estimation) yöntemi kullanılır.

#12. I = {a, b, c, d, e} kümesinden oluşturulan {a, b} → {d} kuralı düşük güven oranlı bir kuralsa aşağıdaki kurallardan hangisi düşük oranlı bir kuraldır?

Cevap: A) {b} → {c}

Açıklama: {a, b} → {d} kuralı düşük güven oranlı bir kuralsa, benzer şekilde {b} → {c} kuralı da düşük güven oranlı bir kural olabilir, çünkü aynı veri setinde benzer düşük güvenli ilişkiler ortaya çıkabilir.

#13. Veri madenciliği ve makine öğrenimi ile ilgili aşağıdakilerden hangisi doğrudur?

Cevap: C) Veri setlerindeki örüntüleri keşfetmeyi hedefler.

Açıklama: Veri madenciliği ve makine öğrenimi, veri setlerindeki örüntüleri keşfetmeyi hedefler.

#14. Lojistik regresyonda, çıktı değişkeni 0 ile 1 arasında olan olasılık değerini ifade eder. Eğer bir modelin hesapladığı olasılık değeri 0.7 ise, bu durum neyi öngörür?

Cevap: A) Eşik değerin üzerinde olduğu için olayın gerçekleşme olasılığının yüksek olduğunu öngörür

Açıklama: Lojistik regresyonda, hesaplanan olasılık değeri belirli bir eşik değerin üzerinde ise, bu olayın gerçekleşme olasılığının yüksek olduğunu öngörür.

#15. Veri madenciliği sürecinde kullanılan modeller, hangi amaç(lar) için kullanılır? I. Veri setlerindeki gizli örüntüleri bulmak II. Çıktıları değerlendirmek III. Ön işleme IV. Tahmin yapmak

Cevap: B) I ve IV

Açıklama: Veri madenciliği sürecinde kullanılan modeller, veri setlerindeki gizli örüntüleri bulmak ve tahmin yapmak amacıyla kullanılır.

#16. Destek tabanlı kesme neden önemlidir?

Cevap: E) Sık öge kümesini bulur

Açıklama: Destek tabanlı kesme, sık öge kümelerinin bulunmasında önemlidir. Yalnızca belirli bir destek eşiğinin üzerinde olan öge kümeleri sık öge kümeleri olarak kabul edilir.

#17. Veri setindeki değerlerin yarısından fazlasını/ortasını belirten istatistik hangisidir?

Cevap: C) Medyan

Açıklama: Medyan, veri setindeki değerlerin ortasını belirten ve veri setini iki eşit parçaya bölen istatistiktir.

#18. Veri setindeki değerlerin ortalama etrafındaki yayılımı ölçen istatistik hangisidir?

Cevap: B) Varyans

Açıklama: Varyans, veri setindeki değerlerin ortalama etrafındaki yayılımını ölçer ve değerlerin ne kadar dağıldığını gösterir.

#19. Kök ve yaprak diyagramı hangi amaçla kullanılır?

Cevap: B) Sürekli verilerin dağılımını göstermek için

Açıklama: Kök ve yaprak diyagramı, sürekli verilerin dağılımını ve veri setindeki bireysel değerlerin frekansını görselleştirmek için kullanılır.

#20. Kutu grafiği hangi istatistikleri görsel olarak temsil eder?

Cevap: C) Çeyreklikler

Açıklama: Kutu grafiği, veri setindeki çeyreklikleri, medyanı ve olası aykırı değerleri görsel olarak temsil eder.

TESTi BiTiR, PUANINI GÖR

SONUÇ

-

İstanbul Üniversitesi Açık ve Uzaktan Eğitim Fakültesi (Auzef)
Açık Öğretim Fakültesi
Bölüm : Yönetim Bilişim Sistemleri Lisans
4. Sınıf  Veri Madenciliği Bahar Dönemi
Auzef Veri Madenciliği Final Deneme Sınavı -6

İstanbul Üniversitesi Açık ve Uzaktan Eğitim Fakültesi (Auzef)
Açık Öğretim Fakültesi
Bölüm : Yönetim Bilişim Sistemleri Lisans
4. Sınıf  Veri Madenciliği Bahar Dönemi
Auzef Veri Madenciliği Final Deneme Sınavı -6

Share your score!
Tweet your score!
Share to other

HD Quiz powered by harmonic design

Auzef Veri Madenciliği Final Deneme Sınavı -6

İstanbul Üniversitesi Açık ve Uzaktan Eğitim Fakültesi (Auzef)
Açık Öğretim Fakültesi
Bölüm : Yönetim Bilişim Sistemleri Lisans
4. Sınıf  Veri Madenciliği Bahar Dönemi
Auzef Veri Madenciliği Final Deneme Sınavı -6

Auzef Veri Madenciliği Final Deneme Sınavı -6

Tahmin Yöntemleri-2 – Ünite 6

Tahmin yöntemleri, verilerin analizi ve gelecekteki değerlerin tahmini için kullanılan önemli istatistiksel tekniklerdir. Bu yöntemler arasında lojistik regresyon, özellikle kategorik ve ikili sonuçlar üzerinde çalışmak için güçlü bir araçtır. Bu makalede, lojistik regresyon ve bazı temel kavramlar ele alınacaktır.

1. Lojistik Regresyon

Lojistik regresyon, bağımlı değişkenin ikili (binary) veya kategorik olduğu durumlarda kullanılan bir regresyon analizidir. Bu model, bağımsız değişkenlerin, belirli bir sonucun olasılığı üzerindeki etkilerini tahmin etmeyi sağlar. Lojistik regresyon modeli, sigmoid fonksiyonunu kullanarak çıktı değerini 0 ile 1 arasında bir olasılık olarak üretir.

2. Sigmoid Fonksiyonu

Sigmoid fonksiyonu, herhangi bir gerçel sayıyı 0 ile 1 arasında bir değere dönüştüren ve lojistik regresyon modelinde kullanılan bir matematiksel fonksiyondur. Bu fonksiyon, modelin olasılık tahminlerini sağlamasına yardımcı olur.

Matematiksel İfade: Sigmoid fonksiyonu, S(z) = 1 / (1 + e^-z) şeklinde ifade edilir. Burada z, bağımsız değişkenlerin ağırlıklandırılmış toplamını temsil eder.

Özellikler: Sigmoid fonksiyonu, girdiyi doğrusal olmayan bir şekilde dönüştürerek, çıktıların olasılık olarak yorumlanmasını sağlar.

3. Logit Dönüşümü

Logit dönüşümü, lojistik regresyon modelinde olasılıklar oranını (odds ratio) daha doğrusal ve düzgün bir şekilde modellemek için kullanılan bir yöntemdir. Bu dönüşüm, olasılık değerlerini logaritmik bir ölçekte temsil eder ve doğrusal regresyon ile benzer şekilde analiz yapmayı mümkün kılar.

4. Lojistik Regresyonun Avantajları

Olasılık Tahmini: Lojistik regresyon, belirli bir olayın gerçekleşme olasılığını tahmin eder ve bu, karar verme süreçlerinde faydalıdır.

Kategorik Verilerle Uyum: Kategorik ve ikili verilerle çalışmaya uygundur, bu nedenle sınıflandırma problemlerinde yaygın olarak kullanılır.

Esneklik: Hem sürekli hem de kategorik bağımsız değişkenlerle çalışabilir.

5. Lojistik Regresyonun Uygulama Alanları

Lojistik regresyon, çeşitli alanlarda geniş bir uygulama yelpazesine sahiptir:

Tıp ve Sağlık: Hastalıkların teşhisi ve tedavi sonuçlarının tahmini.

Pazarlama: Müşteri davranışlarını ve satın alma olasılıklarını tahmin etme.

Sosyal Bilimler: Anket sonuçlarını ve toplumsal eğilimleri analiz etme.

Finans: Kredi riskini değerlendirme ve yatırım kararlarını destekleme.

6. Modelin Değerlendirilmesi

Lojistik regresyon modelinin doğruluğunu ve geçerliliğini değerlendirmek için çeşitli yöntemler kullanılır:

Confusion Matrix (Karmaşıklık Matrisi): Modelin doğru ve yanlış sınıflandırmalarını özetler.

ROC Eğrisi: Modelin doğruluğunu grafiksel olarak temsil eder.

AUC (Area Under the Curve): ROC eğrisinin altındaki alanı ölçer ve modelin genel performansını değerlendirir.

Sonuç

Lojistik regresyon, özellikle kategorik ve ikili sonuçlar üzerinde çalışan güçlü bir tahmin yöntemidir. Doğru uygulandığında, lojistik regresyon modelleri çeşitli alanlarda değerli bilgiler sağlar ve karar verme süreçlerini destekler. Bu yöntem, olasılık tahminleri ve sınıflandırma problemleri için ideal bir araçtır.

Auzef Veri Madenciliği Final Deneme Sınavı -6

Tahmin Yöntemleri-2 – Ünite 6

1- Lojistik regresyon, hangi tür veri setleri üzerinde çalışmaya daha uygundur?

A) Yalnızca sürekli değerler
B) Sürekli veya kategorik değerler
C) Yalnızca ordinal değerler
D) Kategorik ve ikili sonuçlar
E) Sadece nominal değerler

Cevap: D) Kategorik ve ikili sonuçlar

Açıklama: Lojistik regresyon, özellikle kategorik ve ikili (binary) sonuçlar için uygundur, bu nedenle sınıflandırma problemlerinde yaygın olarak kullanılır.

2- Lojistik regresyonun doğrusal regresyondan farkı nedir?

A) Olasılık tahminlerini sağlaması
B) Kategorik değişkenlerin modellemesine uygun olmaması
C) Doğrusal fonksiyonlar kullanmaması
D) Lojistik ve taşıma alanında uygulanması
E) Doğrusal terimlerin eksik olması

Cevap: A) Olasılık tahminlerini sağlaması

Açıklama: Lojistik regresyon, olasılık tahminleri yapar ve bu nedenle ikili ve kategorik sonuçları modellemek için uygundur.

3- Doğrusal regresyonun ikili sonuçlar için uygun olmamasının nedeni nedir?

A) İkili sonuçların doğrusal olmayan doğasını göz ardı etmesi
B) Hata terimlerinin sabit varyansa sahip olması
C) Sürekli değerler yerine kategorik çıktılar üretmesi
D) Değişen varyansın varsayım ihlali yapması
E) Lojistik regresyonun kullanımını zorunlu kılması

Cevap: A) İkili sonuçların doğrusal olmayan doğasını göz ardı etmesi

Açıklama: Doğrusal regresyon, ikili sonuçların doğrusal olmayan doğasını göz ardı eder, bu yüzden bu tür veriler için lojistik regresyon daha uygundur.

4- Hangi lojistik regresyon türü, “Kırmızı/Yeşil/Mavi” gibi sıralı kategorilere sahip bir yanıt değişkeni için kullanılır?

A) Binomial Lojistik Regresyon
B) Multinomial Lojistik Regresyon
C) Ordinal Lojistik Regresyon
D) Çoklu Değişkenli Lojistik Regresyon
E) Hiçbiri, sıralı kategorilere uygun bir regresyon türü yok

Cevap: B) Multinomial Lojistik Regresyon

Açıklama: Multinomial lojistik regresyon, sıralı olmayan kategorik sonuçlar için kullanılır, ancak sorudaki “Kırmızı/Yeşil/Mavi” gibi kategorilere sahip yanıt değişkeni için daha uygundur.

5- Sigmoid fonksiyonunun temel özelliklerinden biri nedir?

A) Doğrusal bir çıktı üretir
B) Herhangi bir gerçel sayıyı 0 ile 1 arasında bir değere dönüştürür
C) Negatif sayılar için sonsuzluğa yakınsar
D) Pozitif girdiler için 2’ye yakınsar
E) Türevi sabit bir değere sahiptir

Cevap: B) Herhangi bir gerçel sayıyı 0 ile 1 arasında bir değere dönüştürür

Açıklama: Sigmoid fonksiyonu, giriş değerini 0 ile 1 arasında bir olasılık değerine dönüştürür, bu nedenle lojistik regresyon modellerinde kullanılır.

6- Olasılıklar oranı neyi ifade eder?

A) Bir olayın gerçekleşmeme olasılığının gerçekleşme olasılığına oranı
B) Bir olayın gerçekleşme olasılığı
C) Tahmin edicideki bir birim değişiklikten sonraki olasılıkların orijinal olasılıklara oranı
D) Bir olayın gerçekleşme olasılığının gerçekleşmeme olasılığına oranı
E) İki bağımsız değişkenin gerçekleşme olasılıklarının oranı

Cevap: D) Bir olayın gerçekleşme olasılığının gerçekleşmeme olasılığına oranı

Açıklama: Olasılıklar oranı, bir olayın gerçekleşme olasılığının gerçekleşmeme olasılığına oranını ifade eder ve lojistik regresyonda önemli bir kavramdır.

7- Hangisi Logaritmik dönüşüm yapılma gerekçesi değildir?

A) Doğrusal bir ilişki elde etmek için
B) Orijinal verilerin yorumlanmasını kolaylaştırmak için
C) Modelin performansını değerlendirmek için
D) Veri normal dağılıma sahip olduğu için
E) Modelin eğitimini kolaylaştırmak için

Cevap: D) Veri normal dağılıma sahip olduğu için

Açıklama: Logaritmik dönüşüm genellikle verileri normal dağılıma yaklaştırmak için yapılır, bu nedenle veri zaten normal dağılıma sahipse bu dönüşüm gerekli değildir.

8- Lojistik regresyonda en uygun eğriyi bulmak için hangi yöntem kullanılır?

A) Ortalama Kareler Hatası
B) R-Kare
C) En Küçük Kareler Yöntemi
D) En Olası Tahmin Yöntemi
E) Doğrusal Dönüşüm

Cevap: D) En Olası Tahmin Yöntemi

Açıklama: Lojistik regresyonda en uygun eğriyi bulmak için En Olası Tahmin (Maximum Likelihood Estimation) yöntemi kullanılır.

9- Logit dönüşümü, lojistik regresyon modelinde hangi olasılık değerini daha doğrusal ve düzgün bir şekilde modellemeyi sağlar?

A) Olasılıklar oranını (odds ratio)
B) Toplam olasılığı
C) Gerçekleşme olasılığını
D) Mutlak olasılığı
E) Ortalama olasılığı

Cevap: A) Olasılıklar oranını (odds ratio)

Açıklama: Logit dönüşümü, olasılıklar oranını (odds ratio) daha doğrusal ve düzgün bir şekilde modellemeyi sağlar.

10- Lojistik regresyonda, çıktı değişkeni 0 ile 1 arasında olan olasılık değerini ifade eder. Eğer bir modelin hesapladığı olasılık değeri 0.7 ise, bu durum neyi öngörür?

A) Eşik değerin üzerinde olduğu için olayın gerçekleşme olasılığının yüksek olduğunu öngörür
B) Olayın hiç gerçekleşmeyeceğini öngörür
C) Modelin yanlış olduğunu gösterir
D) Modelin kararsız olduğunu gösterir
E) Eşik değerin altında olduğu için olayın gerçekleşme olasılığının düşük olduğunu öngörür

Cevap: A) Eşik değerin üzerinde olduğu için olayın gerçekleşme olasılığının yüksek olduğunu öngörür

Açıklama: Lojistik regresyonda, hesaplanan olasılık değeri belirli bir eşik değerin üzerinde ise, bu olayın gerçekleşme olasılığının yüksek olduğunu öngörür.

 

 

Auzef Veri Madenciliği Final Deneme Sınavı -6

 

Yönetim Bilişim Sistemleri Lisans
Veri Madenciliği Yönetim Bilişim Sistemleri Lisans

Yönetim Bilişim Sistemleri Lisans

Auzef Yönetim Bilişim Sistemleri Lisans 4. Sınıf Bahar Dönemi 2024 Final Soruları ve Deneme Sınavları

Editor

Editör

error: Kopyalamaya Karşı Korumalıdır!