auzefVeri MadenciliğiYönetim Bilişim Sistemleri

Veri Madenciliği Final Deneme Sınavı -10

Auzef Veri Madenciliği Final Soruları Deneme Sınavı -10

#1. Regresyon analizinde kullanılan en küçük kareler yöntemi neyi amaçlar?

Cevap: B) Gerçek ve tahmin edilen değerler arasındaki farkı en aza indirmeyi

Açıklama: En küçük kareler yöntemi, tahmin edilen değerler ile gerçek değerler arasındaki farkların karelerinin toplamını en aza indirmeyi amaçlar.

#2. Nesnelerin birden fazla kümeye ait olabileceği kümeleme türü hangisidir?

Cevap: E) Örtüşen Kümeleme

Açıklama: Örtüşen kümeleme, nesnelerin birden fazla kümeye ait olabileceği kümeleme türüdür. Bu sayede veri noktaları birden fazla kümeye dahil olabilir.

#3. SOM'un (Kendi Kendini Düzenleyen Haritalar) eğitim süreci nasıl işler?

Cevap: B) Rekabetçi öğrenme kullanarak ağırlıkları günceller.

Açıklama: SOM’un eğitim süreci, rekabetçi öğrenme kullanarak ağırlıkları günceller ve verileri düşük boyutlu bir haritaya projekte eder.

#4. Reklam için harcanan miktara bağlı olarak bir ürünün satışlarını tahmin etmek istediğimizi varsayalım. - 200'lük bir satış miktarı elde etmek için kaç TL harcanmalıdır?

Cevap: C) 128

Açıklama: Regresyon denklemi Y = 66,86 1,04X olduğuna göre, 200 = 66,86 1,04X denklemini çözerek X’i buluruz: X ≈ 128 TL olacaktır.

#5. Öznitelik ayrıklaştırması aşağıdakilerden hangisini içerir?

Cevap: B) Sürekli bir değişkenin kategorik bir değişkene dönüştürülmesi

Açıklama: Öznitelik ayrıklaştırması, sürekli bir değişkenin belirli aralıklara veya kategorilere dönüştürülmesini içerir.

#6. Ağaç yapısında alt kümeler oluşturan kümeleme türü hangisidir?

Cevap: C) Hiyerarşik Kümeleme

Açıklama: Hiyerarşik kümeleme, veriyi ağaç yapısında alt kümelere böler ve bu sayede farklı seviyelerdeki alt kümeler oluşturur.

#7. Bir veri madenciliği analizi için ihtiyacımız olan tüm verileri toplamak ve işlemek için yeterli zamanımız olmadığında, örneklem büyüklüğü nasıl belirlenir?

Cevap: C) Uyarlanabilir örneklemeyle

Açıklama: Uyarlanabilir örnekleme, sınırlı zaman ve kaynaklarla veri toplama ve işleme işlemini optimize etmek için kullanılır.

#8. Aşağıdaki tabloda bir veri setinde değişkenler arasındaki korelasyon katsayıları verilmiştir. Buna göre ifadelerden hangileri doğrudur? - I. Y değişkeni ile X1 arasında güçlü bir ilişki vardır. - II. Y değişkeni ile X2 arasında doğrusal bir ilişki yoktur. - III. Y değişkeni ile X3 arasında negatif yönlü bir ilişki vardır. - IV. X1 ve X2 arasında güçlü bir pozitif ilişki bulunmaktadır. - V. X2 değişkeni ile X3 arasında negatif bir ilişki vardır.

Cevap: C) I-III

Açıklama: Y değişkeni ile X1 arasında güçlü bir pozitif ilişki (0,997) ve Y değişkeni ile X3 arasında zayıf bir negatif ilişki (-0,038) vardır. X1 ve X2 arasında doğrudan bir korelasyon katsayısı verilmemiştir.

#9. Doğrusal regresyonun ikili sonuçlar için uygun olmamasının nedeni nedir?

Cevap: A) İkili sonuçların doğrusal olmayan doğasını göz ardı etmesi

Açıklama: Doğrusal regresyon, ikili sonuçların doğrusal olmayan doğasını göz ardı eder, bu yüzden bu tür veriler için lojistik regresyon daha uygundur.

#10. Katmanlı (stratified) örnekleme hangi durumda kullanılır?

Cevap: A) Tüm nesne tiplerini yeterince temsil etmeyen durumlarda

Açıklama: Katmanlı örnekleme, tüm nesne tiplerinin yeterince temsil edilmediği durumlarda kullanılır, böylece her bir kategoriye ait veri temsil edilir.

#11. Hangi yaklaşım özniteliklerin, veri madenciliği algoritması çalıştırılmadan önce, veri madenciliği görevinden bağımsız bir şekilde seçilmesini benimser?

Cevap: A) Filtre yaklaşım

Açıklama: Filtre yaklaşım, özniteliklerin veri madenciliği görevinden bağımsız olarak seçilmesini benimser ve bu sayede daha genel ve esnek bir seçim süreci sağlar.

#12. Lojistik regresyon, hangi tür veri setleri üzerinde çalışmaya daha uygundur?

Cevap: D) Kategorik ve ikili sonuçlar

Açıklama: Lojistik regresyon, özellikle kategorik ve ikili (binary) sonuçlar için uygundur, bu nedenle sınıflandırma problemlerinde yaygın olarak kullanılır.

#13. DBSCAN algoritmasında kullanılan epsilon (ε) nedir?

Cevap: B) Yoğunluk eşiği

Açıklama: Epsilon (ε), DBSCAN algoritmasında yoğunluk eşiği olarak kullanılır ve bir veri noktasının komşuluğunu belirler.

#14. Reklam için harcanan miktara bağlı olarak bir ürünün satışlarını tahmin etmek istediğimizi varsayalım. - Bağımsız değişkenin katsayısı (b) kaçtır?

Cevap: B) 1,04

Açıklama: Bağımsız değişkenin katsayısı (b), bağımsız değişkendeki bir birimlik artışın bağımlı değişkende 1,04 birimlik bir artışa neden olduğunu gösterir.

#15. Sigmoid fonksiyonunun temel özelliklerinden biri nedir?

Cevap: B) Herhangi bir gerçel sayıyı 0 ile 1 arasında bir değere dönüştürür

Açıklama: Sigmoid fonksiyonu, giriş değerini 0 ile 1 arasında bir olasılık değerine dönüştürür, bu nedenle lojistik regresyon modellerinde kullanılır.

#16. Bir regresyon modelinde bağımlı değişken ile bir bağımsız değişken arasında bulunan katsayı (b) 2, sabit terim (a) ise 5 olarak bulunmuştur. Bu durumda, bağımlı değişkenin değeri 4 olduğunda tahmini sonuç ne olur?

Cevap: B) 13

Açıklama: Regresyon denklemi Y = a bX olduğuna göre, Y = 5 2(4) = 13 olacaktır.

#17. Logit dönüşümü, lojistik regresyon modelinde hangi olasılık değerini daha doğrusal ve düzgün bir şekilde modellemeyi sağlar?

Cevap: A) Olasılıklar oranını (odds ratio)

Açıklama: Logit dönüşümü, olasılıklar oranını (odds ratio) daha doğrusal ve düzgün bir şekilde modellemeyi sağlar.

#18. Z-Skor Normalizasyonu nedir?

Cevap: D) Değerleri ortalaması 0 ve standart sapması 1 olacak şekilde dönüştürme

Açıklama: Z-skor normalizasyonu, verileri ortalaması 0 ve standart sapması 1 olacak şekilde dönüştürerek, farklı ölçeklerdeki verilerin karşılaştırılmasını kolaylaştırır.

#19. K-ortalamalar kümeleme yönteminde, veri noktalarının kümelere atanmasında hangi kritere göre karar verilir?

Cevap: B) Küme merkezine olan uzaklığa göre

Açıklama: K-ortalamalar kümeleme yönteminde, veri noktalarının kümelere atanmasında küme merkezine olan uzaklığa göre karar verilir.

#20. Hangisi Logaritmik dönüşüm yapılma gerekçesi değildir?

Cevap: D) Veri normal dağılıma sahip olduğu için

Açıklama: Logaritmik dönüşüm genellikle verileri normal dağılıma yaklaştırmak için yapılır, bu nedenle veri zaten normal dağılıma sahipse bu dönüşüm gerekli değildir.

TESTi BiTiR, PUANINI GÖR

SONUÇ

-

İstanbul Üniversitesi Açık ve Uzaktan Eğitim Fakültesi (Auzef)
Açık Öğretim Fakültesi
Bölüm : Yönetim Bilişim Sistemleri Lisans
4. Sınıf  Veri Madenciliği Bahar Dönemi
Auzef Veri Madenciliği Final Soruları Deneme Sınavı -10

İstanbul Üniversitesi Açık ve Uzaktan Eğitim Fakültesi (Auzef)
Açık Öğretim Fakültesi
Bölüm : Yönetim Bilişim Sistemleri Lisans
4. Sınıf  Veri Madenciliği Bahar Dönemi
Auzef Veri Madenciliği Final Soruları Deneme Sınavı -10

Share your score!
Tweet your score!
Share to other

HD Quiz powered by harmonic design

Auzef Veri Madenciliği Final Soruları Deneme Sınavı -10

İstanbul Üniversitesi Açık ve Uzaktan Eğitim Fakültesi (Auzef)
Açık Öğretim Fakültesi
Bölüm : Yönetim Bilişim Sistemleri Lisans
4. Sınıf  Veri Madenciliği Bahar Dönemi
Auzef Veri Madenciliği Final Soruları Deneme Sınavı -10

Auzef Veri Madenciliği Final Soruları Deneme Sınavı -10

Metin Madenciliği – Ünite 10

Metin madenciliği, yapılandırılmamış metinsel verilerden anlamlı bilgiler elde etmek için kullanılan bir veri analiz yöntemidir. Bu teknik, özellikle büyük veri setlerinde gizli kalıpları ve ilişkileri ortaya çıkarmak için kullanılır. Metin madenciliği, doğal dil işleme (NLP), duygu analizi ve gizli anlam çözümlemesi (LSA) gibi çeşitli yöntemleri içerir.

1. Metin Madenciliğinin Temel Adımları

Metin madenciliği süreci, genellikle birkaç temel adımdan oluşur:

Metin Ön İşleme: Bu adım, metni analiz için hazırlamak amacıyla yapılır. Gereksiz kelimelerin (stopwords) kaldırılması, küçük harfe dönüştürme ve noktalama işaretlerinin çıkarılması gibi işlemler içerir.

Tokenizasyon: Metni, kelime veya cümle gibi daha küçük parçalara böler. Bu adım, metnin daha kolay analiz edilmesini sağlar.

Özellik Mühendisliği: Metni sayısal formata dönüştürmek için çeşitli özellikler ekler. Bu, metnin istatistiksel modellerle analiz edilmesini mümkün kılar.

Model Oluşturma: Analiz yapılacak modellerin oluşturulması ve eğitilmesi sürecidir. Bu adım, metinden elde edilen özellikleri kullanarak tahmin ve sınıflandırma yapar.

2. Doğal Dil İşleme (NLP)

Doğal dil işleme, insan dilini bilgisayarların anlaması ve işlemesi için kullanılan bir yapay zeka teknolojisidir. NLP, metin madenciliğinin bir alt alanıdır ve kelime türü etiketleme, cümle bölümlendirme ve anlamsal analiz gibi zorlukları içerir. Bu teknikler, metinden anlam çıkarma ve metinleri kategorilere ayırma gibi işlemler için kullanılır.

3. Duygu Analizi

Duygu analizi, metin verilerindeki duygusal tonları belirlemeye yönelik bir tekniktir. Bu yöntem, genellikle müşteri geri bildirimleri, sosyal medya gönderileri ve ürün incelemeleri gibi metinlerde kullanılır. Duygu analizi, metinleri pozitif, negatif veya nötr duygusal kategorilere ayırarak, kullanıcıların duygusal tepkilerini anlamaya yardımcı olur.

4. Gizli Anlam Çözümlemesi (LSA)

Gizli anlam çözümlemesi, metin kümesindeki ana fikirleri çıkarmak ve temsil etmek için kullanılan bir istatistiksel yöntemdir. LSA, metinlerdeki anlamsal yapıyı keşfetmek ve anlamsal olarak bağlantılı kelimeleri gruplandırmak için kullanılır. Bu yöntem, büyük metin veri setlerinde anahtar kavramları ve ilişkileri belirlemek için oldukça etkilidir.

5. Gizli Dirichlet Analizi (LDA)

Gizli Dirichlet Analizi, konu modelleme için yaygın olarak kullanılan bir olasılık temelli modelleme tekniğidir. LDA, metinlerdeki gizli konuları keşfetmek ve bu konuları temsil eden kelime gruplarını belirlemek için kullanılır. Bu teknik, özellikle büyük ve karmaşık metin veri setlerinde anlamlı konuları belirlemek için etkilidir.

Sonuç

Metin madenciliği, yapılandırılmamış metinsel verilerden değerli bilgiler elde etmek için güçlü bir araçtır. Doğru tekniklerin ve yöntemlerin uygulanması, büyük veri setlerindeki gizli kalıpları ve ilişkileri ortaya çıkararak, işletmelere stratejik kararlar alırken önemli bilgiler sağlar. Metin madenciliği, veri analitiği ve yapay zeka alanlarında önemli bir rol oynar ve çeşitli uygulama alanlarına sahiptir.

Auzef Veri Madenciliği Final Soruları Deneme Sınavı -10

Metin Madenciliği – Ünite 10

1- Metin analitiği ile ilgili olarak aşağıdakilerden hangisi yanlıştır?

A) Yapılandırılmamış metinsel veriyi anlamak ve bilgi çıkarmayı hedefler.
B) Metin madenciliğini içinde barındırır.
C) Müşteri geri bildirimleri üzerinde etkili bir şekilde çalışır.
D) Nominal veri türleriyle sınırlıdır.
E) Metin verilerini anlamak için özel teknikleri içerir.

Cevap: D) Nominal veri türleriyle sınırlıdır.

Açıklama: Metin analitiği, yalnızca nominal veri türleriyle sınırlı değildir; yapılandırılmamış metinsel veriyi anlamak ve bilgi çıkarmak için çeşitli veri türlerini kullanır.

2- Aşağıdaki durumlardan hangisi metin analitiği ile ilgili değildir?

A) Anahtar kelime çıkarma
B) Bilgi çıkarma
C) Hava durumu tahmini
D) Veri madenciliği
E) İlgili belge arama

Cevap: C) Hava durumu tahmini

Açıklama: Hava durumu tahmini, metin analitiği ile ilgili değildir. Metin analitiği, yapılandırılmamış metinsel verilerden anlam ve bilgi çıkarma ile ilgilidir.

3- Metin madenciliği ile ilgili olarak hangisi yanlıştır?

A) Tokenizasyon metni belirli parçalara böler.
B) Özellik mühendisliği, metni sayısal formata dönüştürmek için özellikler ekler.
C) Model oluşturma, metni analiz etmek için kullanılan bir adımdır.
D) Doğal dil işlemede yapılanları kapsar.
E) Metin verilerini anlamak için özel teknikleri içermez.

Cevap: D) Doğal dil işlemede yapılanları kapsar.

Açıklama: Metin madenciliği, yapılandırılmamış metin verilerini analiz etmek ve bu verilerden anlamlı bilgileri çıkarmak için kullanılan bir tekniktir. Metin madenciliği adımları arasında metnin belirli parçalara bölünmesi (tokenizasyon), metin verilerinin sayısal formata dönüştürülmesi için özellikler eklenmesi (özellik mühendisliği) ve model oluşturma gibi işlemler yer alır. Doğal dil işleme (NLP) ise, metin madenciliğinin önemli bir bileşeni olarak kabul edilmekle birlikte, metin madenciliği doğrudan NLP’de yapılan tüm işlemleri kapsamaz. Bu nedenle, “Doğal dil işlemede yapılanları kapsar” ifadesi yanlıştır. Metin madenciliği, metin verilerini anlamak için özel teknikleri içerir ve bu teknikler, doğal dil işlemenin ötesine geçerek metin verilerinden anlamlı bilgileri çıkarmaya odaklanır

4- Metin madenciliği adımları arasında hangisi metni belirli parçalara böler?

A) Metin ön işleme
B) Model oluşturma
C) Özellik mühendisliği
D) Tokenizasyon
E) Doğal Dil İşleme

Cevap: D) Tokenizasyon

Açıklama: Tokenizasyon, metni belirli parçalara, genellikle kelimelere veya cümlelere bölen bir adımdır.

5- Metin madenciliği hangi adımda gürültüyü azaltarak veri kalitesini artırmayı amaçlar?

A) Model oluşturma
B) Tokenizasyon
C) Özellik mühendisliği
D) Metin ön işleme
E) Doğal dil işleme

Cevap: D) Metin ön işleme

Açıklama: Metin ön işleme, metin madenciliği sürecinde gürültüyü azaltarak veri kalitesini artırmayı amaçlar. Bu adım, veriyi temizlemek ve analiz için hazırlamak için önemlidir.

6- Doğal dil işleme (NLP) ile ilgili olarak hangisi doğrudur?

A) Sadece sayısal verilerle çalışır.
B) İnsan dilini bilgisayar programlarının anlaması için bir yöntem içermez.
C) Metin madenciliğinin bir alt alanıdır.
D) Kelime türü etiketleme, metin bölümleme gibi zorlukları içerir.
E) Yalnızca yapılandırılmış metinsel veriyi analiz eder.

Cevap: D) Kelime türü etiketleme, metin bölümleme gibi zorlukları içerir.

Açıklama: Doğal dil işleme (NLP), kelime türü etiketleme ve metin bölümleme gibi zorlukları içerir ve insan dilini bilgisayar programlarının anlaması için çeşitli yöntemler içerir.

7- Duygu analizi neyi amaçlar?

A) Metin verilerini sadece sayısal formata dönüştürmeyi
B) Pozitif, negatif veya nötr duygusal kategorilere ayırmayı
C) Sadece finansal verileri analiz etmeyi
D) Tokenizasyon işlemini gerçekleştirmeyi
E) Metin ön işleme adımını atlamayı

Cevap: B) Pozitif, negatif veya nötr duygusal kategorilere ayırmayı

Açıklama: Duygu analizi, metin verilerini pozitif, negatif veya nötr duygusal kategorilere ayırmayı amaçlar.

8- Hangi durum, duygu analizi için en uygun bir uygulama alanıdır?

A) Meteorolojik verilerin analizi
B) Hisse senedi piyasası tahminleri
C) Yemek tariflerinin sınıflandırılması
D) İç organların anatomik incelemesi
E) Galaksiler arası uzaklık ölçümleri

Cevap: C) Yemek tariflerinin sınıflandırılması

Açıklama: Duygu analizi, metin verilerinde ifade edilen duygusal tonları belirleme sürecidir ve genellikle müşteri yorumları, sosyal medya paylaşımları veya ürün incelemeleri gibi metinlerin duygusal yönlerini anlamak için kullanılır. Ancak, duygu analizi sadece ticari uygulamalarla sınırlı değildir. Yemek tariflerinin sınıflandırılması, insanların tariflere karşı duygusal tepkilerini analiz etmeyi ve hangi tariflerin daha çok beğenildiğini anlamayı içerir. Bu tür analiz, tariflerin popülerliğini belirlemede ve kullanıcıların hangi tür tariflere daha fazla ilgi gösterdiğini anlamada kullanılabilir

9- Gizli anlam çözümlemesi (LSA) nedir?

A) Bir dilin kökenini inceleyen bir dilbilim teorisidir.
B) Bir metin kümesindeki ana fikirleri çıkarmak ve temsil etmek için kullanılan bir istatistiksel yöntemdir.
C) Bir belgenin anlamını yorumlamak için kullanılan bir dil işleme tekniğidir.
D) Yalnızca kelime frekansını değil, aynı zamanda metindeki yazım hatalarını düzeltir.
E) LSA, anlamsal olarak bağlantılı kelimeleri gruplandırmak için kullanılan bir semantik ağdır.

Cevap: B) Bir metin kümesindeki ana fikirleri çıkarmak ve temsil etmek için kullanılan bir istatistiksel yöntemdir.

Açıklama: Gizli anlam çözümlemesi (LSA), bir metin kümesindeki ana fikirleri çıkarmak ve temsil etmek için kullanılan bir istatistiksel yöntemdir.

10- Gizli dirichlet analizi ne işe yarar?

A) Konu modelleme için yaygın olarak kullanılan bir olasılık temelli modelleme tekniğidir.
B) Çevrimiçi alışverişlerde öneri sistemlerini güçlendiren bir algoritmadır.
C) Görüntü tanıma problemlerinde kullanılan bir derin öğrenme modelidir.
D) Konum tabanlı hizmetlerde harita oluşturmak için kullanılır.
E) Genetik algoritmaları temsil etmek için kullanılan bir modelleme tekniğidir.

Cevap: A) Konu modelleme için yaygın olarak kullanılan bir olasılık temelli modelleme tekniğidir.

Açıklama: Gizli Dirichlet Analizi (LDA), konu modelleme için yaygın olarak kullanılan bir olasılık temelli modelleme tekniğidir. Bu teknik, metin verilerindeki gizli konuları keşfetmek için kullanılır.

Auzef Veri Madenciliği Final Soruları Deneme Sınavı -10

Yönetim Bilişim Sistemleri Lisans
Veri Madenciliği Yönetim Bilişim Sistemleri Lisans

Yönetim Bilişim Sistemleri Lisans

Auzef Yönetim Bilişim Sistemleri Lisans 4. Sınıf Bahar Dönemi Final Soruları ve Deneme Sınavları, 2024 Sınav Soruları

Editor

Editör

error: Kopyalamaya Karşı Korumalıdır!