Auzef Veri Madenciliği Final Soruları Deneme Sınavı -10

Veri Madenciliği Final Deneme Sınavı -10

Haziran 14, 2024

Auzef Veri Madenciliği Final Soruları Deneme Sınavı -10

İstanbul Üniversitesi Açık ve Uzaktan Eğitim Fakültesi (Auzef) Açık Öğretim Fakültesi Bölüm : Yönetim Bilişim Sistemleri Lisans 4. Sınıf Veri Madenciliği Bahar Dönemi Auzef Veri Madenciliği Final Soruları Deneme Sınavı -10

Auzef Veri Madenciliği Final Soruları Deneme Sınavı -10

Metin Madenciliği – Ünite 10

Metin madenciliği, yapılandırılmamış metinsel verilerden anlamlı bilgiler elde etmek için kullanılan bir veri analiz yöntemidir. Bu teknik, özellikle büyük veri setlerinde gizli kalıpları ve ilişkileri ortaya çıkarmak için kullanılır. Metin madenciliği, doğal dil işleme (NLP), duygu analizi ve gizli anlam çözümlemesi (LSA) gibi çeşitli yöntemleri içerir.

1. Metin Madenciliğinin Temel Adımları

Metin madenciliği süreci, genellikle birkaç temel adımdan oluşur:

Metin Ön İşleme: Bu adım, metni analiz için hazırlamak amacıyla yapılır. Gereksiz kelimelerin (stopwords) kaldırılması, küçük harfe dönüştürme ve noktalama işaretlerinin çıkarılması gibi işlemler içerir.

Tokenizasyon: Metni, kelime veya cümle gibi daha küçük parçalara böler. Bu adım, metnin daha kolay analiz edilmesini sağlar.

Özellik Mühendisliği: Metni sayısal formata dönüştürmek için çeşitli özellikler ekler. Bu, metnin istatistiksel modellerle analiz edilmesini mümkün kılar.

Model Oluşturma: Analiz yapılacak modellerin oluşturulması ve eğitilmesi sürecidir. Bu adım, metinden elde edilen özellikleri kullanarak tahmin ve sınıflandırma yapar.

2. Doğal Dil İşleme (NLP)

Doğal dil işleme, insan dilini bilgisayarların anlaması ve işlemesi için kullanılan bir yapay zeka teknolojisidir. NLP, metin madenciliğinin bir alt alanıdır ve kelime türü etiketleme, cümle bölümlendirme ve anlamsal analiz gibi zorlukları içerir. Bu teknikler, metinden anlam çıkarma ve metinleri kategorilere ayırma gibi işlemler için kullanılır.

3. Duygu Analizi

Duygu analizi, metin verilerindeki duygusal tonları belirlemeye yönelik bir tekniktir. Bu yöntem, genellikle müşteri geri bildirimleri, sosyal medya gönderileri ve ürün incelemeleri gibi metinlerde kullanılır. Duygu analizi, metinleri pozitif, negatif veya nötr duygusal kategorilere ayırarak, kullanıcıların duygusal tepkilerini anlamaya yardımcı olur.

4. Gizli Anlam Çözümlemesi (LSA)

Gizli anlam çözümlemesi, metin kümesindeki ana fikirleri çıkarmak ve temsil etmek için kullanılan bir istatistiksel yöntemdir. LSA, metinlerdeki anlamsal yapıyı keşfetmek ve anlamsal olarak bağlantılı kelimeleri gruplandırmak için kullanılır. Bu yöntem, büyük metin veri setlerinde anahtar kavramları ve ilişkileri belirlemek için oldukça etkilidir.

5. Gizli Dirichlet Analizi (LDA)

Gizli Dirichlet Analizi, konu modelleme için yaygın olarak kullanılan bir olasılık temelli modelleme tekniğidir. LDA, metinlerdeki gizli konuları keşfetmek ve bu konuları temsil eden kelime gruplarını belirlemek için kullanılır. Bu teknik, özellikle büyük ve karmaşık metin veri setlerinde anlamlı konuları belirlemek için etkilidir.

Sonuç

Metin madenciliği, yapılandırılmamış metinsel verilerden değerli bilgiler elde etmek için güçlü bir araçtır. Doğru tekniklerin ve yöntemlerin uygulanması, büyük veri setlerindeki gizli kalıpları ve ilişkileri ortaya çıkararak, işletmelere stratejik kararlar alırken önemli bilgiler sağlar. Metin madenciliği, veri analitiği ve yapay zeka alanlarında önemli bir rol oynar ve çeşitli uygulama alanlarına sahiptir.

Auzef Veri Madenciliği Final Soruları Deneme Sınavı -10

Metin Madenciliği – Ünite 10

1- Metin analitiği ile ilgili olarak aşağıdakilerden hangisi yanlıştır?

A) Yapılandırılmamış metinsel veriyi anlamak ve bilgi çıkarmayı hedefler.
B) Metin madenciliğini içinde barındırır.
C) Müşteri geri bildirimleri üzerinde etkili bir şekilde çalışır.
D) Nominal veri türleriyle sınırlıdır.
E) Metin verilerini anlamak için özel teknikleri içerir.

Cevap: D) Nominal veri türleriyle sınırlıdır.

Açıklama: Metin analitiği, yalnızca nominal veri türleriyle sınırlı değildir; yapılandırılmamış metinsel veriyi anlamak ve bilgi çıkarmak için çeşitli veri türlerini kullanır.

2- Aşağıdaki durumlardan hangisi metin analitiği ile ilgili değildir?

A) Anahtar kelime çıkarma
B) Bilgi çıkarma
C) Hava durumu tahmini
D) Veri madenciliği
E) İlgili belge arama

Cevap: C) Hava durumu tahmini

Açıklama: Hava durumu tahmini, metin analitiği ile ilgili değildir. Metin analitiği, yapılandırılmamış metinsel verilerden anlam ve bilgi çıkarma ile ilgilidir.

3- Metin madenciliği ile ilgili olarak hangisi yanlıştır?

A) Tokenizasyon metni belirli parçalara böler.
B) Özellik mühendisliği, metni sayısal formata dönüştürmek için özellikler ekler.
C) Model oluşturma, metni analiz etmek için kullanılan bir adımdır.
D) Doğal dil işlemede yapılanları kapsar.
E) Metin verilerini anlamak için özel teknikleri içermez.

Cevap: D) Doğal dil işlemede yapılanları kapsar.

Açıklama: Metin madenciliği, yapılandırılmamış metin verilerini analiz etmek ve bu verilerden anlamlı bilgileri çıkarmak için kullanılan bir tekniktir. Metin madenciliği adımları arasında metnin belirli parçalara bölünmesi (tokenizasyon), metin verilerinin sayısal formata dönüştürülmesi için özellikler eklenmesi (özellik mühendisliği) ve model oluşturma gibi işlemler yer alır. Doğal dil işleme (NLP) ise, metin madenciliğinin önemli bir bileşeni olarak kabul edilmekle birlikte, metin madenciliği doğrudan NLP’de yapılan tüm işlemleri kapsamaz. Bu nedenle, “Doğal dil işlemede yapılanları kapsar” ifadesi yanlıştır. Metin madenciliği, metin verilerini anlamak için özel teknikleri içerir ve bu teknikler, doğal dil işlemenin ötesine geçerek metin verilerinden anlamlı bilgileri çıkarmaya odaklanır

4- Metin madenciliği adımları arasında hangisi metni belirli parçalara böler?

A) Metin ön işleme
B) Model oluşturma
C) Özellik mühendisliği
D) Tokenizasyon
E) Doğal Dil İşleme

Cevap: D) Tokenizasyon

Açıklama: Tokenizasyon, metni belirli parçalara, genellikle kelimelere veya cümlelere bölen bir adımdır.

5- Metin madenciliği hangi adımda gürültüyü azaltarak veri kalitesini artırmayı amaçlar?

A) Model oluşturma
B) Tokenizasyon
C) Özellik mühendisliği
D) Metin ön işleme
E) Doğal dil işleme

Cevap: D) Metin ön işleme

Açıklama: Metin ön işleme, metin madenciliği sürecinde gürültüyü azaltarak veri kalitesini artırmayı amaçlar. Bu adım, veriyi temizlemek ve analiz için hazırlamak için önemlidir.

6- Doğal dil işleme (NLP) ile ilgili olarak hangisi doğrudur?

A) Sadece sayısal verilerle çalışır.
B) İnsan dilini bilgisayar programlarının anlaması için bir yöntem içermez.
C) Metin madenciliğinin bir alt alanıdır.
D) Kelime türü etiketleme, metin bölümleme gibi zorlukları içerir.
E) Yalnızca yapılandırılmış metinsel veriyi analiz eder.

Cevap: D) Kelime türü etiketleme, metin bölümleme gibi zorlukları içerir.

Açıklama: Doğal dil işleme (NLP), kelime türü etiketleme ve metin bölümleme gibi zorlukları içerir ve insan dilini bilgisayar programlarının anlaması için çeşitli yöntemler içerir.

7- Duygu analizi neyi amaçlar?

A) Metin verilerini sadece sayısal formata dönüştürmeyi
B) Pozitif, negatif veya nötr duygusal kategorilere ayırmayı
C) Sadece finansal verileri analiz etmeyi
D) Tokenizasyon işlemini gerçekleştirmeyi
E) Metin ön işleme adımını atlamayı

Cevap: B) Pozitif, negatif veya nötr duygusal kategorilere ayırmayı

Açıklama: Duygu analizi, metin verilerini pozitif, negatif veya nötr duygusal kategorilere ayırmayı amaçlar.

8- Hangi durum, duygu analizi için en uygun bir uygulama alanıdır?

A) Meteorolojik verilerin analizi
B) Hisse senedi piyasası tahminleri
C) Yemek tariflerinin sınıflandırılması
D) İç organların anatomik incelemesi
E) Galaksiler arası uzaklık ölçümleri

Cevap: C) Yemek tariflerinin sınıflandırılması

Açıklama: Duygu analizi, metin verilerinde ifade edilen duygusal tonları belirleme sürecidir ve genellikle müşteri yorumları, sosyal medya paylaşımları veya ürün incelemeleri gibi metinlerin duygusal yönlerini anlamak için kullanılır. Ancak, duygu analizi sadece ticari uygulamalarla sınırlı değildir. Yemek tariflerinin sınıflandırılması, insanların tariflere karşı duygusal tepkilerini analiz etmeyi ve hangi tariflerin daha çok beğenildiğini anlamayı içerir. Bu tür analiz, tariflerin popülerliğini belirlemede ve kullanıcıların hangi tür tariflere daha fazla ilgi gösterdiğini anlamada kullanılabilir

9- Gizli anlam çözümlemesi (LSA) nedir?

A) Bir dilin kökenini inceleyen bir dilbilim teorisidir.
B) Bir metin kümesindeki ana fikirleri çıkarmak ve temsil etmek için kullanılan bir istatistiksel yöntemdir.
C) Bir belgenin anlamını yorumlamak için kullanılan bir dil işleme tekniğidir.
D) Yalnızca kelime frekansını değil, aynı zamanda metindeki yazım hatalarını düzeltir.
E) LSA, anlamsal olarak bağlantılı kelimeleri gruplandırmak için kullanılan bir semantik ağdır.

Cevap: B) Bir metin kümesindeki ana fikirleri çıkarmak ve temsil etmek için kullanılan bir istatistiksel yöntemdir.

Açıklama: Gizli anlam çözümlemesi (LSA), bir metin kümesindeki ana fikirleri çıkarmak ve temsil etmek için kullanılan bir istatistiksel yöntemdir.

10- Gizli dirichlet analizi ne işe yarar?

A) Konu modelleme için yaygın olarak kullanılan bir olasılık temelli modelleme tekniğidir.
B) Çevrimiçi alışverişlerde öneri sistemlerini güçlendiren bir algoritmadır.
C) Görüntü tanıma problemlerinde kullanılan bir derin öğrenme modelidir.
D) Konum tabanlı hizmetlerde harita oluşturmak için kullanılır.
E) Genetik algoritmaları temsil etmek için kullanılan bir modelleme tekniğidir.

Cevap: A) Konu modelleme için yaygın olarak kullanılan bir olasılık temelli modelleme tekniğidir.

Açıklama: Gizli Dirichlet Analizi (LDA), konu modelleme için yaygın olarak kullanılan bir olasılık temelli modelleme tekniğidir. Bu teknik, metin verilerindeki gizli konuları keşfetmek için kullanılır.

Auzef Veri Madenciliği Final Soruları Deneme Sınavı -10

Yönetim Bilişim Sistemleri Lisans

Yönetim Bilişim Sistemleri Lisans

Auzef Yönetim Bilişim Sistemleri Lisans 4. Sınıf Bahar Dönemi Final Soruları ve Deneme Sınavları, 2024 Sınav Soruları

#2. Nesnelerin birden fazla kümeye ait olabileceği kümeleme türü hangisidir?

#3. Katmanlı (stratified) örnekleme hangi durumda kullanılır?

#4. Doğrusal regresyonun ikili sonuçlar için uygun olmamasının nedeni nedir?

#5. Logit dönüşümü, lojistik regresyon modelinde hangi olasılık değerini daha doğrusal ve düzgün bir şekilde modellemeyi sağlar?

#6. Hangisi Logaritmik dönüşüm yapılma gerekçesi değildir?

#7. Hangi yaklaşım özniteliklerin, veri madenciliği algoritması çalıştırılmadan önce, veri madenciliği görevinden bağımsız bir şekilde seçilmesini benimser?

#8. Lojistik regresyon, hangi tür veri setleri üzerinde çalışmaya daha uygundur?

#9. Ağaç yapısında alt kümeler oluşturan kümeleme türü hangisidir?

#10. DBSCAN algoritmasında kullanılan epsilon (ε) nedir?

#11. K-ortalamalar kümeleme yönteminde, veri noktalarının kümelere atanmasında hangi kritere göre karar verilir?

#12. Bir veri madenciliği analizi için ihtiyacımız olan tüm verileri toplamak ve işlemek için yeterli zamanımız olmadığında, örneklem büyüklüğü nasıl belirlenir?

#13. Reklam için harcanan miktara bağlı olarak bir ürünün satışlarını tahmin etmek istediğimizi varsayalım. – 200’lük bir satış miktarı elde etmek için kaç TL harcanmalıdır?

#14. Regresyon analizinde kullanılan en küçük kareler yöntemi neyi amaçlar?

#15. Reklam için harcanan miktara bağlı olarak bir ürünün satışlarını tahmin etmek istediğimizi varsayalım. – Bağımsız değişkenin katsayısı (b) kaçtır?

#16. SOM’un (Kendi Kendini Düzenleyen Haritalar) eğitim süreci nasıl işler?

#17. Bir regresyon modelinde bağımlı değişken ile bir bağımsız değişken arasında bulunan katsayı (b) 2, sabit terim (a) ise 5 olarak bulunmuştur. Bu durumda, bağımlı değişkenin değeri 4 olduğunda tahmini sonuç ne olur?

#18. Z-Skor Normalizasyonu nedir?

#19. Sigmoid fonksiyonunun temel özelliklerinden biri nedir?

#20. Öznitelik ayrıklaştırması aşağıdakilerden hangisini içerir?

SONUÇ

Auzef Veri Madenciliği Final Soruları Deneme Sınavı -10

Auzef Veri Madenciliği Final Soruları Deneme Sınavı -10

Metin Madenciliği – Ünite 10

1. Metin Madenciliğinin Temel Adımları

2. Doğal Dil İşleme (NLP)

3. Duygu Analizi

4. Gizli Anlam Çözümlemesi (LSA)

5. Gizli Dirichlet Analizi (LDA)

Sonuç

Auzef Veri Madenciliği Final Soruları Deneme Sınavı -10

Metin Madenciliği – Ünite 10

1- Metin analitiği ile ilgili olarak aşağıdakilerden hangisi yanlıştır?

2- Aşağıdaki durumlardan hangisi metin analitiği ile ilgili değildir?

3- Metin madenciliği ile ilgili olarak hangisi yanlıştır?

4- Metin madenciliği adımları arasında hangisi metni belirli parçalara böler?

5- Metin madenciliği hangi adımda gürültüyü azaltarak veri kalitesini artırmayı amaçlar?

6- Doğal dil işleme (NLP) ile ilgili olarak hangisi doğrudur?

7- Duygu analizi neyi amaçlar?

8- Hangi durum, duygu analizi için en uygun bir uygulama alanıdır?

9- Gizli anlam çözümlemesi (LSA) nedir?

10- Gizli dirichlet analizi ne işe yarar?

Auzef Veri Madenciliği Final Soruları Deneme Sınavı -10

Editor