auzefVeri MadenciliğiYönetim Bilişim Sistemleri

Veri Madenciliği Final Deneme Sınavı -1

Veri Madenciliği Final Deneme Sınavı -1

#1. Reklam için harcanan miktara bağlı olarak bir ürünün satışlarını tahmin etmek istediğimizi varsayalım. - 200'lük bir satış miktarı elde etmek için kaç TL harcanmalıdır?

Cevap: C) 128

Açıklama: Regresyon denklemi Y = 66,86 1,04X olduğuna göre, 200 = 66,86 1,04X denklemini çözerek X’i buluruz: X ≈ 128 TL olacaktır.

#2. K-ortalamalar kümeleme yönteminde, merkezi prototip genellikle hangi tür veriler için kullanılır?

Cevap: A) Nicel Veriler

Açıklama: K-ortalamalar kümeleme yönteminde, merkezi prototip genellikle nicel veriler için kullanılır, çünkü bu yöntem veri noktalarının aritmetik ortalamasını hesaplar.

#3. Veri setinde en sık tekrar eden değeri ifade eden istatistik hangisidir?

Cevap: D) Mod

Açıklama: Mod, veri setinde en sık tekrar eden değeri ifade eder ve veri dağılımında tepe noktasını temsil eder.

#4. Hangi kümeleme türü, veriyi kesinlikle örtüşmeyen alt kümelerine böler?

Cevap: D) Bölütlenmiş Kümeleme

Açıklama: Bölütlenmiş kümeleme, veriyi kesinlikle örtüşmeyen alt kümelere böler ve her nesne yalnızca bir kümeye ait olur.

#5. Pasta grafiği hangi tür verilerin görsel analizi için kullanılır?

Cevap: B) Kategorik veriler

Açıklama: Pasta grafiği, kategorik verilerin oranlarını ve yüzdelerini görsel olarak temsil etmek için kullanılır.

#6. DBSCAN algoritmasının öne çıkan özellikleri nelerdir?

Cevap: B) Aykırı değerleri saptama ve silme yeteneği

Açıklama: DBSCAN algoritması, aykırı değerleri saptama ve silme yeteneği ile öne çıkar ve yoğunluk tabanlı kümeleme yapar.

#7. Veri setindeki en büyük ve en küçük değer arasındaki farkı gösteren istatistik hangisidir?

Cevap: B) Aralık

Açıklama: Aralık, veri setindeki en büyük ve en küçük değer arasındaki farkı ifade eder ve veri dağılımının genişliğini gösterir.

#8. Aşağıdaki tabloda bir veri setinde değişkenler arasındaki korelasyon katsayıları verilmiştir. Buna göre ifadelerden hangileri doğrudur? - I. Y değişkeni ile X1 arasında güçlü bir ilişki vardır. - II. Y değişkeni ile X2 arasında doğrusal bir ilişki yoktur. - III. Y değişkeni ile X3 arasında negatif yönlü bir ilişki vardır. - IV. X1 ve X2 arasında güçlü bir pozitif ilişki bulunmaktadır. - V. X2 değişkeni ile X3 arasında negatif bir ilişki vardır.

Cevap: C) I-III

Açıklama: Y değişkeni ile X1 arasında güçlü bir pozitif ilişki (0,997) ve Y değişkeni ile X3 arasında zayıf bir negatif ilişki (-0,038) vardır. X1 ve X2 arasında doğrudan bir korelasyon katsayısı verilmemiştir.

#9. Regresyon analizinde kullanılan en küçük kareler yöntemi neyi amaçlar?

Cevap: B) Gerçek ve tahmin edilen değerler arasındaki farkı en aza indirmeyi

Açıklama: En küçük kareler yöntemi, tahmin edilen değerler ile gerçek değerler arasındaki farkların karelerinin toplamını en aza indirmeyi amaçlar.

#10. SOM'un (Kendi Kendini Düzenleyen Haritalar) avantajları nelerdir?

Cevap: B) Boyut azaltma özelliği

Açıklama: SOM (Kendi Kendini Düzenleyen Haritalar), boyut azaltma özelliği ile öne çıkar ve yüksek boyutlu verileri düşük boyutlu haritalara indirger.

#11. Hangi kümeleme türünde nesneler sadece bir kümeye ait olabilir?

Cevap: D) Özel Kümeleme

Açıklama: Özel kümeleme, nesnelerin sadece bir kümeye ait olabileceği kümeleme türüdür. Bu, veri noktalarının birden fazla kümeye dahil olmaması anlamına gelir.

#12. Bir regresyon modelinde bağımlı değişken ile bir bağımsız değişken arasında bulunan katsayı (b) 2, sabit terim (a) ise 5 olarak bulunmuştur. Bu durumda, bağımlı değişkenin değeri 4 olduğunda tahmini sonuç ne olur?

Cevap: B) 13

Açıklama: Regresyon denklemi Y = a bX olduğuna göre, Y = 5 2(4) = 13 olacaktır.

#13. Histogram hangi veri özelliklerini göstermek için kullanılır?

Cevap: A) Belli bir aralıktaki dağılım

Açıklama: Histogram, veri setindeki değerlerin belli bir aralıktaki dağılımını göstermek için kullanılır ve frekans dağılımını görselleştirir.

#14. Metin madenciliği adımları arasında hangisi metni belirli parçalara böler?

Cevap: D) Tokenizasyon

Açıklama: Tokenizasyon, metni belirli parçalara, genellikle kelimelere veya cümlelere bölen bir adımdır.

#15. Aşırı değerlerin bulunduğu bir veri setinde hangi merkezi eğilim ölçüsü, genellikle yanıltıcı olabilir?

Cevap: B) Medyan

Açıklama: Aşırı değerlerin bulunduğu bir veri setinde, medyan merkezi eğilim ölçüsü olarak genellikle yanıltıcı olabilir, çünkü aşırı değerler medyanı etkileyebilir.

#16. Doğal dil işleme (NLP) ile ilgili olarak hangisi doğrudur?

Cevap: D) Kelime türü etiketleme, metin bölümleme gibi zorlukları içerir.

Açıklama: Doğal dil işleme (NLP), kelime türü etiketleme ve metin bölümleme gibi zorlukları içerir ve insan dilini bilgisayar programlarının anlaması için çeşitli yöntemler içerir.

#17. Hangi durum, duygu analizi için en uygun bir uygulama alanıdır?

Cevap: C) Yemek tariflerinin sınıflandırılması

Açıklama: Duygu analizi, metin verilerinde ifade edilen duygusal tonları belirleme sürecidir ve genellikle müşteri yorumları, sosyal medya paylaşımları veya ürün incelemeleri gibi metinlerin duygusal yönlerini anlamak için kullanılır. Ancak, duygu analizi sadece ticari uygulamalarla sınırlı değildir. Yemek tariflerinin sınıflandırılması, insanların tariflere karşı duygusal tepkilerini analiz etmeyi ve hangi tariflerin daha çok beğenildiğini anlamayı içerir. Bu tür analiz, tariflerin popülerliğini belirlemede ve kullanıcıların hangi tür tariflere daha fazla ilgi gösterdiğini anlamada kullanılabilir

#18. Gizli dirichlet analizi ne işe yarar?

Cevap: A) Konu modelleme için yaygın olarak kullanılan bir olasılık temelli modelleme tekniğidir.

Açıklama: Gizli Dirichlet Analizi (LDA), konu modelleme için yaygın olarak kullanılan bir olasılık temelli modelleme tekniğidir. Bu teknik, metin verilerindeki gizli konuları keşfetmek için kullanılır.

#19. Aşağıdaki durumlardan hangisi metin analitiği ile ilgili değildir?

Cevap: C) Hava durumu tahmini

Açıklama: Hava durumu tahmini, metin analitiği ile ilgili değildir. Metin analitiği, yapılandırılmamış metinsel verilerden anlam ve bilgi çıkarma ile ilgilidir.

#20. Reklam için harcanan miktara bağlı olarak bir ürünün satışlarını tahmin etmek istediğimizi varsayalım. - Bağımsız değişkenin katsayısı (b) kaçtır?

Cevap: B) 1,04

Açıklama: Bağımsız değişkenin katsayısı (b), bağımsız değişkendeki bir birimlik artışın bağımlı değişkende 1,04 birimlik bir artışa neden olduğunu gösterir.

TESTi BiTiR, PUANINI GÖR

SONUÇ

-

İstanbul Üniversitesi Açık ve Uzaktan Eğitim Fakültesi (Auzef)
Açık Öğretim Fakültesi
Bölüm : Yönetim Bilişim Sistemleri Lisans
4. Sınıf  Veri Madenciliği Bahar Dönemi
Veri Madenciliği Final Deneme Sınavı -1

İstanbul Üniversitesi Açık ve Uzaktan Eğitim Fakültesi (Auzef)
Açık Öğretim Fakültesi
Bölüm : Yönetim Bilişim Sistemleri Lisans
4. Sınıf  Veri Madenciliği Bahar Dönemi
Veri Madenciliği Final Deneme Sınavı -1

Share your score!
Tweet your score!
Share to other

HD Quiz powered by harmonic design

Veri Madenciliği Final Deneme Sınavı -1

İstanbul Üniversitesi Açık ve Uzaktan Eğitim Fakültesi (Auzef)
Açık Öğretim Fakültesi
Bölüm : Yönetim Bilişim Sistemleri Lisans
4. Sınıf  Veri Madenciliği Bahar Dönemi
Veri Madenciliği Final Deneme Sınavı -1

Veri Madenciliği Final Deneme Sınavı -1

Veri Madenciliğine Giriş – Ünite 1

Veri madenciliği, büyük veri çağında veri setlerinin içindeki anlamlı bilgileri ve örüntüleri keşfetme sürecidir. Bu süreç, ham verilerin işlenip anlamlı bilgilere dönüştürülmesini sağlayarak işletmelerin stratejik kararlar almasına yardımcı olur. Veri madenciliği, farklı sektörlerde geniş bir uygulama yelpazesine sahip olup, pazarlamadan sağlığa, finansal analizlerden bilimsel araştırmalara kadar birçok alanda kullanılır. Bu makale, veri madenciliği sürecinin temel adımlarını, veri tiplerini ve veri madenciliğinin diğer ilgili disiplinlerle ilişkisini ele alacaktır.

1. Veri Madenciliği Süreci

Veri madenciliği süreci, çeşitli adımlardan oluşur:

Veri Ön İşleme: Veri setlerinin temizlenmesi, düzenlenmesi ve analiz için hazırlanmasını içerir. Eksik verilerin doldurulması, aykırı değerlerin tespit edilmesi ve düzeltilmesi gibi işlemleri kapsar.

Modelleme: Veri madenciliğinde kullanılan modeller, veri setlerinden örüntüleri belirlemek ve tahminler yapmak için kullanılır. Regresyon analizi, sınıflandırma, kümeleme ve derin öğrenme gibi modeller bulunur.

Örüntü Tanıma: Veri kümelerindeki gizli örüntüleri, ilişkileri ve eğilimleri bulmayı amaçlar. Bu örüntüler, gelecekteki davranışları tahmin etmek veya veriler hakkında anlamlı bilgiler elde etmek için kullanılabilir.

Tahmin ve Karar Destek: Elde edilen modeller, gelecekteki olayların olası senaryolarını tahmin etmekte veya karar verme süreçlerinde destek olmakta kullanılır.

Doğrulama ve Değerlendirme: Modellerin doğruluğunu ve etkinliğini değerlendirmek için doğrulama teknikleri kullanılır. Modellerin gerçek dünya verileriyle ne kadar uyumlu olduğunu ve ne kadar doğru tahminler yaptığını ölçmek önemlidir.

2. Veri Tipleri

Veri madenciliğinde kullanılan veri tipleri genellikle yapısal ve yapısal olmayan veri olarak iki ana gruba ayrılır:

Yapısal Veri: İlişkisel veri tabanlarında bulunan yapılandırılmış veri türleridir. Sayılar, metinler, tarihler gibi sütun ve satırlardan oluşan tablolar yapısal veriye örnek olarak gösterilebilir.

Yapısal Olmayan Veri: Belirli bir yapıya sahip olmayan veya geleneksel tablo formatına uymayan veri türlerini içerir. Metin belgeleri, sosyal medya gönderileri, video ve ses dosyaları yapısal olmayan veriye örnek olarak gösterilebilir.

Yapısal veriler, nitel (nominal ve ordinal) ve nicel (kesikli ve sürekli) olarak ikiye ayrılabilir:

Nominal Değişkenler: Kategoriler arasında sıralama veya derecelendirme yoktur. Örneğin, cinsiyet, renk, ülke gibi kategorik veriler nominal değişkenlere örnektir.

Ordinal Değişkenler: Kategoriler arasında belirli bir sıralamanın olduğu verilerdir. Örneğin, eğitim seviyesi veya memnuniyet seviyesi ordinal değişkenlere örnektir.

Kesikli Değişkenler: Belirli bir aralıkta ölçülen ve belirli değerler alabilen değişkenlerdir. Örneğin, bir şirketin aylık satışları kesikli değişkenlere örnektir.

Sürekli Değişkenler: Sonsuz bir aralıkta ölçülen ve herhangi bir değer alabilen değişkenlerdir. Örneğin, bir kişinin boyu sürekli değişkenlere örnektir.

3. Veri, Enformasyon ve Bilgi İlişkisi

Veri (data), enformasyon (information) ve bilgi (knowledge), bilgi yönetimi ve analitik süreçlerinde temel kavramlardır. Veri, ham ve işlenmemiş bilgileri ifade ederken, enformasyon, bu verilerin düzenlenmiş ve uygun bir biçimde sunulmuş halidir. Bilgi ise, enformasyonun anlam kazanmış ve işlevsel hale gelmiş olduğu durumu temsil eder.

Veri: İşlenmemiş ve düzensiz bilgilerdir. Örneğin, bir işletmenin satış verileri.

Enformasyon: Bu verilerin organize edilmiş ve anlaşılır hale getirilmiş hali. Örneğin, aylık satışlar grafiği.

Bilgi: Enformasyonun anlam kazanmış ve işlevsel hale gelmiş hali. Örneğin, belirli bir ürünün belirli bir mevsimde daha fazla talep gördüğü bilgisi.

4. Veri Madenciliği ve Makine Öğrenmesi

Veri madenciliği ve makine öğrenimi, veri setlerinden anlamlı bilgilerin elde edilmesine odaklanan ancak farklı önceliklere sahip iki temel alandır:

Veri Madenciliği: Veri setlerindeki gizli örüntüleri bulmayı ve bu örüntüleri açıklamayı hedefler.

Makine Öğrenmesi: Belirli bir amacı olan modeller geliştirme üzerine odaklanır. Örneğin, bir öneri sistemi oluşturmak.

Her iki alan da veri kümelerinden bilgi çıkarmayı hedefler ve veri setlerindeki örüntüleri keşfetmek, tahminler yapmak veya karar destek sistemleri oluşturmak için kullanılır.

Sonuç

Veri madenciliği, modern iş dünyasında ve araştırma alanlarında büyük bir öneme sahiptir. Bu süreç, ham verilerin anlamlı bilgilere dönüştürülmesini sağlayarak stratejik kararlar alınmasına yardımcı olur. Veri madenciliği, farklı veri tiplerini ve modelleri kullanarak verilerin içindeki gizli bilgileri ortaya çıkarır ve bu bilgileri işlevsel hale getirir. Veri madenciliği ve makine öğrenimi, veri setlerinden anlamlı bilgiler elde etmek için kullanılan iki temel alandır ve her ikisi de veri analitiği sürecinin önemli bir parçasıdır.

Veri Madenciliğine Giriş – Ünite 1

1- Veri madenciliği sürecinde hangi adım veri setlerinin temizlenmesini, düzenlenmesini ve hazırlanmasını içerir?

A) Modelleme
B) Örüntü Tanıma
C) Doğrulama ve Değerlendirme
D) Tahmin ve Karar Destek
E) Ön İşleme

Cevap: E) Ön İşleme

Açıklama: Ön işleme, veri madenciliği sürecinde veri setlerinin temizlenmesi, düzenlenmesi ve hazırlanmasını içerir.

2- Hangisi yapısal bir veri türüdür?

A) Metin belgeleri
B) Sosyal medya gönderileri
C) Tarihler
D) Ses dosyaları
E) İlişkisel veritabanlarındaki tablolar

Cevap: E) İlişkisel veritabanlarındaki tablolar

Açıklama: İlişkisel veritabanlarındaki tablolar yapısal veri türüdür.

3- Nominal değişkenler hangi özelliğe sahiptir?

A) Kategoriler arasında belirli bir sıralama vardır.
B) Kategoriler arasında hiçbir sıralama yoktur.
C) Kesirli değerler alabilirler.
D) Yapısal veriye örnektirler.
E) Sayılar, metinler gibi sütun ve satırlardan oluşurlar.

Cevap: B) Kategoriler arasında hiçbir sıralama yoktur.

Açıklama: Nominal değişkenler, kategoriler arasında sıralama olmayan değişkenlerdir.

4- Hangi adım, veri madenciliği sürecindeki en zahmetli ve zaman alıcı adımdır?

A) Modelleme
B) Tahmin ve Karar Destek
C) Örüntü Tanıma
D) Doğrulama ve Değerlendirme
E) Ön İşleme

Cevap: E) Ön İşleme

Açıklama: Ön işleme, veri madenciliği sürecinde en zahmetli ve zaman alıcı adımdır.

5- Hangisi veri, enformasyon ve bilgi arasındaki ilişkiyi doğru ifade eder?

A) Veri, enformasyonun işlenmiş haliyken, bilgi bu verilerin düzenlenmiş hali olarak tanımlanır.
B) Bilgi, enformasyonun daha detaylı bir versiyonudur ve veri en basit formudur.
C) Veri, ham ve işlenmemiş bilgileri ifade ederken, enformasyon bu verilerin işlenmiş ve düzenlenmiş hali olarak tanımlanır, bilgi ise enformasyonun işlenmiş ve kullanılabilir hali olarak tanımlanır.
D) Bilgi, verilerin anlamlı hale geldiği durumu temsil ederken, enformasyon bu verilerin anlam kazanmış hali olarak tanımlanır.
E) Veri, enformasyonun daha basit bir formu iken, bilgi bu verilerin en kapsamlı hali olarak tanımlanır.

Cevap: C) Veri, ham ve işlenmemiş bilgileri ifade ederken, enformasyon bu verilerin işlenmiş ve düzenlenmiş hali olarak tanımlanır, bilgi ise enformasyonun işlenmiş ve kullanılabilir hali olarak tanımlanır.

Açıklama: Veri, enformasyon ve bilgi arasındaki ilişki, verinin işlenerek enformasyona, enformasyonun da anlam kazanarak bilgiye dönüşmesi sürecini yansıtır.

6- Hangisi yapısal olmayan veri türüne örnektir?

A) Doğum tarihleri
B) Hız verisi
C) Satış tablosundaki satılan ürün miktarı
D) Ses dosyaları
E) Sınav sonuçları

Cevap: D) Ses dosyaları

Açıklama: Ses dosyaları yapısal olmayan veri türüdür.

7- Hangi değişken türü, sayısal bir ilişkiye sahip değildir ancak sıralanabilir?

A) Nominal Değişkenler
B) Sürekli Değişkenler
C) Kesikli Değişkenler
D) Ordinal Değişkenler
E) Yapısal Değişkenler

Cevap: D) Ordinal Değişkenler

Açıklama: Ordinal değişkenler, sayısal bir ilişkiye sahip olmadan sıralanabilir değişkenlerdir.

8- Veri madenciliği ve makine öğrenimi ile ilgili aşağıdakilerden hangisi doğrudur?

A) Her ikisi de belirli bir amaca hizmet eden modeller geliştirmeyi amaçlar.
B) İkisi de yapay zeka alanının bir alt kategorileridir ve bu alanda daha somut görevleri gerçekleştirmek için kullanılır.
C) Veri setlerindeki örüntüleri keşfetmeyi hedefler.
D) İkisinin de odakları aynıdır.
E) Veri madenciliği ve makine öğrenimi, aynı süreci ifade eder ve birbirinin yerine kullanılabilir terimlerdir.

Cevap: C) Veri setlerindeki örüntüleri keşfetmeyi hedefler.

Açıklama: Veri madenciliği ve makine öğrenimi, veri setlerindeki örüntüleri keşfetmeyi hedefler.

9- Veri madenciliği ve bilgi keşfi arasındaki ilişkiyi doğru ifade eden aşağıdaki seçeneklerden hangisidir?

A) Veri madenciliği, bilgi keşfinin bir parçasıdır ve veri analizlerini içerir.
B) Veri madenciliği, bilgi keşfi ile eş anlamlıdır ve aynı süreci ifade eder.
C) Veri madenciliği, bilgi keşfi sürecindeki en zahmetli adımdır.
D) Veri madenciliğiyle bilgi keşfi arasında doğrudan bir ilişki yoktur.
E) Bilgi keşfi, veri madenciliği sürecinin son adımıdır.

Cevap: A) Veri madenciliği, bilgi keşfinin bir parçasıdır ve veri analizlerini içerir.

Açıklama: Veri madenciliği, bilgi keşfinin bir parçasıdır ve veri analizlerini içerir.

10- Veri madenciliği sürecinde kullanılan modeller, hangi amaç(lar) için kullanılır?

I. Veri setlerindeki gizli örüntüleri bulmak
II. Çıktıları değerlendirmek
III. Ön işleme
IV. Tahmin yapmak
A) I ve II
B) I ve IV
C) I, II ve IV
D) III ve IV
E) II, III ve IV

Cevap: B) I ve IV

Açıklama: Veri madenciliği sürecinde kullanılan modeller, veri setlerindeki gizli örüntüleri bulmak ve tahmin yapmak amacıyla kullanılır.

Veri Madenciliği Final Deneme Sınavı -1

Yönetim Bilişim Sistemleri Lisans
Veri Madenciliği Yönetim Bilişim Sistemleri Lisans

Yönetim Bilişim Sistemleri Lisans

Auzef Yönetim Bilişim Sistemleri Lisans 4. Sınıf Bahar Dönemi Final Soruları ve Deneme Sınavları, 2024 Sınav Soruları

Editor

Editör

error: Kopyalamaya Karşı Korumalıdır!