auzefVeri MadenciliğiYönetim Bilişim Sistemleri

Veri Madenciliği Vize Deneme Sınavı -1

Veri Madenciliği Vize Deneme Sınavı -1

#1. Belli bir parçanın üretimi için gereken ortalama zamanın 11.5 dakika olduğu biliniyor. İşe alınan 10 işçinin bu mamulü üretim süreleri gözlemleniyor ve aşağıdaki sonuçlar elde ediliyor. %5 anlam düzeyinde yeni işe alınan işçilerin bu mamulü üretim süresinin eski işçilerden daha fazla olup olmadığını araştırınız. (İpucu: Bu soru için toplanan verilerin kendisi verilmiştir. Daha önceki örneklerde ve sorularda toplanan verilerden elde edilen ortalamalar veya standart sapmalar verilmişti.) - Yukarıdaki örneğe göre hesaplanan test istatistiği değeri kaçtır?

Cevap: E) 2,06

Açıklama: T-testi kullanılarak hesaplanan test istatistiği değeri 2,06’dır.

#2. Hangi yaklaşım özniteliklerin, veri madenciliği algoritması çalıştırılmadan önce, veri madenciliği görevinden bağımsız bir şekilde seçilmesini benimser?

Cevap: A) Filtre yaklaşım

Açıklama: Filtre yaklaşım, özniteliklerin veri madenciliği görevinden bağımsız olarak seçilmesini benimser ve bu sayede daha genel ve esnek bir seçim süreci sağlar.

#3. Yaşlı ve genç yetişkinler arasındaki algılanan yaşam doyumunun farklarını incelemek amacıyla bir araştırma yapılmıştır. 10 kişilik iki gruptan oluşan, 70 yaş üstü yaşlı yetişkinlere ve 20 – 30 yaş arası genç yetişkinlere yüksek güvenilirlik ve geçerliliği olduğu bilinen bir yaşam memnuniyeti testi verilmiştir. Ölçüm puanları 0 (en düşük) – 60 (en yüksek) arasındadır. Yaşlı yetişkinlerin verdiği puanların ortalaması 44.5 ve varyansı 75.39 iken genç yetişkinlerin verdiği puanların ortalaması 28.1 ve varyansı 72.99 olarak hesaplanmıştır. Yaşlı ve genç yetişkinler arasındaki ortalama yaşam memnuniyetinin farklı olduğu iddiasını %5 anlam düzeyinde test ediniz ve yorumlayınız. - Yukarıdaki örneğe göre kritik test istatistiği değeri kaçtır?

Cevap: E) 2,23

Açıklama: Kritik test istatistiği değeri %5 anlamlılık düzeyinde 2,23’tür.

#4. A firması tarafından üretilen ampullerden 80 adet seçilmiş ve ortalama 1258 saat çalıştığı görülmüştür. Ana kütleye ait standart sapma 94 saattir. B firması tarafından üretilen ampullerden 60 adet seçilmiş ve ortalama 1029 saat çalıştığı görülmüştür. Ana kütleye ait standart sapma 68 saattir. A firmasının ampul fiyatı daha fazla olduğu için bir test yapılacaktır. A firması tarafından üretilen ampullerin çalışma süresi, B firması tarafından üretilen ampullerin çalışma süresinden 200 saat fazlaysa, A firmasının ampulleri satın alınacaktır. 𝛼𝛼 = 0.011 için hangi firmanın ampullerinin satın alınacağını test ediniz. - Yukarıdaki örneğe göre hesaplanan test istatistiği değeri kaçtır?

Cevap: B) 2,12

Açıklama: Z-testi kullanılarak hesaplanan test istatistiği değeri 2,12’dir.

#5. Bir veri madenciliği analizi için ihtiyacımız olan tüm verileri toplamak ve işlemek için yeterli zamanımız olmadığında, örneklem büyüklüğü nasıl belirlenir?

Cevap: C) Uyarlanabilir örneklemeyle

Açıklama: Uyarlanabilir örnekleme, sınırlı zaman ve kaynaklarla veri toplama ve işleme işlemini optimize etmek için kullanılır.

#6. Öznitelik ayrıklaştırması aşağıdakilerden hangisini içerir?

Cevap: B) Sürekli bir değişkenin kategorik bir değişkene dönüştürülmesi

Açıklama: Öznitelik ayrıklaştırması, sürekli bir değişkenin belirli aralıklara veya kategorilere dönüştürülmesini içerir.

#7. Katmanlı (stratified) örnekleme hangi durumda kullanılır?

Cevap: A) Tüm nesne tiplerini yeterince temsil etmeyen durumlarda

Açıklama: Katmanlı örnekleme, tüm nesne tiplerinin yeterince temsil edilmediği durumlarda kullanılır, böylece her bir kategoriye ait veri temsil edilir.

#8. Reklam için harcanan miktara bağlı olarak bir ürünün satışlarını tahmin etmek istediğimizi varsayalım. - Sabit katsayı (a) kaçtır?

Cevap: D) 66,86

Açıklama: Regresyon denkleminin sabit katsayısı, modelin kesişim noktası olarak bulunur ve bu örnekte 66,86 olarak hesaplanmıştır.

#9. Z-Skor Normalizasyonu nedir?

Cevap: D) Değerleri ortalaması 0 ve standart sapması 1 olacak şekilde dönüştürme

Açıklama: Z-skor normalizasyonu, verileri ortalaması 0 ve standart sapması 1 olacak şekilde dönüştürerek, farklı ölçeklerdeki verilerin karşılaştırılmasını kolaylaştırır.

#10. Reklam için harcanan miktara bağlı olarak bir ürünün satışlarını tahmin etmek istediğimizi varsayalım. - 150 TL’lik reklam harcaması yapıldığı durumdaki tahmini satış miktarı ne kadar olur?

Cevap: E) 223

Açıklama: Regresyon denklemi Y = 66,86 1,04X olduğuna göre, Y = 66,86 1,04(150) = 223 olacaktır.

#11. Veri madenciliği sürecinde kullanılan modeller, hangi amaç(lar) için kullanılır? I. Veri setlerindeki gizli örüntüleri bulmak II. Çıktıları değerlendirmek III. Ön işleme IV. Tahmin yapmak

Cevap: B) I ve IV

Açıklama: Veri madenciliği sürecinde kullanılan modeller, veri setlerindeki gizli örüntüleri bulmak ve tahmin yapmak amacıyla kullanılır.

#12. Bir regresyon analizinde bağımsız değişkenin katsayısının 2,16 bulunması neyi ifade eder?

Cevap: B) Bağımsız değişkenin bağımlı değişken üzerindeki etkisinin bir birim artışla 2,16 birim arttığını gösterir.

Açıklama: Regresyon analizinde bağımsız değişkenin katsayısı, bağımsız değişkendeki bir birimlik artışın bağımlı değişkende ne kadar bir artışa neden olduğunu gösterir.

#13. Aşağıdaki ifadelerin hangileri yanlıştır? - I. Veri madenciliğinde hipotez testleri, elde edilen veri örüntülerinin istatistiksel olarak anlamlı olup olmadığını değerlendirir. - II. Hipotez testleri, değişkenler arasındaki ilişkilerin istatistiksel anlamlılığını değerlendirmek için kullanılabilir. - III. Hipotez testleri, veri madenciliğinde kullanılan algoritmaların doğruluğunu belirlemek için kullanılır.

Cevap: C) Yalnız III

Açıklama: Hipotez testleri, veri madenciliğinde kullanılan algoritmaların doğruluğunu belirlemek için kullanılmaz. Bu testler, değişkenler arasındaki ilişkilerin ve elde edilen veri örüntülerinin istatistiksel anlamlılığını değerlendirir.

#14. Hangisi yapısal bir veri türüdür?

Cevap: E) İlişkisel veritabanlarındaki tablolar

Açıklama: İlişkisel veritabanlarındaki tablolar yapısal veri türüdür.

#15. Veri madenciliği ve makine öğrenimi ile ilgili aşağıdakilerden hangisi doğrudur?

Cevap: C) Veri setlerindeki örüntüleri keşfetmeyi hedefler.

Açıklama: Veri madenciliği ve makine öğrenimi, veri setlerindeki örüntüleri keşfetmeyi hedefler.

#16. Regresyon analizindeki eş varyanslık (homoscedasticity) kavramı ne anlama gelir?

Cevap: A) Hataların sabit bir varyansa sahip olduğunu

Açıklama: Homoscedasticity, hataların sabit bir varyansa sahip olduğu durumu ifade eder. Bu, regresyon analizinde önemli bir varsayımdır.

#17. Hangi adım, veri madenciliği sürecindeki en zahmetli ve zaman alıcı adımdır?

Cevap: E) Ön İşleme

Açıklama: Ön işleme, veri madenciliği sürecinde en zahmetli ve zaman alıcı adımdır.

#18. Korelasyon katsayısı hangi durumda sıfıra eşit olur?

Cevap: C) Herhangi bir ilişki olmadığında

Açıklama: Korelasyon katsayısı, iki değişken arasında herhangi bir ilişki olmadığında sıfıra eşit olur.

#19. Hangisi yapısal olmayan veri türüne örnektir?

Cevap: D) Ses dosyaları

Açıklama: Ses dosyaları yapısal olmayan veri türüdür.

#20. Yaşlı ve genç yetişkinler arasındaki algılanan yaşam doyumunun farklarını incelemek amacıyla bir araştırma yapılmıştır. 10 kişilik iki gruptan oluşan, 70 yaş üstü yaşlı yetişkinlere ve 20 – 30 yaş arası genç yetişkinlere yüksek güvenilirlik ve geçerliliği olduğu bilinen bir yaşam memnuniyeti testi verilmiştir. Ölçüm puanları 0 (en düşük) – 60 (en yüksek) arasındadır. Yaşlı yetişkinlerin verdiği puanların ortalaması 44.5 ve varyansı 75.39 iken genç yetişkinlerin verdiği puanların ortalaması 28.1 ve varyansı 72.99 olarak hesaplanmıştır. Yaşlı ve genç yetişkinler arasındaki ortalama yaşam memnuniyetinin farklı olduğu iddiasını %5 anlam düzeyinde test ediniz ve yorumlayınız. - Yukarıdaki örnekte hangi test istatistiği kullanılmalıdır?

Cevap: B) T-testi

Açıklama: T-testi, küçük örneklem büyüklükleri ve bilinmeyen populasyon standart sapmaları için kullanılır.

TESTi BiTiR, PUANINI GÖR

SONUÇ

-

İstanbul Üniversitesi Açık ve Uzaktan Eğitim Fakültesi (Auzef)
Açık Öğretim Fakültesi
Bölüm : Yönetim Bilişim Sistemleri Lisans
4. Sınıf  Veri Madenciliği Bahar Dönemi
Veri Madenciliği Vize Deneme Sınavı -1

İstanbul Üniversitesi Açık ve Uzaktan Eğitim Fakültesi (Auzef)
Açık Öğretim Fakültesi
Bölüm : Yönetim Bilişim Sistemleri Lisans
4. Sınıf  Veri Madenciliği Bahar Dönemi
Veri Madenciliği Vize Deneme Sınavı -1

Share your score!
Tweet your score!
Share to other

HD Quiz powered by harmonic design

Veri Madenciliği Vize Deneme Sınavı -1

İstanbul Üniversitesi Açık ve Uzaktan Eğitim Fakültesi (Auzef)
Açık Öğretim Fakültesi
Bölüm : Yönetim Bilişim Sistemleri Lisans
4. Sınıf  Veri Madenciliği Bahar Dönemi
Veri Madenciliği Vize Deneme Sınavı -1

Veri Madenciliği Vize Deneme Sınavı -1

Veri Madenciliğine Giriş – Ünite 1

Veri madenciliği, büyük veri çağında veri setlerinin içindeki anlamlı bilgileri ve örüntüleri keşfetme sürecidir. Bu süreç, ham verilerin işlenip anlamlı bilgilere dönüştürülmesini sağlayarak işletmelerin stratejik kararlar almasına yardımcı olur. Veri madenciliği, farklı sektörlerde geniş bir uygulama yelpazesine sahip olup, pazarlamadan sağlığa, finansal analizlerden bilimsel araştırmalara kadar birçok alanda kullanılır. Bu makale, veri madenciliği sürecinin temel adımlarını, veri tiplerini ve veri madenciliğinin diğer ilgili disiplinlerle ilişkisini ele alacaktır.

1. Veri Madenciliği Süreci

Veri madenciliği süreci, çeşitli adımlardan oluşur:

Veri Ön İşleme: Veri setlerinin temizlenmesi, düzenlenmesi ve analiz için hazırlanmasını içerir. Eksik verilerin doldurulması, aykırı değerlerin tespit edilmesi ve düzeltilmesi gibi işlemleri kapsar.

Modelleme: Veri madenciliğinde kullanılan modeller, veri setlerinden örüntüleri belirlemek ve tahminler yapmak için kullanılır. Regresyon analizi, sınıflandırma, kümeleme ve derin öğrenme gibi modeller bulunur.

Örüntü Tanıma: Veri kümelerindeki gizli örüntüleri, ilişkileri ve eğilimleri bulmayı amaçlar. Bu örüntüler, gelecekteki davranışları tahmin etmek veya veriler hakkında anlamlı bilgiler elde etmek için kullanılabilir.

Tahmin ve Karar Destek: Elde edilen modeller, gelecekteki olayların olası senaryolarını tahmin etmekte veya karar verme süreçlerinde destek olmakta kullanılır.

Doğrulama ve Değerlendirme: Modellerin doğruluğunu ve etkinliğini değerlendirmek için doğrulama teknikleri kullanılır. Modellerin gerçek dünya verileriyle ne kadar uyumlu olduğunu ve ne kadar doğru tahminler yaptığını ölçmek önemlidir.

2. Veri Tipleri

Veri madenciliğinde kullanılan veri tipleri genellikle yapısal ve yapısal olmayan veri olarak iki ana gruba ayrılır:

Yapısal Veri: İlişkisel veri tabanlarında bulunan yapılandırılmış veri türleridir. Sayılar, metinler, tarihler gibi sütun ve satırlardan oluşan tablolar yapısal veriye örnek olarak gösterilebilir.

Yapısal Olmayan Veri: Belirli bir yapıya sahip olmayan veya geleneksel tablo formatına uymayan veri türlerini içerir. Metin belgeleri, sosyal medya gönderileri, video ve ses dosyaları yapısal olmayan veriye örnek olarak gösterilebilir.

Yapısal veriler, nitel (nominal ve ordinal) ve nicel (kesikli ve sürekli) olarak ikiye ayrılabilir:

Nominal Değişkenler: Kategoriler arasında sıralama veya derecelendirme yoktur. Örneğin, cinsiyet, renk, ülke gibi kategorik veriler nominal değişkenlere örnektir.

Ordinal Değişkenler: Kategoriler arasında belirli bir sıralamanın olduğu verilerdir. Örneğin, eğitim seviyesi veya memnuniyet seviyesi ordinal değişkenlere örnektir.

Kesikli Değişkenler: Belirli bir aralıkta ölçülen ve belirli değerler alabilen değişkenlerdir. Örneğin, bir şirketin aylık satışları kesikli değişkenlere örnektir.

Sürekli Değişkenler: Sonsuz bir aralıkta ölçülen ve herhangi bir değer alabilen değişkenlerdir. Örneğin, bir kişinin boyu sürekli değişkenlere örnektir.

3. Veri, Enformasyon ve Bilgi İlişkisi

Veri (data), enformasyon (information) ve bilgi (knowledge), bilgi yönetimi ve analitik süreçlerinde temel kavramlardır. Veri, ham ve işlenmemiş bilgileri ifade ederken, enformasyon, bu verilerin düzenlenmiş ve uygun bir biçimde sunulmuş halidir. Bilgi ise, enformasyonun anlam kazanmış ve işlevsel hale gelmiş olduğu durumu temsil eder.

Veri: İşlenmemiş ve düzensiz bilgilerdir. Örneğin, bir işletmenin satış verileri.

Enformasyon: Bu verilerin organize edilmiş ve anlaşılır hale getirilmiş hali. Örneğin, aylık satışlar grafiği.

Bilgi: Enformasyonun anlam kazanmış ve işlevsel hale gelmiş hali. Örneğin, belirli bir ürünün belirli bir mevsimde daha fazla talep gördüğü bilgisi.

4. Veri Madenciliği ve Makine Öğrenmesi

Veri madenciliği ve makine öğrenimi, veri setlerinden anlamlı bilgilerin elde edilmesine odaklanan ancak farklı önceliklere sahip iki temel alandır:

Veri Madenciliği: Veri setlerindeki gizli örüntüleri bulmayı ve bu örüntüleri açıklamayı hedefler.

Makine Öğrenmesi: Belirli bir amacı olan modeller geliştirme üzerine odaklanır. Örneğin, bir öneri sistemi oluşturmak.

Her iki alan da veri kümelerinden bilgi çıkarmayı hedefler ve veri setlerindeki örüntüleri keşfetmek, tahminler yapmak veya karar destek sistemleri oluşturmak için kullanılır.

Sonuç

Veri madenciliği, modern iş dünyasında ve araştırma alanlarında büyük bir öneme sahiptir. Bu süreç, ham verilerin anlamlı bilgilere dönüştürülmesini sağlayarak stratejik kararlar alınmasına yardımcı olur. Veri madenciliği, farklı veri tiplerini ve modelleri kullanarak verilerin içindeki gizli bilgileri ortaya çıkarır ve bu bilgileri işlevsel hale getirir. Veri madenciliği ve makine öğrenimi, veri setlerinden anlamlı bilgiler elde etmek için kullanılan iki temel alandır ve her ikisi de veri analitiği sürecinin önemli bir parçasıdır.

Veri Madenciliğine Giriş – Ünite 1

1- Veri madenciliği sürecinde hangi adım veri setlerinin temizlenmesini, düzenlenmesini ve hazırlanmasını içerir?

A) Modelleme
B) Örüntü Tanıma
C) Doğrulama ve Değerlendirme
D) Tahmin ve Karar Destek
E) Ön İşleme

Cevap: E) Ön İşleme

Açıklama: Ön işleme, veri madenciliği sürecinde veri setlerinin temizlenmesi, düzenlenmesi ve hazırlanmasını içerir.

2- Hangisi yapısal bir veri türüdür?

A) Metin belgeleri
B) Sosyal medya gönderileri
C) Tarihler
D) Ses dosyaları
E) İlişkisel veritabanlarındaki tablolar

Cevap: E) İlişkisel veritabanlarındaki tablolar

Açıklama: İlişkisel veritabanlarındaki tablolar yapısal veri türüdür.

3- Nominal değişkenler hangi özelliğe sahiptir?

A) Kategoriler arasında belirli bir sıralama vardır.
B) Kategoriler arasında hiçbir sıralama yoktur.
C) Kesirli değerler alabilirler.
D) Yapısal veriye örnektirler.
E) Sayılar, metinler gibi sütun ve satırlardan oluşurlar.

Cevap: B) Kategoriler arasında hiçbir sıralama yoktur.

Açıklama: Nominal değişkenler, kategoriler arasında sıralama olmayan değişkenlerdir.

4- Hangi adım, veri madenciliği sürecindeki en zahmetli ve zaman alıcı adımdır?

A) Modelleme
B) Tahmin ve Karar Destek
C) Örüntü Tanıma
D) Doğrulama ve Değerlendirme
E) Ön İşleme

Cevap: E) Ön İşleme

Açıklama: Ön işleme, veri madenciliği sürecinde en zahmetli ve zaman alıcı adımdır.

5- Hangisi veri, enformasyon ve bilgi arasındaki ilişkiyi doğru ifade eder?

A) Veri, enformasyonun işlenmiş haliyken, bilgi bu verilerin düzenlenmiş hali olarak tanımlanır.
B) Bilgi, enformasyonun daha detaylı bir versiyonudur ve veri en basit formudur.
C) Veri, ham ve işlenmemiş bilgileri ifade ederken, enformasyon bu verilerin işlenmiş ve düzenlenmiş hali olarak tanımlanır, bilgi ise enformasyonun işlenmiş ve kullanılabilir hali olarak tanımlanır.
D) Bilgi, verilerin anlamlı hale geldiği durumu temsil ederken, enformasyon bu verilerin anlam kazanmış hali olarak tanımlanır.
E) Veri, enformasyonun daha basit bir formu iken, bilgi bu verilerin en kapsamlı hali olarak tanımlanır.

Cevap: C) Veri, ham ve işlenmemiş bilgileri ifade ederken, enformasyon bu verilerin işlenmiş ve düzenlenmiş hali olarak tanımlanır, bilgi ise enformasyonun işlenmiş ve kullanılabilir hali olarak tanımlanır.

Açıklama: Veri, enformasyon ve bilgi arasındaki ilişki, verinin işlenerek enformasyona, enformasyonun da anlam kazanarak bilgiye dönüşmesi sürecini yansıtır.

6- Hangisi yapısal olmayan veri türüne örnektir?

A) Doğum tarihleri
B) Hız verisi
C) Satış tablosundaki satılan ürün miktarı
D) Ses dosyaları
E) Sınav sonuçları

Cevap: D) Ses dosyaları

Açıklama: Ses dosyaları yapısal olmayan veri türüdür.

7- Hangi değişken türü, sayısal bir ilişkiye sahip değildir ancak sıralanabilir?

A) Nominal Değişkenler
B) Sürekli Değişkenler
C) Kesikli Değişkenler
D) Ordinal Değişkenler
E) Yapısal Değişkenler

Cevap: D) Ordinal Değişkenler

Açıklama: Ordinal değişkenler, sayısal bir ilişkiye sahip olmadan sıralanabilir değişkenlerdir.

8- Veri madenciliği ve makine öğrenimi ile ilgili aşağıdakilerden hangisi doğrudur?

A) Her ikisi de belirli bir amaca hizmet eden modeller geliştirmeyi amaçlar.
B) İkisi de yapay zeka alanının bir alt kategorileridir ve bu alanda daha somut görevleri gerçekleştirmek için kullanılır.
C) Veri setlerindeki örüntüleri keşfetmeyi hedefler.
D) İkisinin de odakları aynıdır.
E) Veri madenciliği ve makine öğrenimi, aynı süreci ifade eder ve birbirinin yerine kullanılabilir terimlerdir.

Cevap: C) Veri setlerindeki örüntüleri keşfetmeyi hedefler.

Açıklama: Veri madenciliği ve makine öğrenimi, veri setlerindeki örüntüleri keşfetmeyi hedefler.

9- Veri madenciliği ve bilgi keşfi arasındaki ilişkiyi doğru ifade eden aşağıdaki seçeneklerden hangisidir?

A) Veri madenciliği, bilgi keşfinin bir parçasıdır ve veri analizlerini içerir.
B) Veri madenciliği, bilgi keşfi ile eş anlamlıdır ve aynı süreci ifade eder.
C) Veri madenciliği, bilgi keşfi sürecindeki en zahmetli adımdır.
D) Veri madenciliğiyle bilgi keşfi arasında doğrudan bir ilişki yoktur.
E) Bilgi keşfi, veri madenciliği sürecinin son adımıdır.

Cevap: A) Veri madenciliği, bilgi keşfinin bir parçasıdır ve veri analizlerini içerir.

Açıklama: Veri madenciliği, bilgi keşfinin bir parçasıdır ve veri analizlerini içerir.

10- Veri madenciliği sürecinde kullanılan modeller, hangi amaç(lar) için kullanılır?

I. Veri setlerindeki gizli örüntüleri bulmak
II. Çıktıları değerlendirmek
III. Ön işleme
IV. Tahmin yapmak
A) I ve II
B) I ve IV
C) I, II ve IV
D) III ve IV
E) II, III ve IV

Cevap: B) I ve IV

Açıklama: Veri madenciliği sürecinde kullanılan modeller, veri setlerindeki gizli örüntüleri bulmak ve tahmin yapmak amacıyla kullanılır.

Veri Madenciliği Vize Deneme Sınavı -1

Yönetim Bilişim Sistemleri Lisans
Veri Madenciliği Yönetim Bilişim Sistemleri Lisans

Yönetim Bilişim Sistemleri Lisans

Auzef Yönetim Bilişim Sistemleri Lisans 4. Sınıf Bahar Dönemi Vize Soruları ve Deneme Sınavları, 2024 Sınav Soruları

Editor

Editör

error: Kopyalamaya Karşı Korumalıdır!