auzefVeri MadenciliğiYönetim Bilişim Sistemleri

Veri Madenciliği Ünite -3

Veri Keşfi ve Görselleştirme

#1. Pasta grafiği hangi tür verilerin görsel analizi için kullanılır?

Cevap: B) Kategorik veriler

Açıklama: Pasta grafiği, kategorik verilerin oranlarını ve yüzdelerini görsel olarak temsil etmek için kullanılır.

#2. Veri setinde en sık tekrar eden değeri ifade eden istatistik hangisidir?

Cevap: D) Mod

Açıklama: Mod, veri setinde en sık tekrar eden değeri ifade eder ve veri dağılımında tepe noktasını temsil eder.

#3. Veri setindeki değerlerin ortalama etrafındaki yayılımı ölçen istatistik hangisidir?

Cevap: B) Varyans

Açıklama: Varyans, veri setindeki değerlerin ortalama etrafındaki yayılımını ölçer ve değerlerin ne kadar dağıldığını gösterir.

#4. Veri setindeki en büyük ve en küçük değer arasındaki farkı gösteren istatistik hangisidir?

Cevap: B) Aralık

Açıklama: Aralık, veri setindeki en büyük ve en küçük değer arasındaki farkı ifade eder ve veri dağılımının genişliğini gösterir.

#5. Aşırı değerlerin bulunduğu bir veri setinde hangi merkezi eğilim ölçüsü, genellikle yanıltıcı olabilir?

Cevap: B) Medyan

Açıklama: Aşırı değerlerin bulunduğu bir veri setinde, medyan merkezi eğilim ölçüsü olarak genellikle yanıltıcı olabilir, çünkü aşırı değerler medyanı etkileyebilir.

#6. Saçılım grafiği hangi tür ilişkileri görsel olarak göstermek için kullanılır?

Cevap: D) İki değişken arasındaki ilişkiler

Açıklama: Saçılım grafiği, iki değişken arasındaki ilişkileri ve bu ilişkinin yönünü ve gücünü görsel olarak göstermek için kullanılır.

#7. Kutu grafiği hangi istatistikleri görsel olarak temsil eder?

Cevap: C) Çeyreklikler

Açıklama: Kutu grafiği, veri setindeki çeyreklikleri, medyanı ve olası aykırı değerleri görsel olarak temsil eder.

#8. Veri setindeki değerlerin yarısından fazlasını/ortasını belirten istatistik hangisidir?

Cevap: C) Medyan

Açıklama: Medyan, veri setindeki değerlerin ortasını belirten ve veri setini iki eşit parçaya bölen istatistiktir.

#9. Histogram hangi veri özelliklerini göstermek için kullanılır?

Cevap: A) Belli bir aralıktaki dağılım

Açıklama: Histogram, veri setindeki değerlerin belli bir aralıktaki dağılımını göstermek için kullanılır ve frekans dağılımını görselleştirir.

#10. Kök ve yaprak diyagramı hangi amaçla kullanılır?

Cevap: B) Sürekli verilerin dağılımını göstermek için

Açıklama: Kök ve yaprak diyagramı, sürekli verilerin dağılımını ve veri setindeki bireysel değerlerin frekansını görselleştirmek için kullanılır.

TESTi BiTiR, PUANINI GÖR

SONUÇ

-

İstanbul Üniversitesi Açık ve Uzaktan Eğitim Fakültesi (Auzef)
Açık Öğretim Fakültesi
Bölüm : Yönetim Bilişim Sistemleri Lisans
4. Sınıf  Veri Madenciliği Bahar Dönemi
Ünite 3 :  Veri Keşfi ve Görselleştirme

İstanbul Üniversitesi Açık ve Uzaktan Eğitim Fakültesi (Auzef)
Açık Öğretim Fakültesi
Bölüm : Yönetim Bilişim Sistemleri Lisans
4. Sınıf  Veri Madenciliği Bahar Dönemi
Ünite 3 :  Veri Keşfi ve Görselleştirme

Share your score!
Tweet your score!
Share to other

HD Quiz powered by harmonic design

Veri Keşfi ve Görselleştirme

İstanbul Üniversitesi Açık ve Uzaktan Eğitim Fakültesi (Auzef)
Açık Öğretim Fakültesi
Bölüm : Yönetim Bilişim Sistemleri Lisans
4. Sınıf  Veri Madenciliği Bahar Dönemi
Ünite 3 :  Veri Keşfi ve Görselleştirme

Veri Keşfi ve Görselleştirme – Ünite 3

Veri Keşfi ve Görselleştirme

Veri keşfi ve görselleştirme, veri analizi sürecinin kritik aşamalarından biridir. Bu süreç, ham verilerin incelenmesi, anlamlı bilgiler elde edilmesi ve verilerin görsel temsil edilmesi yoluyla karar verme sürecine katkıda bulunur. Veri keşfi, verilerin özelliklerini anlamak, örüntüleri tespit etmek ve anormallikleri belirlemek için kullanılırken, veri görselleştirme bu bilgilerin anlaşılır bir şekilde sunulmasını sağlar.

1. Merkezi Eğilim Ölçüleri

Merkezi eğilim ölçüleri, veri setinin merkezi bir değer etrafında nasıl dağıldığını gösterir. En yaygın merkezi eğilim ölçüleri ortalama, medyan ve moddur:

Ortalama: Veri setindeki tüm değerlerin toplamının, değerlerin sayısına bölünmesiyle elde edilir. Aşırı değerler ortalamayı etkileyebilir.

Medyan: Veri setindeki ortanca değeri temsil eder. Aşırı değerlerden etkilenmez ve verilerin yarısını üstünde, yarısını altında bırakır.

Mod: Veri setinde en sık tekrar eden değerdir. Veri setinde birden fazla mod olabilir.

2. Yayılım Ölçüleri

Yayılım ölçüleri, veri setindeki değerlerin ne kadar geniş bir alana yayıldığını gösterir. En yaygın yayılım ölçüleri aralık, varyans ve standart sapmadır:

Aralık: Veri setindeki en büyük ve en küçük değer arasındaki farktır.

Varyans: Değerlerin ortalama etrafındaki dağılımını ölçer ve değerlerin ortalamadan ne kadar saptığını gösterir.

Standart Sapma: Varyansın kareköküdür ve veri setindeki değerlerin ortalama etrafında ne kadar dağıldığını gösterir.

3. Görselleştirme Teknikleri

Veri görselleştirme, verilerin grafikler ve diğer görsel araçlar kullanılarak temsil edilmesidir. Yaygın görselleştirme teknikleri şunlardır:

Histogram: Veri setindeki değerlerin frekans dağılımını göstermek için kullanılır. Veriler belirli aralıklara bölünerek sütun grafiği şeklinde gösterilir.

Kutu Grafiği (Box Plot): Veri setindeki çeyreklikleri, medyanı ve olası aykırı değerleri görsel olarak temsil eder.

Pasta Grafiği: Kategorik verilerin oranlarını ve yüzdelerini görsel olarak temsil eder. Her dilim, toplamın belirli bir yüzdesini temsil eder.

Saçılım Grafiği (Scatter Plot): İki değişken arasındaki ilişkiyi görsel olarak göstermek için kullanılır. Noktalar, iki değişkenin değerlerine göre konumlandırılır.

Kök ve Yaprak Diyagramı: Sürekli verilerin dağılımını ve frekansını göstermek için kullanılır.

4. Veri Görselleştirmenin Önemi

Veri görselleştirme, karmaşık verilerin anlaşılmasını kolaylaştırır ve verilerdeki örüntüleri, trendleri ve anormallikleri hızlı bir şekilde tespit etmeyi sağlar. Ayrıca, görselleştirmeler, verilerin daha etkili bir şekilde sunulmasına yardımcı olur ve karar verme sürecinde önemli bir rol oynar.

Sonuç olarak, veri keşfi ve görselleştirme, veri analizi sürecinin ayrılmaz bir parçasıdır ve verilerin anlamlandırılmasında, yorumlanmasında ve sunulmasında kritik bir rol oynar. Bu süreçler, verilerin daha etkili bir şekilde kullanılmasını ve karar verme süreçlerinin iyileştirilmesini sağlar.

 

Veri Keşfi ve Görselleştirme – Ünite 3

1- Veri setinde en sık tekrar eden değeri ifade eden istatistik hangisidir?

A) Ortalama
B) Standart Sapma
C) Medyan
D) Mod
E) Varyans

Cevap: D) Mod

Açıklama: Mod, veri setinde en sık tekrar eden değeri ifade eder ve veri dağılımında tepe noktasını temsil eder.

2- Veri setindeki değerlerin yarısından fazlasını/ortasını belirten istatistik hangisidir?

A) Ortalama
B) Standart Sapma
C) Medyan
D) Mod
E) Aralık

Cevap: C) Medyan

Açıklama: Medyan, veri setindeki değerlerin ortasını belirten ve veri setini iki eşit parçaya bölen istatistiktir.

3- Veri setindeki en büyük ve en küçük değer arasındaki farkı gösteren istatistik hangisidir?

A) Mod
B) Aralık
C) Medyan
D) Ortalama
E) Standart Sapma

Cevap: B) Aralık

Açıklama: Aralık, veri setindeki en büyük ve en küçük değer arasındaki farkı ifade eder ve veri dağılımının genişliğini gösterir.

4- Veri setindeki değerlerin ortalama etrafındaki yayılımı ölçen istatistik hangisidir?

A) Medyan
B) Varyans
C) Mod
D) Aralık
E) Standart Sapma

Cevap: B) Varyans

Açıklama: Varyans, veri setindeki değerlerin ortalama etrafındaki yayılımını ölçer ve değerlerin ne kadar dağıldığını gösterir.

5- Aşırı değerlerin bulunduğu bir veri setinde hangi merkezi eğilim ölçüsü, genellikle yanıltıcı olabilir?

A) Mod
B) Medyan
C) Standart Sapma
D) Varyans
E) Aralık

Cevap: B) Medyan

Açıklama: Aşırı değerlerin bulunduğu bir veri setinde, medyan merkezi eğilim ölçüsü olarak genellikle yanıltıcı olabilir, çünkü aşırı değerler medyanı etkileyebilir.

6- Kök ve yaprak diyagramı hangi amaçla kullanılır?

A) İki değişken arasındaki ilişkiyi göstermek için
B) Sürekli verilerin dağılımını göstermek için
C) Aşırı değerleri belirlemek için
D) Veri setinin merkezi eğilimini göstermek için
E) Kategorik verilerin oransal dağılımını göstermek için

Cevap: B) Sürekli verilerin dağılımını göstermek için

Açıklama: Kök ve yaprak diyagramı, sürekli verilerin dağılımını ve veri setindeki bireysel değerlerin frekansını görselleştirmek için kullanılır.

7- Histogram hangi veri özelliklerini göstermek için kullanılır?

A) Belli bir aralıktaki dağılım
B) Medyan
C) Çeyreklikler
D) Aykırı değerler
E) Ortalama

Cevap: A) Belli bir aralıktaki dağılım

Açıklama: Histogram, veri setindeki değerlerin belli bir aralıktaki dağılımını göstermek için kullanılır ve frekans dağılımını görselleştirir.

8- Kutu grafiği hangi istatistikleri görsel olarak temsil eder?

A) Oransal dağılım
B) Standart Sapma
C) Çeyreklikler
D) Medyan
E) Varyans

Cevap: C) Çeyreklikler

Açıklama: Kutu grafiği, veri setindeki çeyreklikleri, medyanı ve olası aykırı değerleri görsel olarak temsil eder.

9- Pasta grafiği hangi tür verilerin görsel analizi için kullanılır?

A) Sürekli veriler
B) Kategorik veriler
C) Dağılım verileri
D) Aritmetik veriler
E) Her tür veri

Cevap: B) Kategorik veriler

Açıklama: Pasta grafiği, kategorik verilerin oranlarını ve yüzdelerini görsel olarak temsil etmek için kullanılır.

10- Saçılım grafiği hangi tür ilişkileri görsel olarak göstermek için kullanılır?

A) Lineer ilişkiler
B) Kategorik ilişkiler
C) Karmaşık ilişkiler
D) İki değişken arasındaki ilişkiler
E) Eşzamanlı ilişkiler

Cevap: D) İki değişken arasındaki ilişkiler

Açıklama: Saçılım grafiği, iki değişken arasındaki ilişkileri ve bu ilişkinin yönünü ve gücünü görsel olarak göstermek için kullanılır.

 

Yönetim Bilişim Sistemleri Lisans
Veri Madenciliği Yönetim Bilişim Sistemleri Lisans

Yönetim Bilişim Sistemleri Lisans

Auzef Yönetim Bilişim Sistemleri Lisans 4. Sınıf Bahar Dönemi Ünite Soruları ve Deneme Sınavları, 2024 Sınav Soruları

Editor

Editör

error: Kopyalamaya Karşı Korumalıdır!