Web Analitiği Ve Zekâsı Ünite -4
Web Trafiği Analizi
#1. Kategorik değişkenlerin frekans dağılımını hesaplamak için R’da hangi fonksiyon kullanılabilir?
Cevap: D) table()
Açıklama: `table()` fonksiyonu, **kategorik verilerin frekans dağılımını hesaplamak için** kullanılır. Örneğin, bir veri setindeki cinsiyet sütunu için `table(veri$Gender)` komutu kullanıldığında, “Erkek” ve “Kadın” kategorilerinin kaç kez geçtiğini sayar.
Kategorik değişkenlerin frekans dağılımını hesaplamak için table() fonksiyonu kullanılır.
table(veri$Kategori) komutu, veri setindeki her bir kategoriye kaç adet gözlem düştüğünü gösterir.
Örneğin, bir Cinsiyet değişkeni için table(veri$Gender) komutu kullanıldığında, veri setinde kaç erkek ve kaç kadın gözlem bulunduğunu görebiliriz.
Bu yöntem, kategorik verilerin dağılımını anlamak için önemli bir istatistiksel tekniktir ve özellikle anket sonuçları, müşteri segmentasyonu gibi alanlarda sıkça kullanılır.
#2. Bir veri setinin ilk birkaç satırını görüntülemek için kullanılan R fonksiyonu aşağıdakilerden hangisidir?
Cevap: D) head()
Açıklama: `head()` fonksiyonu, bir veri setinin **ilk birkaç satırını (varsayılan olarak ilk 6 satırını) görüntülemek** için kullanılır. Eğer belirli bir satır sayısı görmek istenirse, `head(veri, 10)` gibi bir kullanım mümkündür.
Bir veri setinin ilk birkaç satırını görüntülemek için head() fonksiyonu kullanılır.
head(veri), varsayılan olarak ilk 6 satırı döndürür.
head(veri, 10), ilk 10 satırı göstermek için kullanılabilir.
Bu fonksiyon, veri setini hızlıca gözden geçirmek ve değişkenlerin nasıl göründüğünü anlamak için oldukça faydalıdır. Veri analistleri, veri setini yükledikten sonra ilk olarak head() fonksiyonunu kullanarak veri hakkında genel bir fikir edinir.
#3. Veri setinde tekrarlayan satırların tespit edilmesi için R programında hangi fonksiyon kullanılır?
Cevap: B) duplicated()
Açıklama: `duplicated()` fonksiyonu, veri setinde **tekrarlayan (duplikat) satırları bulmak için kullanılır**. Bu fonksiyon, tekrarlanan satırları **TRUE (doğru) / FALSE (yanlış)** olarak işaretleyerek analiz edilmesini sağlar.
Tekrarlayan satırları tespit etmek için duplicated() fonksiyonu kullanılır.
Bu fonksiyon, veri setindeki tekrarlanan satırları TRUE veya FALSE olarak işaretleyerek hangi verilerin tekrarlandığını analiz etmeye olanak tanır.
duplicated(veri) komutu, ilk kez görünen satırları FALSE, tekrar edenleri ise TRUE olarak işaretler.
veri[duplicated(veri), ] komutu, sadece tekrarlayan satırları döndürür.
Bu yöntem, veri temizleme işlemlerinde kritik öneme sahiptir, çünkü yinelenen veriler istatistiksel analizlerin ve makine öğrenmesi modellerinin doğruluğunu düşürebilir.
#4. R programlama dilinde summary() fonksiyonunun kullanımı ile ilgili aşağıdaki ifadelerden hangisi doğrudur?
Cevap: B) Veri setindeki tüm değişkenlerin özet istatistiklerini verir.
Açıklama: `summary()` fonksiyonu, **veri setindeki tüm değişkenlerin temel istatistiklerini** döndürür. Nümerik değişkenler için ortalama, medyan, min/maks değerlerini, kategorik değişkenler için ise frekans dağılımını gösterir.
summary() fonksiyonu, bir veri setindeki tüm değişkenlerin özet istatistiklerini verir.
Nümerik değişkenler için minimum, maksimum, ortalama, medyan ve çeyrek değerleri hesaplar.
Kategorik değişkenler için her kategorinin frekans dağılımını gösterir.
Örneğin:
summary(mtcars)
komutu, mtcars veri setindeki her değişken için temel istatistikleri döndürür.
Bu fonksiyon, veri seti hakkında genel bir bakış sağlamak ve veri temizleme sürecine başlamak için kritik bir araçtır.
#5. Veri setindeki “Bounce Rate (%)” değişkeni aşağıdakilerden hangisini ifade eder?
Cevap: A) Hemen çıkma oranı
Açıklama: Hemen çıkma oranı (Bounce Rate), bir kullanıcının siteye geldikten sonra başka bir sayfaya geçmeden ayrılma yüzdesini ifade eder. Yüksek bounce rate, içeriğin veya sayfa deneyiminin kullanıcıları yeterince çekmediğini gösterebilir.
Hemen çıkma oranı (Bounce Rate), bir kullanıcının web sitesine girdikten sonra herhangi bir etkileşimde bulunmadan ayrılmasını ifade eder. Yüksek bir hemen çıkma oranı, kullanıcıların sayfayı ilgi çekici bulmadığını veya istedikleri bilgiye ulaşamadığını gösterebilir. Web sitesi sahipleri bu oranı düşürmek için içerik kalitesini artırabilir, gezinme yapısını iyileştirebilir veya sayfa yükleme hızını artırabilir.
Öğrenme Yönetim Sistemi Öğrenci Dostu LOLONOLO bol bol deneme sınavı yapmayı önerir.
#6. R programlama dilinde lapply() fonksiyonunun temel amacı aşağıdakilerden hangisidir?
Cevap: C) Bir veri kümesi üzerinde işlem yaparak her elemana tek bir işlem uygulamak.
Açıklama: `lapply()` fonksiyonu, **bir liste veya vektörün her elemanına belirli bir işlemi uygulamak** için kullanılır. Örneğin, `lapply(veri, mean)` komutu, veri setindeki her sütunun ortalama değerini hesaplar.
lapply() fonksiyonu, bir veri kümesi üzerindeki her elemana tek tek işlem uygulamak için kullanılır.
Bu fonksiyon, listeler ve vektörler üzerinde iterasyon yapmak için kullanılır.
Örneğin, lapply(veri, mean) komutu, veri setindeki her sütunun ortalamasını hesaplar.
lapply() fonksiyonunun kullanımı, veri dönüşümleri ve büyük veri setleri üzerinde aynı işlemi tekrar tekrar uygulamak gerektiğinde büyük kolaylık sağlar. Özellikle, sapply() ve tapply() fonksiyonları ile birlikte kullanılarak daha gelişmiş veri manipülasyonu işlemleri yapılabilir.
#7. Veri setinde yer alan nümerik değişkenlerden biri aşağıdakilerden hangisidir?
Cevap: A) Pageviews
Açıklama: “Pageviews” (sayfa görüntüleme sayısı) **nümerik bir değişkendir** çünkü bir sayfanın kaç kez görüntülendiğini sayısal bir değer olarak ifade eder. Diğer seçeneklerde yer alan “User Type”, “Gender” ve “Source” gibi değişkenler ise kategoriktir.
Pageviews (Sayfa Görüntüleme Sayısı) nümerik bir değişkendir çünkü doğrudan sayısal bir değeri temsil eder. Web analitiğinde, sayfa görüntüleme sayıları, kullanıcıların bir siteyle ne kadar etkileşimde bulunduğunu ölçmek için kullanılır. Yüksek sayfa görüntüleme oranı, içeriğin kullanıcıları cezbettiğini gösterirken, çok düşük bir oran içeriğin yeterince ilgi çekici olmadığını veya gezinme yapısının kullanıcı dostu olmadığını gösterebilir.
#8. Kullanıcıların siteye erişim sırasında kullandıkları cihaz türünü içeren değişken aşağıdakilerden hangisidir?
Cevap: E) Device Category
Açıklama: “Device Category” değişkeni, kullanıcıların siteye erişirken kullandıkları cihaz türünü (mobil, tablet, masaüstü) belirtir. Google Analytics ve diğer web analitik araçlarında, cihaz kategorileri ayrı bir değişken olarak takip edilir ve raporlanır.
Device Category değişkeni, kullanıcıların siteye erişirken kullandıkları cihaz türünü (masaüstü, mobil veya tablet) belirten bir değişkendir. Web analitiği araçları, bu değişkeni kullanarak kullanıcı deneyimini cihaz türüne göre analiz etmeyi ve optimize etmeyi sağlar. Örneğin, mobil kullanıcılar için daha iyi bir deneyim sunmak amacıyla mobil uyumlu tasarım değişiklikleri yapmak bu değişkenin analizine dayanabilir.
#9. R programlama dilinde prop.table() fonksiyonunun temel görevi aşağıdakilerden hangisidir?
Cevap : C) Bir tablo içindeki frekans değerlerini oranlara çevirir.
Açıklama : prop.table() fonksiyonu, bir tablo veya matris içindeki frekans değerlerini yüzdelik oranlara çevirerek istatistiksel analizlerde daha anlamlı hale getirmek için kullanılır. Özellikle kategorik değişkenlerin oranlarını hesaplamak amacıyla tercih edilir.
Örneğin, bir veri setinde cinsiyet dağılımını görmek için önce table(veri$Gender) ile frekans tablosu oluşturulur, ardından prop.table(table(veri$Gender)) kullanılarak bu frekans değerleri toplamın yüzdesi olarak dönüştürülür.
Bu sayede, veri setindeki her kategorinin toplam içindeki yüzdesi hesaplanarak, analizlerin daha doğru yorumlanması sağlanır. Aynı zamanda satır veya sütun bazlı oranlar hesaplamak için margin = 1 veya margin = 2 argümanları da kullanılabilir (prop.table(table(veri), margin = 1)).
#10. Bir veri setindeki eksik değerlerin toplam sayısını bulmak için aşağıdaki fonksiyonlardan hangisi kullanılır?
Cevap: E) sum(is.na(veri))
Açıklama: `sum(is.na(veri))` fonksiyonu, bir veri setindeki **tüm eksik (NA) değerleri sayarak** toplam sayıyı döndürür. Diğer fonksiyonlar, eksik değerleri farklı şekillerde analiz edebilir ancak toplam eksik değer sayısını hesaplamak için en doğru yöntem budur.
Bir veri setinde eksik değerlerin toplam sayısını belirlemek için sum(is.na(veri)) fonksiyonu kullanılır.
is.na(veri), veri setindeki NA (eksik) değerleri tespit eder.
sum() fonksiyonu ise bu eksik değerlerin toplam sayısını döndürür.
Eksik veri analizleri, veri biliminde ve istatistiksel modellemede önemli bir adımdır. Eksik verileri analiz etmek, modelin doğruluğunu artırabilir ve verinin tamamlanması için hangi yöntemlerin uygulanması gerektiğini belirlemeye yardımcı olur.
Öğrenme Yönetim Sistemi Öğrenci Dostu LOLONOLO bol bol deneme sınavı yapmayı önerir.
SONUÇ
İstanbul Üniversitesi Açık ve Uzaktan Eğitim Fakültesi (Auzef)
Açık Öğretim Fakültesi
Bölüm : Web Tasarımı ve Kodlama
2. Sınıf Bahar Dönemi
Web Analitiği Ve Zekâsı Ünite -4
Web Trafiği Analizi
İstanbul Üniversitesi Açık ve Uzaktan Eğitim Fakültesi (Auzef)
Açık Öğretim Fakültesi
Bölüm : Web Tasarımı ve Kodlama
2. Sınıf Bahar Dönemi
Web Analitiği Ve Zekâsı Ünite -4
Web Trafiği Analizi
Web Trafiği Analizi
| İstanbul Üniversitesi Açık ve Uzaktan Eğitim Fakültesi (Auzef) Açık Öğretim Fakültesi Bölüm : Web Tasarımı ve Kodlama 2. Sınıf Bahar Dönemi Web Analitiği Ve Zekâsı Ünite -4 Web Trafiği Analizi |
|---|
Web Trafiği Analizi
Webde Veri Analizi |
|
|---|---|
@lolonolo_com |
Web Trafiği Analizi
Web Analitiği Ve Zekâsı Ünite -4
Web Trafiği Analizi
Web Analitiği ve Zekâsı – Ünite 4: Webde Veri Analizi |
|
|---|---|
@lolonolo_com |
Web Trafiği Analizi
Web Analitiği ve Zekâsı – Ünite 4: Webde Veri Analizi |
|
|---|---|
@lolonolo_com |
|
Auzef Web Tasarımı ve Kodlama 2. Sınıf

