auzefWeb Analitiği Ve ZekâsıWeb Tasarım Ve Kodlama

Web Analitiği Ve Zekâsı Ünite -3

Webde Veri Toplama Ve Ön İşleme

 

#1. Google Analytics ile ilgili aşağıdaki ifadelerden hangisi yanlıştır?

Cevap: D) Google Analytics, kullanıcıların kişisel şifre bilgilerini saklayarak güvenlik risklerini analiz eder.

Açıklama: Google Analytics, gizlilik politikaları gereği şifre saklamaz ve analiz etmez.
Google Analytics, ziyaretçilerin site üzerindeki hareketlerini ve etkileşimlerini analiz eder. Ancak, kullanıcıların şifre gibi kişisel verilerini saklamaz ve analiz etmez. Gizlilik politikalarına göre, Google Analytics yalnızca anonimleştirilmiş ve kullanıcıların açık rızasıyla toplanan verileri işleyebilir. Bu nedenle, şifre saklama ve güvenlik analizi yapma ifadesi yanlıştır.

#2. R’da analizlerde kullanılmak üzere veri adlı bir data frame tanımlanıyor. Aşağıdakilerden hangisi summary(veri) fonksiyonu ile elde edilemez?

Cevap: C) Nümerik nitelikler için standart sapma (standard deviation)

Açıklama: `summary()` fonksiyonu standart sapma hesaplamaz, bunun yerine `sd()` fonksiyonu kullanılır.
summary(veri) fonksiyonu, veri çerçevesindeki kategorik ve nümerik değişkenlerin özet istatistiklerini döndürür. Ancak standart sapma (standard deviation) değerini göstermez. Standart sapma hesaplamak için sd() fonksiyonu kullanılır. summary() yalnızca ortalama, medyan, minimum, maksimum ve eksik değerler gibi temel istatistikleri verir.

#3. Aşağıdakilerden hangisi bir sunucu logu parametreleri arasında değildir?

Cevap: B) Kullanıcı şifresi

Açıklama: Sunucu loglarında güvenlik nedeniyle kullanıcı şifreleri tutulmaz.
Sunucu logları, genellikle kullanıcının erişim zamanını, istek türünü, kullanıcı adını ve ziyaret yolunu içerir. Ancak, güvenlik ve gizlilik ilkeleri gereği kullanıcı şifreleri hiçbir sunucu logunda saklanmaz. Bu tür hassas bilgiler, güvenli veri saklama politikalarına göre şifre

#4. Aşağıdaki ifadelerden hangisi, veri setindeki aykırı değerlerin (outliers) tespit edilmesi için kullanılan çeyrekler arası aralık (IQR) yöntemi ile ilgili yanlıştır?

Cevap: B) Aykırı değerler yalnızca veri setindeki eksik (NA) değerlerden oluşur.

Açıklama: Aykırı değerler eksik verilerle (NA) sınırlı değildir. IQR yöntemi, aşırı büyük veya küçük değerleri belirleyerek aykırı değerleri tespit eder.
IQR yöntemi, veri setindeki aykırı değerleri belirlemek için kullanılan en yaygın yöntemlerden biridir. Çeyrekler arası aralık (IQR), Q3 (Üçüncü çeyrek) ile Q1 (Birinci çeyrek) arasındaki farktır. Aykırı değerler yalnızca eksik (NA) değerlerden oluşmaz, çünkü IQR yöntemi belirli sınırların dışında kalan değerleri tespit eder. Aykırı değerler, alt sınırın (Q1 – 1.5 * IQR) altında veya üst sınırın (Q3 + 1.5 * IQR) üstünde olan tüm verilerdir. Bu nedenle, aykırı değerlerin sadece eksik verilerden (NA) oluştuğunu söylemek yanlıştır.

#5. R’da veri normalizasyonu süreciyle ilgili aşağıdaki ifadelerden hangisi yanlıştır?

Cevap: D) preProcess() fonksiyonu yalnızca kategorik değişkenler üzerinde çalışır.

Açıklama: `preProcess()` fonksiyonu hem nümerik hem de kategorik veriler için veri ön-işleme işlemleri gerçekleştirebilir.
preProcess() fonksiyonu yalnızca kategorik değişkenler üzerinde çalışmaz. Aksine, bu fonksiyon hem nümerik hem de kategorik veriler için ölçekleme (scaling), normalizasyon (normalization), merkezleme (centering), eksik değer doldurma (imputation) gibi çeşitli veri ön işleme işlemlerini gerçekleştirir. Kategorik değişkenler için belirli ön işlemler yapılsa da, preProcess() fonksiyonu genellikle nümerik değişkenler üzerinde kullanılır.

Öğrenme Yönetim Sistemi Öğrenci Dostu LOLONOLO bol bol deneme sınavı yapmayı önerir.

#6. R ile bir analiz çalışması yapmak için çalışma klasörünün belirlenmesi sürecine ilişkin aşağıdaki ifadelerden hangisi yanlıştır?

Cevap: C) Çalışma klasörünün belirlenmesi için yalnızca ve yalnızca RStudio’nun menü seçenekleri kullanılabilir.

Açıklama: R’da çalışma klasörü `setwd()` fonksiyonu ile de belirlenebilir.
R’da çalışma klasörü belirleme işlemi yalnızca RStudio menü seçenekleriyle sınırlı değildir. Çalışma dizini setwd(“klasör_yolu”) komutu kullanılarak doğrudan R komut satırından da değiştirilebilir. RStudio menüsünden dizin belirlemek kolay bir yöntemdir, ancak tek yöntem değildir. Bu nedenle, “yalnızca RStudio menü seçenekleri kullanılabilir” ifadesi yanlıştır.

#7. Veri ayrıklaştırma (data discretization) sürecine ilişkin aşağıdaki ifadelerden hangisi yanlıştır?

Cevap: E) Veri ayrıklaştırma sonrası oluşturulan kategorik değişken her zaman analizlerde kullanılmalıdır, orijinal nümerik değişken çıkarılmalıdır.

Açıklama: Orijinal nümerik değişken her zaman çıkarılmak zorunda değildir. Kimi analizlerde hem ayrıklaştırılmış hem de orijinal değişkenin birlikte kullanılması faydalı olabilir.
Veri ayrıklaştırma (data discretization) işlemi, nümerik verileri belirli aralıklara bölerek kategorik hale getirme sürecidir. Ancak, orijinal nümerik değişkenin analizlerden tamamen çıkarılması zorunlu değildir. Bazı durumlarda, analizler hem ayrıklaştırılmış (discrete) değişkenler hem de orijinal nümerik değişkenlerle yapılır. Örneğin, makine öğrenmesi modellerinde, bazı algoritmalar orijinal nümerik değerleri kullanarak daha iyi performans gösterebilir. Bu yüzden, ayrıklaştırılmış değişkenlerin zorunlu olarak analizde kullanılması ve orijinal değişkenlerin silinmesi gerektiği yanlıştır.

#8. Google Site Kit ile ilgili aşağıdaki ifadelerden hangisi yanlıştır?

Cevap: A) Google Site Kit yalnızca Google Analytics hizmetini destekler, diğer Google araçlarıyla entegrasyon sağlamaz.

Açıklama: Google Site Kit, Google Search Console, Google Ads ve diğer hizmetlerle de entegrasyon sunar.
Google Site Kit, sadece Google Analytics ile sınırlı değildir. Google tarafından geliştirilen bu WordPress eklentisi, Google Search Console, Google AdSense, Google Tag Manager ve Google PageSpeed Insights gibi çeşitli araçlarla entegrasyon sağlayarak site sahiplerinin analiz yapmasına ve reklam gelirlerini yönetmesine olanak tanır. Yanlış olan ifade, Google Site Kit’in sadece Google Analytics ile çalıştığını iddia eden seçenektir.

#9. Google Analytics verilerine R ile erişim sağlamak için aşağıdaki adımlardan hangisi yanlıştır?

Cevap: E) Kimlik doğrulaması sırasında tarayıcı üzerinden oturum açılmalı ve gerekli izinler verilmelidir.

Açıklama: R’da kimlik doğrulaması için genellikle komut satırı tercih edilir, tarayıcıdan giriş gerekliliği yoktur.
R’da Google Analytics verilerine erişim sağlamak için googleAnalyticsR paketi kullanılır ve kimlik doğrulaması genellikle ga_auth() fonksiyonu ile yapılır. Kimlik doğrulaması sırasında tarayıcıdan giriş yapma zorunluluğu yoktur, çünkü R ortamında kimlik doğrulaması doğrudan token bazlı olarak gerçekleştirilebilir. Tarayıcı üzerinden giriş yapmak, genellikle kullanıcıların etkileşimli kimlik doğrulama gerektiren durumları için geçerlidir.

#10. R’da yapay kodlama (dummy coding) sürecine ilişkin aşağıdaki ifadelerden hangisi yanlıştır?

Cevap: E) Yapay kodlama işlemi sonucunda sütunlarda yalnızca 0 ve 1 değerleri yer alır.

Açıklama:
Yapay kodlama (dummy coding), kategorik değişkenleri sayısal değerlere dönüştürerek analizlerde kullanılmasını sağlar. Kodlama sonucunda sütunlarda yalnızca 0 ve 1 değerleri yer almaz. Bazı durumlarda, başka dönüşümler uygulanarak farklı sayısal değerler de üretilebilir. Örneğin, contr.treatment() gibi bazı fonksiyonlarla kodlama yöntemi değiştirilebilir. Dolayısıyla, yapay kodlamanın sadece 0 ve 1 değerleri içerdiğini söylemek hatalıdır.

Öğrenme Yönetim Sistemi Öğrenci Dostu LOLONOLO bol bol deneme sınavı yapmayı önerir.

Öncesi
TESTi BiTiR, PUANINI GÖR

SONUÇ

İstanbul Üniversitesi Açık ve Uzaktan Eğitim Fakültesi (Auzef)
Açık Öğretim Fakültesi
Bölüm : Web Tasarımı ve Kodlama
2. Sınıf Bahar Dönemi
Web Analitiği Ve Zekâsı Ünite -3
Webde Veri Toplama Ve Ön İşleme

İstanbul Üniversitesi Açık ve Uzaktan Eğitim Fakültesi (Auzef)
Açık Öğretim Fakültesi
Bölüm : Web Tasarımı ve Kodlama
2. Sınıf Bahar Dönemi
Web Analitiği Ve Zekâsı Ünite -3
Webde Veri Toplama Ve Ön İşleme

Webde Veri Toplama Ve Ön İşleme

İstanbul Üniversitesi Açık ve Uzaktan Eğitim Fakültesi (Auzef)
Açık Öğretim Fakültesi
Bölüm : Web Tasarımı ve Kodlama
2. Sınıf Bahar Dönemi
Web Analitiği Ve Zekâsı Ünite -3
Webde Veri Toplama Ve Ön İşleme

Webde Veri Toplama Ve Ön İşleme

Webde Veri Toplama ve Ön İşleme

Günümüzde web analitiği, işletmelerin ve bireylerin dijital dünyada daha bilinçli kararlar almasını sağlayan temel bir bileşendir. Veri toplama ve ön işleme süreçleri, doğru analizler yapabilmek için oldukça kritik bir yere sahiptir. Bu süreçler, çeşitli veri kaynaklarının kullanılması ve bu verilerin anlamlı hale getirilmesiyle gerçekleştirilir. Web siteleri üzerinden veri toplayan sistemler, özellikle kullanıcı davranışlarını anlamak, pazarlama stratejilerini geliştirmek ve hizmet kalitesini artırmak için yaygın şekilde kullanılmaktadır.

Sunucu Logları ve Web Verisi

Web siteleri üzerinden elde edilen veriler, farklı kaynaklardan toplanabilir. Bunlardan biri de sunucu loglarıdır. Sunucu logları, bir web sunucusuna gelen her isteğin kaydedildiği dosyalardır ve bu dosyalarda kullanıcıların hangi sayfaları ziyaret ettiği, hangi IP adreslerinden bağlandıkları ve hangi tarayıcıları kullandıkları gibi birçok bilgi yer alır. Ancak güvenlik ve gizlilik kuralları gereği, kullanıcı şifreleri gibi hassas bilgiler bu loglarda saklanmaz.

Bu log dosyalarındaki temel parametreler arasında ziyaret yolu, zaman damgası, kullanıcı adı ve istek türü gibi bilgiler bulunur. Log analizi, sistem yöneticileri için kritik olup anormal aktivitelerin tespit edilmesine ve güvenlik açıklarının belirlenmesine yardımcı olur.

Google Analytics ve Web Veri Analizi

Google Analytics, web sitelerine gelen ziyaretçi trafiğini analiz etmeye yarayan en popüler araçlardan biridir. Bu araç sayesinde ziyaretçilerin demografik özellikleri, ilgi alanları, coğrafi konumları ve sitedeki hareketleri detaylı şekilde incelenebilir. Ayrıca, trafik kaynaklarının etkinliği değerlendirilerek pazarlama stratejileri optimize edilebilir ve e-ticaret metrikleri analiz edilerek satış süreçleri geliştirilebilir.

Ancak Google Analytics’in güvenlik politikaları gereği kullanıcı şifreleri veya benzeri hassas bilgiler saklanmaz ve analiz edilmez. Bunun yerine kullanıcı davranışlarını anlamaya yönelik anonimleştirilmiş veriler kullanılır. Gerçek zamanlı analizler ile kullanıcıların o an hangi sayfalarda gezindiği ve hangi içeriklerle ilgilendiği takip edilebilir.

R ile Google Analytics Verilerine Erişim

Google Analytics verilerine R programlama dili ile erişmek mümkündür. Bu süreçte googleAnalyticsR paketi kullanılır ve kullanıcıların kimlik doğrulama işlemi için ga_auth() fonksiyonunu çalıştırmaları gerekir. Kimlik doğrulama işlemi, her oturumda manuel olarak gerçekleştirilmez, ilk yetkilendirmeden sonra bilgiler global olarak saklanır.

R ile veri analizi yaparken, çalışma klasörünün doğru belirlenmesi oldukça önemlidir. Çalışma klasörünün belirlenmesi için setwd() fonksiyonu veya RStudio’nun grafiksel arayüzündeki menü seçenekleri kullanılabilir. Çalışma klasörünün doğru ayarlanması, veriye kolay erişim sağlarken, verinin kaybolmasını ya da yanlış dosya yolları nedeniyle hata alınmasını engeller.

Google Site Kit ve Web Site Yönetimi

Web sitesi sahipleri için Google’ın sunduğu Google Site Kit eklentisi, Google hizmetlerinin WordPress sitelerine kolayca entegre edilmesini sağlar. Google Analytics, Google Search Console ve Google Ads gibi çeşitli araçlarla doğrudan entegrasyon sağlanabilir. Bu entegrasyon sayesinde web sitesi trafiği ve performansı kolayca takip edilebilir.

Google Site Kit, WordPress kontrol paneli üzerinden etkinleştirilebilir ve herhangi bir teknik bilgi gerektirmeden kurulumu gerçekleştirilebilir. Böylece web sitesi sahipleri, SEO performanslarını ve kullanıcı etkileşimlerini zahmetsizce izleyebilirler.

Veri Ön İşleme ve Analiz Teknikleri

Web analitiğinde toplanan veriler, analizden önce belirli ön işlemlerden geçirilmelidir. Veri ön işleme, eksik verilerin doldurulması, aykırı değerlerin tespit edilmesi ve verinin uygun formatlara dönüştürülmesi gibi işlemleri içerir.

Veri Önişleme Tekniklerinden Bazıları:

  1. Veri Özetleme ve Keşifsel Analiz:
    • summary() fonksiyonu ile veri hakkında temel istatistikler elde edilir.
    • Standart sapma gibi değerler sd() fonksiyonu ile hesaplanır.
  2. Veri Normalizasyonu:
    • preProcess() fonksiyonu, değişkenleri belirli bir aralığa getirmek için kullanılır.
    • c(“range”) parametresi ile veriler 0 ile 1 arasına normalize edilir.
  3. Yapay Kodlama (Dummy Coding):
    • dummyVars() fonksiyonu, kategorik değişkenleri 0 ve 1 şeklinde kodlayarak analiz için uygun hale getirir.
  4. Aykırı Değer Analizi:
    • Çeyrekler arası aralık (IQR) yöntemi ile aykırı değerler belirlenir.
    • Aykırı değerler, yalnızca eksik verilerle (NA) sınırlı değildir; istatistiksel olarak uç noktada kalan değerler de aykırı olarak değerlendirilir.
  5. Veri Ayrıklaştırma (Data Discretization):
    • cut() fonksiyonu ile nümerik değişkenler belirli aralıklara bölünerek kategorik hale getirilir.
    • Ayrıklaştırılan veriler, orijinal nümerik değerlerle birlikte analizlerde kullanılabilir.

Sonuç

Web analitiği ve veri işleme süreçleri, veri odaklı kararlar almak için büyük önem taşır. Sunucu logları, Google Analytics gibi araçlar ve R programlama dili, bu süreçleri yönetmek ve analiz etmek için etkin bir şekilde kullanılabilir. Toplanan verilerin anlamlandırılması için doğru veri önişleme tekniklerinin uygulanması gereklidir.

Bu süreçler sayesinde işletmeler ve bireyler, web sitelerinin performansını artırabilir, kullanıcı davranışlarını daha iyi anlayabilir ve daha bilinçli kararlar alabilirler. Etkin veri analizi, rekabet avantajı elde etmek ve dijital dünyada başarılı olmak için kritik bir unsurdur.

@lolonolo_com

Web Analitiği Ve Zekâsı Ünite -3

Webde Veri Toplama Ve Ön İşleme

Web Analitiği ve Zekâsı – Ünite 3: Webde Veri Toplama ve Ön İşleme

1- Aşağıdakilerden hangisi bir sunucu logu parametreleri arasında değildir?

A) Ziyaret yolu
B) Kullanıcı şifresi
C) Zaman damgası
D) Kullanıcı adı
E) İstek türü

Cevap: B) Kullanıcı şifresi

Açıklama: Sunucu loglarında güvenlik nedeniyle kullanıcı şifreleri tutulmaz.
Sunucu logları, genellikle kullanıcının erişim zamanını, istek türünü, kullanıcı adını ve ziyaret yolunu içerir. Ancak, güvenlik ve gizlilik ilkeleri gereği kullanıcı şifreleri hiçbir sunucu logunda saklanmaz. Bu tür hassas bilgiler, güvenli veri saklama politikalarına göre şifrelenmiş veya sistemin erişemeyeceği bir şekilde saklanmalıdır

2- Google Analytics ile ilgili aşağıdaki ifadelerden hangisi yanlıştır?

A) Ziyaretçilerin demografik özellikleri, ilgi alanları ve coğrafi konumları analiz edilebilir.
B) Trafik kaynaklarının etkinliği değerlendirilerek pazarlama stratejileri optimize edilebilir.
C) Satış verileri, ortalama sipariş değeri ve en çok satılan ürünler gibi e-ticaret metrikleri analiz edilebilir.
D) Google Analytics, kullanıcıların kişisel şifre bilgilerini saklayarak güvenlik risklerini analiz eder.
E) Kullanıcıların anlık davranışları ve aktif sayfa gezintileri takip edilebilir.

Cevap: D) Google Analytics, kullanıcıların kişisel şifre bilgilerini saklayarak güvenlik risklerini analiz eder.

Açıklama: Google Analytics, gizlilik politikaları gereği şifre saklamaz ve analiz etmez.
Google Analytics, ziyaretçilerin site üzerindeki hareketlerini ve etkileşimlerini analiz eder. Ancak, kullanıcıların şifre gibi kişisel verilerini saklamaz ve analiz etmez. Gizlilik politikalarına göre, Google Analytics yalnızca anonimleştirilmiş ve kullanıcıların açık rızasıyla toplanan verileri işleyebilir. Bu nedenle, şifre saklama ve güvenlik analizi yapma ifadesi yanlıştır.

3- Google Analytics verilerine R ile erişim sağlamak için aşağıdaki adımlardan hangisi yanlıştır?

A) Google Analytics hesabına erişim için googleAnalyticsR paketi yüklenmeli ve çağrılmalıdır.
B) ga_auth() fonksiyonu ile Google hesabı üzerinden kimlik doğrulaması yapılmalıdır.
C) İlk kimlik doğrulamasından sonra bilgiler global olarak saklanır ve her oturumda manuel olarak kimlik doğrulaması yapılması gereklidir.
D) Mevcut Google hesabından farklı bir Google hesabı ile giriş yapma imkânı bulunmaktadır.
E) Kimlik doğrulaması sırasında tarayıcı üzerinden oturum açılmalı ve gerekli izinler verilmelidir.

Cevap: E) Kimlik doğrulaması sırasında tarayıcı üzerinden oturum açılmalı ve gerekli izinler verilmelidir.

Açıklama: R’da kimlik doğrulaması için genellikle komut satırı tercih edilir, tarayıcıdan giriş gerekliliği yoktur.
R’da Google Analytics verilerine erişim sağlamak için googleAnalyticsR paketi kullanılır ve kimlik doğrulaması genellikle ga_auth() fonksiyonu ile yapılır. Kimlik doğrulaması sırasında tarayıcıdan giriş yapma zorunluluğu yoktur, çünkü R ortamında kimlik doğrulaması doğrudan token bazlı olarak gerçekleştirilebilir. Tarayıcı üzerinden giriş yapmak, genellikle kullanıcıların etkileşimli kimlik doğrulama gerektiren durumları için geçerlidir.

4- Google Site Kit ile ilgili aşağıdaki ifadelerden hangisi yanlıştır?

A) Google Site Kit yalnızca Google Analytics hizmetini destekler, diğer Google araçlarıyla entegrasyon sağlamaz.
B) Google tarafından geliştirilen ve WordPress için resmi bir eklenti olarak sunulmaktadır.
C) Google Analytics başta olmak üzere çeşitli Google hizmetlerinin web sitesine entegre edilmesine olanak tanır.
D) Entegrasyon süreci, WordPress kontrol paneli üzerinden gerçekleştirilebilir ve teknik bilgi gerektirmez.
E) Bu eklenti, WordPress kullanıcılarının web sitelerindeki Google araçlarına kolay erişim sağlamalarına yardımcı olur.

Cevap: A) Google Site Kit yalnızca Google Analytics hizmetini destekler, diğer Google araçlarıyla entegrasyon sağlamaz.

Açıklama: Google Site Kit, Google Search Console, Google Ads ve diğer hizmetlerle de entegrasyon sunar.
Google Site Kit, sadece Google Analytics ile sınırlı değildir. Google tarafından geliştirilen bu WordPress eklentisi, Google Search Console, Google AdSense, Google Tag Manager ve Google PageSpeed Insights gibi çeşitli araçlarla entegrasyon sağlayarak site sahiplerinin analiz yapmasına ve reklam gelirlerini yönetmesine olanak tanır. Yanlış olan ifade, Google Site Kit’in sadece Google Analytics ile çalıştığını iddia eden seçenektir.

5- R ile bir analiz çalışması yapmak için çalışma klasörünün belirlenmesi sürecine ilişkin aşağıdaki ifadelerden hangisi yanlıştır?

A) Çalışma klasörü oluşturulduktan sonra veri seti ve kullanılacak R betik dosyası bu klasörde saklanmalıdır.
B) RStudio’da “Session – Set Working Directory – Choose Directory” seçeneği kullanılarak çalışma klasörü belirlenebilir.
C) Çalışma klasörünün belirlenmesi için yalnızca ve yalnızca RStudio’nun menü seçenekleri kullanılabilir.
D) Veri seti ve R betik dosyasının aynı klasörde olduğu durumlarda “Session – Set Working Directory – To Source File Location” seçeneği tercih edilebilir.
E) Çalışma klasörünün doğru belirlenmesi, R çalışma ortamında veri dosyalarına kolay erişim sağlar.

Cevap: C) Çalışma klasörünün belirlenmesi için yalnızca ve yalnızca RStudio’nun menü seçenekleri kullanılabilir.

Açıklama: R’da çalışma klasörü `setwd()` fonksiyonu ile de belirlenebilir.
R’da çalışma klasörü belirleme işlemi yalnızca RStudio menü seçenekleriyle sınırlı değildir. Çalışma dizini setwd(“klasör_yolu”) komutu kullanılarak doğrudan R komut satırından da değiştirilebilir. RStudio menüsünden dizin belirlemek kolay bir yöntemdir, ancak tek yöntem değildir. Bu nedenle, “yalnızca RStudio menü seçenekleri kullanılabilir” ifadesi yanlıştır.

6- R’da analizlerde kullanılmak üzere veri adlı bir data frame tanımlanıyor. Aşağıdakilerden hangisi summary(veri) fonksiyonu ile elde edilemez?

A) Kategorik (factor) nitelikler için her bir kategorinin frekans bilgisi
B) Nümerik nitelikler için ortalama (mean) ve medyan (median) değerleri
C) Nümerik nitelikler için standart sapma (standard deviation)
D) Niteliklerdeki eksik değerler (NA’s)
E) Nümerik nitelikler için minimum (min) ve maksimum (max) değerleri

Cevap: C) Nümerik nitelikler için standart sapma (standard deviation)

Açıklama: `summary()` fonksiyonu standart sapma hesaplamaz, bunun yerine `sd()` fonksiyonu kullanılır.
summary(veri) fonksiyonu, veri çerçevesindeki kategorik ve nümerik değişkenlerin özet istatistiklerini döndürür. Ancak standart sapma (standard deviation) değerini göstermez. Standart sapma hesaplamak için sd() fonksiyonu kullanılır. summary() yalnızca ortalama, medyan, minimum, maksimum ve eksik değerler gibi temel istatistikleri verir.

7- R’da yapay kodlama (dummy coding) sürecine ilişkin aşağıdaki ifadelerden hangisi yanlıştır?

A) Yapay kodlama işlemi sonucunda sütunlarda yalnızca 0 ve 1 değerleri yer alır.
B) dummyVars() fonksiyonu, kategorik bir değişkenin yapay kodlaması için bir model oluşturur.
C) predict() fonksiyonu, oluşturulan yapay kodlama modelini veri setine uygulayarak dönüşüm yapar.
D) Yapay kodlama işlemi sonucunda, kategorik değişkenin her kategorisi için ayrı bir sütun oluşturulur.
E) Yapay kodlama sonrasında, orijinal kategorik değişken yapay kodlanmış sütunların doğru çalışabilmesi için veri setinde tutulmalıdır.

Cevap: E) Yapay kodlama işlemi sonucunda sütunlarda yalnızca 0 ve 1 değerleri yer alır.

Açıklama:
Yapay kodlama (dummy coding), kategorik değişkenleri sayısal değerlere dönüştürerek analizlerde kullanılmasını sağlar. Kodlama sonucunda sütunlarda yalnızca 0 ve 1 değerleri yer almaz. Bazı durumlarda, başka dönüşümler uygulanarak farklı sayısal değerler de üretilebilir. Örneğin, contr.treatment() gibi bazı fonksiyonlarla kodlama yöntemi değiştirilebilir. Dolayısıyla, yapay kodlamanın sadece 0 ve 1 değerleri içerdiğini söylemek hatalıdır.

8- R’da veri normalizasyonu süreciyle ilgili aşağıdaki ifadelerden hangisi yanlıştır?

A) is.numeric() fonksiyonu, sütunların nümerik veri tipine sahip olup olmadığını belirlemek için kullanılabilir.
B) caret::preProcess() fonksiyonu, veri ön-işleme için bir model oluşturulmasını sağlar.
C) preProcess() fonksiyonu kullanılarak method parametresi c(“range”) seçildiğinde, veri [0, 1] aralığına normalleştirilir.
D) preProcess() fonksiyonu yalnızca kategorik değişkenler üzerinde çalışır.
E) preProcess() fonksiyonu kullanılarak method parametresi c(“scale”) seçildiğinde, veri standardizasyonu gerçekleştirilir.

Cevap: D) preProcess() fonksiyonu yalnızca kategorik değişkenler üzerinde çalışır.

Açıklama: `preProcess()` fonksiyonu hem nümerik hem de kategorik veriler için veri ön-işleme işlemleri gerçekleştirebilir.
preProcess() fonksiyonu yalnızca kategorik değişkenler üzerinde çalışmaz. Aksine, bu fonksiyon hem nümerik hem de kategorik veriler için ölçekleme (scaling), normalizasyon (normalization), merkezleme (centering), eksik değer doldurma (imputation) gibi çeşitli veri ön işleme işlemlerini gerçekleştirir. Kategorik değişkenler için belirli ön işlemler yapılsa da, preProcess() fonksiyonu genellikle nümerik değişkenler üzerinde kullanılır.

9- Aşağıdaki ifadelerden hangisi, veri setindeki aykırı değerlerin (outliers) tespit edilmesi için kullanılan çeyrekler arası aralık (IQR) yöntemi ile ilgili yanlıştır?

A) Çeyrekler arası aralık (IQR), 3. çeyrek (Q3) ile 1. çeyrek (Q1) arasındaki farktır.
B) Aykırı değerler yalnızca veri setindeki eksik (NA) değerlerden oluşur.
C) Alt ve üst sınırlar dışında kalan tüm değerler aykırı değer olarak değerlendirilir.
D) Üst sınır, 3. çeyrekten 1.5 IQR yukarıdaki noktadır.
E) Alt sınır, 1. çeyrekten 1.5 IQR aşağıdaki noktadır.

Cevap: B) Aykırı değerler yalnızca veri setindeki eksik (NA) değerlerden oluşur.

Açıklama: Aykırı değerler eksik verilerle (NA) sınırlı değildir. IQR yöntemi, aşırı büyük veya küçük değerleri belirleyerek aykırı değerleri tespit eder.
IQR yöntemi, veri setindeki aykırı değerleri belirlemek için kullanılan en yaygın yöntemlerden biridir. Çeyrekler arası aralık (IQR), Q3 (Üçüncü çeyrek) ile Q1 (Birinci çeyrek) arasındaki farktır. Aykırı değerler yalnızca eksik (NA) değerlerden oluşmaz, çünkü IQR yöntemi belirli sınırların dışında kalan değerleri tespit eder. Aykırı değerler, alt sınırın (Q1 – 1.5 * IQR) altında veya üst sınırın (Q3 + 1.5 * IQR) üstünde olan tüm verilerdir. Bu nedenle, aykırı değerlerin sadece eksik verilerden (NA) oluştuğunu söylemek yanlıştır.

10- Veri ayrıklaştırma (data discretization) sürecine ilişkin aşağıdaki ifadelerden hangisi yanlıştır?

A) cut() fonksiyonu, bir nümerik değişkeni belirli aralıklara bölerek kategorik bir değişkene dönüştürür.
B) quantile() fonksiyonu, veriyi belirli olasılık aralıklarına göre dilimlere böler.
C) include.lowest = TRUE, aralıklardaki en küçük değerin dahil edilmesini sağlar ve düzgün sınırlar oluşturur.
D) labels parametresi, her bir dilime atanacak kategorik etiketleri tanımlamak için kullanılır.
E) Veri ayrıklaştırma sonrası oluşturulan kategorik değişken her zaman analizlerde kullanılmalıdır, orijinal nümerik değişken çıkarılmalıdır.

Cevap: E) Veri ayrıklaştırma sonrası oluşturulan kategorik değişken her zaman analizlerde kullanılmalıdır, orijinal nümerik değişken çıkarılmalıdır.

Açıklama: Orijinal nümerik değişken her zaman çıkarılmak zorunda değildir. Kimi analizlerde hem ayrıklaştırılmış hem de orijinal değişkenin birlikte kullanılması faydalı olabilir.
Veri ayrıklaştırma (data discretization) işlemi, nümerik verileri belirli aralıklara bölerek kategorik hale getirme sürecidir. Ancak, orijinal nümerik değişkenin analizlerden tamamen çıkarılması zorunlu değildir. Bazı durumlarda, analizler hem ayrıklaştırılmış (discrete) değişkenler hem de orijinal nümerik değişkenlerle yapılır. Örneğin, makine öğrenmesi modellerinde, bazı algoritmalar orijinal nümerik değerleri kullanarak daha iyi performans gösterebilir. Bu yüzden, ayrıklaştırılmış değişkenlerin zorunlu olarak analizde kullanılması ve orijinal değişkenlerin silinmesi gerektiği yanlıştır.

@lolonolo_com

Web Tasarım ve Kodlama
Auzef Web Analitiği Ve Zekâsı Web Tasarımı ve Kodlama

Auzef Web Tasarımı ve Kodlama 2. Sınıf

BEN_BEN

Auzef, Anadolu-Aöf, Ata-Aöf, SEGEM, Açık Lise, Ales, DGS, LGS, ilokul,  Ortaokul, English, TOEFL

error: Kopyalamaya Karşı Korumalıdır!