LOLONOLO Ana Sayfa » blog » auzef » Yapay Zeka ve Makine Öğrenmesi 2024-2025 Final Soruları
auzefYapay Zeka ve Makine ÖğrenmesiYönetim Bilişim Sistemleri

Yapay Zeka ve Makine Öğrenmesi 2024-2025 Final Soruları

Yapay Zeka ve Makine Öğrenmesi 2024-2025 Final Soruları

 
LOLONOLO Ana Sayfa » blog » auzef » Yapay Zeka ve Makine Öğrenmesi 2024-2025 Final Soruları

#1. x = veri.yas
y = veri.mutluluk

plt.xlabel(“Yaş”)
plt.ylabel(“Mutluluk Oranı”)
Yukarıdaki Python kod bloğu ile iki nitelik arasında doğrusal bir ilişkinin olup olmadığı grafik üzerinde incelenmek isteniyor.
Bunun için yukarıda … ile boş bırakılan boşluğa aşağıdaki seçeneklerden hangisi getirilmelidir?

Cevap: E) plt.scatter(x,y)
Açıklama : Veri biliminde ve istatistikte iki sürekli değişken (örneğin yaş ve mutluluk oranı) arasındaki doğrusal veya doğrusal olmayan ilişkiyi (korelasyonu) görsel olarak incelemek için en uygun grafik türü “Serpilme Diyagramı” (Scatter Plot)’dır. Python’un Matplotlib kütüphanesinde bu grafiği çizdirmek için `plt.scatter()` fonksiyonu kullanılır. `plt.hist()` tek değişkenin dağılımını (histogram), `plt.boxplot()` ise verinin çeyrekliklerini ve aykırı değerlerini (kutu grafiği) gösterir; iki değişken arası ilişki tayininde doğrudan kullanılmazlar.

#2. Aşağıdaki seçeneklerden hangisi ayrık (discret) veri örneği değildir?

Cevap: C) Bir kişinin boyu.
Açıklama: İstatistiksel veriler nicel (sayısal) bağlamda “Ayrık” (Discrete) ve “Sürekli” (Continuous) olmak üzere ikiye ayrılır. Ayrık veriler belirli bir aralıktaki sadece tam sayı değerlerini alabilen, sayılabilen (counted) ve aralarında küsuratlı değer bulunmayan verilerdir (öğrenci sayısı, zarın üst yüzü, gol sayısı gibi). Ancak “bir kişinin boyu” (veya ağırlığı, yaşı, sıcaklık), iki değer arasında sonsuz sayıda ondalık (küsuratlı) değer alabilen, sayılmayan ancak ölçülebilen (measured) verilerdir; bu nedenle ayrık değil “Sürekli Veri” örneğidir.

#3. Aşağıdaki seçeneklerde verilenlerden hangisi büyük dil modellerine (large language models) bir örnektir?

Cevap: E) ChatGPT
Açıklama: Büyük Dil Modelleri (Large Language Models – LLM), devasa boyutlardaki metin verileri üzerinde eğitilen, doğal dili işleme, anlama ve insan benzeri metinler üretme kapasitesine sahip Derin Öğrenme tabanlı yapay zeka modelleridir. (Transformer mimarisine dayanırlar). OpenAI tarafından geliştirilen GPT (Generative Pre-trained Transformer) tabanlı sohbet botu “ChatGPT”, LLM teknolojisinin günümüzdeki en ünlü ve en güçlü temsilcilerinden (örneklerinden) biridir. Deep Blue bir satranç programı, IoT (Nesnelerin İnterneti) bir donanım ağı konsepti, Turing Testi ise zeka ölçüm metodolojisidir.

#4. Aşağıdakilerden hangisi Naive Bayes Sınıflandırıcı ile ilgili yanlış bir ifadedir?

Cevap: C) Naive Bayes Sınıflandırıcı ile Bayes Sınıflandırıcı (Full Bayes Classifier) birbirinin aynısı yöntemlerdir.
Açıklama : Naive Bayes ve Tam (Full) Bayes sınıflandırıcıları temelini aynı teoremden (Bayes Teoremi) alsalar da, matematiksel işleyişleri açısından birbirinin aynısı değildirler. Tam Bayes sınıflandırıcıları, nitelikler (features) arasındaki her türlü ortak etkileşimi ve koşullu bağımlılığı hesaplamak zorundadır ve bu nedenle devasa bir işlem yükü gerektirir. “Naive” (Saf) Bayes ise, problemin çözümünü inanılmaz derecede basitleştirmek için veri setindeki tüm özelliklerin birbirinden “tamamen bağımsız” olduğu gibi gerçek dışı (safça) bir varsayıma dayanır. Bu bağımsızlık varsayımı, iki algoritmayı birbirinden ayıran en temel farktır.

#5. Bir akıllı telefon üreticisi, farklı kullanım alışkanlıklarının günlük batarya tüketimine nasıl etki ettiğini anlamak amacıyla bir çoklu doğrusal regresyon modeli kurmuştur. Analiz sonucunda edilen model sabiti (𝛽0 ), CPU kullanım oranı katsayısı (𝛽1 ) ve ekran parlaklığı katsayısı (𝛽2 ) aşağıda verilmiştir:
𝛽0 = 2 . 5𝛽1 = 0 . 05𝛽2 = 0 . 03
Bu çoklu doğrusal regresyon modeline göre, CPU kullanım oranı 40 ve ekran parlaklık seviyesi 70 birim olan bir akıllı telefonun tahmini günlük ortalama batarya tüketimi miktarı aşağıdakilerden hangisidir?

Cevap: C) 6.6
Açıklama :Çoklu doğrusal regresyon modelinde tahmin denklemi:
Y = β₀ + β₁X₁ + β₂X₂
şeklindedir.
Verilen değerlere göre:
Y = 2.5 + (0.05 × 40) + (0.03 × 70)
Y = 2.5 + 2 + 2.1
Y = 6.6
Buna göre CPU kullanım oranı 40 ve ekran parlaklığı seviyesi 70 olan bir akıllı telefonun tahmini günlük ortalama batarya tüketimi 6.6 birimdir.

Öğrenme Yönetim Sistemi Öğrenci Dostu LOLONOLO bol bol deneme sınavı yapmayı önerir.

#6. Bir araştırmacı veri setinde yer alan tüm nümerik nitelikleri [0,1] aralığına ölçeklendirmek istiyor. Bunun için aşağıda verilen Python kodlarından hangisi kullanılabilir?

Cevap: C) from sklearn.preprocessing import MinMaxScaler
Açıklama : Veri setindeki farklı ölçeklere sahip sayısal niteliklerin makine öğrenmesi algoritmaları (özellikle KNN, SVM veya yapay sinir ağları) tarafından yanlış ağırlıklandırılmasını önlemek için “Normalizasyon” (Ölçeklendirme) yapılır. Tüm verileri [0, 1] aralığına doğrusal olarak sıkıştıran işlem “Min-Max Normalizasyonu”dur ve Python’da scikit-learn kütüphanesindeki `MinMaxScaler` sınıfı ile uygulanır. (`StandardScaler` veriyi ortalaması 0, standart sapması 1 olacak şekilde Z-skoruna göre ölçeklendirir, aralığı [0,1] değildir).

#7. …, bilgisayarların deneyimlerden (verilerden) öğrenmesini sağlamak ve dünyayı bir kavramlar hiyerarşisi açısından anlamak (yani karmaşık kavramları daha basit olanlardan oluşturarak öğrenmek) olarak görülebilir.
Yukarıda … ile verilen boşluğa aşağıdaki seçeneklerden hangisi getirilmelidir?

Cevap: B) Derin öğrenme
Açıklama: Geleneksel makine öğrenmesi modellerinde özellik çıkarımı (feature extraction) insanlar tarafından elle yapılır. Ancak “Derin Öğrenme” (Deep Learning), yapay sinir ağlarının çok sayıda gizli katman (deep layers) kullanılarak eğitildiği bir alt daldır. Bu katmanlar, veriyi hiyerarşik olarak işler; ilk katmanlar basit kenarları veya pikselleri (kavramları) öğrenirken, derinlere inildikçe bu basit özellikler birleşerek yüzler, şekiller ve karmaşık anlamlar oluşturur. Bu “kavramlar hiyerarşisi” inşa ederek öğrenme süreci doğrudan Derin Öğrenmenin felsefi ve teknik tanımıdır.

#8. ……..import KNeighborsClassifier
k-En Yakın Komşu Algoritması ile Python’da çalışmak isteyen bir araştırmacı yukarıda … ile verilen kod satırını aşağıdaki seçeneklerden hangisi ile tamamlamalıdır?

Cevap: D) from sklearn.neighbors
Açıklama : Python’da makine öğrenmesi uygulamaları geliştirmek için standart kabul edilen kütüphane “scikit-learn” (sklearn)’dir. Bu kütüphanenin alt modülleri algoritmaların türlerine göre gruplandırılmıştır. k-En Yakın Komşu (k-NN) algoritması, mesafelere (komşuluk ilişkilerine) dayalı bir model olduğu için `neighbors` modülünün altında yer alır. Sınıflandırma problemi için bu kütüphaneyi içeri aktarırken kullanılması gereken doğru ve tam kod satırı `from sklearn.neighbors import KNeighborsClassifier` şeklindedir.

#9. k-En Yakın Komşu Algoritması’nın karar aşamasında kullanılan çoğunluk oylaması (majority voting) ile ilgili aşağıda verilenlerden hangisi doğrudur?

Cevap: D) Sınıfı etiketi bilinmeyen x örneğine en yakın k komşunun sınıf etiketlerine bakılır. Sayıca en fazla olan sınıf etiketi atanır.
Açıklama : k-En Yakın Komşu (k-NN – k-Nearest Neighbors) algoritması tembel bir öğrenme (lazy learning) algoritmasıdır. Sınıflandırma problemlerinde, yeni gelen ve sınıfı bilinmeyen veri noktasının (x örneğinin), eğitim veri setindeki diğer noktalara olan uzaklıkları hesaplanır. En yakın ‘k’ adet komşu seçilir. “Çoğunluk oylaması” (majority voting) mantığı gereği, bu ‘k’ adet komşu arasında hangi sınıf etiketine ait veri sayısı daha fazlaysa, yeni gelen veri noktasına o sınıfın etiketi atanır. Ağırlıklı oylama (weighted voting) farklı bir yöntemdir, standart çoğunluk oylamasında sadece sınıfların frekansına (sayıca çokluğuna) bakılır.

#10. from sklearn.metrics import …
Çoklu doğrusal regresyon analizi sonucunda modelin performansını değerlendirmek isteyen bir araştırmacının yukarıda … ile verilen boşluğu aşağıdaki seçeneklerin hangisi ile doldurması uygun olur?

Cevap: A) mean_squared_error
Açıklama: Makine öğrenmesinde metrikler problemin türüne (sınıflandırma veya regresyon) göre tamamen değişir. Soru kökünde bir “Çoklu Doğrusal Regresyon” probleminden bahsedilmiştir. Regresyon algoritmaları kategorik değil, sürekli/sayısal (fiyat, yaş, tüketim vb.) tahminler yapar. Bu yüzden gerçek değerler ile tahmin edilen değerler arasındaki “hatayı” (farkı) ölçen Ortalama Kare Hata (MSE – mean_squared_error), Ortalama Mutlak Hata (MAE) veya R-Kare gibi metrikler kullanılır. Diğer şıklarda yer alan classification_report, recall_score ve confusion_matrix yalnızca sınıflandırma (kategorik) algoritmalarının başarısını ölçen metriklerdir.

Öğrenme Yönetim Sistemi Öğrenci Dostu LOLONOLO bol bol deneme sınavı yapmayı önerir.

Proje Tamamlanma Durumu
Başarılı
Başarısız
Başarılı
Başarılı
Başarılı

#11. Yukarıda verilen tabloya göre; karar ağaçlarında niteliklerin belirsizliğini ölçmek için kullanılan Entropi değeri Proje Tamamlanma Durumu niteliği için aşağıdaki seçeneklerin hangisi kullanılarak doğru biçimde hesaplanabilir?

Cevap: D)
Tabloda toplam 5 durum bulunmaktadır. Bunlardan 4 tanesi “Başarılı”, 1 tanesi ise “Başarısız”dır.
Entropi formülü gereği:
[latex]E = - \sum p_i \log_2(p_i)[/latex]
Bu duruma uyarladığımızda:
[latex]Entropi = - \left( \frac{1}{5} \log_2\left(\frac{1}{5}\right) \right) - \left( \frac{4}{5} \log_2\left(\frac{4}{5}\right) \right)[/latex]
[latex]Entropi = -\frac{1}{5} \log_2\left(\frac{1}{5}\right) - \frac{4}{5} \log_2\left(\frac{4}{5}\right)[/latex]

#12. model = Sequential(name=”YSA Modelim”)
Keras kütüphanesi yardımı ile bir yapay sinir ağı modeli oluşturulurken, modele bir girdi katmanı eklemek için aşağıdaki seçeneklerin hangisi kullanılabilir?

Cevap: E) model.add(InputLayer(input_shape=(X_train.shape[1],), name=”Girdi_Katmani”))
Açıklama : Python’da derin öğrenme ve yapay sinir ağları mimarilerini hızlıca tasarlamak için kullanılan yüksek seviyeli kütüphanelerden biri Keras’tır. Keras’ın `Sequential` (Sıralı) API’si kullanılarak bir sinir ağı tasarlanırken; ağa girdi katmanı (InputLayer), gizli katmanlar (Dense, Dropout vb.) veya çıktı katmanları eklemek için özel olarak `.add()` (ekle) metodu (fonksiyonu) kullanılır. Python listelerindeki `.append()` veya `.insert()` fonksiyonları bu nesne yapısında katman eklemek için kullanılmaz. Ağın inşası ancak `.add()` komutuyla zincirleme olarak sağlanır.

#13. I. Euclidean (Öklid)
II. Manhattan
III. Chebyshev
IV. Cosine
V. Jaccard
VI. Adam
Yukarıdaki uzaklık fonksiyonlarından hangisi ya da hangileri k-En Yakın Komşu Algoritması’nın uzaklık fonksiyonu olarak kullanılabilir?

Cevap: A) I, II, III, IV ve V
Açıklama : k-NN algoritması, veri noktaları arasındaki mesafeyi ölçerek sınıflandırma veya regresyon yapar. Bu mesafeyi ölçmek için veri setinin tipine (sayısal, kategorik, metin) göre farklı uzaklık/benzerlik metrikleri kullanılır. Sayısal verilerde en çok Öklid (Euclidean), Manhattan ve Chebyshev kullanılırken; metin madenciliği veya yönsel benzerliklerde Cosine (Kosinüs) benzerliği; kategorik/ikili verilerde ise Jaccard katsayısı uzaklık fonksiyonu olarak kullanılabilir. Ancak VI numaralı “Adam” bir uzaklık fonksiyonu değil, derin öğrenmede (yapay sinir ağlarında) kullanılan bir optimizasyon algoritmasıdır. Bu nedenle doğru grup I, II, III, IV ve V’tir.

#14. Aşağıdakilerden hangisi yapay sinir ağlarında kullanılan bir öğrenme algoritmasıdır?

Cevap: A) Geriye Yayılım Algoritması
Açıklama: Yapay Sinir Ağları (Artificial Neural Networks – ANN), insan beyninin çalışma prensibini taklit eden katmanlı matematiksel modellerdir. Bu ağların “öğrenme” (ağırlıklarını güncelleme) aşamasında en yaygın kullanılan temel algoritma “Geriye Yayılım” (Backpropagation) algoritmasıdır. İleri yönlü beslemeden sonra elde edilen tahmin hatası (loss/error), türev kuralları (zincir kuralı) yardımıyla çıkış katmanından giriş katmanına doğru geriye doğru yayılır ve aradaki bağlantı ağırlıkları bu hatayı minimize edecek şekilde güncellenir. Diğer seçenekler geleneksel makine öğrenmesi algoritmalarıdır.

Yapay Zeka ve Makine Öğrenmesi 2024-2025 Final Soruları 14. soru

#15. Bir e-ticaret şirketinin günlük satış gelirini açıklamaya yönelik potansiyel değişkenler, bu değişkenlere ait tahmini beta (β) katsayıları ve p-değerleri yukarııdaki gibidir. Yukarıdaki tabloda yer alan beş bağımsız değişkenden hangisinin modele istatistiksel açıdan anlamlı bir katkı sağlamadığı söylenebilir?

Cevap: A) Sosyal Medya Etkileşimi
Açıklama : Çoklu Doğrusal Regresyon gibi istatistiksel modellerde, bağımsız bir değişkenin modele (tahmin gücüne) olan anlamlı katkısı “p-değeri” (p-value) üzerinden değerlendirilir. Genel kabul görmüş istatistiksel anlamlılık eşiği $p < 0.05$’tir (yani %95 güven aralığı). p-değeri 0.05’ten küçük olan değişkenler modele anlamlı katkı sağlar. Tablo incelendiğinde; Reklam Harcaması (0.005), Web Trafiği (0.030), Müşteri Memnuniyeti (0.000) ve Sepet Tutarı (0.040) bu eşiğin altındadır. Ancak “Sosyal Medya Etkileşimi” değişkeninin p-değeri 0.600’dür (0.05’ten çok büyüktür). Bu durum, bu değişkenin katsayısının şans eseri oluşabileceğini ve modele istatistiksel açıdan anlamlı hiçbir katkı sağlamadığını gösterir.

Öğrenme Yönetim Sistemi Öğrenci Dostu LOLONOLO bol bol deneme sınavı yapmayı önerir.

#16. I. ID3
II. ID4.5
III. C4.5
IV. C5.0
V. CART
Yukarıda verilenlerden hangisi ya da hangileri sınıflandırma için kullanılabilen karar ağacı algoritmalarındandır?

Cevap: B) I, III, IV ve V
Açıklama: Makine öğrenmesinde karar ağacı yapısını kullanan temel algoritmaların tarihsel bir gelişim süreci vardır. Ross Quinlan tarafından geliştirilen ID3 algoritması, daha sonra sırasıyla C4.5 ve C5.0 algoritmalarına evrilerek gelişmiştir. Öte yandan Leo Breiman ve ekibi tarafından geliştirilen CART (Classification and Regression Trees) algoritması da (Gini safsızlığını kullanarak) hem sınıflandırma hem regresyon yapan bir diğer ünlü karar ağacı modelidir. Ancak “ID4.5” diye bir karar ağacı algoritması makine öğrenmesi literatürğinde mevcut değildir (C4.5 ile karıştırılmak için konmuş bir çeldiricidir). Dolayısıyla doğru karar ağacı algoritmaları I, III, IV ve V numaralı olanlardır.

Küme Küme Merkezi
K1 (5,5)
K2 (18,20)
K3 (220,3)
K4 (33,40)
K5 (200,210)

#17. k-Ortalamalar algoritması kullanılarak gerçekleştirilen kümeleme analizi sonucunda elde edilen kümeler ve küme merkezleri yukarıdaki tabloda verilmiştir. Buna göre; örnek veri (20,21) aşağıdaki kümelerden hangisine benzerlik gösterir ve atanır?

Cevap: E) K2
Açıklama: k-Ortalamalar (K-Means) algoritması, bir veriyi merkezine en yakın olduğu (en çok benzerlik gösterdiği) kümeye atar. Atama işlemi genellikle iki nokta arasındaki Öklid uzaklığı (sqrt{(x_2 – x_1)^2 (y_2 – y_1)^2}) hesaplanarak bulunur. Yeni veri noktası (20, 21)’dir. En yakın görünen K2 (18, 20) ile arasındaki uzaklık hesabı: sqrt{(20 – 18)^2 (21 – 20)^2} = sqrt{2^2 1^2} = sqrt{5} approx 2.23’tür. Diğer merkezler, örneğin K1(5,5) veya K4(33,40) noktalarından çok daha uzaktadır. Matematiksel olarak minimum uzaklık (maksimum benzerlik) K2 merkezine ait olduğu için örnek veri K2 kümesine atanır.

#18. from sklearn.model_selection import StratifiedKFold
k = 10
n = 2
perf_deg = StratifiedKFold(n_splits=k, shuffle=True, random_state=5)
Bir araştırmacı model performans değerlendirmesi aşaması için yukarıdaki Python kod bloğunu çağırıyorsa aşağıda verilen performans değerlendirme yöntemlerinden hangisini kullanmaktadır?

Cevap: D) Tabakalı 10-kat çapraz geçerleme
Açıklama : Makine öğrenmesi modellerinde modelin genelleştirme yeteneğini ölçmek ve overfitting’i önlemek için çapraz geçerleme (cross-validation) yöntemleri kullanılır. Sınıf dengesizliği olan veri setlerinde her katmanda (fold) sınıfların orijinal oranda temsil edilmesini sağlayan yöntem “Tabakalı” (Stratified) çapraz geçerlemedir. Kod bloğunda `StratifiedKFold` fonksiyonu çağrılmış ve parametre olarak `n_splits=k` verilmiştir. `k` değişkeninin değeri 10 olarak tanımlandığı için, bu işlem doğrudan “Tabakalı 10-kat çapraz geçerleme” (Stratified 10-Fold Cross-Validation) anlamına gelir.

#19. model = …(criterion=”gini”, max_depth=3, random_state = 123)
Yukarıdaki Python kod satırında bir CART sınıflandırıcı modeli oluşturulmak istenmektedir. Bunun için … ile verilen boşluğa aşağıdaki seçeneklerde verilen ifadelerden hangisi getirilmelidir?

Cevap: B) DecisionTreeClassifier
Açıklama: Python makine öğrenmesi kütüphanesi scikit-learn (sklearn) içerisinde CART (Classification and Regression Trees) tabanlı Karar Ağacı modellerini kurmak için modüller bulunur. Soruda bir “sınıflandırıcı” (classifier) modeli oluşturulmak istendiği açıkça belirtilmiştir; regresyon (tahmin) değil. Sınıflandırma işlemleri için kullanılan doğru sınıfın adı DecisionTreeClassifier şeklindedir. Kod bloğu model = DecisionTreeClassifier(criterion=”gini”, max_depth=3, random_state=123) olarak tanımlanır.

Yapay Zeka ve Makine Öğrenmesi 2024-2025 Final Soruları 6. soru

#20. Yukarıdaki tabloya göre, sisteme zararlı yazılım bulaştığı bilinen bir durumda (“Evet”), söz konusu sistemde güncelleme gecikmesi olma (“Var”) koşullu olasılığı aşağıdakilerden hangisidir?

Cevap: B) 1/2
Açıklama: İstenen olasılık bir “koşullu olasılık” (Conditional Probability) hesaplamasıdır. Soru, “Zararlı Yazılım Bulaşma Durumu = Evet” iken “Güncelleme Gecikmesi = Var” olma olasılığını sormaktadır, yani P(Var | Evet). Tabloya baktığımızda zararlı yazılım bulaşma durumu “Evet” olan toplam kayıt sayısı 4’tür. Bu 4 “Evet” kaydının içinde, güncelleme gecikmesinin “Var” olduğu kayıt sayısı 2’dir. Dolayısıyla P(Var | Evet) olasılığı 2/4 olur, bu da çözüldüğünde 1/2 (yani yüzde 50) sonucunu verir.

Öğrenme Yönetim Sistemi Öğrenci Dostu LOLONOLO bol bol deneme sınavı yapmayı önerir.

Öncesi
TESTi BiTiR, PUANINI GÖR

SONUÇ

Yapay Zeka ve Makine Öğrenmesi 2024-2025 Final Soruları

Yapay Zeka ve Makine Öğrenmesi 2024-2025 Final Soruları

Makine Öğrenmesi 2024-2025 Final Soruları

Konu Özeti

Sınıflandırma ve Regresyon Algoritmaları | Model Değerlendirme | Veri Ön İşleme | Yapay Sinir Ağları ve Derin Öğrenme

Makine Öğrenmesi dersi; bilgisayar sistemlerinin açıkça programlanmadan, veriye dayalı deneyimlerden öğrenerek belirli görevleri yerine getirme yeteneği kazanmasını sağlayan algoritmaları ve matematiksel modelleri inceleyen kapsamlı bir disiplindir. Sınıflandırma (Classification) ve Regresyon (Regression) gibi danışmanlı öğrenme (supervised learning) görevlerinden; Kümeleme (Clustering) gibi danışmansız öğrenme (unsupervised learning) görevlerine kadar geniş bir yelpazeyi kapsar. Bu süreçte algoritmaların performansı, modelin veriyi ezberlemesini (aşırı öğrenme – overfitting) engellemek amacıyla çapraz geçerleme (cross-validation) gibi metotlarla test edilir.

Temel Algoritmalar: k-NN, Naive Bayes, Karar Ağaçları ve K-Means

Veri madenciliği ve makine öğrenmesinde kullanılan en yaygın sınıflandırma algoritmalarından biri k-En Yakın Komşu (k-NN) algoritmasıdır. Mesafe temelli çalışan bu tembel öğrenme (lazy learning) algoritmasında, Öklid (Euclidean), Manhattan veya Minkowski gibi uzaklık metrikleri kullanılır ve yeni verinin sınıfı, en yakın ‘k’ sayıdaki komşusunun çoğunluk oylamasıyla (majority voting) belirlenir. Olasılık temelli Naive Bayes sınıflandırıcısı ise Bayes Teoremi’ni kullanır ve niteliklerin birbirinden tamamen bağımsız olduğu “saf” (naive) varsayımına dayanır. Karar ağaçlarında (CART, ID3, C4.5) veri seti, bilgi kazancı (information gain) veya Gini safsızlığı gibi metriklerle dallara ayrılırken, belirsizliğin ölçümü için “Entropi” hesaplamalarından faydalanılır. Danışmansız öğrenmenin baş aktörlerinden k-Ortalamalar (K-Means) algoritması ise, verileri k adet kümeye ayırarak benzer özellikteki verilerin küme merkezlerine (centroid) olan uzaklıklarını minimize etmeyi hedefler.

Model Değerlendirme, Veri Ön İşleme ve Derin Öğrenme

Makine öğrenmesi projelerinde ham verinin doğrudan algoritmaya verilmesi genellikle düşük performansla sonuçlanır. Bu nedenle farklı ölçeklerdeki sayısal verilerin 0 ile 1 arasına sıkıştırılması (Min-Max Scaling) gibi veri ön işleme adımları zorunludur. Kurulan modellerin performansını değerlendirmek için sınıflandırma problemlerinde doğruluk (accuracy), duyarlılık (recall) ve karmaşıklık matrisi (confusion matrix) kullanılırken; çoklu doğrusal regresyon gibi tahmin problemlerinde Ortalama Kare Hata (MSE) metrikleri ve p-değeri (istatistiksel anlamlılık) analizleri tercih edilir. Günümüzde ise bu klasik algoritmalar, Keras ve TensorFlow gibi kütüphaneler yardımıyla kurulan Yapay Sinir Ağları (YSA) ve Geriye Yayılım (Backpropagation) mekanizmalarıyla çok daha karmaşık hale gelmiş; milyarlarca parametreli Büyük Dil Modelleri’nin (ChatGPT gibi LLM’ler) doğuşuna zemin hazırlayan Derin Öğrenme (Deep Learning) devrimini başlatmıştır.

@lolonolo_com
Makine Öğrenmesi 2024-2025 Final Soruları

1. k-En Yakın Komşu Algoritması’nın karar aşamasında kullanılan çoğunluk oylaması (majority voting) ile ilgili aşağıda verilenlerden hangisi doğrudur?

A) Sınıfı etiketi bilinmeyen x örneğine en yakın k komşunun sınıf etiketlerine bakılır. Sayıca en az olan sınıf etiketi atanır.
B) Sınıfı etiketi bilinmeyen x örneğine en yakın k komşu arasında her zaman en yakınındaki gözleme ait sınıf etiketi atanır.
C) Sınıfı etiketi bilinmeyen x örneğine en yakın k komşu arasında ağırlığı (weight) en az olan sınıf etiketi atanır.
D) Sınıfı etiketi bilinmeyen x örneğine en yakın k komşunun sınıf etiketlerine bakılır. Sayıca en fazla olan sınıf etiketi atanır.
E) Sınıfı etiketi bilinmeyen x örneğine en yakın k komşu arasında ağırlığı (weight) en fazla olan sınıf etiketi atanır.

Cevap: D) Sınıfı etiketi bilinmeyen x örneğine en yakın k komşunun sınıf etiketlerine bakılır. Sayıca en fazla olan sınıf etiketi atanır.

🔒 Bu içerik sadece Reklamsız Üyelere özeldir.

2. x = veri.yas
y = veri.mutluluk

plt.xlabel(“Yaş”)
plt.ylabel(“Mutluluk Oranı”)
Yukarıdaki Python kod bloğu ile iki nitelik arasında doğrusal bir ilişkinin olup olmadığı grafik üzerinde incelenmek isteniyor.
Bunun için yukarıda … ile boş bırakılan boşluğa aşağıdaki seçeneklerden hangisi getirilmelidir?

A) plt.hist(x, y)
B) plt.heatmap(x, y)
C) plt.boxplot(x, y)
D) plt.pic(x,y)
E) plt.scatter(x,y)

Cevap: E) plt.scatter(x,y)

🔒 Bu içerik sadece Reklamsız Üyelere özeldir.

3.

Proje Tamamlanma Durumu
Başarılı
Başarısız
Başarılı
Başarılı
Başarılı

Yukarıda verilen tabloya göre; karar ağaçlarında niteliklerin belirsizliğini ölçmek için kullanılan Entropi değeri Proje Tamamlanma Durumu niteliği için aşağıdaki seçeneklerin hangisi kullanılarak doğru biçimde hesaplanabilir?

A) Entropi = -\frac{1}{5} \log_2\left(\frac{1}{5}\right) + \frac{4}{5} \log_2\left(\frac{4}{5}\right)
B) Entropi = \frac{1}{5} \log_2\left(\frac{1}{5}\right) + \frac{4}{5} \log_2\left(\frac{4}{5}\right)
C) Entropi = -\frac{1}{5} \log_2\left(\frac{1}{5}\right)
D) Entropi = -\frac{1}{5} \log_2\left(\frac{1}{5}\right) - \frac{4}{5} \log_2\left(\frac{4}{5}\right)
E) Entropi = \frac{1}{5} \log_2\left(\frac{1}{5}\right) - \frac{4}{5} \log_2\left(\frac{4}{5}\right)

Cevap: D)

🔒 Bu içerik sadece Reklamsız Üyelere özeldir.

4. from sklearn.model_selection import StratifiedKFold
k = 10
n = 2
perf_deg = StratifiedKFold(n_splits=k, shuffle=True, random_state=5)
Bir araştırmacı model performans değerlendirmesi aşaması için yukarıdaki Python kod bloğunu çağırıyorsa aşağıda verilen performans değerlendirme yöntemlerinden hangisini kullanmaktadır?

A) Tabakalı 5-kat çapraz geçerleme
B) Tabakalı ikili ayırma
C) Tabakalı 2-kat çapraz geçerleme
D) Tabakalı 10-kat çapraz geçerleme
E) Tekrarlı ikili ayırma

Cevap: D) Tabakalı 10-kat çapraz geçerleme

🔒 Bu içerik sadece Reklamsız Üyelere özeldir.

5. I. Euclidean (Öklid)
II. Manhattan
III. Chebyshev
IV. Cosine
V. Jaccard
VI. Adam
Yukarıdaki uzaklık fonksiyonlarından hangisi ya da hangileri k-En Yakın Komşu Algoritması’nın uzaklık fonksiyonu olarak kullanılabilir?

A) I, II, III, IV ve V
B) I ve II
C) I, II ve III
D) I, II, III ve IV
E) I ve VI

Cevap: A) I, II, III, IV ve V

🔒 Bu içerik sadece Reklamsız Üyelere özeldir.

6. Yapay Zeka ve Makine Öğrenmesi 2024-2025 Final Soruları 6. soru
Yukarıdaki tabloya göre, sisteme zararlı yazılım bulaştığı bilinen bir durumda (“Evet”), söz konusu sistemde güncelleme gecikmesi olma (“Var”) koşullu olasılığı aşağıdakilerden hangisidir?

A) 0
B) 1/2
C) 1
D) 3/4
E) 4/5

Cevap: B) 1/2

🔒 Bu içerik sadece Reklamsız Üyelere özeldir.

7. Bir araştırmacı veri setinde yer alan tüm nümerik nitelikleri [0,1] aralığına ölçeklendirmek istiyor. Bunun için aşağıda verilen Python kodlarından hangisi kullanılabilir?

A) from sklearn.model_selection import train_test_split
B) from matplotlib.cbook import boxplot_stats
C) from sklearn.preprocessing import MinMaxScaler
D) from sklearn.preprocessing import StandardScaler
E) import seaborn as sns

Cevap: C) from sklearn.preprocessing import MinMaxScaler

🔒 Bu içerik sadece Reklamsız Üyelere özeldir.

8. Bir akıllı telefon üreticisi, farklı kullanım alışkanlıklarının günlük batarya tüketimine nasıl etki ettiğini anlamak amacıyla bir çoklu doğrusal regresyon modeli kurmuştur. Analiz sonucunda edilen model sabiti (𝛽0 ), CPU kullanım oranı katsayısı (𝛽1 ) ve ekran parlaklığı katsayısı (𝛽2 )
aşağıda verilmiştir:
𝛽0 = 2 . 5𝛽1 = 0 . 05𝛽2 = 0 . 03
Bu çoklu doğrusal regresyon modeline göre, CPU kullanım oranı 40 ve ekran parlaklık seviyesi 70 birim olan bir akıllı telefonun tahmini günlük ortalama batarya tüketimi miktarı aşağıdakilerden hangisidir?

A) 5.5
B) 2.5
C) 6.6
D) 3.7
E) 8.3

Cevap: C) 6.6

🔒 Bu içerik sadece Reklamsız Üyelere özeldir.

9. ……..import KNeighborsClassifier
k-En Yakın Komşu Algoritması ile Python’da çalışmak isteyen bir araştırmacı yukarıda … ile verilen kod satırını aşağıdaki seçeneklerden hangisi ile tamamlamalıdır?

A) from sklearn.model_selection
B) from sklearn.metrics
C) from sklearn.preprocessing
D) from sklearn.neighbors
E) import matplotlib.pyplot

Cevap: D) from sklearn.neighbors

🔒 Bu içerik sadece Reklamsız Üyelere özeldir.

10. Aşağıdakilerden hangisi Naive Bayes Sınıflandırıcı ile ilgili yanlış bir ifadedir?

A) Naive Bayes Sınıflandırıcı adındaki “naive”, bu algoritmanın sınıflandırma için kullanılan tahmini sağlayan nitelikler arasındaki bağımsızlık varsayımı nedeni ile verilmiştir.
B) Naive Bayes Sınıflandırıcı Bayes Teoremi’ne dayanır.
C) Naive Bayes Sınıflandırıcı ile Bayes Sınıflandırıcı (Full Bayes Classifier) birbirinin aynısı yöntemlerdir.
D) Naive Bayes Sınıflandırıcı ile çalışırken niteliklerin veri tipinin sürekli olması durumunda normal dağılıma uygun dağıldığı kabul edilerek, normal dağılım için olasılık yoğunluk fonksiyonu hesaplanabilir.
E) Naive Bayes Sınıflandırıcı ile gerçekleştirilen analizler sonucunda olasılığı en yüksek çıkan sınıf değeri, sınıfı bilinmeyen örneğin sınıfı olarak atanır.

Cevap: C) Naive Bayes Sınıflandırıcı ile Bayes Sınıflandırıcı (Full Bayes Classifier) birbirinin aynısı yöntemlerdir.

🔒 Bu içerik sadece Reklamsız Üyelere özeldir.

11. Aşağıdaki seçeneklerden hangisi ayrık (discret) veri örneği değildir?

A) Zar atıldığında üst yüze gelen nokta sayısı.
B) Bir sınıftaki öğrenci sayısı.
C) Bir kişinin boyu.
D) Bir futbol takımının attığı gol sayısı.
E) Bir fabrikanın günlük ürettiği ürün adedi.

Cevap: C) Bir kişinin boyu.

🔒 Bu içerik sadece Reklamsız Üyelere özeldir.

12. Aşağıdakilerden hangisi yapay sinir ağlarında kullanılan bir öğrenme algoritmasıdır?

A) Geriye Yayılım Algoritması
B) C5.0 Algoritması
C) k-En Yakın Komşu Algoritması
D) k-Ortalamalar Algoritması
E) Naive Bayes Algoritması

Cevap: A) Geriye Yayılım Algoritması

🔒 Bu içerik sadece Reklamsız Üyelere özeldir.

13. …, bilgisayarların deneyimlerden (verilerden) öğrenmesini sağlamak ve dünyayı bir kavramlar hiyerarşisi açısından anlamak (yani karmaşık kavramları daha basit olanlardan oluşturarak öğrenmek) olarak görülebilir.
Yukarıda … ile verilen boşluğa aşağıdaki seçeneklerden hangisi getirilmelidir?

A) Pekiştirmeli öğrenme
B) Derin öğrenme
C) Danışmanlı öğrenme
D) Tembel öğrenme
E) Danışmansız öğrenme

Cevap: B) Derin öğrenme

🔒 Bu içerik sadece Reklamsız Üyelere özeldir.

14. Yapay Zeka ve Makine Öğrenmesi 2024-2025 Final Soruları 14. soru
Bir e-ticaret şirketinin günlük satış gelirini açıklamaya yönelik potansiyel değişkenler, bu değişkenlere ait tahmini beta (β) katsayıları ve p-değerleri yukarııdaki gibidir.
Yukarıdaki tabloda yer alan beş bağımsız değişkenden hangisinin modele istatistiksel açıdan anlamlı bir katkı sağlamadığı söylenebilir?

A) Sosyal Medya Etkileşimi
B) Web Site Trafiği (tıklama)
C) Reklam Harcaması (TL)
D) Ortalama Sepet Tutarı (TL)
E) Müşteri Memnuniyeti

Cevap: A) Sosyal Medya Etkileşimi

🔒 Bu içerik sadece Reklamsız Üyelere özeldir.

15.

Küme Küme Merkezi
K1 (5,5)
K2 (18,20)
K3 (220,3)
K4 (33,40)
K5 (200,210)

k-Ortalamalar algoritması kullanılarak gerçekleştirilen kümeleme analizi sonucunda elde edilen kümeler ve küme merkezleri yukarıdaki tabloda verilmiştir.
Buna göre; örnek veri (20,21) aşağıdaki kümelerden hangisine benzerlik gösterir ve atanır?

A) K1
B) K3
C) K4
D) K5
E) K2

Cevap: E) K2

🔒 Bu içerik sadece Reklamsız Üyelere özeldir.

16. model = …(criterion=”gini”, max_depth=3, random_state = 123)
Yukarıdaki Python kod satırında bir CART sınıflandırıcı modeli oluşturulmak istenmektedir. Bunun için … ile verilen boşluğa aşağıdaki seçeneklerde verilen ifadelerden hangisi getirilmelidir?

A) TClassifier
B) DecisionTreeClassifier
C) DecisionTreeRegressor
D) DTRegressor
E) DecisionClassifier

Cevap: B) DecisionTreeClassifier

🔒 Bu içerik sadece Reklamsız Üyelere özeldir.

17. I. ID3
II. ID4.5
III. C4.5
IV. C5.0
V. CART
Yukarıda verilenlerden hangisi ya da hangileri sınıflandırma için kullanılabilen karar ağacı algoritmalarındandır?

A) I, II ve III
B) I, III, IV ve V
C) Yanlızca I
D) I, III ve IV
E) Yalnızca III

Cevap: B) I, III, IV ve V

🔒 Bu içerik sadece Reklamsız Üyelere özeldir.

18. from sklearn.metrics import …
Çoklu doğrusal regresyon analizi sonucunda modelin performansını değerlendirmek isteyen bir araştırmacının yukarıda … ile verilen boşluğu aşağıdaki seçeneklerin hangisi ile doldurması uygun olur?

A) mean_squared_error
B) classification_report
C) recall_score
D) ConfusionMatrixDisplay
E) confusion_matrix

Cevap: A) mean_squared_error

🔒 Bu içerik sadece Reklamsız Üyelere özeldir.

19. Aşağıdaki seçeneklerde verilenlerden hangisi büyük dil modellerine (large language models) bir örnektir?

A) IoT
B) Deep Blue
C) Turing Testi
D) API
E) ChatGPT

Cevap: E) ChatGPT

🔒 Bu içerik sadece Reklamsız Üyelere özeldir.

20. model = Sequential(name=”YSA Modelim”)
Keras kütüphanesi yardımı ile bir yapay sinir ağı modeli oluşturulurken, modele bir girdi katmanı eklemek için aşağıdaki seçeneklerin hangisi kullanılabilir?

A) model.get(InputLayer(input_shape=(X_train.shape[1],), name=”Girdi_Katmani”))
B) model.append(InputLayer(input_shape=(X_train.shape[1],), name=”Girdi_Katmani”))
C) model.insert(InputLayer(input_shape=(X_train.shape[1],), name=”Girdi_Katmani”))
D) model.create(InputLayer(input_shape=(X_train.shape[1],), name=”Girdi_Katmanı”))
E) model.add(InputLayer(input_shape=(X_train.shape[1],), name=”Girdi_Katmani”))

Cevap: E) model.add(InputLayer(input_shape=(X_train.shape[1],), name=”Girdi_Katmani”))

🔒 Bu içerik sadece Reklamsız Üyelere özeldir.
@lolonolo_com

AUZEF YÖNETİM BİLİŞİM SİSTEMLERİ

Editor

Editör