Yapay Zeka ve Makine Öğrenmesi 2024-2025 Final Soruları

Haziran 5, 2026

Makine Öğrenmesi 2024-2025 Final Soruları

Konu Özeti

Sınıflandırma ve Regresyon Algoritmaları | Model Değerlendirme | Veri Ön İşleme | Yapay Sinir Ağları ve Derin Öğrenme

Makine Öğrenmesi dersi; bilgisayar sistemlerinin açıkça programlanmadan, veriye dayalı deneyimlerden öğrenerek belirli görevleri yerine getirme yeteneği kazanmasını sağlayan algoritmaları ve matematiksel modelleri inceleyen kapsamlı bir disiplindir. Sınıflandırma (Classification) ve Regresyon (Regression) gibi danışmanlı öğrenme (supervised learning) görevlerinden; Kümeleme (Clustering) gibi danışmansız öğrenme (unsupervised learning) görevlerine kadar geniş bir yelpazeyi kapsar. Bu süreçte algoritmaların performansı, modelin veriyi ezberlemesini (aşırı öğrenme – overfitting) engellemek amacıyla çapraz geçerleme (cross-validation) gibi metotlarla test edilir.

Temel Algoritmalar: k-NN, Naive Bayes, Karar Ağaçları ve K-Means

Veri madenciliği ve makine öğrenmesinde kullanılan en yaygın sınıflandırma algoritmalarından biri k-En Yakın Komşu (k-NN) algoritmasıdır. Mesafe temelli çalışan bu tembel öğrenme (lazy learning) algoritmasında, Öklid (Euclidean), Manhattan veya Minkowski gibi uzaklık metrikleri kullanılır ve yeni verinin sınıfı, en yakın ‘k’ sayıdaki komşusunun çoğunluk oylamasıyla (majority voting) belirlenir. Olasılık temelli Naive Bayes sınıflandırıcısı ise Bayes Teoremi’ni kullanır ve niteliklerin birbirinden tamamen bağımsız olduğu “saf” (naive) varsayımına dayanır. Karar ağaçlarında (CART, ID3, C4.5) veri seti, bilgi kazancı (information gain) veya Gini safsızlığı gibi metriklerle dallara ayrılırken, belirsizliğin ölçümü için “Entropi” hesaplamalarından faydalanılır. Danışmansız öğrenmenin baş aktörlerinden k-Ortalamalar (K-Means) algoritması ise, verileri k adet kümeye ayırarak benzer özellikteki verilerin küme merkezlerine (centroid) olan uzaklıklarını minimize etmeyi hedefler.

Model Değerlendirme, Veri Ön İşleme ve Derin Öğrenme

Makine öğrenmesi projelerinde ham verinin doğrudan algoritmaya verilmesi genellikle düşük performansla sonuçlanır. Bu nedenle farklı ölçeklerdeki sayısal verilerin 0 ile 1 arasına sıkıştırılması (Min-Max Scaling) gibi veri ön işleme adımları zorunludur. Kurulan modellerin performansını değerlendirmek için sınıflandırma problemlerinde doğruluk (accuracy), duyarlılık (recall) ve karmaşıklık matrisi (confusion matrix) kullanılırken; çoklu doğrusal regresyon gibi tahmin problemlerinde Ortalama Kare Hata (MSE) metrikleri ve p-değeri (istatistiksel anlamlılık) analizleri tercih edilir. Günümüzde ise bu klasik algoritmalar, Keras ve TensorFlow gibi kütüphaneler yardımıyla kurulan Yapay Sinir Ağları (YSA) ve Geriye Yayılım (Backpropagation) mekanizmalarıyla çok daha karmaşık hale gelmiş; milyarlarca parametreli Büyük Dil Modelleri’nin (ChatGPT gibi LLM’ler) doğuşuna zemin hazırlayan Derin Öğrenme (Deep Learning) devrimini başlatmıştır.

@lolonolo_com

Makine Öğrenmesi 2024-2025 Final Soruları

1. k-En Yakın Komşu Algoritması’nın karar aşamasında kullanılan çoğunluk oylaması (majority voting) ile ilgili aşağıda verilenlerden hangisi doğrudur?

A) Sınıfı etiketi bilinmeyen x örneğine en yakın k komşunun sınıf etiketlerine bakılır. Sayıca en az olan sınıf etiketi atanır.
B) Sınıfı etiketi bilinmeyen x örneğine en yakın k komşu arasında her zaman en yakınındaki gözleme ait sınıf etiketi atanır.
C) Sınıfı etiketi bilinmeyen x örneğine en yakın k komşu arasında ağırlığı (weight) en az olan sınıf etiketi atanır.
D) Sınıfı etiketi bilinmeyen x örneğine en yakın k komşunun sınıf etiketlerine bakılır. Sayıca en fazla olan sınıf etiketi atanır.
E) Sınıfı etiketi bilinmeyen x örneğine en yakın k komşu arasında ağırlığı (weight) en fazla olan sınıf etiketi atanır.

Cevap: D) Sınıfı etiketi bilinmeyen x örneğine en yakın k komşunun sınıf etiketlerine bakılır. Sayıca en fazla olan sınıf etiketi atanır.

🔒 Bu içerik sadece Reklamsız Üyelere özeldir.

2. x = veri.yas
y = veri.mutluluk
…
plt.xlabel(“Yaş”)
plt.ylabel(“Mutluluk Oranı”)
Yukarıdaki Python kod bloğu ile iki nitelik arasında doğrusal bir ilişkinin olup olmadığı grafik üzerinde incelenmek isteniyor.
Bunun için yukarıda … ile boş bırakılan boşluğa aşağıdaki seçeneklerden hangisi getirilmelidir?

A) plt.hist(x, y)
B) plt.heatmap(x, y)
C) plt.boxplot(x, y)
D) plt.pic(x,y)
E) plt.scatter(x,y)

Cevap: E) plt.scatter(x,y)

🔒 Bu içerik sadece Reklamsız Üyelere özeldir.

3.

Proje Tamamlanma Durumu

Başarılı

Başarısız

Başarılı

Yukarıda verilen tabloya göre; karar ağaçlarında niteliklerin belirsizliğini ölçmek için kullanılan Entropi değeri Proje Tamamlanma Durumu niteliği için aşağıdaki seçeneklerin hangisi kullanılarak doğru biçimde hesaplanabilir?

A) $Entropi = -\frac{1}{5} \log_2\left(\frac{1}{5}\right) + \frac{4}{5} \log_2\left(\frac{4}{5}\right)$
B) $Entropi = \frac{1}{5} \log_2\left(\frac{1}{5}\right) + \frac{4}{5} \log_2\left(\frac{4}{5}\right)$
C) $Entropi = -\frac{1}{5} \log_2\left(\frac{1}{5}\right)$
D) $Entropi = -\frac{1}{5} \log_2\left(\frac{1}{5}\right) - \frac{4}{5} \log_2\left(\frac{4}{5}\right)$
E) $Entropi = \frac{1}{5} \log_2\left(\frac{1}{5}\right) - \frac{4}{5} \log_2\left(\frac{4}{5}\right)$

Cevap: D)

🔒 Bu içerik sadece Reklamsız Üyelere özeldir.

4. from sklearn.model_selection import StratifiedKFold
k = 10
n = 2
perf_deg = StratifiedKFold(n_splits=k, shuffle=True, random_state=5)
Bir araştırmacı model performans değerlendirmesi aşaması için yukarıdaki Python kod bloğunu çağırıyorsa aşağıda verilen performans değerlendirme yöntemlerinden hangisini kullanmaktadır?

A) Tabakalı 5-kat çapraz geçerleme
B) Tabakalı ikili ayırma
C) Tabakalı 2-kat çapraz geçerleme
D) Tabakalı 10-kat çapraz geçerleme
E) Tekrarlı ikili ayırma

Cevap: D) Tabakalı 10-kat çapraz geçerleme

🔒 Bu içerik sadece Reklamsız Üyelere özeldir.

5. I. Euclidean (Öklid)
II. Manhattan
III. Chebyshev
IV. Cosine
V. Jaccard
VI. Adam
Yukarıdaki uzaklık fonksiyonlarından hangisi ya da hangileri k-En Yakın Komşu Algoritması’nın uzaklık fonksiyonu olarak kullanılabilir?

A) I, II, III, IV ve V
B) I ve II
C) I, II ve III
D) I, II, III ve IV
E) I ve VI

Cevap: A) I, II, III, IV ve V

🔒 Bu içerik sadece Reklamsız Üyelere özeldir.

6.
Yukarıdaki tabloya göre, sisteme zararlı yazılım bulaştığı bilinen bir durumda (“Evet”), söz konusu sistemde güncelleme gecikmesi olma (“Var”) koşullu olasılığı aşağıdakilerden hangisidir?

A) 0
B) 1/2
C) 1
D) 3/4
E) 4/5

Cevap: B) 1/2

🔒 Bu içerik sadece Reklamsız Üyelere özeldir.

7. Bir araştırmacı veri setinde yer alan tüm nümerik nitelikleri [0,1] aralığına ölçeklendirmek istiyor. Bunun için aşağıda verilen Python kodlarından hangisi kullanılabilir?

A) from sklearn.model_selection import train_test_split
B) from matplotlib.cbook import boxplot_stats
C) from sklearn.preprocessing import MinMaxScaler
D) from sklearn.preprocessing import StandardScaler
E) import seaborn as sns

Cevap: C) from sklearn.preprocessing import MinMaxScaler

🔒 Bu içerik sadece Reklamsız Üyelere özeldir.

8. Bir akıllı telefon üreticisi, farklı kullanım alışkanlıklarının günlük batarya tüketimine nasıl etki ettiğini anlamak amacıyla bir çoklu doğrusal regresyon modeli kurmuştur. Analiz sonucunda edilen model sabiti (𝛽0 ), CPU kullanım oranı katsayısı (𝛽1 ) ve ekran parlaklığı katsayısı (𝛽2 )
aşağıda verilmiştir:
𝛽0 = 2 . 5𝛽1 = 0 . 05𝛽2 = 0 . 03
Bu çoklu doğrusal regresyon modeline göre, CPU kullanım oranı 40 ve ekran parlaklık seviyesi 70 birim olan bir akıllı telefonun tahmini günlük ortalama batarya tüketimi miktarı aşağıdakilerden hangisidir?

A) 5.5
B) 2.5
C) 6.6
D) 3.7
E) 8.3

Cevap: C) 6.6

🔒 Bu içerik sadece Reklamsız Üyelere özeldir.

9. ……..import KNeighborsClassifier
k-En Yakın Komşu Algoritması ile Python’da çalışmak isteyen bir araştırmacı yukarıda … ile verilen kod satırını aşağıdaki seçeneklerden hangisi ile tamamlamalıdır?

A) from sklearn.model_selection
B) from sklearn.metrics
C) from sklearn.preprocessing
D) from sklearn.neighbors
E) import matplotlib.pyplot

Cevap: D) from sklearn.neighbors

🔒 Bu içerik sadece Reklamsız Üyelere özeldir.

10. Aşağıdakilerden hangisi Naive Bayes Sınıflandırıcı ile ilgili yanlış bir ifadedir?

A) Naive Bayes Sınıflandırıcı adındaki “naive”, bu algoritmanın sınıflandırma için kullanılan tahmini sağlayan nitelikler arasındaki bağımsızlık varsayımı nedeni ile verilmiştir.
B) Naive Bayes Sınıflandırıcı Bayes Teoremi’ne dayanır.
C) Naive Bayes Sınıflandırıcı ile Bayes Sınıflandırıcı (Full Bayes Classifier) birbirinin aynısı yöntemlerdir.
D) Naive Bayes Sınıflandırıcı ile çalışırken niteliklerin veri tipinin sürekli olması durumunda normal dağılıma uygun dağıldığı kabul edilerek, normal dağılım için olasılık yoğunluk fonksiyonu hesaplanabilir.
E) Naive Bayes Sınıflandırıcı ile gerçekleştirilen analizler sonucunda olasılığı en yüksek çıkan sınıf değeri, sınıfı bilinmeyen örneğin sınıfı olarak atanır.

Cevap: C) Naive Bayes Sınıflandırıcı ile Bayes Sınıflandırıcı (Full Bayes Classifier) birbirinin aynısı yöntemlerdir.

🔒 Bu içerik sadece Reklamsız Üyelere özeldir.

11. Aşağıdaki seçeneklerden hangisi ayrık (discret) veri örneği değildir?

A) Zar atıldığında üst yüze gelen nokta sayısı.
B) Bir sınıftaki öğrenci sayısı.
C) Bir kişinin boyu.
D) Bir futbol takımının attığı gol sayısı.
E) Bir fabrikanın günlük ürettiği ürün adedi.

Cevap: C) Bir kişinin boyu.

🔒 Bu içerik sadece Reklamsız Üyelere özeldir.

12. Aşağıdakilerden hangisi yapay sinir ağlarında kullanılan bir öğrenme algoritmasıdır?

A) Geriye Yayılım Algoritması
B) C5.0 Algoritması
C) k-En Yakın Komşu Algoritması
D) k-Ortalamalar Algoritması
E) Naive Bayes Algoritması

Cevap: A) Geriye Yayılım Algoritması

🔒 Bu içerik sadece Reklamsız Üyelere özeldir.

13. …, bilgisayarların deneyimlerden (verilerden) öğrenmesini sağlamak ve dünyayı bir kavramlar hiyerarşisi açısından anlamak (yani karmaşık kavramları daha basit olanlardan oluşturarak öğrenmek) olarak görülebilir.
Yukarıda … ile verilen boşluğa aşağıdaki seçeneklerden hangisi getirilmelidir?

A) Pekiştirmeli öğrenme
B) Derin öğrenme
C) Danışmanlı öğrenme
D) Tembel öğrenme
E) Danışmansız öğrenme

Cevap: B) Derin öğrenme

🔒 Bu içerik sadece Reklamsız Üyelere özeldir.

14.
Bir e-ticaret şirketinin günlük satış gelirini açıklamaya yönelik potansiyel değişkenler, bu değişkenlere ait tahmini beta (β) katsayıları ve p-değerleri yukarııdaki gibidir.
Yukarıdaki tabloda yer alan beş bağımsız değişkenden hangisinin modele istatistiksel açıdan anlamlı bir katkı sağlamadığı söylenebilir?

A) Sosyal Medya Etkileşimi
B) Web Site Trafiği (tıklama)
C) Reklam Harcaması (TL)
D) Ortalama Sepet Tutarı (TL)
E) Müşteri Memnuniyeti

Cevap: A) Sosyal Medya Etkileşimi

🔒 Bu içerik sadece Reklamsız Üyelere özeldir.

15.

Küme	Küme Merkezi
K1	(5,5)
K2	(18,20)
K3	(220,3)
K4	(33,40)
K5	(200,210)

k-Ortalamalar algoritması kullanılarak gerçekleştirilen kümeleme analizi sonucunda elde edilen kümeler ve küme merkezleri yukarıdaki tabloda verilmiştir.
Buna göre; örnek veri (20,21) aşağıdaki kümelerden hangisine benzerlik gösterir ve atanır?

A) K1
B) K3
C) K4
D) K5
E) K2

Cevap: E) K2

🔒 Bu içerik sadece Reklamsız Üyelere özeldir.

16. model = …(criterion=”gini”, max_depth=3, random_state = 123)
Yukarıdaki Python kod satırında bir CART sınıflandırıcı modeli oluşturulmak istenmektedir. Bunun için … ile verilen boşluğa aşağıdaki seçeneklerde verilen ifadelerden hangisi getirilmelidir?

A) TClassifier
B) DecisionTreeClassifier
C) DecisionTreeRegressor
D) DTRegressor
E) DecisionClassifier

Cevap: B) DecisionTreeClassifier

🔒 Bu içerik sadece Reklamsız Üyelere özeldir.

17. I. ID3
II. ID4.5
III. C4.5
IV. C5.0
V. CART
Yukarıda verilenlerden hangisi ya da hangileri sınıflandırma için kullanılabilen karar ağacı algoritmalarındandır?

A) I, II ve III
B) I, III, IV ve V
C) Yanlızca I
D) I, III ve IV
E) Yalnızca III

Cevap: B) I, III, IV ve V

🔒 Bu içerik sadece Reklamsız Üyelere özeldir.

18. from sklearn.metrics import …
Çoklu doğrusal regresyon analizi sonucunda modelin performansını değerlendirmek isteyen bir araştırmacının yukarıda … ile verilen boşluğu aşağıdaki seçeneklerin hangisi ile doldurması uygun olur?

A) mean_squared_error
B) classification_report
C) recall_score
D) ConfusionMatrixDisplay
E) confusion_matrix

Cevap: A) mean_squared_error

🔒 Bu içerik sadece Reklamsız Üyelere özeldir.

19. Aşağıdaki seçeneklerde verilenlerden hangisi büyük dil modellerine (large language models) bir örnektir?

A) IoT
B) Deep Blue
C) Turing Testi
D) API
E) ChatGPT

Cevap: E) ChatGPT

🔒 Bu içerik sadece Reklamsız Üyelere özeldir.

20. model = Sequential(name=”YSA Modelim”)
Keras kütüphanesi yardımı ile bir yapay sinir ağı modeli oluşturulurken, modele bir girdi katmanı eklemek için aşağıdaki seçeneklerin hangisi kullanılabilir?

A) model.get(InputLayer(input_shape=(X_train.shape[1],), name=”Girdi_Katmani”))
B) model.append(InputLayer(input_shape=(X_train.shape[1],), name=”Girdi_Katmani”))
C) model.insert(InputLayer(input_shape=(X_train.shape[1],), name=”Girdi_Katmani”))
D) model.create(InputLayer(input_shape=(X_train.shape[1],), name=”Girdi_Katmanı”))
E) model.add(InputLayer(input_shape=(X_train.shape[1],), name=”Girdi_Katmani”))

Cevap: E) model.add(InputLayer(input_shape=(X_train.shape[1],), name=”Girdi_Katmani”))

🔒 Bu içerik sadece Reklamsız Üyelere özeldir.

@lolonolo_com

#2. Aşağıdaki seçeneklerden hangisi ayrık (discret) veri örneği değildir?

#3. Aşağıdaki seçeneklerde verilenlerden hangisi büyük dil modellerine (large language models) bir örnektir?

#4. Aşağıdakilerden hangisi Naive Bayes Sınıflandırıcı ile ilgili yanlış bir ifadedir?

#6. Bir araştırmacı veri setinde yer alan tüm nümerik nitelikleri [0,1] aralığına ölçeklendirmek istiyor. Bunun için aşağıda verilen Python kodlarından hangisi kullanılabilir?

#8. ……..import KNeighborsClassifier k-En Yakın Komşu Algoritması ile Python’da çalışmak isteyen bir araştırmacı yukarıda … ile verilen kod satırını aşağıdaki seçeneklerden hangisi ile tamamlamalıdır?

#9. k-En Yakın Komşu Algoritması’nın karar aşamasında kullanılan çoğunluk oylaması (majority voting) ile ilgili aşağıda verilenlerden hangisi doğrudur?

#10. from sklearn.metrics import …Çoklu doğrusal regresyon analizi sonucunda modelin performansını değerlendirmek isteyen bir araştırmacının yukarıda … ile verilen boşluğu aşağıdaki seçeneklerin hangisi ile doldurması uygun olur?

#11. Yukarıda verilen tabloya göre; karar ağaçlarında niteliklerin belirsizliğini ölçmek için kullanılan Entropi değeri Proje Tamamlanma Durumu niteliği için aşağıdaki seçeneklerin hangisi kullanılarak doğru biçimde hesaplanabilir?

#12. model = Sequential(name=”YSA Modelim”) Keras kütüphanesi yardımı ile bir yapay sinir ağı modeli oluşturulurken, modele bir girdi katmanı eklemek için aşağıdaki seçeneklerin hangisi kullanılabilir?

#13. I. Euclidean (Öklid) II. Manhattan III. Chebyshev IV. Cosine V. Jaccard VI. Adam Yukarıdaki uzaklık fonksiyonlarından hangisi ya da hangileri k-En Yakın Komşu Algoritması’nın uzaklık fonksiyonu olarak kullanılabilir?

#14. Aşağıdakilerden hangisi yapay sinir ağlarında kullanılan bir öğrenme algoritmasıdır?

#16. I. ID3II. ID4.5III. C4.5IV. C5.0V. CARTYukarıda verilenlerden hangisi ya da hangileri sınıflandırma için kullanılabilen karar ağacı algoritmalarındandır?

#17. k-Ortalamalar algoritması kullanılarak gerçekleştirilen kümeleme analizi sonucunda elde edilen kümeler ve küme merkezleri yukarıdaki tabloda verilmiştir. Buna göre; örnek veri (20,21) aşağıdaki kümelerden hangisine benzerlik gösterir ve atanır?

#19. model = …(criterion=”gini”, max_depth=3, random_state = 123) Yukarıdaki Python kod satırında bir CART sınıflandırıcı modeli oluşturulmak istenmektedir. Bunun için … ile verilen boşluğa aşağıdaki seçeneklerde verilen ifadelerden hangisi getirilmelidir?

#20. Yukarıdaki tabloya göre, sisteme zararlı yazılım bulaştığı bilinen bir durumda (“Evet”), söz konusu sistemde güncelleme gecikmesi olma (“Var”) koşullu olasılığı aşağıdakilerden hangisidir?

SONUÇ