auzefVeri BilimiYönetim Bilişim Sistemleri

Veri Bilimi 2023-2024 Final Sınav Soruları

Veri Bilimi 2023-2024 Final Sınav Soruları

#1.
1. plt.legend()
2. x = np.linspace(1, 10, 20)
3. plt.show()
4. plt.xlabel('X-Etiket')
5. plt.plot(x, label='Örnek Çizim')
Yukarıda numaralandırılmış kodlar ile çizim oluşturmak ve görüntülemek için verilen komutlar hangi sırayla çalıştırılmalıdır?

Cevap : E) 2-5-4-1-3

Açıklama : Bu komutlar, matplotlib kullanarak bir çizim oluşturmak ve görüntülemek için gereken adımları içerir. İşte doğru sıralama ve her adımın ne yaptığı:

1- x = np.linspace(1, 10, 20): x ekseni için 1 ile 10 arasında 20 eşit aralıkta değerler oluşturur.
2- plt.plot(x, label=’Örnek Çizim’): x eksenindeki değerleri y eksenine çizer ve etiketi ‘Örnek Çizim’ olarak belirler.
3- plt.xlabel(‘X-Etiket’): x eksenine ‘X-Etiket’ yazısını ekler.
4- plt.legend(): Çizimdeki etiketleri gösterir.
5- plt.show(): Çizimi ekranda gösterir.

Bu adımlar doğru sırayla yapıldığında, matplotlib ile düzgün bir çizim oluşturulur ve ekranda görüntülenir.

#2. Yukarıda verilen denklem K-means kümeleme algoritmasında ne amaçla kullanılır?

Cevap : A) Veriler ile veri merkezleri arasındaki mesafeyi hesaplamak için

Açıklama : Bu denklem, Euclidean mesafesini hesaplamak için kullanılır ve K-Means kümeleme algoritmasında, veriler ile küme merkezleri arasındaki mesafeyi hesaplamak için kullanılır. Algoritmanın amacı, her bir veri noktasını en yakın küme merkezine atamaktır.

#3. Gruplandırılmış bir verinin dağılımının en iyi temsilini ve her bir veri değerinin sıklığını gösteren grafik türü aşağıdakilerden hangisidir?

Cevap : D) Histogram grafiği

Açıklama : Histogram grafiği, verinin gruplandırılmış dağılımını ve her bir grup için veri değerlerinin sıklığını gösteren bir grafik türüdür. Histogramlar, sürekli veri dağılımlarını görselleştirmek için kullanılır ve veri değerlerinin belirli aralıklarda (binler) nasıl dağıldığını gösterir. Bu grafikte, x ekseni veri aralıklarını, y ekseni ise bu aralıklardaki veri değerlerinin sıklığını temsil eder.Bu nedenle, gruplandırılmış bir verinin dağılımını ve sıklığını en iyi şekilde temsil eden grafik türü histogram grafiğidir.

#4. Lojistik regrasyon modeli tahmin işleminde aşağıdaki yaklaşımlardan hangisini kullanır?

Cevap : C)  Maksimum olasılık tahmini (MLS) yaklaşımı

Açıklama : Lojistik regresyon, bağımlı değişkenin kategorik olduğu durumlarda kullanılan bir regresyon analizidir. Tahmin işleminde, parametrelerin en iyi tahminlerini elde etmek için Maksimum Olasılık Tahmini (Maximum Likelihood Estimation, MLE) kullanılır. Bu yöntem, verilen veri seti için modelin parametrelerinin olasılığını en yüksek hale getirecek şekilde ayarlanmasını sağlar.

Bu nedenle, lojistik regresyon modelinde tahmin işlemi için Maksimum Olasılık Tahmini (MLS) yaklaşımı kullanılır.

#5. Bir arabanın satış fiyatı (1.000 $) ile yaşı (yıl olarak) arasındaki ilişki, belirli bir modeldeki rastgele araba örneklerinden tahmin edilerek aşağıdaki ilişki formülü elde edilmiştir.
satışücreti=24.2-(1.182)yıl
Bu denklemden aşağıdaki ifadelerden hangisi çıkarılabilir?

Cevap : E) Otomobil her yıl yaşlandığında satış fiyatı yaklaşık 1182 $ düşer.

Açıklama : Denklemde yıl parametresi her yıl için 1.182 düşüş gösterir. Bu, her yıl için 1182 dolarlık bir düşüş anlamına gelir

#6. Yukarıda python’da oluşturulan listeye; - Zarife - adlı öğrenciyi ekleyecek söz dizimi (komut satırı) hangi seçenekte doğru olarak verilmiştir?

Cevap : C) ogr.append(“Zarife”)

Açıklama : Python’da bir listeye yeni bir eleman eklemek için append() metodu kullanılır. Bu metot, listeye eleman eklemek için en yaygın kullanılan yöntemdir ve doğru şekilde kullanımı parantez içinde eklenen elemanla birlikte olmalıdır.

Veri bilimi 2024 Soru 13-1

Bu kod çalıştırıldığında, “Zarife” adlı öğrenci listeye eklenecektir ve çıktı şu şekilde olacaktır:

Veri bilimi 2024 Soru 13-2

#7. Python kütüphanesi ile oluşturulan yukarıdaki grafikte, grafik kenarlarının farklı renkte olmasını sağlayan parametre/argüman aşağıdakilerden hangisidir?

Cevap : D) edgecolor=

Açıklama : Python’da matplotlib kütüphanesi ile grafik oluştururken, barların kenar renklerini ayarlamak için ‘edgecolor’ parametresi kullanılır. Bu parametre, her bir barın kenar çizgilerinin rengini belirler.

#8. Algoritma kavramı ile ilgili aşağıda verilen ifadelerden hangisi doğrudur?

Cevap: B) Girdi olarak bir değer alan ve girdiye bağlı olarak çıktı değeri üreten bir hesaplama prosedürüdür.

Açıklama : Algoritma, belirli bir problemi çözmek veya belirli bir görevi yerine getirmek için tanımlanmış adım adım talimatlar dizisidir. Bu talimatlar, girdileri alır ve bu girdilere dayalı olarak belirli bir çıktıyı üretir. Algoritmalar, bilgisayar biliminin temel kavramlarından biridir ve çeşitli programlama ve problem çözme senaryolarında kullanılır.

#9. Lojistik regresyon yöntemi aşağıdakilerden hangisini bulmak için kullanılır?

Cevap : B) Sürekli tahmin edici değişkenler ile sonuç değişkeninin logiti arasındaki doğrusal ilişki

Lojistik regresyon, bağımlı değişkenin kategorik olduğu (örneğin, 0 veya 1 gibi ikili sonuçlar) durumlarda kullanılan bir regresyon analizidir. Bu yöntem, sürekli tahmin edici değişkenlerin (bağımsız değişkenler) sonuç değişkeninin logit (log odds) dönüşümü ile olan doğrusal ilişkisini bulmak için kullanılır.

Logit dönüşümü, bir olasılığı 0 ile 1 arasında sınırlamaya ve doğrusal bir modelle ilişkilendirmeye yarar. Lojistik regresyon modelinde, bağımsız değişkenlerin etkisi logit fonksiyonu aracılığıyla hesaplanır:

Veri Bilimi 2023-2024 Final Sınav Soruları Soru 19 Cevap
Burada p, bağımlı değişkenin 1 olma olasılığıdır. Bu denkleme göre, bağımsız değişkenlerin katsayıları (β değerleri), logit dönüşümü üzerinden bağımlı değişkene olan etkisini açıklar. Bu nedenle, lojistik regresyon, sürekli tahmin edici değişkenler ile sonuç değişkeninin logiti arasındaki doğrusal ilişkiyi belirlemek için kullanılır.

#10. Yukarıdaki Python kodunun vereceği sonuç aşağıdakilerden hangisidir?

Cevap : D) 1

Veri Bilimi 2024 Soru 2

Kodun çıktısı: 1

Açıklama : Sözlükte d[‘a’] 0, d[‘b’] 1 ve d[‘c’] 5 değerlerine sahiptir. İlk koşulda d[‘a’] 0 olduğundan if bloğu çalışmaz, d[‘b’] 1 olduğundan elif bloğu çalışır ve 1 yazdırılır.

#11. Yukarıda verilen - tesla - adlı liste veri yapısını - info-  adlı veri çerçevesine dönüştürmek için - ? - yerine yazılması gereken kod aşağıdakilerden hangisidir?

Cevap : A) info=pd.DataFrame(tesla)

Açıklama : Pandas kütüphanesinde bir listeyi veri çerçevesine dönüştürmek için pd.DataFrame() fonksiyonu kullanılır. Bu fonksiyon, listeyi bir veri çerçevesi (DataFrame) nesnesine dönüştürür. Doğru kod aşağıdaki gibidir:

Veri Bilimi 2024 Soru 11

#12. Yukarıda verilen - dizi - adlı dizideki - 8 - sayısını ekrana yazdırmak için - print() - fonksiyonu içerisine yazılması gereken kodun söz dizimi aşağıdakilerden hangisidir?

Cevap : C) print(dizi[1,2])

Açıklama : NumPy dizilerinde elemanlara erişim için köşeli parantezler kullanılır ve indeksler sıfırdan başlar. Verilen dizi iki boyutlu bir dizidir ve 8 sayısı ikinci satır ve üçüncü sütundadır. Bu nedenle, dizi[1,2] ifadesi doğru elemanı döndürecektir.

Veri Bilimi 2023-2024 Final Sınav Soruları Cevap 18

Bu kod çalıştırıldığında, çıktı olarak 8 sayısı ekrana yazdırılacaktır.

#13. Aşağıdaki ifadelerden hangisi en küçük kareler yönteminin amacını en iyi şekilde açıklamaktadır?

Cevap : E) Ölçüm sonucu elde edilmiş veri noktalarına mümkün olduğu kadar yakın geçecek bir fonksiyon eğrisi bulmaya yarar.

#14. Aşağıdaki bilişim firmalarından hangisi Python dilini resmî programlama dili olarak kabul etmiştir?

Cevap : B) Google

Açıklama : Google, Python’u resmi programlama dillerinden biri olarak kabul eden ve geniş ölçüde kullanan firmalardan biridir. Google, Python’u çeşitli projelerinde ve ürünlerinde yoğun bir şekilde kullanmaktadır. Python’un sadeliği ve çok yönlülüğü, Google’ın bu dili benimsemesinde önemli bir rol oynamıştır. Bu nedenle, Python’un resmi olarak kabul edildiği firmalardan biri Google’dır.

#15. Yukarıda verilen Python kodunun ekran çıktısının sonucu aşağıdakilerden hangisidir?

Cevap : A)  1, 2, 3, 4

Veri Bilimi 2023-2024 Final Sınav Soruları Soru 1

Kodun çıktısı: 1, 2, 3, 4

Açıklama : Kod, 1’den başlayarak 10’a kadar olan sayılar üzerinde iterasyon yapar. i değeri 5’e eşit olduğunda döngü sona erer. print(i) komutu döngünün dışında olduğu için 1, 2, 3 ve 4 değerleri yazdırılı

#16. Yukarıdaki Python dilinde oluşturulan ve adı “data” olan veri çerçevesi verilmiştir.
Bu veri çerçevesinde kalın çizgilerle çevrelenmiş kayıtları görüntüleyen kod aşağıdakilerden hangisidir?

Cevap : D) data.iloc[:,0:2]

Açıklama : Kalın çizgilerle çevrelenmiş kayıtlar “country” ve “continent” sütunlarını içerir. data.iloc[:,0:2] kodu, veri çerçevesindeki 0. sütundan (country) başlayarak 2. sütuna (continent) kadar olan sütunları seçer.

Veri Bilimi 2024 Soru 12 Çözüm

Bu kod, belirtilen sütunları görüntüleyecektir.

#17. Bilgisayarın - C - ana dizinin altında yer alan - VERI - adlı dizinden - iller - adlı ve - csv - uzantılı dosyayı okumak için yazılması gereken Python komut satırı aşağıdakilerden hangisidir?

Cevap : C) iller=pd.read_csv(“C:/VERI/iller.csv”)

Açıklama : CSV dosyasını pandas ile okumak için doğru komut pd.read_csv() fonksiyonudur.

#18. Python'da K-means kütüphanesini çağırmak için çalışma sayfasına yazılması gereken kod aşağıdakilerden hangisidir?

Cevap : E) from sklearn.cluster import K-Means

Açıklama : Python’da K-means kümeleme algoritmasını kullanmak için scikit-learn (sklearn) kütüphanesinden KMeans sınıfı import edilir. Doğru import ifadesi şu şekildedir:

Veri Bilimi 2023-2024 Final Sınav Soruları Soru 17

Bu kod, sklearn kütüphanesinin cluster modülünden KMeans sınıfını çağırır ve K-means algoritmasını kullanmanıza olanak tanır.

#19. Yukarıda verilen Python programının çıktısı aşağıdakilerden hangisidir?

Cevap : A)  {elma, muz, çilek, portakal}

Açıklama : Set veri yapısına add() metodu ile “portakal” eklenir. Set, sıralanmamış bir koleksiyon olduğundan, elemanlar sırasız olarak yazdırılır.

#20. Yukarıda verilen görseli en doğru şekilde tanımlayan seçenek aşağıdakilerden hangisidir?

Cevap : B) Makine öğrenimini temsil eder.

Açıklama : Görsel, makine öğrenimi sürecinin adımlarını temsil etmektedir. Bu adımlar genellikle veri toplama, veriyi işleme (eğitim aşaması), model oluşturma ve sonuçları tahmin etme şeklinde ilerler. Görselde bu aşamalar açıkça gösterilmektedir: “Veri”, “Eğitim Aşaması”, “Model Kurma” ve “Çıkışın Tahmini”.

Bu nedenle, görsel makine öğrenimini en doğru şekilde temsil etmektedir.

TESTi BiTiR, PUANINI GÖR

SONUÇ

-

Veri Bilimi 2023-2024 Final Sınav Soruları

Yönetim Bİlişim Sistemleri Lisans 2. sınıf bahar dönemi final sınav soruları

Veri Bilimi 2023-2024 Final Sınav Soruları

Yönetim Bİlişim Sistemleri Lisans 2. sınıf bahar dönemi final sınav soruları

Share your score!
Tweet your score!
Share to other

HD Quiz powered by harmonic design

Veri Bilimi 2023-2024 Final Sınav Soruları

Veri Bilimi: Teorik Temeller ve Uygulama Alanları

Giriş

Veri bilimi, büyük hacimli ve çeşitli veri setlerini anlamlandırmak, analiz etmek ve içgörüler elde etmek amacıyla kullanılan disiplinler arası bir alandır. Veri bilimi, istatistik, bilgisayar bilimi, matematik ve alan bilgisi gibi farklı disiplinlerin bir araya gelmesiyle ortaya çıkmıştır. Bu makalede, veri biliminin teorik temelleri, kullanılan yöntemler ve çeşitli uygulama alanları ele alınacaktır.

Teorik Temeller

İstatistik ve Matematik

Veri biliminin temel taşlarından biri istatistiktir. İstatistiksel yöntemler, veri analizi ve modelleme süreçlerinde kritik bir rol oynar. İstatistiksel testler, hipotez testleri, regresyon analizleri ve zaman serisi analizi gibi teknikler, veri biliminin vazgeçilmez araçlarıdır.

Matematiksel temeller de veri bilimi için önemlidir. Lineer cebir, olasılık teorisi ve optimizasyon yöntemleri, veri bilimcilerin karmaşık veri setlerini anlamlandırmak ve modeller oluşturmak için kullandıkları başlıca matematiksel araçlardır.

Bilgisayar Bilimi

Veri bilimi, büyük veri setlerini işlemek ve analiz etmek için bilgisayar bilimine dayanır. Algoritmalar, veri yapıları ve programlama dilleri, veri bilimi süreçlerinde yaygın olarak kullanılır. Python ve R gibi programlama dilleri, veri bilimi alanında en çok tercih edilen araçlardır. Bu diller, veri işleme, görselleştirme ve makine öğrenimi modellerinin oluşturulması için geniş kütüphaneler ve araçlar sunar.

Kullanılan Yöntemler

Makine Öğrenimi

Makine öğrenimi, veri biliminin önemli bir alt alanıdır. Makine öğrenimi algoritmaları, verilerden öğrenerek tahminlerde bulunur veya sınıflandırma yapar. Denetimli öğrenme, denetimsiz öğrenme ve pekiştirmeli öğrenme gibi farklı makine öğrenimi yaklaşımları vardır.

Denetimli Öğrenme:

Girdi ve çıktı verileri kullanılarak modellerin eğitildiği yaklaşımdır. Lojistik regresyon, karar ağaçları, destek vektör makineleri ve yapay sinir ağları gibi algoritmalar bu kategoriye girer.

Denetimsiz Öğrenme:

Sadece girdi verileri kullanılarak desenlerin ve yapının keşfedildiği yaklaşımdır. K-means kümeleme ve ana bileşen analizi (PCA) bu kategoriye örnek olarak verilebilir.

Pekiştirmeli Öğrenme:

Bir ajanın, ödüller veya cezalar yoluyla öğrenme yaptığı bir yaklaşımdır. Bu tür öğrenme, özellikle oyun oynama ve robotik uygulamalarda kullanılır.

Büyük Veri Teknolojileri

Veri bilimi, genellikle büyük veri setleri ile çalışmayı gerektirir. Büyük veri teknolojileri, bu veri setlerinin işlenmesini ve analiz edilmesini sağlar. Hadoop ve Spark gibi çerçeveler, dağıtık veri işleme ve depolama için kullanılır. Bu teknolojiler, verilerin hızlı bir şekilde işlenmesini ve analiz edilmesini mümkün kılar.

Uygulama Alanları

İş Zekası ve Karar Destek Sistemleri

Veri bilimi, işletmelerin daha bilinçli kararlar almasına yardımcı olur. İş zekası araçları, verilerin görselleştirilmesi ve analiz edilmesi yoluyla içgörüler sağlar. Bu içgörüler, stratejik kararların alınmasında ve operasyonel verimliliğin artırılmasında kritik rol oynar.

Sağlık ve Tıp

Veri bilimi, sağlık sektöründe de önemli uygulamalara sahiptir. Elektronik sağlık kayıtları, genomik veriler ve tıbbi görüntüler gibi büyük veri setleri, hastalıkların teşhisinde ve tedavisinde kullanılmaktadır. Makine öğrenimi modelleri, hastalık riskini tahmin etmede ve kişiselleştirilmiş tedavi planları oluşturulmasında kullanılır.

Finans

Finans sektörü, veri bilimi tekniklerinden yoğun bir şekilde faydalanır. Risk analizi, dolandırıcılık tespiti ve algoritmik ticaret gibi alanlarda veri bilimi uygulamaları yaygındır. Büyük veri analitiği, finansal piyasalardaki trendleri ve desenleri anlamak için kullanılır.

Perakende ve Pazarlama

Perakende sektörü, müşteri davranışlarını anlamak ve kişiselleştirilmiş pazarlama stratejileri geliştirmek için veri bilimi kullanır. Müşteri segmentasyonu, pazar sepet analizi ve talep tahmini, veri biliminin perakende sektöründe yaygın uygulamalarındandır.

Sonuç

Veri bilimi, çok disiplinli yapısıyla geniş bir uygulama yelpazesine sahiptir. İstatistik, matematik ve bilgisayar biliminin birleşimi olan veri bilimi, büyük veri setlerini anlamlandırarak değerli içgörüler elde etmeyi sağlar. Makine öğrenimi ve büyük veri teknolojileri gibi yöntemler, veri bilimini daha etkili ve verimli kılarak, farklı sektörlerde önemli faydalar sağlar. Gelecekte, veri biliminin daha da gelişerek yeni uygulama alanları yaratması ve mevcut süreçleri iyileştirmesi beklenmektedir.

@lolonolo_com

Veri Bilimi 2023-2024 Final Sınav Soruları

Veri Bilimi 2023-2024 Final Sınav Soruları

Veri Bilimi 2023-2024 Final Sınav Soruları Soru 1

1. Yukarıda verilen Python kodunun ekran çıktısının sonucu aşağıdakilerden hangisidir?

A)  1, 2, 3, 4
B)  2, 4, 6, 8, 10
C)  6, 7, 8, 9
D)  6, 7, 8, 9, 10
E)  1, 3, 5, 7, 9

Cevap : A)  1, 2, 3, 4

Veri Bilimi 2023-2024 Final Sınav Soruları Soru 1

Kodun çıktısı: 1, 2, 3, 4

Açıklama : Kod, 1’den başlayarak 10’a kadar olan sayılar üzerinde iterasyon yapar. i değeri 5’e eşit olduğunda döngü sona erer. print(i) komutu döngünün dışında olduğu için 1, 2, 3 ve 4 değerleri yazdırılı

Veri Bilimi 2023-2024 Final Sınav Soruları Soru 2

2. Yukarıdaki Python kodunun vereceği sonuç aşağıdakilerden hangisidir?

A) 5
B) 0
C) 2
D) 1
E) 3

Cevap : D) 1

Veri Bilimi 2024 Soru 2

Kodun çıktısı: 1

Açıklama : Sözlükte d[‘a’] 0, d[‘b’] 1 ve d[‘c’] 5 değerlerine sahiptir. İlk koşulda d[‘a’] 0 olduğundan if bloğu çalışmaz, d[‘b’] 1 olduğundan elif bloğu çalışır ve 1 yazdırılır.

Veri Bilimi 2023-2024 Final Sınav Soruları Soru 3

3. Yukarıda verilen denklem K-means kümeleme algoritmasında ne amaçla kullanılır?

A) Veriler ile veri merkezleri arasındaki mesafeyi hesaplamak için
B) Veri uzunluklarını hesaplamak için
C) Küme elemanlarının sayısını kontrol etmek için
D) Veri merkezlerini hesaplamak için
E) Küme sayılarını belirlemek için

Cevap : A) Veriler ile veri merkezleri arasındaki mesafeyi hesaplamak için

Açıklama : Bu denklem, Euclidean mesafesini hesaplamak için kullanılır ve K-Means kümeleme algoritmasında, veriler ile küme merkezleri arasındaki mesafeyi hesaplamak için kullanılır. Algoritmanın amacı, her bir veri noktasını en yakın küme merkezine atamaktır.

4. Bir arabanın satış fiyatı (1.000 $) ile yaşı (yıl olarak) arasındaki ilişki, belirli bir modeldeki rastgele araba örneklerinden tahmin edilerek aşağıdaki ilişki formülü elde edilmiştir.

satışücreti=24.2-(1.182)yıl

Bu denklemden aşağıdaki ifadelerden hangisi çıkarılabilir?

A) Otomobil her yıl yaşlandığında satış fiyatı yaklaşık 2420 $ düşer.
B) Yeni bir arabanın maliyeti yaklaşık 23.018 $ olur.
C) Yeni bir arabanın maliyeti yaklaşık 11.820 $ olur.
D) Otomobil her yıl yaşlandığında satış fiyatı yaklaşık %11,82 düşer.
E) Otomobil her yıl yaşlandığında satış fiyatı yaklaşık 1182 $ düşer.

Cevap : E) Otomobil her yıl yaşlandığında satış fiyatı yaklaşık 1182 $ düşer.

Açıklama : Denklemde yıl parametresi her yıl için 1.182 düşüş gösterir. Bu, her yıl için 1182 dolarlık bir düşüş anlamına gelir

5. Bilgisayarın “C” ana dizinin altında yer alan “VERI” adlı dizinden “iller” adlı ve “csv” uzantılı dosyayı okumak için yazılması gereken Python komut satırı aşağıdakilerden hangisidir?

A) iller=pd.read_csv(C:/VERI/iller.csv)
B) iller=pd.read.csv(“C:/VERI/iller.csv”)
C) iller=pd.read_csv(“C:/VERI/iller.csv”)
D) iller=read_csv(“C:/VERI/iller.csv”)
E) iller=pd.read_csv(“C:/VERI/iller_csv”)

Cevap : C) iller=pd.read_csv(“C:/VERI/iller.csv”)

Açıklama : CSV dosyasını pandas ile okumak için doğru komut pd.read_csv() fonksiyonudur.

Veri Bilimi 2024 Soru 6

6. Python kütüphanesi ile oluşturulan yukarıdaki grafikte, grafik kenarlarının farklı renkte olmasını sağlayan parametre/argüman aşağıdakilerden hangisidir?

A) color=
B) linecolor=
C) barcolor=
D) edgecolor=
E) facecolor=

Cevap : D) edgecolor=

Açıklama : Python’da matplotlib kütüphanesi ile grafik oluştururken, barların kenar renklerini ayarlamak için ‘edgecolor’ parametresi kullanılır. Bu parametre, her bir barın kenar çizgilerinin rengini belirler.

7. Lojistik regrasyon modeli tahmin işleminde aşağıdaki yaklaşımlardan hangisini kullanır?

A)  Negatif binom dağılım yaklaşımı
B)  Sıradan en küçük kareler (OLS) yaklaşımı
C)  Maksimum olasılık tahmini (MLS) yaklaşımı
D)  Poisson dağılım yaklaşımı
E)  Üstel tahmin dağılım yaklaşımı

Cevap : C)  Maksimum olasılık tahmini (MLS) yaklaşımı

Açıklama : Lojistik regresyon, bağımlı değişkenin kategorik olduğu durumlarda kullanılan bir regresyon analizidir. Tahmin işleminde, parametrelerin en iyi tahminlerini elde etmek için Maksimum Olasılık Tahmini (Maximum Likelihood Estimation, MLE) kullanılır. Bu yöntem, verilen veri seti için modelin parametrelerinin olasılığını en yüksek hale getirecek şekilde ayarlanmasını sağlar.

Bu nedenle, lojistik regresyon modelinde tahmin işlemi için Maksimum Olasılık Tahmini (MLS) yaklaşımı kullanılır.

8

1. plt.legend()
2. x = np.linspace(1, 10, 20)
3. plt.show()
4. plt.xlabel(‘X-Etiket’)
5. plt.plot(x, label=’Örnek Çizim’)

Yukarıda numaralandırılmış kodlar ile çizim oluşturmak ve görüntülemek için verilen komutlar hangi sırayla çalıştırılmalıdır?

A) 5-4-1-3-2
B) 2-4-5-1-3
C) 1-2-4-3-5
D) 4-2-1-3-5
E) 2-5-4-1-3

Cevap : E) 2-5-4-1-3

Açıklama : Bu komutlar, matplotlib kullanarak bir çizim oluşturmak ve görüntülemek için gereken adımları içerir. İşte doğru sıralama ve her adımın ne yaptığı:

1- x = np.linspace(1, 10, 20): x ekseni için 1 ile 10 arasında 20 eşit aralıkta değerler oluşturur.
2- plt.plot(x, label=’Örnek Çizim’): x eksenindeki değerleri y eksenine çizer ve etiketi ‘Örnek Çizim’ olarak belirler.
3- plt.xlabel(‘X-Etiket’): x eksenine ‘X-Etiket’ yazısını ekler.
4- plt.legend(): Çizimdeki etiketleri gösterir.
5- plt.show(): Çizimi ekranda gösterir.

Bu adımlar doğru sırayla yapıldığında, matplotlib ile düzgün bir çizim oluşturulur ve ekranda görüntülenir.

9. Aşağıdaki bilişim firmalarından hangisi Python dilini resmî programlama dili olarak kabul etmiştir?

A) Microsoft
B) Google
C) Apple
D) Amazon
E) IBM

Cevap : B) Google

Açıklama : Google, Python’u resmi programlama dillerinden biri olarak kabul eden ve geniş ölçüde kullanan firmalardan biridir. Google, Python’u çeşitli projelerinde ve ürünlerinde yoğun bir şekilde kullanmaktadır. Python’un sadeliği ve çok yönlülüğü, Google’ın bu dili benimsemesinde önemli bir rol oynamıştır. Bu nedenle, Python’un resmi olarak kabul edildiği firmalardan biri Google’dır.

10. Algoritma kavramı ile ilgili aşağıda verilen ifadelerden hangisi doğrudur?

A) Matematiksel işlemleri tanımlayan harfler ve sayılar topluluğudur.
B) Girdi olarak bir değer alan ve girdiye bağlı olarak çıktı değeri üreten bir hesaplama prosedürüdür.
C) Makine yapma bilimi, insanlar tarafından yapıldığında zekâ gerektiren görevleri yerine getirir.
D) Matematiksel işlemler için kullanılan bir hesaplama tekniğidir.
E) Makine öğrenimi tekniklerini kullanır. Burada program,

Cevap: B) Girdi olarak bir değer alan ve girdiye bağlı olarak çıktı değeri üreten bir hesaplama prosedürüdür.

Açıklama : Algoritma, belirli bir problemi çözmek veya belirli bir görevi yerine getirmek için tanımlanmış adım adım talimatlar dizisidir. Bu talimatlar, girdileri alır ve bu girdilere dayalı olarak belirli bir çıktıyı üretir. Algoritmalar, bilgisayar biliminin temel kavramlarından biridir ve çeşitli programlama ve problem çözme senaryolarında kullanılır.

11
.Veri Bilimi 2023-2024 Soru 11

Yukarıda verilen “tesla” adlı liste veri yapısını “info” adlı veri çerçevesine dönüştürmek için “?” yerine yazılması gereken kod aşağıdakilerden hangisidir?

A) info=pd.DataFrame(tesla)
B) info=DataFrame(tesla)
C) info=Datalist(tesla)
D) info=pd.listFrame(tesla)
E) info=list_DataFrame(tesla)

Cevap : A) info=pd.DataFrame(tesla)

Açıklama : Pandas kütüphanesinde bir listeyi veri çerçevesine dönüştürmek için pd.DataFrame() fonksiyonu kullanılır. Bu fonksiyon, listeyi bir veri çerçevesi (DataFrame) nesnesine dönüştürür. Doğru kod aşağıdaki gibidir:

Veri Bilimi 2024 Soru 11

12. Aşağıda Python dilinde oluşturulan ve adı “data” olan veri çerçevesi verilmiştir.

Veri Bilimi 2024 Soru 12
Bu veri çerçevesinde kalın çizgilerle çevrelenmiş kayıtları görüntüleyen kod aşağıdakilerden hangisidir?

A) data.iloc[:,0:5]
B) data.iloc[:,1:3]
C) data.iloc[:,0:3]
D) data.iloc[:,0:2]
E) data.iloc[:,1:2]

Cevap : D) data.iloc[:,0:2]

Açıklama : Kalın çizgilerle çevrelenmiş kayıtlar “country” ve “continent” sütunlarını içerir. data.iloc[:,0:2] kodu, veri çerçevesindeki 0. sütundan (country) başlayarak 2. sütuna (continent) kadar olan sütunları seçer.

Veri Bilimi 2024 Soru 12 Çözüm

Bu kod, belirtilen sütunları görüntüleyecektir.

13. Python’da oluşturulan ogr=[“Ahmet”, “Işıl”, “Mehmet”, “Ayşe”, “Kazım”, “Zehra”, “Turgay”] adlı listeye; “Zarife” adlı öğrenciyi ekleyecek söz dizimi (komut satırı) hangi seçenekte doğru olarak verilmiştir?

Veri Bilimi 2024 13.soru

A) ogr.append[“Zarife”]
B) ogr.add(“Zarife”)
C) ogr.append(“Zarife”)
D) ogr.add[“Zarife”]
E) ogr.append(Zarife)

Cevap : C) ogr.append(“Zarife”)

Açıklama : Python’da bir listeye yeni bir eleman eklemek için append() metodu kullanılır. Bu metot, listeye eleman eklemek için en yaygın kullanılan yöntemdir ve doğru şekilde kullanımı parantez içinde eklenen elemanla birlikte olmalıdır.

Veri bilimi 2024 Soru 13-1

Bu kod çalıştırıldığında, “Zarife” adlı öğrenci listeye eklenecektir ve çıktı şu şekilde olacaktır:

Veri bilimi 2024 Soru 13-2

Veri Bilimi 2023-2024 Final Sınav Soruları Soru 14

14. Yukarıda verilen görseli en doğru şekilde tanımlayan seçenek aşağıdakilerden hangisidir?

A) Keşifsel veri analizini temsil eder.
B) Makine öğrenimini temsil eder.
C) Python programlama sürecini tanımlar.
D) Algoritmanın çalışmasını açıklar.
E) Grafik çizim sürecini temsil eder.

Cevap : B) Makine öğrenimini temsil eder.

Açıklama : Görsel, makine öğrenimi sürecinin adımlarını temsil etmektedir. Bu adımlar genellikle veri toplama, veriyi işleme (eğitim aşaması), model oluşturma ve sonuçları tahmin etme şeklinde ilerler. Görselde bu aşamalar açıkça gösterilmektedir: “Veri”, “Eğitim Aşaması”, “Model Kurma” ve “Çıkışın Tahmini”.

Bu nedenle, görsel makine öğrenimini en doğru şekilde temsil etmektedir.

15. Gruplandırılmış bir verinin dağılımının en iyi temsilini ve her bir veri değerinin sıklığını gösteren grafik türü aşağıdakilerden hangisidir?

A) Çubuk grafiği
B) Pasta dilimi grafiği
C) Bar grafiği
D) Histogram grafiği
E) Scatter grafiği

Cevap : D) Histogram grafiği

Açıklama : Histogram grafiği, verinin gruplandırılmış dağılımını ve her bir grup için veri değerlerinin sıklığını gösteren bir grafik türüdür. Histogramlar, sürekli veri dağılımlarını görselleştirmek için kullanılır ve veri değerlerinin belirli aralıklarda (binler) nasıl dağıldığını gösterir. Bu grafikte, x ekseni veri aralıklarını, y ekseni ise bu aralıklardaki veri değerlerinin sıklığını temsil eder.Bu nedenle, gruplandırılmış bir verinin dağılımını ve sıklığını en iyi şekilde temsil eden grafik türü histogram grafiğidir.

16. Aşağıdaki ifadelerden hangisi en küçük kareler yönteminin amacını en iyi şekilde açıklamaktadır?

A) Ölçüm sonucu elde edilmiş veri noktalar arasındaki mesafeyi en aza indirmeyi sağlar.
B) Hata kalıntıların toplamının en küçük değerini bize sağlayan kesişim ve eğimin (en iyi) değerlerini bulur.
C) Ölçüm sonucu bulunan noktalardan geçecek doğrunun sadece eğimini bulmayı sağlar.
D) Ölçüm sonucu bulunan noktalara mümkün olduğunca en uzak geçecek bir çizgi bulmayı sağlar.
E) Ölçüm sonucu elde edilmiş veri noktalarına mümkün olduğu kadar yakın geçecek bir fonksiyon eğrisi bulmaya yarar.

Cevap : E) Ölçüm sonucu elde edilmiş veri noktalarına mümkün olduğu kadar yakın geçecek bir fonksiyon eğrisi bulmaya yarar.

Açıklama : ?

17.

Python’da K-means kütüphanesini çağırmak için çalışma sayfasına yazılması gereken kod aşağıdakilerden hangisidir?

A) from pandas.cluster import K-Means
B) from sklearn.cluster import K-cluster
C) from numpy.cluster import K-Means
D) from mutplolib.cluster import K-Means
E) from sklearn.cluster import K-Means

Cevap : E) from sklearn.cluster import K-Means

Açıklama : Python’da K-means kümeleme algoritmasını kullanmak için scikit-learn (sklearn) kütüphanesinden KMeans sınıfı import edilir. Doğru import ifadesi şu şekildedir:

Veri Bilimi 2023-2024 Final Sınav Soruları Soru 17

Bu kod, sklearn kütüphanesinin cluster modülünden KMeans sınıfını çağırır ve K-means algoritmasını kullanmanıza olanak tanır.

18.
dizi= np.array([[1,2,3,4,5], [6,7,8,9,10]]) print(?)

Veri Bilimi 2023-2024 Final Sınav Soruları Soru 18

Yukarıda verilen “dizi” adlı dizideki “8” sayısını ekrana yazdırmak için “print()” fonksiyonu içerisine yazılması gereken kodun söz dizimi aşağıdakilerden hangisidir?

A) print(dizi[7,2])
B) print(dizi[2,3])
C) print(dizi[1,2])
D) print(dizi[3,3])
E) print(dizi[3,0])

Cevap : C) print(dizi[1,2])

Açıklama : NumPy dizilerinde elemanlara erişim için köşeli parantezler kullanılır ve indeksler sıfırdan başlar. Verilen dizi iki boyutlu bir dizidir ve 8 sayısı ikinci satır ve üçüncü sütundadır. Bu nedenle, dizi[1,2] ifadesi doğru elemanı döndürecektir.

Veri Bilimi 2023-2024 Final Sınav Soruları Cevap 18

Bu kod çalıştırıldığında, çıktı olarak 8 sayısı ekrana yazdırılacaktır.

19. Lojistik regresyon yöntemi aşağıdakilerden hangisini bulmak için kullanılır?

A) Sürekli tahmin edici değişkenler arasındaki doğrusal ilişki
B) Sürekli tahmin edici değişkenler ile sonuç değişkeninin logiti arasındaki doğrusal ilişki
C) Gözlemler arasındaki zıt ilişki
D) Gözlemler arasındaki doğrusal ilişki
E) Sürekli tahminî değişkenler ile sonuç değişkeni arasındaki doğrusal ilişki

Cevap : B) Sürekli tahmin edici değişkenler ile sonuç değişkeninin logiti arasındaki doğrusal ilişki

Lojistik regresyon, bağımlı değişkenin kategorik olduğu (örneğin, 0 veya 1 gibi ikili sonuçlar) durumlarda kullanılan bir regresyon analizidir. Bu yöntem, sürekli tahmin edici değişkenlerin (bağımsız değişkenler) sonuç değişkeninin logit (log odds) dönüşümü ile olan doğrusal ilişkisini bulmak için kullanılır.

Logit dönüşümü, bir olasılığı 0 ile 1 arasında sınırlamaya ve doğrusal bir modelle ilişkilendirmeye yarar. Lojistik regresyon modelinde, bağımsız değişkenlerin etkisi logit fonksiyonu aracılığıyla hesaplanır:

Veri Bilimi 2023-2024 Final Sınav Soruları Soru 19 Cevap
Burada p, bağımlı değişkenin 1 olma olasılığıdır. Bu denkleme göre, bağımsız değişkenlerin katsayıları (β değerleri), logit dönüşümü üzerinden bağımlı değişkene olan etkisini açıklar. Bu nedenle, lojistik regresyon, sürekli tahmin edici değişkenler ile sonuç değişkeninin logiti arasındaki doğrusal ilişkiyi belirlemek için kullanılır.

Veri Bilimi 2023-2024 Final Sınav Soruları Soru 20

20. Yukarıda verilen Python programının çıktısı aşağıdakilerden hangisidir?

A)  {elma, muz, çilek, portakal}
B)  {elma, çilek, portakal}
C)  {elma, muz, çilek}
D)  {çilek, portakal}
E)  {elma, muz, portakal}

Cevap : A)  {elma, muz, çilek, portakal}

Açıklama : Set veri yapısına add() metodu ile “portakal” eklenir. Set, sıralanmamış bir koleksiyon olduğundan, elemanlar sırasız olarak yazdırılır.

@lolonolo_com

Veri Bilimi 2023-2024 Final Sınav Soruları

Yönetim Bilişim Sistemleri Lisans

Veri Bilimi 2023-2024 Final Sınav Soruları

Editor

Editör

error: Kopyalamaya Karşı Korumalıdır!