Veri Bilimi

Veri Bilimi Sınav Soruları

Vize	Final
2024 Vize Soruları	2024 Final Soruları
2023 Vize Soruları	2023 Final Soruları

Öğrenci Dostu
Öğrenme Yönetim Sistemi – LOLONOLO

Üniteler

Veri Bilimi İçin Temel Kavramlar

Veri Bilimi İçin Python Programlamasına Giriş

Python’a Özgü Veri Yapıları-1 (liste)

Python’a Özgü Veri Yapıları-2 (tuple, Küme, Sözlük)

Python’da Kontrol Yapıları -1

Python’da Kontrol Yapıları- 2

Python İçin Veri Analizi Araçları -1 (numpy)

Python İçin Veri Analizi Araçları -2 (pandas)

Python İçin Veri Analizi Araçları -3 (matplotlıb)

İstatistiksel Analiz

Makine Öğrenimi (denetimli-Denetimsiz Öğrenme)

Regresyon

Sınıflandırma

Kümeleme

Veri Bilimi ve Python: Temel Kavramlardan Makine Öğrenimine

Günümüzde bilgi çağında, büyük veri setleri analiz edilerek değerli bilgiler elde etmek, iş dünyasında ve bilimde rekabet avantajı sağlamak için önemli hale gelmiştir. Veri bilimi, bu büyük veri setlerini anlamak, işlemek ve analiz etmek için kullanılan bir disiplindir. Bu makalede, veri bilimi alanındaki temel kavramlardan başlayarak, Python programlamasına giriş yapacak ve veri analizi araçlarından makine öğrenimine kadar geniş bir yelpazede konuları ele alacağız.

Veri Bilimi İçin Temel Kavramlar

Veri bilimi, istatistik, matematik, programlama ve bilgi teknolojilerinin entegrasyonunu içeren disiplinlerarası bir alandır. Temel kavramlar arasında veri türleri, veri setleri, veri temizleme ve veri manipülasyonu yer almaktadır. Veri bilimcileri, karmaşık veri setlerini anlamak, temizlemek ve analiz etmek için bu temel kavramları kullanırlar.

Python Programlamasına Giriş

Veri bilimi dünyasında en yaygın olarak kullanılan programlama dillerinden biri Python’dır. Python, açık kaynaklı olması, geniş kütüphane desteğine sahip olması ve kullanımının kolay olması nedeniyle tercih edilmektedir. Bu bölümde, Python programlamasına temel bir giriş yapacak ve dilin temel özelliklerini öğreneceğiz.

Python’a Özgü Veri Yapıları

Python, çeşitli veri yapılarına sahiptir. Bu makalede, liste, tuple, küme ve sözlük gibi temel veri yapılarını inceleyeceğiz. Her bir veri yapısının özellikleri ve nasıl kullanılacağı konularına detaylı bir şekilde değineceğiz.

Python’da Kontrol Yapıları

Python’da kontrol yapıları, programın akışını yönlendirmek için kullanılır. İf-else ifadeleri, döngüler ve break ifadeleri gibi kontrol yapılarını öğrenerek, programlarımızı daha etkili ve esnek hale getirebiliriz.

Python İçin Veri Analizi Araçları

Veri analizi, veri bilimi sürecinin önemli bir aşamasıdır. Python, bu aşamada kullanılan çeşitli kütüphanelere sahiptir. Numpy, pandas ve matplotlib gibi kütüphaneler, veri analizi ve görselleştirmenin yanı sıra matematiksel işlemleri de destekler.

İstatistiksel Analiz

İstatistik, veri bilmi alanında bilgi çıkarmanın temel araçlarından biridir. Bu bölümde, temel istatistik kavramlarına ve istatistiksel analizin nasıl gerçekleştirileceğine odaklanacağız.

Makine Öğrenimi: Denetimli ve Denetimsiz Öğrenme

Makine öğrenimi, bilgisayar sistemlerinin deneyimlerinden öğrenmesine olanak tanıyan bir alanı kapsar. Denetimli öğrenme ve denetimsiz öğrenme, makine öğrenimi modellerinin temel tiplerini temsil eder. Bu bölümde, her iki öğrenme türünü inceleyerek, gerçek dünya uygulamalarında nasıl kullanılabileceğini anlayacağız.

Regresyon, Sınıflandırma ve Kümeleme

Makine öğrenimi altındaki regresyon, sınıflandırma ve kümeleme, farklı veri setleri üzerinde belirli görevleri gerçekleştirmek için kullanılan teknikleri ifade eder. Bu bölümde, her bir konsepti ayrıntılı olarak ele alacak ve gerçek dünya örnekleri üzerinden nasıl uygulanabileceğini göreceğiz.

Bu makale, veri bilimi alanına geniş bir bakış sunarak, temel kavramlardan başlayarak makine öğrenimi tekniklerine kadar birçok konuyu kapsamaktadır. Veri bilimi dünyasında bilgi sahibi olmak, günümüzde birçok sektörde başarıya ulaşmanın anahtarıdır.

Auzef Yönetim Bilişim Sistemleri Lisans

Öğrenci Dostu
LOLONOLO -Öğrenme Yönetim Sistemi

Örnek 1: Python’a Özgü Veri Yapıları (Liste)

Örnek 2: Python’da Kontrol Yapıları

Örnek 3: Numpy ile Matematiksel İşlemler

Bu örnekler, veri blimi konularını Python programlama dilinde nasıl kullanabileceğinizi anlamanıza yardımcı olacaktır. Daha fazla

örnek ve uygulama yaparak konuları pekiştirebilirsiniz.

Veri Bilimi: Teorik Temeller ve Uygulama Alanları

Giriş

Veri bilimi, büyük hacimli ve çeşitli veri setlerini anlamlandırmak, analiz etmek ve içgörüler elde etmek amacıyla kullanılan disiplinler arası bir alandır. Veri bilimi, istatistik, bilgisayar bilimi, matematik ve alan bilgisi gibi farklı disiplinlerin bir araya gelmesiyle ortaya çıkmıştır. Bu makalede, veri biliminin teorik temelleri, kullanılan yöntemler ve çeşitli uygulama alanları ele alınacaktır.

Teorik Temeller

İstatistik ve Matematik

Veri biliminin temel taşlarından biri istatistiktir. İstatistiksel yöntemler, veri analizi ve modelleme süreçlerinde kritik bir rol oynar. İstatistiksel testler, hipotez testleri, regresyon analizleri ve zaman serisi analizi gibi teknikler, veri biliminin vazgeçilmez araçlarıdır.

Matematiksel temeller de veri bilimi için önemlidir. Lineer cebir, olasılık teorisi ve optimizasyon yöntemleri, veri bilimcilerin karmaşık veri setlerini anlamlandırmak ve modeller oluşturmak için kullandıkları başlıca matematiksel araçlardır.

Bilgisayar Bilimi

Veri bilimi, büyük veri setlerini işlemek ve analiz etmek için bilgisayar bilimine dayanır. Algoritmalar, veri yapıları ve programlama dilleri, veri bilimi süreçlerinde yaygın olarak kullanılır. Python ve R gibi programlama dilleri, veri bilimi alanında en çok tercih edilen araçlardır. Bu diller, veri işleme, görselleştirme ve makine öğrenimi modellerinin oluşturulması için geniş kütüphaneler ve araçlar sunar.

Kullanılan Yöntemler

Makine Öğrenimi

Makine öğrenimi, veri biliminin önemli bir alt alanıdır. Makine öğrenimi algoritmaları, verilerden öğrenerek tahminlerde bulunur veya sınıflandırma yapar. Denetimli öğrenme, denetimsiz öğrenme ve pekiştirmeli öğrenme gibi farklı makine öğrenimi yaklaşımları vardır.

Denetimli Öğrenme:

Girdi ve çıktı verileri kullanılarak modellerin eğitildiği yaklaşımdır. Lojistik regresyon, karar ağaçları, destek vektör makineleri ve yapay sinir ağları gibi algoritmalar bu kategoriye girer.

Denetimsiz Öğrenme:

Sadece girdi verileri kullanılarak desenlerin ve yapının keşfedildiği yaklaşımdır. K-means kümeleme ve ana bileşen analizi (PCA) bu kategoriye örnek olarak verilebilir.

Pekiştirmeli Öğrenme:

Bir ajanın, ödüller veya cezalar yoluyla öğrenme yaptığı bir yaklaşımdır. Bu tür öğrenme, özellikle oyun oynama ve robotik uygulamalarda kullanılır.

Büyük Veri Teknolojileri

Veri bilimi, genellikle büyük veri setleri ile çalışmayı gerektirir. Büyük veri teknolojileri, bu veri setlerinin işlenmesini ve analiz edilmesini sağlar. Hadoop ve Spark gibi çerçeveler, dağıtık veri işleme ve depolama için kullanılır. Bu teknolojiler, verilerin hızlı bir şekilde işlenmesini ve analiz edilmesini mümkün kılar.

Uygulama Alanları

İş Zekası ve Karar Destek Sistemleri

Veri bilimi, işletmelerin daha bilinçli kararlar almasına yardımcı olur. İş zekası araçları, verilerin görselleştirilmesi ve analiz edilmesi yoluyla içgörüler sağlar. Bu içgörüler, stratejik kararların alınmasında ve operasyonel verimliliğin artırılmasında kritik rol oynar.

Sağlık ve Tıp

Veri bilimi, sağlık sektöründe de önemli uygulamalara sahiptir. Elektronik sağlık kayıtları, genomik veriler ve tıbbi görüntüler gibi büyük veri setleri, hastalıkların teşhisinde ve tedavisinde kullanılmaktadır. Makine öğrenimi modelleri, hastalık riskini tahmin etmede ve kişiselleştirilmiş tedavi planları oluşturulmasında kullanılır.

Finans

Finans sektörü, veri bilimi tekniklerinden yoğun bir şekilde faydalanır. Risk analizi, dolandırıcılık tespiti ve algoritmik ticaret gibi alanlarda veri bilimi uygulamaları yaygındır. Büyük veri analitiği, finansal piyasalardaki trendleri ve desenleri anlamak için kullanılır.

Perakende ve Pazarlama

Perakende sektörü, müşteri davranışlarını anlamak ve kişiselleştirilmiş pazarlama stratejileri geliştirmek için veri bilimi kullanır. Müşteri segmentasyonu, pazar sepet analizi ve talep tahmini, veri biliminin perakende sektöründe yaygın uygulamalarındandır.

Sonuç

Veri bilimi, çok disiplinli yapısıyla geniş bir uygulama yelpazesine sahiptir. İstatistik, matematik ve bilgisayar biliminin birleşimi olan veri bilimi, büyük veri setlerini anlamlandırarak değerli içgörüler elde etmeyi sağlar. Makine öğrenimi ve büyük veri teknolojileri gibi yöntemler, veri bilimini daha etkili ve verimli kılarak, farklı sektörlerde önemli faydalar sağlar. Gelecekte, veri biliminin daha da gelişerek yeni uygulama alanları yaratması ve mevcut süreçleri iyileştirmesi beklenmektedir.

@lolonolo_com

Veri Bilimi

Veri Bilimi 2023-2024 Final Sınav Soruları

1. Yukarıda verilen Python kodunun ekran çıktısının sonucu aşağıdakilerden hangisidir?

A) 1, 2, 3, 4
B) 2, 4, 6, 8, 10
C) 6, 7, 8, 9
D) 6, 7, 8, 9, 10
E) 1, 3, 5, 7, 9

Cevap : A) 1, 2, 3, 4

Veri Bilimi 2023-2024 Final Sınav Soruları Soru 1

Kodun çıktısı: 1, 2, 3, 4

Açıklama : Kod, 1’den başlayarak 10’a kadar olan sayılar üzerinde iterasyon yapar. i değeri 5’e eşit olduğunda döngü sona erer. print(i) komutu döngünün dışında olduğu için 1, 2, 3 ve 4 değerleri yazdırılı

Veri Bilimi 2023-2024 Final Sınav Soruları Soru 2

2. Yukarıdaki Python kodunun vereceği sonuç aşağıdakilerden hangisidir?

A) 5
B) 0
C) 2
D) 1
E) 3

Cevap : D) 1

Veri Bilimi 2024 Soru 2

Kodun çıktısı: 1

Açıklama : Sözlükte d[‘a’] 0, d[‘b’] 1 ve d[‘c’] 5 değerlerine sahiptir. İlk koşulda d[‘a’] 0 olduğundan if bloğu çalışmaz, d[‘b’] 1 olduğundan elif bloğu çalışır ve 1 yazdırılır.

Veri Bilimi 2023-2024 Final Sınav Soruları Soru 3

3. Yukarıda verilen denklem K-means kümeleme algoritmasında ne amaçla kullanılır?

A) Veriler ile veri merkezleri arasındaki mesafeyi hesaplamak için
B) Veri uzunluklarını hesaplamak için
C) Küme elemanlarının sayısını kontrol etmek için
D) Veri merkezlerini hesaplamak için
E) Küme sayılarını belirlemek için

Cevap : A) Veriler ile veri merkezleri arasındaki mesafeyi hesaplamak için

Açıklama : Bu denklem, Euclidean mesafesini hesaplamak için kullanılır ve K-Means kümeleme algoritmasında, veriler ile küme merkezleri arasındaki mesafeyi hesaplamak için kullanılır. Algoritmanın amacı, her bir veri noktasını en yakın küme merkezine atamaktır.

4. Bir arabanın satış fiyatı (1.000 $) ile yaşı (yıl olarak) arasındaki ilişki, belirli bir modeldeki rastgele araba örneklerinden tahmin edilerek aşağıdaki ilişki formülü elde edilmiştir.

satışücreti=24.2-(1.182)yıl

Bu denklemden aşağıdaki ifadelerden hangisi çıkarılabilir?

A) Otomobil her yıl yaşlandığında satış fiyatı yaklaşık 2420 $ düşer.
B) Yeni bir arabanın maliyeti yaklaşık 23.018 $ olur.
C) Yeni bir arabanın maliyeti yaklaşık 11.820 $ olur.
D) Otomobil her yıl yaşlandığında satış fiyatı yaklaşık %11,82 düşer.
E) Otomobil her yıl yaşlandığında satış fiyatı yaklaşık 1182 $ düşer.

Cevap : E) Otomobil her yıl yaşlandığında satış fiyatı yaklaşık 1182 $ düşer.

Açıklama : Denklemde yıl parametresi her yıl için 1.182 düşüş gösterir. Bu, her yıl için 1182 dolarlık bir düşüş anlamına gelir

5. Bilgisayarın “C” ana dizinin altında yer alan “VERI” adlı dizinden “iller” adlı ve “csv” uzantılı dosyayı okumak için yazılması gereken Python komut satırı aşağıdakilerden hangisidir?

A) iller=pd.read_csv(C:/VERI/iller.csv)
B) iller=pd.read.csv(“C:/VERI/iller.csv”)
C) iller=pd.read_csv(“C:/VERI/iller.csv”)
D) iller=read_csv(“C:/VERI/iller.csv”)
E) iller=pd.read_csv(“C:/VERI/iller_csv”)

Cevap : C) iller=pd.read_csv(“C:/VERI/iller.csv”)

Açıklama : CSV dosyasını pandas ile okumak için doğru komut pd.read_csv() fonksiyonudur.

6. Python kütüphanesi ile oluşturulan yukarıdaki grafikte, grafik kenarlarının farklı renkte olmasını sağlayan parametre/argüman aşağıdakilerden hangisidir?

A) color=
B) linecolor=
C) barcolor=
D) edgecolor=
E) facecolor=

Cevap : D) edgecolor=

Açıklama : Python’da matplotlib kütüphanesi ile grafik oluştururken, barların kenar renklerini ayarlamak için ‘edgecolor’ parametresi kullanılır. Bu parametre, her bir barın kenar çizgilerinin rengini belirler.

7. Lojistik regrasyon modeli tahmin işleminde aşağıdaki yaklaşımlardan hangisini kullanır?

A) Negatif binom dağılım yaklaşımı
B) Sıradan en küçük kareler (OLS) yaklaşımı
C) Maksimum olasılık tahmini (MLS) yaklaşımı
D) Poisson dağılım yaklaşımı
E) Üstel tahmin dağılım yaklaşımı

Cevap : C) Maksimum olasılık tahmini (MLS) yaklaşımı

Açıklama : Lojistik regresyon, bağımlı değişkenin kategorik olduğu durumlarda kullanılan bir regresyon analizidir. Tahmin işleminde, parametrelerin en iyi tahminlerini elde etmek için Maksimum Olasılık Tahmini (Maximum Likelihood Estimation, MLE) kullanılır. Bu yöntem, verilen veri seti için modelin parametrelerinin olasılığını en yüksek hale getirecek şekilde ayarlanmasını sağlar.

Bu nedenle, lojistik regresyon modelinde tahmin işlemi için Maksimum Olasılık Tahmini (MLS) yaklaşımı kullanılır.

1. plt.legend()
2. x = np.linspace(1, 10, 20)
3. plt.show()
4. plt.xlabel(‘X-Etiket’)
5. plt.plot(x, label=’Örnek Çizim’)

Yukarıda numaralandırılmış kodlar ile çizim oluşturmak ve görüntülemek için verilen komutlar hangi sırayla çalıştırılmalıdır?

A) 5-4-1-3-2
B) 2-4-5-1-3
C) 1-2-4-3-5
D) 4-2-1-3-5
E) 2-5-4-1-3

Cevap : E) 2-5-4-1-3

Açıklama : Bu komutlar, matplotlib kullanarak bir çizim oluşturmak ve görüntülemek için gereken adımları içerir. İşte doğru sıralama ve her adımın ne yaptığı:

1- x = np.linspace(1, 10, 20): x ekseni için 1 ile 10 arasında 20 eşit aralıkta değerler oluşturur.
2- plt.plot(x, label=’Örnek Çizim’): x eksenindeki değerleri y eksenine çizer ve etiketi ‘Örnek Çizim’ olarak belirler.
3- plt.xlabel(‘X-Etiket’): x eksenine ‘X-Etiket’ yazısını ekler.
4- plt.legend(): Çizimdeki etiketleri gösterir.
5- plt.show(): Çizimi ekranda gösterir.

Bu adımlar doğru sırayla yapıldığında, matplotlib ile düzgün bir çizim oluşturulur ve ekranda görüntülenir.

9. Aşağıdaki bilişim firmalarından hangisi Python dilini resmî programlama dili olarak kabul etmiştir?

A) Microsoft
B) Google
C) Apple
D) Amazon
E) IBM

Cevap : B) Google

Açıklama : Google, Python’u resmi programlama dillerinden biri olarak kabul eden ve geniş ölçüde kullanan firmalardan biridir. Google, Python’u çeşitli projelerinde ve ürünlerinde yoğun bir şekilde kullanmaktadır. Python’un sadeliği ve çok yönlülüğü, Google’ın bu dili benimsemesinde önemli bir rol oynamıştır. Bu nedenle, Python’un resmi olarak kabul edildiği firmalardan biri Google’dır.

10. Algoritma kavramı ile ilgili aşağıda verilen ifadelerden hangisi doğrudur?

A) Matematiksel işlemleri tanımlayan harfler ve sayılar topluluğudur.
B) Girdi olarak bir değer alan ve girdiye bağlı olarak çıktı değeri üreten bir hesaplama prosedürüdür.
C) Makine yapma bilimi, insanlar tarafından yapıldığında zekâ gerektiren görevleri yerine getirir.
D) Matematiksel işlemler için kullanılan bir hesaplama tekniğidir.
E) Makine öğrenimi tekniklerini kullanır. Burada program,

Cevap: B) Girdi olarak bir değer alan ve girdiye bağlı olarak çıktı değeri üreten bir hesaplama prosedürüdür.

Açıklama : Algoritma, belirli bir problemi çözmek veya belirli bir görevi yerine getirmek için tanımlanmış adım adım talimatlar dizisidir. Bu talimatlar, girdileri alır ve bu girdilere dayalı olarak belirli bir çıktıyı üretir. Algoritmalar, bilgisayar biliminin temel kavramlarından biridir ve çeşitli programlama ve problem çözme senaryolarında kullanılır.

Yukarıda verilen “tesla” adlı liste veri yapısını “info” adlı veri çerçevesine dönüştürmek için “?” yerine yazılması gereken kod aşağıdakilerden hangisidir?

A) info=pd.DataFrame(tesla)
B) info=DataFrame(tesla)
C) info=Datalist(tesla)
D) info=pd.listFrame(tesla)
E) info=list_DataFrame(tesla)

Cevap : A) info=pd.DataFrame(tesla)

Açıklama : Pandas kütüphanesinde bir listeyi veri çerçevesine dönüştürmek için pd.DataFrame() fonksiyonu kullanılır. Bu fonksiyon, listeyi bir veri çerçevesi (DataFrame) nesnesine dönüştürür. Doğru kod aşağıdaki gibidir:

Veri Bilimi 2024 Soru 11

12. Aşağıda Python dilinde oluşturulan ve adı “data” olan veri çerçevesi verilmiştir.

Bu veri çerçevesinde kalın çizgilerle çevrelenmiş kayıtları görüntüleyen kod aşağıdakilerden hangisidir?

A) data.iloc[:,0:5]
B) data.iloc[:,1:3]
C) data.iloc[:,0:3]
D) data.iloc[:,0:2]
E) data.iloc[:,1:2]

Cevap : D) data.iloc[:,0:2]

Açıklama : Kalın çizgilerle çevrelenmiş kayıtlar “country” ve “continent” sütunlarını içerir. data.iloc[:,0:2] kodu, veri çerçevesindeki 0. sütundan (country) başlayarak 2. sütuna (continent) kadar olan sütunları seçer.

Veri Bilimi 2024 Soru 12 Çözüm

Bu kod, belirtilen sütunları görüntüleyecektir.

13. Python’da oluşturulan ogr=[“Ahmet”, “Işıl”, “Mehmet”, “Ayşe”, “Kazım”, “Zehra”, “Turgay”] adlı listeye; “Zarife” adlı öğrenciyi ekleyecek söz dizimi (komut satırı) hangi seçenekte doğru olarak verilmiştir?

Veri Bilimi 2024 13.soru

A) ogr.append[“Zarife”]
B) ogr.add(“Zarife”)
C) ogr.append(“Zarife”)
D) ogr.add[“Zarife”]
E) ogr.append(Zarife)

Cevap : C) ogr.append(“Zarife”)

Açıklama : Python’da bir listeye yeni bir eleman eklemek için append() metodu kullanılır. Bu metot, listeye eleman eklemek için en yaygın kullanılan yöntemdir ve doğru şekilde kullanımı parantez içinde eklenen elemanla birlikte olmalıdır.

Veri bilimi 2024 Soru 13-1

Bu kod çalıştırıldığında, “Zarife” adlı öğrenci listeye eklenecektir ve çıktı şu şekilde olacaktır:

Veri bilimi 2024 Soru 13-2

14. Yukarıda verilen görseli en doğru şekilde tanımlayan seçenek aşağıdakilerden hangisidir?

A) Keşifsel veri analizini temsil eder.
B) Makine öğrenimini temsil eder.
C) Python programlama sürecini tanımlar.
D) Algoritmanın çalışmasını açıklar.
E) Grafik çizim sürecini temsil eder.

Cevap : B) Makine öğrenimini temsil eder.

Açıklama : Görsel, makine öğrenimi sürecinin adımlarını temsil etmektedir. Bu adımlar genellikle veri toplama, veriyi işleme (eğitim aşaması), model oluşturma ve sonuçları tahmin etme şeklinde ilerler. Görselde bu aşamalar açıkça gösterilmektedir: “Veri”, “Eğitim Aşaması”, “Model Kurma” ve “Çıkışın Tahmini”.

Bu nedenle, görsel makine öğrenimini en doğru şekilde temsil etmektedir.

15. Gruplandırılmış bir verinin dağılımının en iyi temsilini ve her bir veri değerinin sıklığını gösteren grafik türü aşağıdakilerden hangisidir?

A) Çubuk grafiği
B) Pasta dilimi grafiği
C) Bar grafiği
D) Histogram grafiği
E) Scatter grafiği

Cevap : D) Histogram grafiği

Açıklama : Histogram grafiği, verinin gruplandırılmış dağılımını ve her bir grup için veri değerlerinin sıklığını gösteren bir grafik türüdür. Histogramlar, sürekli veri dağılımlarını görselleştirmek için kullanılır ve veri değerlerinin belirli aralıklarda (binler) nasıl dağıldığını gösterir. Bu grafikte, x ekseni veri aralıklarını, y ekseni ise bu aralıklardaki veri değerlerinin sıklığını temsil eder.Bu nedenle, gruplandırılmış bir verinin dağılımını ve sıklığını en iyi şekilde temsil eden grafik türü histogram grafiğidir.

16. Aşağıdaki ifadelerden hangisi en küçük kareler yönteminin amacını en iyi şekilde açıklamaktadır?

A) Ölçüm sonucu elde edilmiş veri noktalar arasındaki mesafeyi en aza indirmeyi sağlar.
B) Hata kalıntıların toplamının en küçük değerini bize sağlayan kesişim ve eğimin (en iyi) değerlerini bulur.
C) Ölçüm sonucu bulunan noktalardan geçecek doğrunun sadece eğimini bulmayı sağlar.
D) Ölçüm sonucu bulunan noktalara mümkün olduğunca en uzak geçecek bir çizgi bulmayı sağlar.
E) Ölçüm sonucu elde edilmiş veri noktalarına mümkün olduğu kadar yakın geçecek bir fonksiyon eğrisi bulmaya yarar.

Cevap : E) Ölçüm sonucu elde edilmiş veri noktalarına mümkün olduğu kadar yakın geçecek bir fonksiyon eğrisi bulmaya yarar.

Açıklama : ?

17.

Python’da K-means kütüphanesini çağırmak için çalışma sayfasına yazılması gereken kod aşağıdakilerden hangisidir?

A) from pandas.cluster import K-Means
B) from sklearn.cluster import K-cluster
C) from numpy.cluster import K-Means
D) from mutplolib.cluster import K-Means
E) from sklearn.cluster import K-Means

Cevap : E) from sklearn.cluster import K-Means

Açıklama : Python’da K-means kümeleme algoritmasını kullanmak için scikit-learn (sklearn) kütüphanesinden KMeans sınıfı import edilir. Doğru import ifadesi şu şekildedir:

Soru 17

Bu kod, sklearn kütüphanesinin cluster modülünden KMeans sınıfını çağırır ve K-means algoritmasını kullanmanıza olanak tanır.

18.

dizi= np.array([[1,2,3,4,5], [6,7,8,9,10]]) print(?)

Soru 18

Yukarıda verilen “dizi” adlı dizideki “8” sayısını ekrana yazdırmak için “print()” fonksiyonu içerisine yazılması gereken kodun söz dizimi aşağıdakilerden hangisidir?

A) print(dizi[7,2])
B) print(dizi[2,3])
C) print(dizi[1,2])
D) print(dizi[3,3])
E) print(dizi[3,0])

Cevap : C) print(dizi[1,2])

Açıklama : NumPy dizilerinde elemanlara erişim için köşeli parantezler kullanılır ve indeksler sıfırdan başlar. Verilen dizi iki boyutlu bir dizidir ve 8 sayısı ikinci satır ve üçüncü sütundadır. Bu nedenle, dizi[1,2] ifadesi doğru elemanı döndürecektir.

Cevap 18

Bu kod çalıştırıldığında, çıktı olarak 8 sayısı ekrana yazdırılacaktır.

19. Lojistik regresyon yöntemi aşağıdakilerden hangisini bulmak için kullanılır?

A) Sürekli tahmin edici değişkenler arasındaki doğrusal ilişki
B) Sürekli tahmin edici değişkenler ile sonuç değişkeninin logiti arasındaki doğrusal ilişki
C) Gözlemler arasındaki zıt ilişki
D) Gözlemler arasındaki doğrusal ilişki
E) Sürekli tahminî değişkenler ile sonuç değişkeni arasındaki doğrusal ilişki

Cevap : B) Sürekli tahmin edici değişkenler ile sonuç değişkeninin logiti arasındaki doğrusal ilişki

Lojistik regresyon, bağımlı değişkenin kategorik olduğu (örneğin, 0 veya 1 gibi ikili sonuçlar) durumlarda kullanılan bir regresyon analizidir. Bu yöntem, sürekli tahmin edici değişkenlerin (bağımsız değişkenler) sonuç değişkeninin logit (log odds) dönüşümü ile olan doğrusal ilişkisini bulmak için kullanılır.

Logit dönüşümü, bir olasılığı 0 ile 1 arasında sınırlamaya ve doğrusal bir modelle ilişkilendirmeye yarar. Lojistik regresyon modelinde, bağımsız değişkenlerin etkisi logit fonksiyonu aracılığıyla hesaplanır:

Soru 19 Cevap
Burada p, bağımlı değişkenin 1 olma olasılığıdır. Bu denkleme göre, bağımsız değişkenlerin katsayıları (β değerleri), logit dönüşümü üzerinden bağımlı değişkene olan etkisini açıklar. Bu nedenle, lojistik regresyon, sürekli tahmin edici değişkenler ile sonuç değişkeninin logiti arasındaki doğrusal ilişkiyi belirlemek için kullanılır.

20. Yukarıda verilen Python programının çıktısı aşağıdakilerden hangisidir?

A) {elma, muz, çilek, portakal}
B) {elma, çilek, portakal}
C) {elma, muz, çilek}
D) {çilek, portakal}
E) {elma, muz, portakal}

Cevap : A) {elma, muz, çilek, portakal}

Açıklama : Set veri yapısına add() metodu ile “portakal” eklenir. Set, sıralanmamış bir koleksiyon olduğundan, elemanlar sırasız olarak yazdırılır.

@lolonolo_com

Auzef Yönetim Bilişim Sistemleri Lisans Telegram-min

Auzef Yönetim Bilişim Sistemi Lisans 2.sınıf bahar dönemi sınav soruları

Veri Bilimi ve Python: Temel Kavramlardan Makine Öğrenimine

Veri Bilimi İçin Temel Kavramlar

Python Programlamasına Giriş

Python’a Özgü Veri Yapıları

Python’da Kontrol Yapıları

Python İçin Veri Analizi Araçları

İstatistiksel Analiz

Makine Öğrenimi: Denetimli ve Denetimsiz Öğrenme

Regresyon, Sınıflandırma ve Kümeleme

Veri Bilimi: Teorik Temeller ve Uygulama Alanları

Giriş

Teorik Temeller

İstatistik ve Matematik

Bilgisayar Bilimi

Kullanılan Yöntemler

Makine Öğrenimi

Büyük Veri Teknolojileri

Uygulama Alanları

İş Zekası ve Karar Destek Sistemleri

Sağlık ve Tıp

Finans

Perakende ve Pazarlama

Sonuç

Veri Bilimi

Veri Bilimi 2023-2024 Final Sınav Soruları

1. Yukarıda verilen Python kodunun ekran çıktısının sonucu aşağıdakilerden hangisidir?

2. Yukarıdaki Python kodunun vereceği sonuç aşağıdakilerden hangisidir?

3. Yukarıda verilen denklem K-means kümeleme algoritmasında ne amaçla kullanılır?

4. Bir arabanın satış fiyatı (1.000 $) ile yaşı (yıl olarak) arasındaki ilişki, belirli bir modeldeki rastgele araba örneklerinden tahmin edilerek aşağıdaki ilişki formülü elde edilmiştir.

satışücreti=24.2-(1.182)yıl

Bu denklemden aşağıdaki ifadelerden hangisi çıkarılabilir?

5. Bilgisayarın “C” ana dizinin altında yer alan “VERI” adlı dizinden “iller” adlı ve “csv” uzantılı dosyayı okumak için yazılması gereken Python komut satırı aşağıdakilerden hangisidir?

6. Python kütüphanesi ile oluşturulan yukarıdaki grafikte, grafik kenarlarının farklı renkte olmasını sağlayan parametre/argüman aşağıdakilerden hangisidir?

7. Lojistik regrasyon modeli tahmin işleminde aşağıdaki yaklaşımlardan hangisini kullanır?

1. plt.legend() 2. x = np.linspace(1, 10, 20) 3. plt.show() 4. plt.xlabel(‘X-Etiket’) 5. plt.plot(x, label=’Örnek Çizim’)

Yukarıda numaralandırılmış kodlar ile çizim oluşturmak ve görüntülemek için verilen komutlar hangi sırayla çalıştırılmalıdır?

9. Aşağıdaki bilişim firmalarından hangisi Python dilini resmî programlama dili olarak kabul etmiştir?

10. Algoritma kavramı ile ilgili aşağıda verilen ifadelerden hangisi doğrudur?

Yukarıda verilen “tesla” adlı liste veri yapısını “info” adlı veri çerçevesine dönüştürmek için “?” yerine yazılması gereken kod aşağıdakilerden hangisidir?

12. Aşağıda Python dilinde oluşturulan ve adı “data” olan veri çerçevesi verilmiştir.

Bu veri çerçevesinde kalın çizgilerle çevrelenmiş kayıtları görüntüleyen kod aşağıdakilerden hangisidir?

13. Python’da oluşturulan ogr=[“Ahmet”, “Işıl”, “Mehmet”, “Ayşe”, “Kazım”, “Zehra”, “Turgay”] adlı listeye; “Zarife” adlı öğrenciyi ekleyecek söz dizimi (komut satırı) hangi seçenekte doğru olarak verilmiştir?

14. Yukarıda verilen görseli en doğru şekilde tanımlayan seçenek aşağıdakilerden hangisidir?

16. Aşağıdaki ifadelerden hangisi en küçük kareler yönteminin amacını en iyi şekilde açıklamaktadır?

Python’da K-means kütüphanesini çağırmak için çalışma sayfasına yazılması gereken kod aşağıdakilerden hangisidir?

Yukarıda verilen “dizi” adlı dizideki “8” sayısını ekrana yazdırmak için “print()” fonksiyonu içerisine yazılması gereken kodun söz dizimi aşağıdakilerden hangisidir?

19. Lojistik regresyon yöntemi aşağıdakilerden hangisini bulmak için kullanılır?

20. Yukarıda verilen Python programının çıktısı aşağıdakilerden hangisidir?

Bunu paylaş:

Bunu beğen:

1. plt.legend()
2. x = np.linspace(1, 10, 20)
3. plt.show()
4. plt.xlabel(‘X-Etiket’)
5. plt.plot(x, label=’Örnek Çizim’)