LOLONOLO Ana Sayfa » blog » auzef » Büyük Veri 2024-2025 Final Soruları
auzefBüyük VeriYönetim Bilişim Sistemleri

Büyük Veri 2024-2025 Final Soruları

Büyük Veri 2024-2025 Final Soruları

 
LOLONOLO Ana Sayfa » blog » auzef » Büyük Veri 2024-2025 Final Soruları

#1. …….. büyük veri analizlerini iletmek, anlamak ve geliştirmek için resimler, diyagramlar ya da animasyonlar oluşturmak için kullanan bir tekniktir.

Yukarıdaki cümlede verilen boşluğa aşağıdakilerden hangisi gelmelidir?

Cevap: E) Büyük veri görselleştirme | Açıklama: Cümlede tanımı yapılan kavram, karmaşık veri setlerini ve analiz sonuçlarını daha anlaşılır hale getirmek için görsel öğeler (grafikler, haritalar, diyagramlar) kullanan “büyük veri görselleştirme” tekniğidir.

#2. Aşağıdakilerden hangisi bilgi güvenliğinin ana unsurlardan biri değildir?

Cevap: B) Sürdürülebilirlik | Açıklama: Bilgi güvenliğinin üç temel ana unsuru “CIA Üçlüsü” olarak bilinen Gizlilik (Confidentiality), Bütünlük (Integrity) ve Erişilebilirliktir (Availability). Güvenirlilik genellikle bütünlük ve erişilebilirlik ile ilişkilidir. Sürdürülebilirlik ise bilgi güvenliğinin doğrudan bir ana unsuru değildir.

#3. Karıştırma ve permütasyon olarak da bilinir, veri kümesi öznitelik değerlerini orijinal kayıtlara karşılık gelmeyecek şekilde yeniden düzenlemek maksadıyla kullanılan bir tekniktir.

Yukarıda açıklanan veriyi anonimleştirme tekniği aşağıdakilerden hangisidir?

Cevap: B) Veri Değiştirme | Açıklama: Tanımı yapılan teknik, veri setindeki değerleri kendi içinde karıştırarak (örneğin, bir sütundaki maaş bilgilerini rastgele yer değiştirerek) kişisel bilgileri korumayı amaçlayan “Veri Değiştirme” (Data Swapping/Shuffling) yöntemidir.

#4. Aşağıdakilerden hangisi PySpark için doğru bir tanımlamadır?

Cevap: A) Python ile Spark iş birliği sonucu ortaya çıkmış olup Python kütüphanesinin ismidir. | Açıklama: PySpark, Apache Spark’ın gücünü popüler programlama dili olan Python ile birleştiren bir API ve kütüphanedir. Bu sayede Python geliştiricileri dağıtık veri işleme görevlerini kolayca yapabilirler.

#5. Aşağıdakilerden hangisi işletmelerin büyük veri kaynaklarından biri değildir?

Cevap: A) Personel | Açıklama: Müşteriler (işlem verileri), dokümanlar (yapılandırılmamış veri), web/mobil uygulamalar (loglar) ve ürünler (IoT sensör verileri) doğrudan büyük veri kaynaklarıdır. Personel ise bu verileri üreten veya kullanan bir aktördür, diğerleri gibi birincil bir kaynak olarak kabul edilmez.

Öğrenme Yönetim Sistemi Öğrenci Dostu LOLONOLO bol bol deneme sınavı yapmayı önerir.

#6. I. Klinik referanslar
II. Genomik veriler
III. Statik veriler
IV. Yayınlar

Sağlık hizmetlerinde birçok kaynaktan çok sayıda veri üretilmektedir. Yukarıda verilenlerden hangileri sağlık hizmetlerindeki büyük veri kaynaklarındandır?

Cevap: B) I, II ve IV | Açıklama: Sağlık hizmetlerinde klinik referanslar (hasta kayıtları), genomik veriler (DNA dizilimi) ve bilimsel yayınlar önemli büyük veri kaynaklarıdır. “Statik veriler” ise bir kaynak türü değil, verinin değişme sıklığını belirten genel bir sıfattır.

#7. Aşağıdakilerden hangisi Kişisel Verileri Koruma Kurulu’nun görev ve yetkilerinden değildir?

Cevap: E) Anonimleşen verilerden kimlik bilgilerinin belirlenmesini sağlamak | Açıklama: Kişisel Verileri Koruma Kurulu’nun (KVKK) amacı kişisel verileri ve mahremiyeti korumaktır. Anonimleştirilmiş verilerden kimlik bilgilerini belirlemeye çalışmak (de-anonimleştirme), bu amacın tam tersidir ve kurulun görevleri arasında yer almaz.

#8. Aşağıdakilerden hangisi Apache Spark mimarisinde yer alan bir bileşendir?

Cevap: C) Session runner (Oturum yürütücü) | Açıklama:

#9. Nicel ve nitel analiz yöntemleri arasındaki temel fark aşağıdakilerden hangisidir?

Cevap: E) Nicel analiz sayısal verilerle, nitel analiz soyut verilerle yapılan analizdir. | Açıklama: En temel fark, analiz edilen verinin doğasıdır. Nicel (Quantitative) analiz, ölçülebilir, sayısal ve istatistiksel verilere odaklanırken; Nitel (Qualitative) analiz, metinler, görüşmeler, gözlemler gibi sayısal olmayan, yoruma dayalı ve soyut verilerle ilgilenir.

#10. Sağlık hizmetleri verileri, kamuya açık hale getirilmemesi için yetkisiz erişime karşı güvence altına alınması gereken son derece hassas verilerdir ve ayrıca sağlık hizmeti sahtekarlığı da saldırganlardan önlenebilir. Bu nedenle, …….. sağlık alanındaki en önemli ve zorlu görevlerden biridir.
Yukarıdaki cümlede verilen boşluğa aşağıdaki cümlelerden hangisi gelmelidir?

Cevap: C) Veri güvenliği | Açıklama: Paragrafta verilerin hassasiyetinden, yetkisiz erişime karşı korunması gerektiğinden ve sahtekarlığın önlenmesinden bahsedilmesi, doğrudan “veri güvenliği” konusunun sağlık alanındaki önemini ve zorluğunu vurgulamaktadır.

Öğrenme Yönetim Sistemi Öğrenci Dostu LOLONOLO bol bol deneme sınavı yapmayı önerir.

#11. Herkesin özgürce ve yeniden kullanabileceği ve yeniden dağıtılabilen, yalnızca nitelik ve paylaşım gereksinimine tabi olan veridir.

Tanımı verilen veri çeşidi aşağıdakilerden hangisidir?

Cevap: D) Açık veri | Açıklama: Bu tanım, herhangi bir telif hakkı, patent veya diğer kontrol mekanizmalarına tabi olmayan, herkesin serbestçe erişebileceği, kullanabileceği ve paylaşabileceği “Açık Veri” (Open Data) kavramını açıklamaktadır.

#12. Aşağıdakilerden hangisi Apache Spark ile bir büyük veri analizi süreci için hatalı bir bilgi içermektedir?

Cevap: A) SparkContext komutu ile projenin içindeki değişkenlerin içeriği görüntülenir. | Açıklama: 

#13. Aşağıdakilerden hangisi Konvolüsyonel Sinir Ağları (CNN) için kesinlikle yanlış bir ifadedir?

Cevap: D) Geri beslemeli bir yapay sinir ağıdır. | Açıklama: Konvolüsyonel Sinir Ağları (CNN), verinin ağ içinde tek bir yönde (girdiden çıktıya doğru) aktığı “ileri beslemeli” (feedforward) ağlardır. “Geri beslemeli” (recurrent) yapı, ağdaki nöronların kendi çıktılarını tekrar girdi olarak alabildiği ve özellikle sıralı veriler için kullanılan (RNN gibi) farklı bir mimaridir.

#14. Aşağıdakilerden hangisi yapay zekânın veriden elde ettiği amaçlardan biri değildir?

Cevap: D) Bölütleme | Açıklama: 

#15. Aşağıdakilerden hangisi mahremiyet yaklaşımlarında ele alınan boyutlardan biridir?

Cevap: E) Bilgi mahremiyeti | Açıklama: Mahremiyet (privacy) yaklaşımları farklı boyutlarda incelenir. “Bilgi mahremiyeti” (Information Privacy), kişisel verilerin toplanması, işlenmesi, saklanması ve paylaşılmasıyla ilgili kuralları ve bireyin kendi verileri üzerindeki kontrol hakkını ifade eden temel bir boyuttur.

Öğrenme Yönetim Sistemi Öğrenci Dostu LOLONOLO bol bol deneme sınavı yapmayı önerir.

#16. Dolandırıcılıktan teröre kadar değişen güvenlik sorunlarını çözmek için büyük veri analitiği yöntemlerini kullanarak çözümler üretmektedir. Sistemlerini CIA destekleriyle geliştirmiş ve ABD hükümeti ve güvenlik kurumları tarafından yaygın bir şekilde kullanılmaktadır.

Yukarıda verilen bilgiler hangi kurumun büyük veri uygulaması sayesinde gerçekleştirilmiştir?

Cevap: A) Palantir Technologies | Açıklama: Verilen bilgiler, özellikle CIA tarafından desteklenmesi ve güvenlik, istihbarat alanlarında büyük veri analitiği çözümleri sunmasıyla bilinen “Palantir Technologies” şirketini tanımlamaktadır.

#17. Aşağıdakilerden hangisi veri gelişimi sırasında kullanılan isimlerden biri değildir?

Cevap: B) Gri Veri | Açıklama: Veri -> Büyük Veri -> Akıllı (Smart) Veri şeklinde bir gelişim süreci tanımlanabilir. Kapsamlı veri de bu bağlamda kullanılabilir. Ancak “Gri Veri”, veri gelişimi veya türleri için standart olarak kabul edilen bir terim değildir.

#18. Python ortamında kullanılan “map” komutu aşağıdaki hangi işlemi gerçekleştirmek için kullanılır?

Cevap: D) Tüm özellikleri haritalamak, yeni özellik ekleme, çıkarma, revize etmek için | Açıklama: `map` fonksiyonu, bir veri koleksiyonundaki (liste gibi) her bir öğeye belirli bir işlemi uygulamak için kullanılır. Bu, veri setindeki tüm özelliklere bir dönüşüm uygulamak (haritalamak), yeni özellikler türetmek veya mevcut olanları revize etmek için güçlü bir araçtır.

#19. Aşağıdakilerden hangisi bulut bilişimin veri etkileşiminde olduğu bir bileşen değildir?

Cevap: C) Anlamlılık | Açıklama: Dayanıklılık, süreklilik, erişim ve gizlilik, bulut bilişim hizmetlerinin temel özelliklerindendir. Anlamlılık ise verinin kendisinin bir kalite özelliğidir, bulut bilişimin bir bileşeni veya hizmet özelliği değildir.

#20. “Semantik web sayesinde makinelerin etkileşiminin yanında …….. etkileşiminin de üst seviyeye ulaşması beklenmektedir.”
Yukarıdaki cümlede verilen boşluğa aşağıdakilerden hangisi gelmelidir?

Cevap: C) Makine İnsan | Açıklama: Semantik Web (Web 3.0), verilerin makineler tarafından anlaşılabildiği ve işlenebildiği bir web vizyonudur. Bu sayede sadece makinelerin kendi aralarındaki (makine-makine) etkileşimi değil, aynı zamanda makinelerin insanlara daha akıllı ve bağlama duyarlı hizmetler sunmasıyla “makine-insan” etkileşimi de üst seviyeye çıkar.

Öğrenme Yönetim Sistemi Öğrenci Dostu LOLONOLO bol bol deneme sınavı yapmayı önerir.

Öncesi
TESTi BiTiR, PUANINI GÖR

SONUÇ

Büyük Veri 2024-2025 Final Soruları

Büyük Veri 2024-2025 Final Soruları

Büyük Veri 2024-2025 Final Soruları

Büyük Veri: Temel Kavramlar, Uygulamalar ve Güvenlik

Giriş

Bu makalede, büyük veri alanındaki temel kavramlar, analiz yöntemleri, güvenlik sorunları ve uygulama örnekleri ele alınacaktır. 2024-2025 final sınavı soruları temel alınarak hazırlanan bu içerik, büyük verinin çeşitli yönlerini kapsamaktadır.

Büyük Veri Görselleştirme

Büyük veri görselleştirme, büyük veri analizlerini iletmek, anlamak ve geliştirmek için resimler, diyagramlar ya da animasyonlar oluşturmak için kullanılan bir tekniktir.

Büyük Veri ve Veri Güvenliği

Veri güvenliği, özellikle hassas sağlık verileri gibi büyük veri kümelerinde yetkisiz erişimi engellemek ve sahtekarlığı önlemek için en önemli ve zorlu görevlerden biridir.

Büyük Veri Uygulamaları – Palantir Technologies

Dolandırıcılıktan teröre kadar değişen güvenlik sorunlarını çözmek için büyük veri analitiğini kullanan ve CIA destekli sistemler geliştiren önemli bir kuruluş Palantir Technologies’dir.

Semantik Web ve Makine-İnsan Etkileşimi

Semantik web sayesinde makinelerin etkileşiminin yanında makine insan etkileşiminin de üst seviyeye ulaşması beklenmektedir.

Mahremiyet Yaklaşımları – Bilgi Mahremiyeti

Mahremiyet yaklaşımlarında ele alınan boyutlardan biri bilgi mahremiyetidir.

Nicel ve Nitel Analiz Yöntemleri

Nicel ve nitel analiz yöntemleri arasındaki temel fark, nicel analizin sayısal verilerle, nitel analizin ise soyut verilerle yapılan analiz olmasıdır.

Apache Spark ile Büyük Veri Analizi Süreci

Apache Spark ile büyük veri analizi sürecinde Init() komutu kütüphaneleri çalıştırır hale getirir, pip install ile yeni kütüphaneler yüklenir, import ile kütüphaneler projeye dahil edilir ve SparkSession.builder ile yerel bilgisayarda çok çekirdekli bir uygulama başlatılabilir. SparkContext komutu ile değişken içeriği görüntülenmez.

Yapay Zekanın Veriden Elde Ettiği Amaçlar

Yapay zekanın veriden elde ettiği amaçlardan biri bölütleme değildir. Diğer amaçlar arasında tahminde bulunma, kümeleme, sınıflandırma ve optimizasyon yer alır.

Kişisel Verileri Koruma Kurulu (KVKK) Görev ve Yetkileri

Kişisel Verileri Koruma Kurulu’nun görev ve yetkilerinden biri anonimleşen verilerden kimlik bilgilerinin belirlenmesini sağlamak değildir. Kurulun görevi veri sorumluları sicilini tutmak, özel nitelikli kişisel verilerin işlenmesi için önlemleri belirlemek ve veri güvenliğine ilişkin düzenlemeler yapmaktır.

Bilgi Güvenliğinin Ana Unsurları (CIA)

Bilgi güvenliğinin ana unsurları arasında erişilebilirlik, gizlilik ve bütünlük yer alır. Sürdürülebilirlik doğrudan bir ana unsur değildir.

Apache Spark Mimarisi

Apache Spark mimarisinde Cluster manager (Küme yönetimi) ve Session runner (Oturum yürütücü) gibi bileşenler yer alır.

Bulut Bilişim ve Veri Etkileşimi

Bulut bilişimin veri etkileşiminde olduğu bileşenlerden biri anlamlılık değildir. Diğerleri arasında dayanıklılık, süreklilik, erişim ve gizlilik bulunur.

İşletmelerin Büyük Veri Kaynakları

İşletmelerin büyük veri kaynaklarından biri personel değildir. Diğer kaynaklar arasında müşteri, doküman, web ve mobil uygulamalar ile ürün yer alır.

PySpark Tanımı

PySpark, Python ile Spark iş birliği sonucu ortaya çıkmış olup Python kütüphanesinin ismidir.

Sağlık Hizmetlerinde Büyük Veri Kaynakları

Sağlık hizmetlerindeki büyük veri kaynakları arasında klinik referanslar, genomik veriler ve yayınlar yer alır. Statik veriler bir kaynak türü değildir.

Veri Anonimleştirme Teknikleri – Veri Değiştirme

Veri kümesi öznitelik değerlerini orijinal kayıtlara karşılık gelmeyecek şekilde yeniden düzenlemek için kullanılan anonimleştirme tekniği Veri Değiştirmedir.

Python’da “map” Komutunun Kullanımı

Python ortamında kullanılan “map” komutu, tüm özellikleri haritalamak, yeni özellik ekleme, çıkarma, revize etmek için kullanılır.

Veri Gelişimi Sırasında Kullanılan İsimler

Veri gelişimi sırasında kullanılan isimlerden biri Gri Veri değildir. Diğerleri arasında Veri, Büyük Veri ve Akıllı Veri yer alır.

Açık Veri Tanımı

Herkesin özgürce kullanabileceği ve yeniden dağıtabileceği veri çeşidi Açık Veridir.

Konvolüsyonel Sinir Ağları (CNN) Özellikleri

Konvolüsyonel Sinir Ağları (CNN) ileri beslemeli bir yapay sinir ağıdır, geri beslemeli değildir.

Sonuç

Büyük veri, günümüz dünyasında karar alma süreçlerinden bilimsel araştırmalara kadar pek çok alanda devrim yaratmaktadır. Bu makalede ele alınan temel kavramlar, büyük verinin potansiyelini anlamak ve etik ilkeler çerçevesinde kullanmak için önemli bir başlangıç noktası sunmaktadır.

@lolonolo_com

Büyük Veri 2024-2025 Final Soruları

Büyük Veri 2024-2025 Final Soruları (1-11)

1- …….. büyük veri analizlerini iletmek, anlamak ve geliştirmek için resimler, diyagramlar ya da animasyonlar oluşturmak için kullanan bir tekniktir.

Yukarıdaki cümlede verilen boşluğa aşağıdakilerden hangisi gelmelidir?

A) Zaman serisi analizi
B) Optimizasyon
C) Doğal dil işleme
D) Sinyal işleme
E) Büyük veri görselleştirme

Cevap : E) Büyük veri görselleştirme

Açıklama : Cümlede tanımı yapılan kavram, karmaşık veri setlerini ve analiz sonuçlarını daha anlaşılır hale getirmek için görsel öğeler (grafikler, haritalar, diyagramlar) kullanan “büyük veri görselleştirme” tekniğidir.

2- Sağlık hizmetleri verileri, kamuya açık hale getirilmemesi için yetkisiz erişime karşı güvence altına alınması gereken son derece hassas verilerdir ve ayrıca sağlık hizmeti sahtekarlığı da saldırganlardan önlenebilir. Bu nedenle, …….. sağlık alanındaki en önemli ve zorlu görevlerden biridir.
Yukarıdaki cümlede verilen boşluğa aşağıdaki cümlelerden hangisi gelmelidir?

A) Verinin hacmi
B) Verinin toplanması
C) Veri güvenliği
D) Verinin hızı
E) Verinin ekonomik değeri

Cevap : C) Veri güvenliği

Açıklama : Paragrafta verilerin hassasiyetinden, yetkisiz erişime karşı korunması gerektiğinden ve sahtekarlığın önlenmesinden bahsedilmesi, doğrudan “veri güvenliği” konusunun sağlık alanındaki önemini ve zorluğunu vurgulamaktadır.

3- Dolandırıcılıktan teröre kadar değişen güvenlik sorunlarını çözmek için büyük veri analitiği yöntemlerini kullanarak çözümler üretmektedir. Sistemlerini CIA destekleriyle geliştirmiş ve ABD hükümeti ve güvenlik kurumları tarafından yaygın bir şekilde kullanılmaktadır.

Yukarıda verilen bilgiler hangi kurumun büyük veri uygulaması sayesinde gerçekleştirilmiştir?

A) Palantir Technologies
B) Amerikan Kroger Şirketi
C) Commonbond Platformu
D) CERN Büyük Hadron Çarpıştırıcısı
E) Tennessee Valley Authority (Tennessee Vadisi Yönetimi)

Cevap : A) Palantir Technologies

Açıklama : Verilen bilgiler, özellikle CIA tarafından desteklenmesi ve güvenlik, istihbarat alanlarında büyük veri analitiği çözümleri sunmasıyla bilinen “Palantir Technologies” şirketini tanımlamaktadır.

4- “Semantik web sayesinde makinelerin etkileşiminin yanında …….. etkileşiminin de üst seviyeye ulaşması beklenmektedir.”

Yukarıdaki cümlede verilen boşluğa aşağıdakilerden hangisi gelmelidir?

A) İnsan – İnsan
B) Web Makine
C) Makine İnsan
D) Makine Makine
E) Web – İnsan

Cevap : C) Makine İnsan

Açıklama : Semantik Web (Web 3.0), verilerin makineler tarafından anlaşılabildiği ve işlenebildiği bir web vizyonudur. Bu sayede sadece makinelerin kendi aralarındaki (makine-makine) etkileşimi değil, aynı zamanda makinelerin insanlara daha akıllı ve bağlama duyarlı hizmetler sunmasıyla “makine-insan” etkileşimi de üst seviyeye çıkar.

5- Aşağıdakilerden hangisi mahremiyet yaklaşımlarında ele alınan boyutlardan biridir?

A) Erişebilirlik mahremiyeti
B) Boyut mahremiyeti
C) Gizlilik mahremiyeti
D) Açıklık mahremiyeti
E) Bilgi mahremiyeti

Cevap : E) Bilgi mahremiyeti

Açıklama : Mahremiyet (privacy) yaklaşımları farklı boyutlarda incelenir. “Bilgi mahremiyeti” (Information Privacy), kişisel verilerin toplanması, işlenmesi, saklanması ve paylaşılmasıyla ilgili kuralları ve bireyin kendi verileri üzerindeki kontrol hakkını ifade eden temel bir boyuttur.

6- Nicel ve nitel analiz yöntemleri arasındaki temel fark aşağıdakilerden hangisidir?

A) Nitel veri küçük veri kümelerini, nicel veri büyük veri kümelerini analiz eder.
B) Betimsel istatistik nitel analizde, kavramsal istatistik nicel analizde kullanılır.
C) İki yöntem de analiz için farklı teknolojiler kullanır.
D) Nitel analiz, nicel analizden daha kesin sonuçlar üretir.
E) Nicel analiz sayısal verilerle, nitel analiz soyut verilerle yapılan analizdir.

Cevap : E) Nicel analiz sayısal verilerle, nitel analiz soyut verilerle yapılan analizdir.

Açıklama : En temel fark, analiz edilen verinin doğasıdır. Nicel (Quantitative) analiz, ölçülebilir, sayısal ve istatistiksel verilere odaklanırken; Nitel (Qualitative) analiz, metinler, görüşmeler, gözlemler gibi sayısal olmayan, yoruma dayalı ve soyut verilerle ilgilenir.

7- Aşağıdakilerden hangisi Apache Spark ile bir büyük veri analizi süreci için hatalı bir bilgi içermektedir?

A) SparkContext komutu ile projenin içindeki değişkenlerin içeriği görüntülenir.
B) Init() komutu ile yüklenen kütüphaneler çalışır hale getirilir.
C) Pip install komutu ile Python’a yeni kütüphaneler yüklenir.
D) Import komutu ile yüklü kütüphaneler projeye dâhil edilir.
E) SparkSession.builder komutu sayesinde yerel bilgisayarda çok çekirdekli bir uygulama başlatılabilir.

Cevap : A) SparkContext komutu ile projenin içindeki değişkenlerin içeriği görüntülenir.

Açıklama :

8- Aşağıdakilerden hangisi yapay zekânın veriden elde ettiği amaçlardan biri değildir?

A) Tahminde bulunma
B) Kümeleme
C) Sınıflandırma
D) Bölütleme
E) Yakımsama, optimizasyon

Cevap : D) Bölütleme

Açıklama :

9- Aşağıdakilerden hangisi Kişisel Verileri Koruma Kurulu’nun görev ve yetkilerinden değildir?

A) Veri sorumluları sicilinin tutulmasını sağlamak
B) Özel nitelikli kişisel verilerin işlenmesi için aranan yeterli önlemleri belirlemek
C) Veri sorumlusunun ve temsilcisinin görev, yetki ve sorumluluklarına ilişkin düzenleyici işlem yapmak
D) Veri güvenliğine ilişkin yükümlülükleri belirlemek amacıyla düzenleyici işlem yapmak
E) Anonimleşen verilerden kimlik bilgilerinin belirlenmesini sağlamak

Cevap : E) Anonimleşen verilerden kimlik bilgilerinin belirlenmesini sağlamak

Açıklama : Kişisel Verileri Koruma Kurulu’nun (KVKK) amacı kişisel verileri ve mahremiyeti korumaktır. Anonimleştirilmiş verilerden kimlik bilgilerini belirlemeye çalışmak (de-anonimleştirme), bu amacın tam tersidir ve kurulun görevleri arasında yer almaz.

10- Aşağıdakilerden hangisi bilgi güvenliğinin ana unsurlardan biri değildir?

A) Erişilebilirlik
B) Sürdürülebilirlik
C) Gizlilik
D) Güvenirlilik
E) Bütünlük

Cevap : B) Sürdürülebilirlik

Açıklama : Bilgi güvenliğinin üç temel ana unsuru “CIA Üçlüsü” olarak bilinen Gizlilik (Confidentiality), Bütünlük (Integrity) ve Erişilebilirliktir (Availability). Güvenilirlik genellikle bütünlük ve erişilebilirlik ile ilişkilidir. Sürdürülebilirlik ise bilgi güvenliğinin doğrudan bir ana unsuru değildir.

11- Aşağıdakilerden hangisi Apache Spark mimarisinde yer alan bir bileşendir?

A) Task spliter (İşlem bölütleme)
B) Cluster manager (Küme yönetimi)
C) Session runner (Oturum yürütücü)
D) System program (Sistem programı)
E) OS session (İşletim sistemi oturumu)

Cevap : C) Session runner (Oturum yürütücü)

Açıklama :

@lolonolo_com

Büyük Veri 2024-2025 Final Soruları

Büyük Veri 2024-2025 Final Soruları (12-20)

12- Aşağıdakilerden hangisi bulut bilişimin veri etkileşiminde olduğu bir bileşen değildir?

A) Dayanıklılık
B) Süreklilik
C) Anlamlılık
D) Erişim
E) Gizlilik

Cevap : C) Anlamlılık

Açıklama : Dayanıklılık, süreklilik, erişim ve gizlilik, bulut bilişim hizmetlerinin temel özelliklerindendir. Anlamlılık ise verinin kendisinin bir kalite özelliğidir, bulut bilişimin bir bileşeni veya hizmet özelliği değildir.

13- Aşağıdakilerden hangisi işletmelerin büyük veri kaynaklarından biri değildir?

A) Personel
B) Müşteri
C) Doküman
D) Web ve mobil uygulama
E) Ürün

Cevap : A) Personel

Açıklama : Müşteriler (işlem verileri), dokümanlar (yapılandırılmamış veri), web/mobil uygulamalar (loglar) ve ürünler (IoT sensör verileri) doğrudan büyük veri kaynaklarıdır. Personel ise bu verileri üreten veya kullanan bir aktördür, diğerleri gibi birincil bir kaynak olarak kabul edilmez.

14- Aşağıdakilerden hangisi PySpark için doğru bir tanımlamadır?

A) Python ile Spark iş birliği sonucu ortaya çıkmış olup Python kütüphanesinin ismidir.
B) Apache Spark tarafından oluşturulmuş son versiyondur.
C) Gerçek zamanlı verileri işlemek amacıyla oluşturulmuş bir R dili kütüphanesidir.
D) Büyük verideki gizli örüntüleri analiz etmek için oluşturulmuş bir veri tabanı uygulamasıdır.
E) Rastgele dağıtılmış veri kümelerini işlemek için oluşturulmuş bir teknolojidir.

Cevap : A) Python ile Spark iş birliği sonucu ortaya çıkmış olup Python kütüphanesinin ismidir.

Açıklama : PySpark, Apache Spark’ın gücünü popüler programlama dili olan Python ile birleştiren bir API ve kütüphanedir. Bu sayede Python geliştiricileri dağıtık veri işleme görevlerini kolayca yapabilirler.

15- I. Klinik referanslar
II. Genomik veriler
III. Statik veriler
IV. Yayınlar

Sağlık hizmetlerinde birçok kaynaktan çok sayıda veri üretilmektedir. Yukarıda verilenlerden hangileri sağlık hizmetlerindeki büyük veri kaynaklarındandır?

A) I ve III
B) I, II ve IV
C) Il ve III
D) I ve IV
E) I, II ve III

Cevap : B) I, II ve IV

Açıklama : Sağlık hizmetlerinde klinik referanslar (hasta kayıtları), genomik veriler (DNA dizilimi) ve bilimsel yayınlar önemli büyük veri kaynaklarıdır. “Statik veriler” ise bir kaynak türü değil, verinin değişme sıklığını belirten genel bir sıfattır.

16- Karıştırma ve permütasyon olarak da bilinir, veri kümesi öznitelik değerlerini orijinal kayıtlara karşılık gelmeyecek şekilde yeniden düzenlemek maksadıyla kullanılan bir tekniktir.

Yukarıda açıklanan veriyi anonimleştirme tekniği aşağıdakilerden hangisidir?

A) Veriyi Maskeleme
B) Veri Değiştirme
C) Genelleme
D) Takma Adlandırma
E) Veri Bozulması

Cevap : B) Veri Değiştirme

Açıklama : Tanımı yapılan teknik, veri setindeki değerleri kendi içinde karıştırarak (örneğin, bir sütundaki maaş bilgilerini rastgele yer değiştirerek) kişisel bilgileri korumayı amaçlayan “Veri Değiştirme” (Data Swapping/Shuffling) yöntemidir.

17- Python ortamında kullanılan “map” komutu aşağıdaki hangi işlemi gerçekleştirmek için kullanılır?

A) Tüm harfleri sıralamak için
B) Özelliklerin frekans değerlerini büyükten küçüğe sıralamak için
C) Kelimelerin benzerliğine göre frekanslarını bulmak için
D) Tüm özellikleri haritalamak, yeni özellik ekleme, çıkarma, revize etmek için
E) Modelin tüm parametrelerini görüntülemek için

Cevap : D) Tüm özellikleri haritalamak, yeni özellik ekleme, çıkarma, revize etmek için

Açıklama : `map` fonksiyonu, bir veri koleksiyonundaki (liste gibi) her bir öğeye belirli bir işlemi uygulamak için kullanılır. Bu, veri setindeki tüm özelliklere bir dönüşüm uygulamak (haritalamak), yeni özellikler türetmek veya mevcut olanları revize etmek için güçlü bir araçtır.

18- Aşağıdakilerden hangisi veri gelişimi sırasında kullanılan isimlerden biri değildir?

A) Smart Veri
B) Gri Veri
C) Kapsamlı Veri
D) Büyük Veri
E) Veri

Cevap : B) Gri Veri

Açıklama : Veri -> Büyük Veri -> Akıllı (Smart) Veri şeklinde bir gelişim süreci tanımlanabilir. Kapsamlı veri de bu bağlamda kullanılabilir. Ancak “Gri Veri”, veri gelişimi veya türleri için standart olarak kabul edilen bir terim değildir.

19- Herkesin özgürce ve yeniden kullanabileceği ve yeniden dağıtılabilen, yalnızca nitelik ve paylaşım gereksinimine tabi olan veridir.

Tanımı verilen veri çeşidi aşağıdakilerden hangisidir?

A) Gri veri
B) Karanlık veri
C) Semantik veri
D) Açık veri
E) Büyük veri

Cevap : D) Açık veri

Açıklama : Bu tanım, herhangi bir telif hakkı, patent veya diğer kontrol mekanizmalarına tabi olmayan, herkesin serbestçe erişebileceği, kullanabileceği ve paylaşabileceği “Açık Veri” (Open Data) kavramını açıklamaktadır.

20- Aşağıdakilerden hangisi Konvolüsyonel Sinir Ağları (CNN) için kesinlikle yanlış bir ifadedir?

A) İleri beslemeli gelişmiş bir yapay sinir ağıdır.
B) Hayvan görsel korteksinden ilham almıştır.
C) Derin sinir ağlarının başında gelmektedir.
D) Geri beslemeli bir yapay sinir ağıdır.
E) Girişleri iki veya üç boyutlu görüntü olarak varsaymaktadır.

Cevap : D) Geri beslemeli bir yapay sinir ağıdır.

Açıklama : Konvolüsyonel Sinir Ağları (CNN), verinin ağ içinde tek bir yönde (girdiden çıktıya doğru) aktığı “ileri beslemeli” (feedforward) ağlardır. “Geri beslemeli” (recurrent) yapı, ağdaki nöronların kendi çıktılarını tekrar girdi olarak alabildiği ve özellikle sıralı veriler için kullanılan (RNN gibi) farklı bir mimaridir.

@lolonolo_com

Büyük Veri 2024-2025 Final Soruları​

Açık Lise Telegram Grubu AUZEF YÖNETİM BİLİŞİM SİSTEMLERİ

Büyük Veri 2024-2025 Final Soruları

BEN_BEN

Auzef, Anadolu-Aöf, Ata-Aöf, SEGEM, Açık Lise, Ales, DGS, LGS, ilokul,  Ortaokul, English, TOEFL