CyberFlow Logo CyberFlow BLOG
Soc L3 Data Hunting

Güvenlik Verisinde İstatistiksel Temeller ve Varyans Analizi ile Siber Tehditleri Anlama

✍️ Ahmet BİRKAN 📂 Soc L3 Data Hunting

Siber güvenlikte veri biliminin önemi ve istatistiksel varyans analizi ile anomali tespiti hakkında bilgi edinin.

Güvenlik Verisinde İstatistiksel Temeller ve Varyans Analizi ile Siber Tehditleri Anlama

Bu blog yazısında, siber güvenlik alanında verilerin analizi için kritik olan istatistiksel temeller ile varyans analizinin nasıl kullanıldığını keşfedeceğiz.

Giriş ve Konumlandırma

Giriş

Siber güvenlik, günümüzün dijital ortamında kritik bir rol oynamaktadır. İşletmeler, kuruluşlar ve bireyler, çeşitli siber tehditlere karşı kendilerini korumak zorundadır. Bu bağlamda, güvenlik verisinin analizi ve yorumlanması son derece önemlidir. Siber tehditleri anlamak, sadece dışardan gelen saldırılara karşı değil, aynı zamanda iç tehditlere karşı da hazırlıklı olmamızı sağlar. Bu yazıda, güvenlik verisinde istatistiksel temellerin ve varyans analizinin nasıl kullanıldığını inceleyerek, bu bilgilerin siber güvenlik analizi üzerindeki etkilerini ele alacağız.

Siber güvenlikte istatistik, olayların ve davranışların analizine yardımcı olan bir araçtır. Makine öğrenmesi algoritmalarının arka planında yatan bu bilim, normal ve anormal davranışları ayırt etmemizi sağlar. Bu nedenle, siber güvenlik uzmanları için istatistik, verilerin anlamlandırılmasında vazgeçilmez bir araç haline gelmiştir. Örneğin, olası bir saldırıyı teşhis etmek için güvenlik verisinin analizi sırasında çeşitli istatistiksel metriklerin kullanılması gerekir.

Neden Önemlidir?

Güvenlik verisi, yalnızca olayların kaydedilmesi değil, aynı zamanda bu olayların analiz edilmesi ve yorumlanmasını da içermektedir. İstatistiksel analiz, verilerin merkezini ve genel eğilimini belirlemeye olanak tanır. Bu, siber güvenlik analistlerinin, potansiyel tehditler ve anormallikler hakkında daha fazla bilgi edinmesine yardımcı olur. Özellikle, merkezî eğilim ölçüleri (ortalama, medyan, mod gibi) ve dağılım ölçüleri (varyans, standart sapma gibi) kullanılarak yapılan analizler, saldırıların tanımlanması ve etkilerinin anlaşılmasında kritik öneme sahiptir.

Bir örnek vermek gerekirse, bir organizasyona ait günlük veri trafiği analiz edildiğinde, aşırı uç değerler (outlier) tespit edilebilir. Bu tür davranışlar, olası bir saldırının veya iç tehditin habercisi olabilir. Dolayısıyla, istatistiksel teknikler kullanarak verilerin analiz edilmesi, daha proaktif bir güvenlik yaklaşımını mümkün kılmaktadır.

Siber Güvenlik, Pentest ve Savunma Açısından Bağlamlandırma

Siber güvenlik alanında, veri analizi ve varyans hesaplamaları, penetrasyon testleri (pentest) ve savunma stratejilerinin oluşturulmasında önemli bir yer tutar. Pentest süreçlerinde, güvenlik uzmanları sistemlerin güvenlik açıklarını tespit etmek için simülasyonlar gerçekleştirir. Bu simülasyonlar sırasında elde edilen verileri istatistiksel analiz metodları ile değerlendirmek, potansiyel güvenlik açıklarının belirlenmesinde yardımcı olabilir.

Ayrıca, sürekli izleme ve veri analizi önemlidir. Bir organizasyon, sistemlerinin normal çalışma aralığını belirleyerek, istatistiksel olarak anormal davranışları tespit edebilir. Normal davranış profili oluşturmak, organize edilmiş bir yapının izlenmesine ve güvenlik ihlallerinin erken tespitine olanak tanır.

import numpy as np

# Örnek veri seti
veriler = np.array([100, 102, 98, 105, 200])  # Günlük indirme boyutları

# Varyans ve Standart Sapma Hesaplama
varyans = np.var(veriler)
standart_sapma = np.std(veriler)

print("Varyans:", varyans)
print("Standart Sapma:", standart_sapma)

Yukarıdaki örnek, bir organizasyona ait günlük veri indirme boyutlarının varyans ve standart sapma hesaplamasını göstermektedir. Elde edilen bu değerler, sistemin normal davranış profili ile karşılaştırıldığında, anormal durumları tespit etmede kritik bir rol oynar.

Teknik İçeriğe Hazır Hale Gelme

Bu yazının geri kalan bölümünde, güvenlik verisinde istatistiksel temellerin ve varyans analizinin detaylarına dalacağız. Merkezî eğilim ölçüleri, varyans, standart sapma ve anomali tespiti gibi kavramlar üzerinde durarak, bu bilgilerinin siber güvenlik praktiklerinde nasıl uygulanabileceğini keşfedeceğiz. Bu teknik bilgiler, siber güvenlik uzmanlarının, saldırılara karşı daha sağlam bir savunma mekanizması oluşturmalarına yardımcı olacaktır.

Teknik Analiz ve Uygulama

Veri Biliminin Kalbi: İstatistik

Siber güvenlik alanında, verilerin analizi temel bir rol oynamaktadır. İstatistiksel yöntemlerin kullanımı, büyük veri setlerinin anlaşılmasında ve yorumlanmasında kritik öneme sahiptir. Bunun yanında, verilerin davranışlarının anlaşılması, anormal aktivitelerin tespit edilmesine yardımcı olur. Bu bağlamda, istatistiksel araçlar sayesinde elde edilen verilerin merkezi eğilim ölçüleri (ortalama, medyan, mod) ve varyans gibi kavramlar kritik bir yer tutar.

Merkezi Eğilim Ölçüleri

Merkezi eğilim ölçüleri, bir veri setinin genel eğilimini özetler. Orta değeri bulmanın birkaç yolu bulunmaktadır:

  • Ortalama (Mean): Tüm veri noktalarının toplamının, veri sayısına bölünmesiyle elde edilir. Fakat bu, aşırı uç değerlerden (outlier) etkilenebilir.

  • Medyan (Median): Veri seti küçükten büyüğe sıralandığında ortada kalan değerdir. Medyan, aşırı uç değerlerden etkilenmediği için güvenlik verilerinde daha sağlam bir referans noktasıdır.

import numpy as np

# Veri seti
data = [1, 2, 2, 3, 4, 7, 9, 20]  # Aşırı uç değer 20

# Medyan hesaplama
median_value = np.median(data)
print(f"Medyan: {median_value}")

Dağılımın Ölçüsü: Varyans

Varyans, bir veri setindeki değerlerin ortalamadan ne kadar uzaklaştığını gösterir ve veri dağılımını anlamda büyük rol oynar. Düşük varyans, döngüsel ve tahmin edilebilir bir davranışı, yüksek varyans ise değişkenliği ifade eder.

  • Düşük Varyans: Kullanıcı ya da sistemin stabil ve tahmin edilebilir bir davranış sergilemesi.
  • Yüksek Varyans: Örneğin bir hesabın rastgele saatlerde ve farklı konumlardan giriş yapması gibi değişken davranışlar.

Varyans analizi, tehdit avcılarının, sistemdeki normal varyans aralığının dışına çıkan olağandışı hareketleri anomali olarak işaretlemesine olanak tanır.

# Varyans hesaplama
variance_value = np.var(data)
print(f"Varyans: {variance_value}")

Anomali Tespiti Mantığı

Siber güvenlikte anomali tespiti, verilerin normal davranış profili ile kıyaslanarak gerçekleştirilmektedir. İşte bu noktada, varyans ve standart sapma kavramları devreye girer. Öncelikle, sistemin normal davranış profilini oluşturmak için bir taban çizgisi (baseline) belirlemek gerekir.

Anomaliler, verinin normal dağılımının dışında kalan değerleri temsil eder. Z score (standart skor) hesaplaması, bir veri noktasının ortalamadan kaç standart sapma uzakta olduğunu gösterir. Z-Score değeri 3'ten büyük olan olaylar genellikle güçlü bir anomali adayıdır.

# Z-Score hesaplama
def z_score(data):
    mean = np.mean(data)
    std_dev = np.std(data)
    return [(x - mean) / std_dev for x in data]

z_scores = z_score(data)
print(f"Z-Skorları: {z_scores}")

Özellik Ölçeklendirme ve İstatistik

Veri analizi sırasında önemli bir başka konu, özellik ölçeklendirmedir. Genellikle, farklı ölçeklerdeki değerlerin bir arada analiz edilmesi, yanıltıcı sonuçlara yol açabilir. Özellikle makine öğrenmesi uygulamalarında, verilerin normalleştirilmesi veya standartlaştırılması gereklidir.

Özelliklerin ölçeklendirilmesi, veri analizi sonuçlarını daha anlamlı hale getirebilir ve bu şekilde istatistiksel modelleme süreçlerinde hata payını azaltabilir.

Özellikle varyans analizi (ANOVA), iki veya daha fazla grup arasındaki ortalamalar arasında anlamlı bir fark olup olmadığını belirlemede kullanılır. Örneğin, farklı departmanların veri dağılımlarını kıyaslamak için bu yöntem oldukça etkili bir araçtır.

Sonuç olarak, güvenlik verilerinin analizi, istatistiksel yöntemler kullanıldığında daha anlamlı ve etkili hale gelir. Varyans analizi ve anomali tespiti gibi süreçler, tehdit avcılarının veri içindeki anormallikleri tespit etmeleri ve siber tehditleri anlamaları açısından kritik öneme sahiptir.

Risk, Yorumlama ve Savunma

Siber güvenlik alanında risk analizi, organizasyonların karşılaştığı tehditleri anlamak ve buna yönelik önlemler almak için kritik öneme sahiptir. Bu bölümde, elde edilen güvenlik verilerinin yorumlanması, yanlış yapılandırma veya zafiyetlerin etkileri, anomali tespiti ve profesyonel önlemler üzerinde durulacaktır.

Güvenlik Verilerinin Yorumu

Veri analizi, özellikle siber güvenlikte, tehditlerin hızlı ve etkili bir şekilde tanımlanmasına yardımcı olur. Güvenlik verileri genellikle çok büyük ve karmaşık yapıdadır. Buradaki temel metriklerden biri varyanstır. Varyans, verilerin ortalamadan ne kadar yayıldığını göstererek, davranışsal anormallikleri ortaya çıkarmaya yardımcı olur.

Örneğin, bir kullanıcının günlük indirdiği dosya boyutları için varyans hesapladığımızda, yüksek bir varyans değeri, kullanıcının alışılmışın dışında bir davranış sergilediğini gösterir. Bu gibi durumlar, siber tehdit avcıları için ise önemli bir anomali sinyali olabilir.

import numpy as np

# Kullanıcının indirdiği dosya boyutlarına ait veri seti
dosya_boyutlari = [100, 102, 98, 110, 95, 140, 120]

# Varyans hesaplama
varyans = np.var(dosya_boyutlari)
print("Varyans:", varyans)

Yanlış Yapılandırmalar ve Zafiyetler

Yanlış yapılandırmalar, siber güvenlik tehditlerinin temel nedenlerinden biridir. Sistemlerin güvenlik parametrelerinin yanlış bir şekilde ayarlanması, saldırganların sisteme sızmasına olanak tanır. Örneğin, bir veri tabanındaki kullanıcı erişim izinlerinin hatalı ayarlanması durumunda, yetkisiz kişilerin kritik verilere ulaşma şansı artar.

Bu tür durumlarda, var olan zafiyetlerin tespiti ve düzeltilmesi son derece önemlidir. Zafiyetlerin etkilerini değerlendirmek, olası bir ihlalde hangi verilerin sızabileceğini anlamayı sağlar. Siber güvenlik ekibinin, sistemdeki tüm bileşenlerin güvenlik kontrollerini düzenli olarak yapması gerekmektedir.

Sızan Verilerin Analizi

Siber saldırılar sonucunda sızan verilerin doğru bir şekilde analiz edilmesi, gelecekte benzer tehditlerin önlenmesi açısından kritik rol oynar. Topoloji ve servis tespiti, veri sızıntısının hangi sistemlerden yapıldığını anlama konusunda yardımcı olur. Örneğin, bir ağda gerçekleştirilen saldırılar, belirli bir hizmet için kritik zayıflıkları hedef alabilir. Bu durumda, hizmetin durumu ve kullanım sıklığı göz önünde bulundurulmalıdır.

Sızan verilerin oluşturduğu etkiler ve bu verilere dayanan olası saldırı vektörleri, güvenlik ekipleri tarafından derhal değerlendirilmelidir.

Profesyonel Önlemler ve Hardening

Siber güvenlikte hardening, sistemlerin daha az tehdit almasına yönelik uygulanacak temel önlemleri içerir. Aşağıda, sistemlerin bu tür saldırılara karşı daha dayanıklı hale gelmesi için önerilen bazı teknikler bulunmaktadır:

  1. Güvenlik Duvarı ve İdare:

    • Güvenlik duvarları, ağ trafiğini kontrol ederek yetkisiz erişimleri engeller. Doğru yapılandırılmış bir güvenlik duvarı, tehditlere karşı ilk savunma hattını oluşturur.
  2. Güncellemeler ve Yamanmalar:

    • Tüm yazılımların en son sürümlerinin kullanılması ve düzenli olarak güncellemelerin yapılması, bilinen zafiyetlerin kapatılması açısından önemlidir.
  3. Erişim Kontrolleri:

    • Kullanıcıların yalnızca ihtiyaç duyduğu verilere erişebilmesi gerekir. Rol tabanlı erişim kontrolleri (RBAC), potansiyel iç tehditleri minimize eder.
  4. Log Analizi ve İzleme:

    • Sistemlerdeki her türlü işlem ve erişim kaydedilmeli ve düzenli olarak izlenmelidir. Anormal aktiviteler, bu loglar üzerinden tespit edilmelidir.
  5. Eğitim ve Farkındalık:

    • Personelin düzenli olarak siber güvenlik eğitimleri alması, potansiyel insan hatalarını minimize eder.

Sonuç Özeti

Risk, yorumlama ve savunma süreçleri, siber güvenlik alanında büyük bir öneme sahiptir. Güvenlik verilerinin analizi ve yorumlanması, potansiyel tehditlerin tespitini kolaylaştırır. Yanlış yapılandırmalar ve zafiyetler, sistemlerin güvenliğini tehdit ederken, sızan verilerin analizi de saldırıların analiz edilmesi açısından kritik bir adım olarak ortaya çıkmaktadır. Profesyonel önlemler ve hardening teknikleri ile bu tehditler minimize edilebilir, dolayısıyla organizasyonların güvenliği artırılabilir.