CyberFlow Logo CyberFlow BLOG
Soc L1 Izleme Gorunurluk Normalizasyon

Yapılandırılmış ve Yapılandırılmamış Veri: Siber Güvenlikte Kritik Farklılıklar

✍️ Ahmet BİRKAN 📂 Soc L1 Izleme Gorunurluk Normalizasyon

Yapılandırılmış ve yapılandırılmamış verinin siber güvenlikteki önemini ve aralarındaki farkları keşfedin.

Yapılandırılmış ve Yapılandırılmamış Veri: Siber Güvenlikte Kritik Farklılıklar

Yapılandırılmış ve yapılandırılmamış verinin siber güvenlik alanındaki yeri kritik öneme sahiptir. Yapılandırılmış verinin hızı, yapılandırılmamış verinin esnekliği ile karşılaştırılırken, bu ikisi arasındaki teknik farklılıkları anlamak önemlidir.

Giriş ve Konumlandırma

Siber güvenlik dünyasında, verilerin doğru bir şekilde yönetilmesi ve analiz edilmesi kritik öneme sahiptir. Bu bağlamda, yapılandırılmış ve yapılandırılmamış veri kavramlarının anlaşılması, IT profesyonellerinin siber tehditlere karşı daha etkili stratejiler geliştirebilmesi açısından son derece önemlidir. Yapılandırılmış veri, belirli bir şemaya ve önceden tanımlanmış alanlara sahip olan, makineler tarafından rahatlıkla okunabilen veri türüdür. Örneğin, veritabanı tabloları, JSON ve XML formatları bu tür verilere örnek teşkil eder.

{
    "event": "login_attempt",
    "user": "admin",
    "success": true,
    "timestamp": "2023-10-01T10:00:00Z"
}

Yukarıdaki JSON örneği, anahtar-değer çiftleri ile yapılan bir yapılandırılmış veri tanımlamasına örnek olarak sunulabilir. Bu format, sistemlerin veri analizini daha hızlı gerçekleştirmesine olanak tanır ve bu sayede siber güvenlik ekipleri hızla tehditleri tespit edebilirler.

Diğer yandan, yapılandırılmamış veri, herhangi bir sabit formatı olmayan, genellikle düz metin şeklinde tutulan verilerdir. Bu tür verilerin analizi, karmaşık düzenli ifadeler (Regex) yazmayı gerektirdiğinden, siber güvenlik uzmanları için daha fazla zaman ve kaynak tüketebilir. Düz metin logları, siber güvenlik analizleri için zorluklar arz eder çünkü önceden tanımlanmış bir yapı sunmaz. Örneğin:

Failed login attempt from 192.168.1.1 at 2023-10-01 10:00:00

Bu kayıt, düz metin formatında bir yapılandırılmamış veridir ve analistin veriyi anlamlandırabilmesi için her bir kaydı manuel olarak incelemesi gerekebilir. Yapılandırılmamış verilerin işlenmesi, genellikle daha yüksek CPU tüketimi ile ilişkilidir. SIEM (Security Information and Event Management) sistemleri, bu tür verileri anlamak için satırları baştan sona tarayarak karmaşık ayrıştırma işlemleri gerçekleştirir. Bu durum, sistem kaynaklarını yapılandırılmış verilere oranla çok daha fazla tüketir.

Yapılandırılmış ve yapılandırılmamış veri arasındaki temel farklar, siber güvenlikte savunma ve penetrasyon testleri (pentest) açısından büyük bir önem taşır. Yapılandırılmış veriler, hızlı ve verimli bir analiz sağlarken, yapılandırılmamış veriler ise daha fazla esneklik sunar fakat aynı zamanda daha fazla zorluk ve zaman kaybına yol açabilir. Siber güvenlik analistleri, seçimlerini bu farkları göz önünde bulundurarak yapmalıdır.

Son olarak, siber güvenlik alanında bu iki veri türünün anlaşılması, sadece tehdit tespiti değil, aynı zamanda veri koruma stratejilerinin geliştirilmesi için de gereklidir. Modern dünyada JSON gibi yapılandırılmış veri formatlarının tercih edilmesi, güvenlik çözümlerinin hızlı ve etkili bir şekilde uygulamaya konulmasına olanak tanırken, düz metin loglarının hâlâ bazı eski sistemlerde bulunması siber güvenlik ekiplerinin daha karmaşık sorunlarla karşı karşıya kalmasına sebep olabilir.

Bu önemli farklılıkları anlamak, teknik bir analistin siber güvenlik stratejilerini optimize etmesine ve potansiyel riskleri daha etkili bir şekilde yönetmesine katkıda bulunacaktır. Yapılandırılmış ve yapılandırılmamış veri hakkında derinlemesine bilgi sahibi olmak, siber tehditlerin önlenmesi ve sistem güvenliğinin artırılması için kaçınılmazdır.

Teknik Analiz ve Uygulama

Düzenli Veri: Structured

Siber güvenlikteki veri yönetimi, yapılandırılmış ve yapılandırılmamış veri arasındaki farkları anlamakla başlar. Yapılandırılmış veri, belirli bir şemaya sahip olup, alanları (field) önceden tanımlanmış ve makineler tarafından kolayca okunabilen veri türüdür. Veritabanı tabloları, JSON veya XML formatları, bu tür veriye en iyi örnekleri sunar. Yapılandırılmış verinin temel avantajı, hızlı erişim ve analiz süreçleri sağlamasıdır.

Örneğin, JSON formatındaki bir log girişi şöyle görünebilir:

{
  "timestamp": "2023-10-01T12:00:00Z",
  "source_ip": "192.168.1.1",
  "event_id": "1001",
  "message": "Kullanıcı giriş yaptı"
}

Bu yapıda, her bir alan belirli bir içerik barındırır ve bu sayede sistemler bu veriyi kolayca ayrıştırıp işleyebilir.

Standart Formatlar

Modem sistemlerde loglar, genellikle anahtar-değer (key-value) ilişkisiyle tutulur. Özellikle, JSON ve XML gibi yaygın yapılandırılmış formatlar, verinin daha organize bir biçimde saklanmasını sağlar. Bu formatlar sayesinde, bir SIEM (Security Information and Event Management) sistemi, logları daha hızlı analiz edebilir.

Örneğin, aşağıdaki CSV formatındaki log verisi de yapılandırılmış bir örnektir:

timestamp,source_ip,event_id,message
2023-10-01T12:00:00Z,192.168.1.1,1001,Kullanıcı giriş yaptı
2023-10-01T12:05:00Z,192.168.1.2,1002,Kullanıcı çıkış yaptı

Bu tür veriler, esnekliği ve düzeni ile analiz ve raporlama işlemlerinde makina okur yazarlığını artırır.

Karışık Veri: Unstructured

Yapılandırılmamış veri ise herhangi bir sabit formatı olmayan, genellikle düz metin (plain text) şeklinde tutulan verilerdir. Örnek olarak, eski sunucu logları bu kategoriye girer. Bu logları analiz etmek için karmaşık Regex kuralları yazmak gerekebilir. Örneğin:

10.0.0.1 - - [01/Oct/2023:12:00:00 +0000] "GET / HTTP/1.1" 200 2326

Bu format, logların analizini karmaşıklaştırır ve sistem kaynaklarını daha fazla tüketir çünkü her satırın içinde hangi bilginin hangi alana ait olduğu belirsizdir.

Veri Formatı Eşleşmesi

Log formatlarını doğru kategorize etmek, doğru ayrıştırıcıyı (parser) seçmek için kritik bir adımdır. Yapılandırılmamış verilerin işlenmesi, CPU kullanımını artırır ve performans açısından dezavantajlar doğurabilir. Yapılandırılmış veri, belirli bir düzen ve format taşıdığı için genellikle daha hızlı işlenebilir. Örneğin, aşağıdaki örnek bir log ayrıştırma işlemini gösterir:

import re

log_line = '10.0.0.1 - - [01/Oct/2023:12:00:00 +0000] "GET / HTTP/1.1" 200 2326'
pattern = r'(\d+\.\d+\.\d+\.\d+) - - \[(.*?)\] ".*?" (.*?)'
match = re.match(pattern, log_line)

if match:
    ip_address = match.group(1)
    timestamp = match.group(2)
    status_code = match.group(3)

Yukarıda yer alan Python örneği, düz metin loglarını belirli alanlara ayırmak için kullanılan bir Regex desenini gösterir.

Performans Farkı

Yapılandırılmamış verinin SIEM sistemleri tarafından işlenmesi, genellikle daha yüksek CPU tüketimi gerektirir. SIEM sistemleri, eski web sunucu logları gibi yapılandırılmamış veriyi anlamlandırmak için satırları baştan sona tarar. Bu durum, sistem kaynaklarını yapılandırılmış veriye göre çok daha fazla yorar. Yapılandırılmış verinin bir avantajı olan hız ve verimlilik de burada öne çıkar.

Parsing'in Amacı

Yapılandırılmamış veriyi yapılandırılmış hale getirmek için gerçekleştirilen işlem "parsing" olarak adlandırılır. Bu işlem, verinin makine tarafından daha kolay işlenmesini sağlar. Örneğin, bir SIEM aracı, yapılandırılmamış bir logu aşağıdaki alanlara ayırmak için parsing yapabilir:

  • Source IP
  • Event ID
  • Timestamp
  • Message

Sonuç olarak, siber güvenlikte verilerin doğru bir şekilde yönetilmesi ve analizi için yapılandırılmış ve yapılandırılmamış veri arasındaki farkları anlamak hayati önem taşır. Yapılandırılmış veri modern sistemlerde vazgeçilmez bir unsurken, yapılandırılmamış verinin analizi ve yönetimi ek zorluklar getirmektedir.

Risk, Yorumlama ve Savunma

Siber güvenlikte veri analizi, tehditleri tanımlamak ve etkili savunma stratejileri geliştirmek açısından kritik öneme sahiptir. Yapılandırılmış veriler, belirli bir şema ve tanımlı alan yapısına sahip olduğu için makineler tarafından hızla işlenebilirken, yapılandırılmamış veriler karmaşık bir yapıya sahip olup, doğru analiz için ciddi çaba gerektirir. Bu bölümde, elde edilen verilerin güvenlik anlamındaki yorumunu, yanlış yapılandırmaların veya zafiyetlerin etkilerini, sızan veri, topoloji ve servis tespiti gibi sonuçları ele alacağız.

Yapılandırılmış Veri Analizi

Yapılandırılmış veri, örneğin JSON veya XML formatında sunulan bilgiler, siber güvenlik sistemlerinin (SIEM) çalışma hızlılığında önemli bir rol oynamaktadır. Veriler belirli bir düzen (schema) içerisinde bulunduğundan, bu verilerin analiz edilmesi daha az kaynak tüketmektedir. Örneğin, aşağıdaki yapılandırılmış veri örneği, bir olay kaydının güvenliği değerlendirilmesinde kullanılabilir:

{
  "sourceIP": "192.168.1.1",
  "eventID": "12345",
  "timestamp": "2023-10-01T12:00:00Z"
}

Bu tür verilerin analizinde, sistemin log kaydına referans vererek tehdit analizi yapılabilir. Yapılandırılmış veriler sayesinde, olayların ne zaman meydana geldiğini veya hangi kaynaklardan geldiğini belirlemek çok daha hızlıdır.

Elde edilen bulguların güvenlik anlamı, olayların kaydedilmesi ve analiz edilmesi açısından büyük önem taşır. Yanlış yapılandırmalar veya zafiyetler, bu yapılandırmaların eksik veya yetersiz kalması durumunda ortaya çıkabilir. Örneğin, bir hizmetin API uç noktasında gereksiz açıklıklar bırakılması, kötü niyetli bir saldırganın sisteme sızmasını kolaylaştırabilir. Unutulmamalıdır ki, yapılandırılmış verinin doğru analizi, potansiyel saldırı vektörlerinin daha hızlı bir şekilde tanımlanmasına ve etkili savunmanın oluşturulmasına olanak sağlar.

Yapılandırılmamış Veri ile İlgili Zorluklar

Yapılandırılmamış veri genellikle düz metin halinde tutulan, önceden tanımlanmış bir yapıya sahip olmayan verilerden oluşur. Bu verilerin analizi genellikle karmaşık bir süreçtir ve regex gibi tekniklerle anlam kazanır. Örneğin, eski bir web sunucusunun log dosyalarını alalım. Bu log dosyasında saptanabilecek bir IP adresi ve zaman damgası gibi önemli verilere ulaşmak, ciddi bir analiz süreci gerektirir:

192.168.1.1 - - [01/Oct/2023:12:00:00 +0000] "GET /index.html HTTP/1.1" 200 2326

Yapılandırılmamış verileri işlemek, daha yüksek CPU tüketimine yol açar; bu da, sistem kaynaklarının hızla aşınmasına ve potansiyel performans sorunlarına neden olabilir. Yapılandırılmamış verinin analiz edilmesi, SIEM araçlarının doğru parser'lar kullanarak veri analizi yapmasını gerektirir. Yanlış yapılandırılmış veriler, yanlış yorumlara ve bu durumun savunma stratejilerinin zayıflamasına neden olabilir.

Güvenlik Önlemleri ve Hardening

Düzenli ve doğru bir veri yönetimi sağlamak için, güvenlik önlemlerinin sıkı bir şekilde uygulanması gerekmektedir. Aşağıdaki profesyonel öneriler, veri güvenliğini artırmak açısından dikkate alınmalıdır:

  1. Veri Sınıflandırması: İçerik türlerine göre doğru veri sınıflandırması yapılarak, hem yapılandırılmış hem de yapılandırılmamış verilerin yerinde analizi için uygun yöntemlerin belirlenmesi.

  2. İzleme ve Olay Müdahale Planları: Ağ trafiği ve log kayıtlarının sürekli izlenmesi gerekir. Anomalilerin hızla tanımlanmasını sağlamak için etkin izleme sistemleri kurulmalıdır.

  3. Eğitim ve Farkındalık: Personel eğitim programlarının artırılması, potansiyel tehditleri daha iyi anlamalarına ve doğru müdahale stratejileri geliştirmelerine yardımcı olacaktır.

  4. Güvenlik Duvarları ve Saldırı Tespit Sistemleri: İç ve dış ağ trafiği arasında güvenlik katmanları oluşturarak, potansiyel saldırılara karşı etkili savunmalar geliştirilmelidir.

Sonuç

Yapılandırılmış ve yapılandırılmamış veri arasındaki farklar, siber güvenlik bağlamında kritik öneme sahiptir. Yapılandırılmış veriler, hızlı ve etkili bir analiz sağlarken, yapılandırılmamış verinin analizindeki zorluklar, yanlış yorumlama ve potansiyel zafiyetlere yol açabilir. Verilerin güvenliğinin sağlanması için disiplinli bir yaklaşım benimsemek, süregelen tehditlere karşı proaktif bir savunma mekanizması oluşturulmasına yardımcı olacaktır. Bu sürecin parçası olarak, iyi yapılandırılmış veri yönetimi ile güvenlik önlemlerinin sürekli gözden geçirilmesi ve iyileştirilmesi şarttır.