Sayısal görüntülerin içine gizlenen verilerin derin öğrenme tabanlı tespit edilmesi
Tarih
Yazarlar
Dergi Başlığı
Dergi ISSN
Cilt Başlığı
Yayıncı
Erişim Hakkı
Özet
Bilgi güvenliği için kullanılan steganografi, sadece alıcı ve göndericinin bildiği bir gizli mesajı, gizleme yöntemleri aracılığıyla üçüncü şahıslar fark etmeden bir taşıyıcı nesne içerisine gizler. Steganaliz ise gizli mesajların tespit edilmesi için kullanılan teknikleri ve araçları içerir ve steganografik sistemlere karşı yapılan saldırıları tespit eder. Özellikle görüntü steganalizinde, steganografik içerikleri belirlemek amacıyla çeşitli makine öğrenimi (ML: Machine Learning) teknikleri kullanılmaktadır. Görüntü steganalizinde kullanılan ML teknikleri, genellikle özellik çıkarımı ve sınıflandırma gibi adımlar içerir. Ancak, bu yaklaşımlar bazı sıkıntılarla karşı karşıyadır. Özellik çıkarımı aşamasında, kullanılan özellikler her zaman gizli bilgiyi tespit etmek için yeterli olmayabilir ve bu durum analiz sürecini zorlaştırabilir. Ayrıca, geleneksel ML algoritmalarının performansı, büyük ve çeşitli veri kümeleri üzerinde istenilen düzeyde olamayabilir. Bu sıkıntıları aşmak için son yıllarda, görüntü steganalizinde geleneksel yaklaşımlar yerine derin öğrenme (DL: Deep Learning) modelleri yaygın olarak kullanılmaktadır. Bu tez çalışmasında, öncelikle literatürde görüntü steganalizi için önerilmiş DL modelleri incelenerek, CNN modellerinde basitten karmaşığa steganaliz için hangi yapıların kullanılması gerektiği araştırılmıştır. Bu sebeple, modellerin eğitim ve testi için BOSSBase ve BOWS2 verisetlerinde bulunan görüntülere, 0.4 ve 0.2 bpp (bit per pixel) oranında veri gizlenerek taşıyıcı ve stego görüntü çiftlerini içeren verisetleri oluşturulmuştur. Stego görüntülerin oluşturulmasında, HUGO, S-UNIWARD, WOW ve MIPOD olmak üzere dört uzamsal görüntü steganografi tekniği kullanılmıştır. Bu analizler sonucunda, DL'de düşük stego sinyalini kaybetmeden öznitelik analizi yapabilmek için ilk katmanda yüksek geçiren filtreler kullanılması gerektiğini ve aynı zamanda takip eden katmanlarda artık bağlantılar kullanılmasının performansı olumlu etkilediğini görülmüştür. Tezin ikinci aşamasında ise görüntü steganalizinde literatürdeki başarıları bilinen QIAN-NET, XU-NET, YE-NET, YED-NET, SR-NET, GBRAS-NET olarak isimlendirilen DL modellerinin sonuçlarını birleştirerek karar veren TOPLU-STEGNET olarak isimlendirilen kolektif bir DL modeli geliştirilmiştir. HUGO, S-UNIWARD, WOW ve MIPOD gizleme tekniklerinin 0.2 bpp yükünün tespitinde TOPLU-STEGNET modelinin elde ettiği doğruluk değerleri sırasıyla 0.7095, 0.6734, 0.7760 ve 0.6248'dir. Elde edilen sonuçlar önerilen DL modelinin literatürdeki yöntemlerle yarışabildiğini göstermiştir.
Steganography, used for information security, conceals a secret message within a cover object so that only the sender and the receiver are aware of its existence, ensuring that it goes unnoticed by third parties. Steganalysis, on the other hand, encompasses the techniques and tools used to detect these hidden messages and identify attacks on steganographic systems. Various machine learning (ML) techniques are employed to detect steganographic contents, particularly in image steganalysis. The ML techniques used in image steganalysis typically involve steps such as feature extraction and classification. However, these approaches can encounter certain difficulties. During the feature extraction phase, the features used may not always be sufficient to detect the hidden information, which can complicate the analysis process. Furthermore, the performance of traditional ML algorithms may not be satisfactory on large and diverse datasets. To overcome these issues, deep learning (DL) models have been increasingly used in image steganalysis in recent years, replacing traditional approaches. This thesis first reviews the DL models proposed in the literature for image steganalysis and investigates which structures should be used in CNN models for steganalysis from simple to complex. For this purpose, datasets containing cover and stego image pairs have been created using images from the BOSSBase and BOWS2 datasets, with data hidden at 0.4 and 0.2 bpp (bits per pixel). Four spatial image steganography techniques, namely HUGO, S-UNIWARD, WOW, and MIPOD, have been used to create the stego images. These analyses have shown that high-pass filters should be used in the first layer to analyze low stego signals without loss in DL and that using residual connections in subsequent layers positively affects performance. In the second phase of the thesis, an ensemble DL model named TOPLU-STEGNET, which combines the results of well-known DL models in image steganalysis literature such as QIAN-NET, XU-NET, YE-NET, YED-NET, SR-NET, GBRAS-NET, has been developed. The accuracy values obtained by the TOPLU-STEGNET model in detecting the 0.2 bpp load of HUGO, S-UNIWARD, WOW, and MIPOD hiding techniques are respectively 0.7095, 0.6734, 0.7760, and 0.6248. The obtained results demonstrate that the proposed DL model can compete with the methods in the literature.