Publication:
Şifreli ağ trafiğinin içerik açısından sınıflandırılması

dc.contributor.advisorCicioğlu, Murtaza
dc.contributor.advisorToğay, Cengiz
dc.contributor.authorBozkır, Ramazan
dc.contributor.departmentFen Bilimleri Enstitüsü
dc.contributor.departmentBilgisayar Mühendisliği Ana Bilim Dalı
dc.contributor.orcid0000-0002-0032-4270
dc.date.accessioned2022-10-07T05:48:07Z
dc.date.available2022-10-07T05:48:07Z
dc.date.issued2022-06-24
dc.description.abstractGünümüzde internet kullanımının yaygınlaşması mevcut bilgisayar ağları altyapısının verimli ve güvenli bir şekilde yönetilmesini gerektirmektedir. Ayrıca, her geçen gün internet uygulamalarının kullanımındaki artış ile büyük veri hacmini oluşturan ağ trafikleri de ortaya çıkmaktadır. Büyük verilerin işlenebilmesi için performans odaklı yöntemlerin kullanılması gerekmektedir. Ağ trafiği verilerinin, ağ yönetimi ve ağ güvenliği gibi birçok çalışma alanındaki uygulamalar için sınıflandırma ihtiyacı bulunmaktadır. Ağ trafiğinin şifreli olması ve VPN kullanımı gibi uygulamalar ağ trafiği sınıflandırma sürecini zorlaştırmaktadır. Bu tez çalışmasında şifreli ağ trafiğinin sınıflandırılması için gerçek-zamanlı sistemlere kolay ve hızlı uygulanabilir performans-odaklı yeni bir platform geliştirilmiştir. Sınıflandırma sürecinde makine öğrenmesi tekniklerinden yararlanılmıştır. Deney tabanlı makine öğrenmesi tekniklerinin etkili bir şekilde uygulanabilmesi için süreç yönetim gerçekleştirilmiştir. Platformun tasarlanmasında güncel ve performanslı olan veri işleme için Apache Spark, öznitelik çıkarımı için NFStream ve süreç yönetimi için MLflow yazılım teknolojileri kullanılmıştır. Ayrıca, bu çalışma literatüre “pattern byte” isimli yeni bir öznitelik kazandırmıştır. Önerilen platform ile gerçekleştirilen deney kapsamında uygulama ve uygulama türlerine göre ağ trafiği makine öğrenmesi algoritmaları ile sınıflandırılmaktadır. Makine öğrenmesi algoritmalarından GBTree, LightGBM ve XGBoost algoritmalarının kullanılması sonucunda performans sonuçları değerlendirildi. Performans sonuçlarının değerlendirilmesi doğruluk, duyarlılık, kesinlik ve F1 skorları ile incelenmektedir. İncelenen sonuçlarda uygulama sınıflandırmasında GBTree, LightGBM, XGBoost algoritmaları sırasıyla yaklaşık %98, %89 ve %99 F1 skorlarına ulaşmaktadır. Uygulama türlerine göre sınıflandırmada ise tüm algoritmalar %99 F1 skoruna ulaşmaktadır. Sonuç olarak, algoritmalar arasında XGBoost algoritması her iki sınıflandırma probleminde %99’un üzerinde F1 skoru ile en iyi sonuca ulaştığı görülmüştür.
dc.description.abstractToday, the widespread use of the Internet requires efficient and secure management of the existing computer network infrastructure. Network traffic as big data emerges as a result of increasing internet applications day by day. Therefore, performance-oriented methods should be used to process big data. Network traffic data needs to be classified for applications in many workspaces, such as network management and security. Network traffic encryption and applications such as VPN increases the complexity of network traffic classification process. In this thesis, a new performance-oriented platform has been developed for the classification of encrypted network traffic, which can be easily and quickly applied to real-time systems. Machine learning techniques were used in the classification process. Process management was carried out in order to apply experiment-based machine learning techniques effectively. Apache Spark for data processing, NFStream for feature extraction, and MLflow software technologies for process management were used in the design of the platform. In addition, this study has brought a new feature called “pattern byte” to the literature. Within the scope of the experiment carried out with the proposed platform, network traffic is classified by machine learning algorithms according to the application and application types. Performance results were evaluated as a result of using GBTree, LightGBM, and XGBoost algorithms from machine learning algorithms. Evaluation of performance results is examined by accuracy, recall, precision, and F1 scores. In the results examined, GBTree, LightGBM, and XGBoost algorithms achieve F1 scores of approximately 98%, 89%, and 99% in application classification. In classification according to application types, all algorithms reach 99% F1 scores. As a result, among the algorithms, it was seen that the XGBoost algorithm achieved the best result with an F1 score of over 99% in both classification problems.
dc.format.extentVII, 54 sayfa
dc.identifier.citationBozkır, R. (2022). Şifreli ağ trafiğinin içerik açısından sınıflandırılması. Yayınlanmamış yüksek lisans tezi. Bursa Uludağ Üniversitesi Fen Bilimleri Enstitüsü.
dc.identifier.urihttp://hdl.handle.net/11452/29010
dc.language.isotr
dc.publisherBursa Uludağ Üniversitesi
dc.relation.publicationcategoryTez
dc.relation.tubitak2210 Yurt İçi Yüksek Lisans Burs Programı
dc.rightsinfo:eu-repo/semantics/openAccess
dc.subjectAğ trafiği sınıflandırma
dc.subjectAğ trafiği
dc.subjectMakine öğrenmesi
dc.subjectTopluluk yöntemleri
dc.subjectNetwork traffic classification
dc.subjectNetwork traffic
dc.subjectMachine learning
dc.subjectEnsemble methods
dc.titleŞifreli ağ trafiğinin içerik açısından sınıflandırılması
dc.title.alternativeContent classification of encrypted network traffic
dc.typemasterThesis
dspace.entity.typePublication
local.contributor.departmentFen Bilimleri Enstitüsü/Bilgisayar Mühendisliği Ana Bilim Dalı

Files

Original bundle

Now showing 1 - 1 of 1
Thumbnail Image
Name:
Ramazan_Bozkır.pdf
Size:
3.24 MB
Format:
Adobe Portable Document Format
Description:

License bundle

Now showing 1 - 1 of 1
Placeholder
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed upon to submission
Description: