Yazar "Kekül, Hakan" seçeneğine göre listele
Listeleniyor 1 - 10 / 10
Sayfa Başına Sonuç
Sıralama seçenekleri
Öğe A systematic literature review on ransomware detection by evidence-based software engineering method(Sivas Cumhuriyet Üniversitesi, 2024) Kuzu, Engin; Kekül, Hakan; Arslan, HalilRansomware attacks, which aim to take ransom by encrypting the files they infect with unbreakable passwords, have become an increasing threat in recent years. Decrypting encrypted files without data loss is nearly impossible without the encryption key. This often obliges ransomware victims to pay the amount of the ransom demanded. The purpose of our study is to present a systematic literature review of ransomware detection research. The method we base on while performing a systematic literature review is the Evidence-Based Software engineering approach. This approach is based on the Evidence-Based Medicine method, which has been successfully applied in many fields. Six steps of Evidence-Based Software Engineering have been implemented in sequence. For this purpose, 114 scientific articles, which fall within the scope of our research questions, were researched from the studies conducted between 2017 and 2022 on ransomware detection. According to our quality evaluation rules, 49 articles meeting our quality criteria were analyzed. The answers to our research questions, which we determined through the analyzed articles, are presented in detail.Öğe Kanıta Dayalı Yazılım Mühendisliği ile Özel NER Üzerine Sistematik Bir Literatür İncelemesi(Sivas Cumhuriyet Üniversitesi, 2023) Kekül, Hakan; Şeker, AbdulkadirVerilerin önemi artmaya devam ettikçe, veri analiz yöntemlerinin önemi de artmaktadır. Halihazırda çeşitli modeller uygulanmakta ve sürekli yeni modeller önerilmektedir. Bu çalışma kapsamında, bir veri analiz modeli olan Adlandırılmış-Varlık Tanıma üzerine detaylı bir inceleme gerçekleştirdik. Analiz yöntemi olarak uzun yıllardır başarıyla kullanılan Kanıta Dayalı Yazılım Mühendisliği yöntemini uyguladık. Çalışmada, bu yöntemle belirlenen 114 farklı araştırma makalesi arasından seçilen 38 makale analiz edildi. Analiz edilen verilerin detaylı bir sunumu yapılmıştır. Çalışma, NER kullanan yöntemler arasında en etkili olanı belirlemeyi amaçlamıştır. Analiz, BERT'in NER çalışmalarında en başarılı yöntem olduğunu göstermektedir. "Haberler" alanının en fazla sayıda NER veri kümesi içerdiği tespit edilmiştir. Çalışma ayrıca tespit edilen diğer yöntemler ve etki alanları hakkında da detaylı bilgi vermektedir. Özgün ve kapsamlı bir rehber olan bu çalışma, alanla ilgilenenler için mükemmel bir kaynak niteliğindedir.Öğe Multi-Class Classification of ISO/IEC 25010 Software Quality Metrics Using User Feedback(Sivas Cumhuriyet Üniversitesi, 2024) Sönmez, Sedat; Kekül, HakanSoftware quality indicates how effective and efficient a software is. Various standards need to be used to evaluate software quality. One of the most important internationally accepted standards for measuring software quality is the ISO/IEC 25010 software quality standard. With this standard, the quality of a software product is evaluated with eight different metrics. These are functional suitability, performance, compatibility, usability, reliability, security, maintainability and portability metrics. In this study, we tried to determine the relationship between user feedback and the metrics of the ISO/IEC 25010 software quality standard. Machine learning (ML) and natural language processing (NLP) techniques were used to classify user comments. After the data preprocessing phase, vectors of user comments were extracted with the Tf-Idf method for NLP. As a machine learning method, classification was made using five different models: Extra Trees Classifier (ETC), Gaussian Process Classifier (GPC), MLP Classifier (MLPC), Bernoulli Naive Bayes Classifier (BNBC) and Support Vector Classifier (SVC). Our goal is to show how quality metrics can be classified into multiple classes using user notifications. The data set used has an unbalanced structure, containing 1681 user comments classified by software experts. Synthetic Minority Oversampling Technique (SMOTE) was used to address the imbalance in the dataset. The results were compared by applying the same classification models to unbalanced and balanced data sets. According to the results obtained, the best classification model is the Extra Trees Classifier model, which provides the highest accuracy rate of 87% according to the SMOTE applied data set. The results show that ML and NLP methods can be used effectively in the classification process of software quality metrics.Öğe A multiclass hybrid approach to estimating software vulnerability vectors and severity score(Elsevier, 2021) Kekül, Hakan; Ergen, Burhan; Arslan, HalilClassifying detected software vulnerabilities is an important process. However, the metric values of security vectors are manually determined by humans, which takes time and may introduce errors stemming from human nature. These metrics are important because of their role in the calculation of vulnerability severity. It is necessary to use machine learning algorithms and data mining techniques to improve the quality and speed of vulnerability analysis and discovery processes. However, studies in this area are still limited. In this study, vulnerability vectors were estimated using the natural language processing techniques bag of words, term frequency–inverse document frequency, and n-gram for feature extraction together with various multiclass classification algorithms, namely Naïve Bayes, decision tree, k-nearest neighbors, multilayer perceptron, and random forest. Our experiments using a large public dataset facilitate assessment and provide a standard-compliant prediction model for classifying software vulnerability vectors. The results show that the joint use of different techniques and classification algorithms is a promising solution to a multi-probability and difficult-to-predict problem. In addition, our study fills an important gap in its field in terms of the size of the dataset used and because it covers a vulnerability scoring system version that has not yet been extensively studied.Öğe Predicting Bitcoin Price Direction Using Machine Learning Models(Sivas Cumhuriyet Üniversitesi, 2024) Açi, Tanju; Kekül, HakanIn the financial sector, as past economic and social events have shaken trust, this trust is being regained through the internet and computer technologies. Emerging in the 19th century, financial technology has led to a new economic understanding with digital money and especially bitcoin. The decentralized structure of bitcoin and the encryption systems used for security play an important role in preventing fraud and have become the center of attention of investors. As its value has increased, studies on price predictions have naturally increased. This study aims to predict the impact of data obtained from digital economy news sites on bitcoin price using natural language processing and machine learning techniques. In line with this goal, text vectorization was performed with the TF-IDF statistical method. Synthetic Minority Oversampling Technique (SMOTE) was applied to eliminate the imbalance in the vectorized data set. Classification models such as Logistic Regression, Decision Trees, Random Forest, Support Vector Machines, K-Nearest Neighbor, Extra Trees, Bernoulli Naive Bayes and Multilayer Perceptron were applied to the obtained output. According to the results of the performance of different machine learning models in predicting the direction of bitcoin price fluctuation, the Extra Trees Classifier model showed the highest performance with an Accuracy of 86.71%, recall of 86.71%, precision of 86.99% and F1 score of 86.59%.Öğe Sentiment Analysis for Udemy Reviews with Natural Language Processing and Machine Learning Methods(Ankara Bilim Üniversitesi, 2024) Sönmez, Sedat; Açi, Tanju; Takcı, Hidayet; Kekül, HakanUnderstanding and classifying sentiment content in textual data is an important requirement for many industries. Text-based data such as social media platforms, customer feedback and product reviews are a rich source of human emotions and opinions. Extracting meaningful information from this text data and understanding the emotional content helps businesses make strategic decisions, develop products and improve their services. Machine learning methods are widely used to perform sentiment analysis on large amounts of text data. These methods are used to process text data, extract features, train models and classify emotional content. Natural language processing techniques are used to solve a range of problems such as increasing an application's user satisfaction, improving its services or optimising marketing strategies. In this study, emotional tones are determined by analysing course comments in the Udemy application. Prediction is made by classifying positive or negative comments. Udemy application comments on Google Play were used and sentiment analysis is performed using K-Nearest Neighbour (KNN) and Random Forest Classification (RFC) algorithms. As a result of the analyses, it was observed that the KNN algorithm predicted with 84% accuracy. Accuracy, F1 Score, Recall, Precision metrics were used as performance measures.Öğe Using Large Language Model to Label Data in Determining Software Quality Classes: ChatGPT(Institute of Electrical and Electronics Engineers Inc., 2024) Kekül, Hakan; Polatgil, MesutIn this research, ChatGPT's ability to label software quality classes was examined. Approximately 50 thousand Duolingo user comments, randomly selected from the Google Play Store, were labeled by ChatGPT according to ISO software quality classes, and these labels were compared with the labels made by two experts in the field of software engineering. The results were analyzed using the Fleiss' Kappa statistical method. As a result of the analysis, it was determined that ChatGPT's labeling was 69% compatible with the labeling of human experts. According to Fleiss' Kappa method, this rate is quite high in terms of compatibility of three different people. This finding demonstrates that ChatGPT can be used effectively with human experts in data labeling processes. In particular, the labels made in the "Usability" and "Functional Suitability" classes reveal that users attach importance to these features. Although ChatGPT has disadvantages such as hallucination and bias, it is possible to increase the accuracy of these models by using hybrid approaches. The research shows that large language models can be an important auxiliary tool in data labeling processes in the field of software engineering and that more accurate and reliable results can be obtained by working with human experts. © 2024 IEEE.Öğe Yazılım Güvenlik Açığı Veri Tabanları(Osman SAĞDIÇ, 2021) Kekül, Hakan; Ergen, Burhan; Arslan, HalilBir yazılım bileşeninin güvenlik açığı eğiliminin öngörülmesi, yazılım mühendisliğinin zorlayıcı araştırma alanlarından biridir. Bir bileşenin güvenlik açığı eğilimi hakkında önceden bilgi sahibi olmak, test çabasını ve süreyi önemli ölçüde azaltabilir. Yazılım güvenlik açıklarının belirlenmesi ve sınıflandırılması geliştiricilere yazılımın geliştirilmesinde doğru karar verme noktasında yardımcı olacaktır. Bu sebeple yazılımlarda tespit edilen açıklar çok uzun zamandır veri tabanlarına kaydedilmektedir. Farklı araştırma grupları tarafından pek çok veri tabanı oluşmuştur. Bu çeşitlilik her veri tabanına kendi içinde avantajlar ve dezavantajlar sağlamıştır. Bu çalışmada araştırmacıların çalışmalarında hangi veri tabanını kullanacaklarına karar vermelerine yardımcı olmak ve literatürde kullanılan en güncel ve erişime açık olanların sistematik bir listesi oluşturulmuştur. Yazılım güvenlik açığı tespiti ve sınıflandırmasında kullanan birçok farklı veri tabanının incelenmesi ve karşılaştırması yer almaktadır. Çalışmanın sonunda sonuçlar sunulmuş ve gelecekteki çalışmalar için yönlendirici tavsiyeler verilmiştir.Öğe Yazılım Güvenlik Açıklarının Skorlanması Ve Kategorisinin Belirlenmesinde Yeni Bir Yöntem(2022) Kekül, Hakan; Ergen, BurhanYazılım güvenlik açıkları, şahıslar, şirketler ve ülkeler için finansal risklere ve itibar kayıplarına neden olabilmektedir. Yazılım güvenlik açıklarının giderilmesi, test kaynaklarının yetersizliği ve uzman personel eksikleri nedeni ile istenilen seviyede değildir. Kurumların itibarlarını korumak ve güvenli yazılımlar geliştirmek adına sınırlı kaynaklarını doğru kullanarak, test ve düzeltmeleri planlamaları gerekmektedir. Ancak güvenlik vektörlerinin sahip olduğu metrik değerlerinin tespit edilmesi manuel bir işlem olarak insanlar tarafından yapılmaktadır. Bu nedenle bu süreç, zaman almakta ve insanın doğasından kaynaklanan hatalar barındırabilmektedir. Bu metrikler güvenlik açığı önem derecelerinin hesaplanmasında kullanılmasından dolayı önemlidir. Güvenlik açığı analizi ve keşfi işlemlerinin kalitesini artırmak ve süreçleri hızlandırmak için makine öğrenmesi algoritmalarının ve veri madenciliği tekniklerinin kullanılması gerekmektedir. Ancak bu alanda yapılan çalışmalar hala sınırlıdır. Bu çalışmada doğal dil işleme tekniklerinden Bag of Words, Term Frequency Inverse Document Frequency, Ngram, Word2Vec, Doc2Vec ve FastText özellik çıkarımı yöntemleri kullanılarak güvenlik açığı vektörlerinin farklı çok sınıflı sınıflandırılma algoritmaları ile tahmini gerçekleştirilmiştir. Elde edilen metrik değerleri ile güvenlik açığı önem skorları hesaplanmıştır. Sınıflandırma aşamasında Naive Bayes, Desicion Tree, K-Nearest Neighbors, Multi-layer Perceptron ve Random Forest algoritmaları kullanılmıştır. Kamuya açık büyük bir veri setini kullandığımız deneyler, değerlendirmeyi kolaylaştırır ve yazılım güvenlik açığı vektörlerinin sınıflandırılmasında standartlara uygun bir tahmin modeli sunar. Elde edilen sonuçlar çok olasılıklı ve tahmini zor bir problemde farklı tekniklerin ve sınıflandırma algoritmalarının birlikte kullanımının umut verici olduğunu göstermektedir. Ayrıca çalışmamız, kullandığı veri boyutu ve henüz üzerinde pek çalışılmamış güvenlik açığı skorlama sistemi versiyonlarını kapsaması bakımından alanında önemli bir boşluğu doldurmaktadır.Öğe Yüz tanıma uygulamalarında özyüzler ve yapay sinir ağlarının karşılaştırılması(Cumhuriyet Üniversitesi, 2017) Kekül, Hakan; Bircan, HüdaverdiBu tez çalışması ile yüz tanımanın iki temel metodu görünüm ve öznitelik tabanlı yöntemlerin modellenerek karşılaştırılması ve iki metodun yüz tanıma sistemlerinde farklı alternatifler oluşturacak şekilde modellenmesi amaçlanmıştır. Bu amaçla görünüm tabanlı yöntem için özyüzler ve öznitelik tabanlı yöntem için ise yapay sinir ağları kullanılmıştır. Özyüzler ve yapay sinir ağları için farklı veri tabanları kullanılarak sistemler eğitilmiş ve test verileri ile ağların sonuçları karşılaştırılmıştır. Farklı durumlardaki tanıma performansları ve yüz tanıma probleminin zorlukları karşısındaki başarımları değerlendirilmiştir. İki sistemin farklı durumlar için birbirinin alternatifi olabileceği belirlenmiştir.