fCGR yöntemi ile DNA dizi benzerliği için transfer öğrenme modellerinin kullanılması

dc.contributor.authorDelibaş, Emre
dc.date.accessioned2025-05-04T16:20:57Z
dc.date.available2025-05-04T16:20:57Z
dc.date.issued2025
dc.departmentSivas Cumhuriyet Üniversitesi
dc.description.abstractDNA dizilerinin benzerlik analizi, evrimsel ilişkilerin anlaşılması ve genetik mutasyonların belirlenmesi açısından kritik bir konudur. Geleneksel hizalama tabanlı yöntemler yüksek hesaplama maliyetine sahip olduğundan, bu çalışmada hizalamadan bağımsız DNA benzerlik analizi için transfer öğrenme modellerinin uygulanabilirliği incelenmiştir. DNA dizileri, Frequency Chaos Game Representation (fCGR) yöntemiyle görselleştirilmiş ve ResNet50, EfficientNetB0, MobileNet modelleriyle özellik çıkarımı yapılmıştır. Cosine similarity, Euclidean distance ve correlation gibi üç benzerlik metriği ve dört farklı hiyerarşik kümeleme yöntemi karşılaştırılmıştır. Sonuçlar, cosine similarity metriğinin genetik benzerlikleri daha iyi yansıttığını göstermektedir. MobileNet, hafif yapısı ve verimli özellik çıkarımıyla en yüksek doğruluk oranını sunmuştur. PCA ile görselleştirilen özellik vektörleri güçlü kümelenme eğilimleri sergilemiş ve referans filogenetik ağaçlarla uyum göstermiştir. Çalışma, transfer öğrenmenin genetik analizlerde uygulanabilirliğini ortaya koyarak ölçeklenebilir ve biyolojik olarak anlamlı analizler yapılabileceğini göstermektedir.
dc.description.abstractSimilarity analysis of DNA sequences is a critical issue for understanding evolutionary relationships and identifying genetic mutations. Since traditional alignment-based methods have high computational costs, this study investigated the applicability of transfer learning models for alignment-independent DNA similarity analysis. DNA sequences were visualized with the Frequency Chaos Game Representation (fCGR) method and feature extraction was performed with ResNet50, EfficientNetB0, and MobileNet models. Three similarity metrics such as cosine similarity, Euclidean distance, and correlation and four different hierarchical clustering methods were compared. The results show that cosine similarity metric reflects genetic similarities better. MobileNet provided the highest accuracy rate with its lightweight structure and efficient feature extraction. Feature vectors visualized with PCA exhibited strong clustering tendencies and were in agreement with reference phylogenetic trees. The study demonstrates the applicability of transfer learning in genetic analyses and shows that scalable and biologically meaningful analyses can be performed.
dc.identifier.doi10.28948/ngumuh.1575701
dc.identifier.doihttps://doi.org/10.28948/ngumuh.1575701
dc.identifier.endpage531
dc.identifier.issn2564-6605
dc.identifier.issue2
dc.identifier.startpage516
dc.identifier.urihttps://hdl.handle.net/20.500.12418/31498
dc.identifier.volume14
dc.institutionauthorDelibaş, Emre
dc.language.isoen
dc.publisherNiğde Ömer Halisdemir Üniversitesi
dc.relation.ispartofNigde Omer Halisdemir University Journal of Engineering Sciences
dc.relation.publicationcategoryMakale - Ulusal Hakemli Dergi - Kurum Öğretim Elemanı
dc.rightsinfo:eu-repo/semantics/openAccess
dc.snmzKA_DergiPark_20250504
dc.subjectDNA dizi benzerliği
dc.subjectTransfer öğrenme
dc.subjectOtomatik özellik çıkarımı
dc.subjectfCGR
dc.titlefCGR yöntemi ile DNA dizi benzerliği için transfer öğrenme modellerinin kullanılması
dc.title.alternativeUsing transfer learning models for DNA sequence similarity via fCGR method
dc.typeResearch Article

Dosyalar

Koleksiyon