Detection of P53 consensus sequence: A novel string matching with classes algorithm

dc.contributor.buuauthorÖzcan, Gıyasettin
dc.contributor.departmentMühendislik Fakültesi
dc.contributor.departmentBilgisayar Mühendisliği Bölümü
dc.date.accessioned2020-08-13T06:50:15Z
dc.date.available2020-08-13T06:50:15Z
dc.date.issued2016-11-04
dc.description.abstractWe present a novel fast string matching technique for special DNA pattern forms and compare performance of recent CPU architectures on the matching problem. In particular, we consider consensus P53 DNA-binding consensus sequence, which has an important contribution for cancer treatment. Based on biological findings, consensus P53 pattern may emerge in various sequence forms and its length is not deterministic. Therefore, classic string matching algorithms are not able to solve the problem. For efficient solution, we consider bitwise string matching algorithms with classes and present a novel search technique which is based on 64-bit packed variables. In order to prevent obstacles based on variable length of the pattern, we search right and left side indexes of P53 and reduce search space. For experimental analysis, we make use of mus musculus DNA sequences with approximately 2.3 billion nucleotides. We compare algorithm performance on three processors with distinct CPU architecture. Test results show that our search technique introduces at least 20% efficiency during P53 pattern search in each architecture platform. Due to its structure, the algorithm also introduces an efficient solution to similar string matching with class problems.en_US
dc.description.abstractBu çalışmada özel DNA örüntüleri için yeni ve hızlı bir sekans eşleştirme tekniği sunulmakta ve yakın geçmişte üretilen CPU mimarileri üzerinde deneysel karşılaştırmalar yapılmaktadır. Bu çalışmada, bilhassa kanser tedavisinde, önemli bir yere sahip olan P53 DNA-bağlayan konsensüs sekansı göz önüne alınmıştır. Biyolojik kazanımlara göre P53 örüntüsü farklı sekans formlarında karşımıza çıkabilmekte ve sekans uzunluğu değişebilmektedir. Bu nedenle P53 sekansının klasik sekans eşleştirme algoritmaları ile çözümü mümkün olamamaktadır. Bu çalışmada verimli çözüm yöntemi sunmak amacıyla, sınıf özellikli bit-tabanlı sekans eşleştirme algoritması göz önüne alınmıştır. Hedef doğrultusunda, 64-bit paketlenmiş değişken kullanarak yeni bir arama ve eşleştirme algoritması önerilmiştir. Örüntü sekansının değişken uzunluk gösterebilmesi nedeniyle karşılaşılması muhtemel engelleri aşmak için ise veri tabanında P53 sekansının özel kısımlarına dair aramalar yapılmıştır. Deneysel analiz için yaklaşık 2.3 milyar nükleotidden oluşan mus musculus DNA sekansı seçilmiştir. Karşılaştırılan algoritmalar üç farklı bilgisayar mimarisinde test edilmiştir. Deneysel sonuçlar, geliştirdiğimiz algoritmanın P53 sekans arama konusunda tüm mimari platformlarında en iyi verimliliği sağladığını göstermektedir. Yapısı gereği bu algoritma, benzer sekans eşleştirme problemlerinin çözümünde de verimli olanaklar sunmaktadır.tr_TR
dc.identifier.citationÖzcan, G. (2016). "Detection of P53 consensus sequence: A novel string matching with classes algorithm". Uludağ Üniversitesi Mühendislik Fakültesi Dergisi, 21(2), 269-282.tr_TR
dc.identifier.endpage282tr_TR
dc.identifier.issn2148-4147
dc.identifier.issn2148-4155
dc.identifier.issue2tr_TR
dc.identifier.startpage269tr_TR
dc.identifier.urihttps://dergipark.org.tr/tr/download/article-file/261153
dc.identifier.urihttp://hdl.handle.net/11452/12173
dc.identifier.volume21tr_TR
dc.language.isoenen
dc.publisherUludağ Üniversitesitr_TR
dc.relation.journalUludağ Üniversitesi Mühendislik Dergisi / Uludağ University Journal of The Faculty of Engineeringtr_TR
dc.relation.publicationcategoryMakale - Uluslararası Hakemli Dergitr_TR
dc.rightsinfo:eu-repo/semantics/openAccessen_US
dc.subjectComputer engineeringen_US
dc.subjectComputational biologyen_US
dc.subjectText processingen_US
dc.subjectConsensus sequencesen_US
dc.subjectBitwise matchingen_US
dc.subjectHardware countersen_US
dc.subjectBilgisayar mühendisliğitr_TR
dc.subjectHesaplamalı biyolojitr_TR
dc.subjectMetin işlemetr_TR
dc.subjectKonsensüs dizileritr_TR
dc.subjectBitsel eşlemetr_TR
dc.subjectDonanım sayaçlarıtr_TR
dc.titleDetection of P53 consensus sequence: A novel string matching with classes algorithmen_US
dc.title.alternativeP53 konsensüs sekansının yakalanması: Sınıf özellikli yeni bir sekans eşleştirme algoritmasıtr_TR
dc.typeArticleen_US
local.contributor.departmentMühendislik Fakültesi/Bilgisayar Mühendisliği Bölümütr_TR

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
21_2_21.pdf
Size:
783.32 KB
Format:
Adobe Portable Document Format
Description:

License bundle

Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed upon to submission
Description: