This is a Demo Server. Data inside this system is only for test purpose.
 

Automatic, fast and accurate sequence decontamination

dc.contributor.advisor Allmer, Jens en_US
dc.contributor.advisor Tekir, Selma en_US
dc.contributor.author Bağcı, Caner
dc.date info:eu-repo/date/embargoEnd/2019-08-15
dc.date.accessioned 2023-11-13T09:48:41Z
dc.date.available 2023-11-13T09:48:41Z
dc.date.issued 2016-07
dc.department Bioengineering en_US
dc.description Thesis (Master)--Izmir Institute of Technology, Biotechnology, Izmir, 2016 en_US
dc.description Full text release delayed at author's request until 2019.08.15 en_US
dc.description Includes bibliographical references (leaves: 31-39) en_US
dc.description Text in English; Abstract: Turkish and English en_US
dc.description xi, 44 leaves en_US
dc.description.abstract The introduction of massively parallel sequencing technologies was a revolutionary step in genomics. Their decreasing cost and powerful features have put them more and more on demand in the last decade. It is now possible to sequence even complete genomes of organisms, using massively parallel sequencing technologies even for small laboratories around the world. However, the power of this powerful technology comes with its challenges. The challenges are both in technological and computational side of the work. In this work, one of these computational challenges is addressed and a novel algorithm is offered to solve the problem. Sequencing by synthesis is one of the methods used in many different massively parallel sequencing instruments. This method utilizes the biological process of DNA replication and with the help of different means of detection, it allows sequencing a DNA molecule while it is replicated. Since DNA polymerase requires a primer to start the replication reaction, short oligonucleotide adapters are used in sequencing by synthesis methods to initiate the reaction. However, certain circumstances allow these adapters to contaminate final sequence reads. Several tools have been offered to trim adapters from reads; but all depend on the prior knowledge of the adapter sequence by the bioinformatician. In this work, an algorithm is offered to detect and trim adapters only using the sequences of reads, without relying on prior knowledge of adapter sequences. The algorithm was shown to perform better or on the same grounds with existing methods in terms of speed and efficiency. en_US
dc.description.abstract Kitlesel parallel dizileme yöntemlerinin ortaya çıkışı genomik alanında devrim niteliğinde bir adım oldu. Giderek düşen fiyatları ve güçlü özellikleri bu yöntemleri her geçen gün daha ilgi çekici hale getirdi. Günümüzde bu yöntemlerin kullanımı, dünya çapında küçük laboratuvarların bile genom düzeyinde dizileme yapabilmesine olanak sağlamaktadır. Ancak bu yöntemin de güçlü özellikleri yanında bazı problemleriyle geliyor. Bu problemler hem teknolojik, hem de bilişimsel alanlardadır. Bu çalışmada, bu bilişimsel problemlerden biri ele alınmış ve çözümü için yeni bir algoritma önerilmiştir. Sentez ile sekanslama, bir çok kitlesel parallel sekanslama aletinde kullanılan yaygın bir yöntemdir. Bu yöntem biyolojik DNA kopyalanması reaksiyonunu kullanarak, değişik algılama yöntemleriyle DNA dizilimesi yapmayı sağlar. DNA polimeraz enzimi kopyalama reaksiyonunu başlatabilmek için bir primer’e ihtiyaç duyduğu için, sentez ile sekanslama yöntemlerinde kısa adaptör sekansları kullanılır. Ancak bazı durumlar bu adaptörlerin sonuçta çıkan dizi okumalarını kontamine etmesine sebep olur. Bu dizileri temizlemek için çeşitli yöntemler önerilmiş olsa da, bunların hepsi adaptör dizilerinin önceden biliniyor olması varsayımı üzerine çalışır. Bu çalışmada, adaptör sekanslarını önceden herhangi bir bilgi olmadan sadece okumaların kendilerini kullanarak bulan ve temizleyen bir algoritma önerilmektedir. Algoritmanın hız ve etkinlik açısından, var olan yöntemlerden daha iyi veya eşit düzeylerde olduğu gösterilmiştir. en_US
dc.description.sponsorship TUBITAK grant number 113E326 en_US
dc.identifier.citationreference Bağcı, C. (2016). Automatic, fast and accurate sequence decontamination. Unpublished master's thesis, İzmir Institute of Technology, İzmir, Turkey en_US
dc.identifier.uri http://standard-demo.gcris.com/handle/123456789/5480
dc.institutionauthor Bağcı, Caner
dc.language.iso en en_US
dc.oaire.dateofacceptance 2016-01-01
dc.oaire.impulse 0
dc.oaire.influence 2.9837197E-9
dc.oaire.influence_alt 0
dc.oaire.is_green false
dc.oaire.isindiamondjournal false
dc.oaire.keywords Genetics
dc.oaire.keywords Genetik
dc.oaire.keywords Biyoteknoloji
dc.oaire.popularity 1.3486456E-9
dc.oaire.popularity_alt 0.0
dc.oaire.publiclyfunded false
dc.publisher Izmir Institute of Technology
dc.relation.publicationcategory Tez en_US
dc.request.email canerbagci90@gmail.com
dc.request.fullname Caner Bağcı
dc.rights info:eu-repo/semantics/openAccess en_US
dc.subject Molecular biology en_US
dc.subject Biotechnology en_US
dc.subject Bioinformatics en_US
dc.subject Next generation sequencing en_US
dc.subject DNA sequencing en_US
dc.title Automatic, fast and accurate sequence decontamination en_US
dc.title.alternative Otomatik, hızlı ve doğru dizi dekontaminasyonu en_US
dc.type Master Thesis en_US
dspace.entity.type Publication

Files

Collections