This is a Demo Server. Data inside this system is only for test purpose.
 

Development of a unified analysis framework for multicolor flow cytometry data based on quasi-supervised learning

dc.contributor.advisor Karaçalı, Bilge en_US
dc.contributor.author Köktürk Güzel, Başak Esin
dc.date.accessioned 2023-11-16T12:14:20Z
dc.date.available 2023-11-16T12:14:20Z
dc.date.issued 2017-07
dc.department Electrical and Electronics Engineering en_US
dc.description Thesis (Doctoral)--Izmir Institute of Technology, Electronics and Communication Engineering, Izmir, 2017 en_US
dc.description Full text release delayed at author's request until 2019.08.10 en_US
dc.description Includes bibliographical references (leaves: 89-93) en_US
dc.description Text in English; Abstract: Turkish and English en_US
dc.description.abstract In this dissertation, automatic compensation and gating strategies are investigated for multi-color flow cytometry data analysis. We propose two clustering algorithms that combine the quasi-supervised learning algorithm with an expectation-maximization routine for automatic gating. The quasi-supervised learning algorithm estimates the posterior probabilities of the different cell populations at each sample in a dataset in a manner that does not involve fitting a parametric model to the data. We have developed two different binary divisive clustering algorithms based on expectation maximization with responsibility values calculated using the quasi-supervised learning algorithm instead of the probabilistic models used in conventional expectation maximization applications. Our clustering algorithms determine the number of clusters in run-time by measuring the overlap between the estimated clusters in each provisional division and comparing it with the previous one to determine whether the division is warranted or not. Since this type of clustering is indifferent to the underlying distribution of dataset, it is well suited to automatic flow cytometry gating. The second clustering algorithm improves upon the first one using a simulated annealing approach. Its iterative structure allows finding the global minimum of a cost functional that achieves the best separation point by gradually smoothing the decision regions in each iteration. Finally, we have developed a joint diagonalization and clustering method for automatic compensation of flow data based on the methods above. The proposed method identifies cell sub groups using the annealing-based model-free expectation-maximization algorithm and finds a data transformation matrix that achieves orthogonality of the covariance structure of each identified cell cluster using fast Frobenius diagonalization. We have tested all proposed algortihms on both synthetically created datasets and real multi-color flow cytometry datasets. The results show that our automated gating algorithms are very successful in identifying the distinct cell groups so long as there is enough statistical evidence for their presence. In addition, the automated compensation procedure was also successfully applied on the synthetically created dataset and real multi-color flow cytometry data of lymphocytes that are a low autofluorescence cell group. However, the automated compensation algorithm needs further study to be generalized to high autofluorescence cell types where proper compensation does not necessarily coincide with an orthogonal covariance structure. en_US
dc.description.abstract Bu tezde, çok renkli akış sitometri veri analizi için otomatik kompensasyon ve kapılama stratejileri incelenmiştir. Otomatik kapılama için yarı-güdümlü öğrenme algoritmasını ve beklenti en iyileme rutinini birleştirerek iki gruplama algoritması önerilmiştir. Yarı-güdümlü öğrenme algoritması veriye parametrik bir model uydurmadan, her bir örnekteki farklı hücre popülasyonlarının sonsal olasılıklarını tahmin eder. Sorumluluk değerleri konvansiyonel beklenti en iyileme uygulamalarında kullanılan olasılık modelleri yerine, yarı-güdümlü öğrenme algoritması ile hesaplanarak beklenti en iyilemeye dayalı iki tane ikili kümeleme algoritması geliştirilmiştir. Kümeleme algoritmalarımız, her bir geçici bölünmede tahmini kümeler arasındaki örtüşmeyi ölçerek ve bu örtüşmeyi bir önceki ile karşılaştırarak, bölünmenin doğru olup olmadığı belirler ve böylelikle işleyiş sürecinde küme sayısını belirler. Bu tür kümeleme, veri kümesinin altında yatan dağılıma kayıtsız olduğundan, otomatik akış sitometri kapılaması için uygundur. İkinci kümeleme algoritması benzetimli tavlama yaklaşımını kullanarak ilk kümeleme algoritmasını geliştirmiştir. Benzetimli tavlama yaklaşımının tekrarlayıcı yapısı bir maaliyet fonksiyonun global minimumunu bulmayı sağlar ve biz bu yaklaşımı karar bölgelerini her tekrarda kademeli olarak yumuşatarak en iyi ayrışma noktasını bulmak için kullandık. Son olarak, yukarıdaki kapılama yöntemlerine dayalı olarak akış verisinin otomatik olarak kompensasyonu için bir ortak köşegenleştirme ve kümeleme yöntemi geliştirdik. Kompensasyon, farklı florokrom kanalları arasındaki spektral yayılımı gidermek için kullanılan bir prosedürdür. Önerilen yöntem, hücre alt gruplarını tavlama temelli modelden bağımsız beklenti en iyileme algoritması kullanarak tanımlamakta ve tanımlanan her bir hücre kümesinin kovaryans yapısının dikkenliğini, hızlı Frobenius kös¸egenleştirme yöntemini kullanarak elde eden bir veri dönüşüm matrisi bularak sağlamaktadır. Önerilen algoritmaları sentetik olarak oluşturulan veri kümeleri ve gerçek çok renkli akış sitometrisi veri kümeleri üzerinde test edilmiştir. Sonuçlar, otomatik kapılama algoritmalarımızın yeterli istatistiksel kanıtı olduğu sürece farklı hücre gruplarını tanımada çok başarılı olduğunu göstermektedir. Buna ek olarak, otomatik kompensasyon prosedürü, başarılı bir şekilde sentetik olarak oluşturulmuş veri setine ve gerçek düşük otofloresanslı lenfosit hücre gruplarına başarıyla uygulanmıştır, ancak, dikgen kovaryans matrisinin geçerli olmadığı yüksek otofloresanslı hücre türlerine genellenebilmesi için daha fazla bir çalışmaya ihtiyaç duyulmaktadır en_US
dc.format.extent xi, 93 leaves en_US
dc.identifier.citationreference Köktürk Güzel, B. E. (2017). Development of a unified analysis framework for multicolor flow cytometry data based on quasi-supervised learning. Unpublished doctoral dissertation, İzmir Institute of Technology, İzmir, Turkey en_US
dc.identifier.uri http://standard-demo.gcris.com/handle/123456789/6390
dc.institutionauthor Köktürk Güzel, Başak Esin
dc.language.iso en en_US
dc.oaire.dateofacceptance 2017-01-01
dc.oaire.impulse 0
dc.oaire.influence 2.9837197E-9
dc.oaire.influence_alt 0
dc.oaire.is_green false
dc.oaire.isindiamondjournal false
dc.oaire.keywords Elektrik ve Elektronik Mühendisliği
dc.oaire.keywords Flow cytometry
dc.oaire.keywords Electrical and Electronics Engineering
dc.oaire.popularity 1.5427726E-9
dc.oaire.popularity_alt 0.0
dc.oaire.publiclyfunded false
dc.publisher Izmir Institute of Technology en_US
dc.relation.publicationcategory Tez en_US
dc.request.email posta@basakesin.net
dc.request.fullname Başak Esin Köktürk Güzel
dc.rights info:eu-repo/semantics/openAccess en_US
dc.subject Flow cytometer en_US
dc.subject Biomedical signals en_US
dc.subject Biomedical data analysis en_US
dc.subject Hierarchical clustering en_US
dc.subject Quasi-supervised learning en_US
dc.title Development of a unified analysis framework for multicolor flow cytometry data based on quasi-supervised learning en_US
dc.title.alternative Çok renkli akış sitometrisi verileri için yarıgüdümlü öğrenme temelli tümleşik bir analiz platformu geliştirilmesi en_US
dc.type Doctoral Thesis en_US
dspace.entity.type Publication

Files

Collections