Yeni nesil dizileme sonucu üretilen genetik veriyi fastq, bam, vcf, bed ve excel formatlarında bulut tabanlı bir sistemde depolamayı ve bu veriye bir web uygulaması üzerinden hızlı ve kolay bir şekilde erişimi sağlayan uygulamanın geliştirilmesi.
İhtiyaç
Yeni Nesil Dizileme çıktısı olan ham genetik veri ve bu ham verinin analizi sırasında üretilen ara çıktılar büyük boyutlu dosyalar oluşturmaktadır. Genetik tanı hekimleri, ham dizileme verisi yanı sıra, analiz sürecindeki dosya dönüşümlerinde elde edilen formatların tümünü koruyarak yaptıkları genetik tanının kayıtlarını tutar, tek bir örneğin fastq, bam, vcf ve excel formatlarındaki sonuçlarını saklarlar.
Örneğin, sadece bir yürütme (Yeni Nesil Dizileme cihazının her bir çalışmasında kullanılan örnekler toplamı) sonucunda oluşan .fastq formatındaki ham verinin boyutu 40 GB’a kadar çıkabilmektedir. Bu verinin analizi sırasında oluşan .bam dosyasının boyutu da 10 GB kadar olabilmektedir.
Kurumların ellerinde bulundurduğu genetik veri toplamı kolaylıkla onlarca TB düzeyine ulaşmakta ve bu toplam her geçen gün katlanarak artmaktadır.
Bu boyuttaki verilerin kişisel bilgisayarlarda veya harici disklerde tutulması pratik olmadığı gibi, depolama alanının sürekli büyümesi, veri kaybı, veri güvenliği gibi sorunları beraberinde getirmektedir.
Mevcut internet altyapısı göz önüne alındığında, bu büyüklükteki dosyaların bulut ortamına direkt olarak yüklenmesi de başlı başına bir problemdir.
Çözüm
Dizileme ve analizler sonucu üretilmiş fastq, bam, vcf, bed, excel formatlarındaki genetik veriyi ve bu veriye ait (cinsiyet, hastalık semptomları, hastalığın ortaya çıktığı yaş gibi) fenodatayı, özel bir algoritma ile sıkıştıracak, ardından kullanıcının kendisinin belirleyeceği şifre ile şifreleyerek bulut ortamına yükleyecek, kullanıcının, tekrar erişmek istediğinde, dosyaları görüntülemesine, bilgisayarına indirmesine ve şifrelemeyi çözerek kullanmasına imkan verecek uygulama: GENE2STORE.