Open-Source-Plattform Galaxy ermöglicht frei zugängliche Genominformationen zum Coronavirus COVID-19

26.02.2020

Ein Forscherteam aus Freiburg, Belgien, Australien und den USA haben die bisher verfügbaren Daten zu Sequenzen des neuartigen Coronavirus überprüft und auf der Open-Source-Plattform Galaxy veröffentlicht. Die Bioinformatiker wollen damit den Datenaustausch zwischen den Behörden, Instituten und Laboren, die sich mit dem Virus beschäftigen, vereinfachen. Ihr Vorgehen und die Ergebnisse haben die Forschenden auf dem Portal bioRxiv dokumentiert.

Die Plattform Galaxy eignet sich zur Analyse von Big Data in den Lebenswissenschaften. Über öffentliche Server erhalten Wissenschaftlerinnen und Wissenschaftler unter anderem freien Zugang zu Analysewerkzeugen und reproduzierbaren Auswertungsverfahren. In der Studie wurden alle bisher öffentlich verfügbaren COVID-19-Genomdaten mit Galaxy neu analysiert. In den bisherigen Veröffentlichungen habe es oft an Transparenz bezüglich der Datenanalyse gefehlt, so die Forscher. So enthalte beispielsweise nur eine von vier bis Anfang Februar publizierten Studien zum COVID-19-Genom eindeutige Angaben zu den verwendeten Rohdaten. Zudem waren die Analysen nicht gut dokumentiert und nicht reproduzierbar. Dadurch war es nicht möglich, die jeweiligen Aussagen nachzuvollziehen oder zu überprüfen.
Dem Team gelang es, auf die vorliegenden Sequenzen jeweils identische Arbeitsabläufe anzuwenden und mittels Galaxy öffentlich zugänglich zu machen. Forschenden steht damit nun weltweit über ein Netzwerk von Galaxy-Servern in Europa, den USA und Australien nicht nur die Auswertung der Daten, sondern gleichzeitig auch die wissenschaftliche Infrastruktur für eigene Analysen von COVID-19-Daten zur Verfügung. Damit lassen sich in Zukunft neuveröffentlichte Daten innerhalb von Stunden neu analysieren und mit den bisherigen Daten vergleichen. Eine globale Zusammenarbeit, die für die Bewältigung von Notfällen im Bereich der öffentlichen Gesundheit wie dem Ausbruch von COVID-19 notwendig ist, erfordert schließlich einen ungehinderten Zugang zu Daten, Analysewerkzeugen und zur Berechnungsinfrastruktur.“

Galaxy wurde an der US-amerikanischen Penn State University initiiert und an der Universität Freiburg im Sonderforschungsbereich „Medizinische Epigenetik“ sowie als Teil des Deutschen Netzwerks für Bioinformatik-Infrastruktur (de.NBI) weiterentwickelt. Der Europa-Server befindet sich im Rechenzentrum der Universität Freiburg und ist als Community-Projekt angelegt. Die Daten sind online frei zugänglich. Wissenschaftler, die den Server nutzen möchten, brauchen keine Kenntnisse im Programmieren: Alle Einstellungen lassen sich über eine grafisch aufbereitete Oberfläche vornehmen.

Weiterlesen:

https://www.biorxiv.org/content/10.1101/2020.02.21.959973v1

  
Galaxy-Projekt

https://usegalaxy.eu