Die Universität zu Lübeck hat bereits weltweit beachtete Erfolge bei der Erforschung von COVID-19 erzielt. Ein Team aus dem Institut für Neuro- und Bioinformatik hat nun die weltweit besten Erkennungsraten auf öffentlich verfügbaren COVID-19 CT-Datensätzen mit Deep Learning nochmals deutlich steigern können.
Die Diagnose einer SARS-CoV-2 Infektion erfolgt üblicherweise über einen biomolekularen PCR-Test. Dabei wird das Erbgut des Virus durch eine kontrollierte Vervielfältigung desselben nachgewiesen. Leider können dabei in der Regel mehr als 24 Stunden vergehen. Wird im Einzelfall eine sehr schnelle Diagnose benötigt oder kommt es insbesondere in anderen Ländern zu Engpässen in der Versorgung mit Tests, werden die Nachteile des PCR-Tests deutlich. Es scheint sinnvoll, nach alternativen Testverfahren für Ausnahmesituationen zu suchen. Eine gute Grundlage hierfür bieten CT-Scans der Lunge, auf denen krankheitsbedingte Abnormalitäten durch geschulte Radiologen festgestellt werden können. Um zu erforschen, wie Radiologen bei der Auswertung großer Mengen an CT-Scans unterstützt werden können, haben Herr Alshazly (PHD), Herr Linse, Professor Barth und Professor Martinetz verschiedene Deep Learning Verfahren untersucht, um CT-Scans von COVID-19 Patienten von solchen mit anderen Lungenerkrankungen automatisiert zu differenzieren und COVID-19 bedingte Abnormalitäten in der Lunge zu lokalisieren.
Die Menge an öffentlich verfügbaren CT-Bildern sind zurzeit noch limitiert. Daher lag die Herausforderung vor allem in der kleinen Menge an Scans und auch den unterschiedlichen Bedingungen, wie die Bilder aufgenommen wurden. Die Heterogenität der Bilder wird bestimmt durch die unterschiedlichen verwendeten Aufnahmegeräte und die unterschiedlichen Orte, wo die Scans durchgeführt wurden, was ein hohes Maß an Rauschen erzeugt. Um trotz dieser Heterogenität ein robustes Klassifikationssystem zu entwickeln, kam es bei der Arbeit auf eine neue Art der Vorverarbeitung der Daten an. Die unterschiedlich großen CT-Scans wurden in eine "digitale Leinwand" eingebettet, deren Größe für jede Netzwerkarchitektur spezifisch gewählt und mittels verschiedener Bildtransformationen modifiziert wurde. Somit konnten die bisher höchsten Genauigkeiten auf den genutzten Testdatensätzen nochmals deutlich übertroffen werden. Anschließend wurden die Bereiche innerhalb der CT-Scans eingegrenzt, die zur Diagnoseentscheidung der Algorithmen am meisten beigetragen hatten. Ein Beispiel dafür sehen Sie hier dargestellt in Form einer Heatmap. Tatsächlich entsprachen diese Bereiche denen, die von Radiologen als Abnormalitäten bestimmt worden waren.
Um Radiologen einen Nutzen zu bringen, müssen die verfügbaren Datensätze noch umfangreicher auch andere Lungenerkrankungen beinhalten, gegen die COVID-19 abgegrenzt werden muss. Entsprechende Datensätze werden derzeit in einem großen deutschen Konsortium von Radiologen erstellt.
Die Publikation dazu finden Sie hier: (Link https://arxiv.org/pdf/2011.05317.pdf)