DiversityScanner

KI-basierte Robotik hilft bei der Entdeckung kleiner wirbelloser Tiere

Studien zur Biodiversität, bei denen eine große Anzahl von Exemplaren analysiert wird, werden in einem größeren Umfang als je zuvor veröffentlicht. Die Forschungsobjekte, vor allem Insekten, werden häufig mit Malaise-Fallen gefangen. Diese Fallen wurden von dem schwedischen Entomologen Rene Malaise zum Sammeln von Sägefliegen erfunden, sind aber auch für andere Insekten, insbesondere für fliegende Insekten wie Diptera und Hymenoptera, sehr effizient. Da die Fallen rund um die Uhr in Betrieb sind, können sie enorme Mengen von Hunderten bis Tausenden von Exemplaren während eines 1-2-wöchigen Sammelzeitraums für eine einzige Falle sammeln. Mit mehreren Fallen, die in einem Lebensraum aufgestellt werden, um lokale Variationen zu berücksichtigen, und die über mehrere Jahreszeiten hinweg in Betrieb sind, um zeitliche Variationen in der Insektenvielfalt und -abundanz zu berücksichtigen, kann eine nahezu vollständige Stichprobe der Artenvielfalt von Insekten an einem bestimmten Ort gewonnen werden.

Die Analyse von Organismen aus Malaise-Fallenproben erfordert in erster Linie zwei wichtige Schritte: die Trennung einzelner Exemplare von den Sammelproben, die Tausende von oft kleinen Insekten wie winzige parasitische Wespen oder Fliegen und Mücken enthalten. Der zweite Schritt ist ihre Identifizierung, d. h. die Zuordnung zu bekannten Arten. Herkömmliche Verfahren und Techniken, mit denen versucht wird, Insekten und andere Arthropoden aus Malaise-Fallenproben zu erfassen, litten unter dem Problem der Skalierbarkeit und erlaubten nur die Nutzung eines kleinen Teils der Proben (und damit der Arten). Jeder Versuch, die Vielfalt vollständig zu erforschen, würde an der schieren Menge der Insekten scheitern, selbst bei nur einer einzigen Sammelprobe. Davon abgesehen, dass der Arbeitsaufwand für die Bearbeitung sehr hoch ist, kann die überwiegende Mehrheit der in einer Probe enthaltenen Exemplare, insbesondere bei sehr artenreichen Gruppen wie den Zweiflüglern (Diptera hymenoptera), aufgrund des gravierenden Mangels an Taxonomen nicht einer bekannten Art zugeordnet werden. Dies gilt selbst für Länder wie Deutschland mit einer mehr als 200-jährigen taxonomischen Geschichte, und in bestimmten Dipterengruppen warten noch Hunderte oder sogar Tausende von Arten auf ihre Entdeckung und Dokumentation.

DNA-Barcoding dient der Entdeckung und Überwachung der biologischen Vielfalt

Für die Identifizierung unbekannter Tierexemplare und die Entdeckung unbekannter Arten ist DNA-Barcoding zum De-facto-Standard geworden. Und die Methode ist skalierbar. Das Zentrum für Biodiversitätsgenomik in Guelph, Kanada, hat weltweit etwa 10 Millionen Exemplare von über 700 000 Arten verarbeitet. Ein neues globales Projekt namens BIOSCAN zielt darauf ab, 10 Millionen Exemplare mit Strichcodes zu versehen und die Strichcodeabdeckung für zwei Millionen Arten zusammenzustellen. Andere technologische Ansätze zielen darauf ab, den Sequenzierungsprozess zu vereinfachen, indem die erforderliche Laborausrüstung und die Kosten minimiert werden, wodurch die Schwelle für die Verwendung von DNA-Barcoding als Methode der Wahl für die Identifizierung, Entdeckung und Überwachung von Arten gesenkt wird, was ein Minimum an Ressourcen und Fachwissen erfordert.

Während die Sequenzierungstechnologie weiterhin rasante Fortschritte macht, stellt die Vorbereitung von Exemplaren aus Massenproben immer noch ein großes Hindernis bei groß angelegten Biodiversitätsprojekten dar, bei denen Massensammelgeräte wie Malaise-Fallen eingesetzt werden. Es gibt zwar Versuche, dieses Problem zu umgehen, nämlich durch das Metabarcoding, aber diese Methode hat mehrere Nachteile, darunter eine unvollständige Abdeckung aufgrund von Primer-Verzerrungen und/oder aufgrund geringer DNA-Konzentrationen bei seltenen Arten. 

DiversityScanner – automatisierte Sortierung kleinerer Insekten mittels Methoden der künstlichen Intelligenz

Die Sortierung von Proben aus Malaise-Fallen ist äußerst arbeitsintensiv und erfordert das Fachwissen von ausgebildeten Taxonomen. Da dieses Problem bei jedem groß angelegten Biodiversitätsprojekt immer noch eine Schlüsselrolle spielt, haben sich Entomologen und Spezialisten für maschinelles Lernen zusammengetan, um Abhilfe zu schaffen. Der Biodiversitätsforscher Rudolf Meier des Museums für Naturkunde in Berlin und die Gruppe von Christian Pytuliak des Karlsruher Instituts für Technologie entwickelten in Zusammenarbeit mit Entomologen der Zoologischen Staatssammlung München und der Sapienza Universität Roms den DiversityScanner“, einen Roboter zur automatisierten Sortierung von Kleininsekten in verschiedene Klassen mittels künstlicher Intelligenz. 

Der DiversityScanner ist in der Lage, einzelne Insekten aus Proben zu entnehmen und diese zu fotografieren. Ein Computer verwendet dann eine Art künstliche Intelligenz, bekannt als maschinelles Lernen, um die Flügel, Antennen, Beine und andere Eigenschaften jedes Individuums mit bekannten Exemplaren zu vergleichen. Je wärmer die Farbe, z.B. rot, desto wichtiger sind die Körperteile für die Identifizierung. In einem weiteren Schritt wird jedes Insekt einzeln auf eine Platte mit 95 Wells übertragen. Die Proben können dann genetisch analysiert werden, wobei für jedes Insekt ein „DNA-Barcode“ generiert wird, der darauf mit bekannten Arten in einer öffentlichen Referenzdatenbank abgeglichen wird.

Die Genauigkeit des Roboters liegt derzeit bei ca. 91%, d. h. etwa 9 von 10 Insekten werden richtig klassifiziert. Laut den Forschern, die ihre Studie kürzlich auf dem Preprint-Server bioRxiv veröffentlicht haben, lässt sich die Genauigkeit verbessern, wenn für das Training des Roboters mehr Proben zur Verfügung stehen. Die DiversityScanner-Software und 3D-Druckpläne wurden inzwischen öffentlich zugänglich gemacht.

Ein großer Vorteil des DiversityScanners ist seine Skalierbarkeit. Er befasst sich somit mit einem der Hauptprobleme von Biodiversitätsstudien, die sich mit großen Mengen von Exemplaren und Arten befassen, darunter viele Insekten, die keiner bekannten Art zugeordnet werden können, entweder aufgrund von fehlender taxonomischer Expertise oder, weil diese Exemplare zu Arten gehören, die es noch zu entdecken gilt. Die Identifizierung von Organismen durch DNA-Barcoding ist inzwischen schnell, zuverlässig und kostengünstig geworden. Der DiversityScanner hat das Potential, die Aufgabe des Sortierens in einem ähnlichen Umfang zu beschleunigen.

German Barcode of Life – GBOL III: Dark Taxa

Obwohl bei der Zusammenstellung der genetischen Referenzdatenbank für deutsche Tiere große Fortschritte gemacht wurden, sind viele Arten, insbesondere Insekten, bisher nicht in der genetischen Referenzdatenbank enthalten. Das neue Projekt ‘GBOL: Dark Taxa’ soll diesbezüglich helfen und konzentriert sich auf unbekannte Arten, sogenannte dark taxa“, die mehrere Gruppen megadiverser und wenig bekannter Insektengruppen von Diptera und parasitoiden Hymenoptera umfassen. Das vom Bundesministerium für Bildung und Forschung (BMBF) geförderte dreijährige Projekt widmet sich der Entdeckung unbekannter Arten, sogenannter dark taxa“, in unserer heimischen Fauna mit einem integrativen taxonomischen Ansatz, einschließlich DNA-Barcoding.

GBOL III zielt darauf ab, einen Beitrag zur BIOSCAN-Initiative des Zentrums für Biodiversität auf globaler und nationaler Ebene zu leisten, indem es die Grundlagen für ein groß angelegtes Biomonitoring-System zur Erfassung der Biodiversität unseres Planeten schafft. In Zeiten steigender Temperaturen, zunehmender Wetterextreme und Eisrückgang sowie maßlosem Verlust an Biodiversität werden neue Technologien wie der DiversityScanner dringend benötigt, um die Hürden zu überwinden, auf die die Forschung bei der Erfassung und Überwachung der bis heute wenig bekannten oder gar unbekannten Artenvielfalt, stößt.

Referenzen

Wuehrl L, Pylatiuk C, Giersch M, Lapp F, von Rintelen T, Balke M, Schmidt S, Cerretti P, Meier R (2021) DiversityScanner: Robotic discovery of small invertebrates with machine learning methods. bioRxiv: 2021.05.17.444523. https://doi.org/10.1101/2021.05.17.444523. YouTube: https://youtu.be/ElJ5VSHa4OI

Science News (4 June 2921): Artificial intelligence could help biologists classify the world’s tiny creatures. doi:10.1126/science.abj8374

Morinière J, Balke M, Doczkal D, Geiger MF, Hardulak LA, Haszprunar G, Hausmann A, Hendrich L, Regalado L, Rulik B, Schmidt S, Wägele J, Hebert PDN (2019) A DNA barcode library for 5,200 German flies and midges (Insecta: Diptera) and its implications for metabarcoding‐based biomonitoring. Molecular Ecology Resources 19: 900–928. https://doi.org/10.1111/1755-0998.13022

Stefan Schmidt – ZSM