Zum Hauptinhalt springen
03.07.2025

Museum für Naturkunde Berlin und KI-Ideenwerkstatt feiern Abschluss ihres Pilotprojekts

Wie lassen sich alte Sammlungsetiketten effizient digitalisieren? Das Museum für Naturkunde Berlin und die KI-Ideenwerkstatt präsentierten ihre Ergebnisse in einem Abschluss-Webinar.

Historische Sammlungsetiketten in naturkundlichen Archiven von Museen und Forschungsinstitutionen enthalten wertvolle Informationen. Sie lassen Rückschlüsse auf die Biodiversitätsentwicklung der letzten zwei bis drei Jahrhunderte zu. Diese Informationen digital zu erfassen und auszuwerten, ist eine Mammutaufgabe, aber der Einsatz von gut trainierter KI kann diesen Prozess deutlich beschleunigen und effizienter machen.

Mit Unterstützung durch die KI-Ideenwerkstatt für Umweltschutz hat das Museum für Naturkunde Berlin (MfN) im letzten Jahr eine KI-Pipeline entwickelt. Sie ermöglicht es, Sammlungsetiketten zu digitalisieren und deren Informationen zu extrahieren. In modularen Schritten werden Metadaten wie Fundort, Jahr, Sammler*innen oder Artnamen erfasst, geclustert und als PAGE-XML-Datei für weitere Verknüpfungen zur Verfügung gestellt. Der Code der KI-Pipeline ist ab sofort öffentlich zugänglich.

Internationales Interesse am Abschluss-Webinar

Das Interesse an den Projektergebnissen ist international sehr groß. Gemeinsam mit dem WiNoDa Knowledge Lab organisierten das Museum für Naturkunde und die KI-Ideenwerkstatt eine hybride Abschlussveranstaltung, zu der sich über 100 Teilnehmende aus aller Welt dazuschalteten, unter anderem aus Neuseeland, den Niederlanden, den USA sowie Chile und Finnland. 

Das englischsprachige Webinar bot Impulsvorträge aus dem Sammlungsmanagement und der KI-Anwendung. Es gab einen umfassenden Überblick über die Erkenntnisse aus dem Projekt KIEBIDS: KI-basierte Extraktion BIodiversitätsrelevanter Daten aus Schriftgut. Es folgte eine intensive Diskussion, die verdeutlichte, wie groß der Bedarf an KI-Unterstützung in der Sammlungserschließung weltweit ist. Am Nachmittag konnten Interessierte das Museum besuchen und an einer Führung durch die Schmetterlingssammlung teilnehmen.

Schmetterlinge in Sammlungsbox
Holotypus (=rotes Etikett) des Scrobigera albomarginata (1872) aus der Sammlung des Museum für Naturkunde Berlin.

Das Webinar im Überblick

Einblicke in die Arbeit der KI-Ideenwerkstatt

Reinhard Messerschmidt präsentierte als stellvertretender Auftragskoordinator die KI-Ideenwerkstatt. Die Pilotprojekte, zu denen auch KIEBIDS gehört, gingen 2025 in die zweite Runde. Aktuell betreut das Team die Pilotprojekte Robbenblick und Faszination nächtlicher Vogelzug.

Wie Sammlungsmanagement von KI-basierten Prozessen profitieren kann – und vice versa

In ihrem Impulsvortrag hob Franziska Schuster, Erschließungsmanagerin am MfN Berlin, hervor, welch besondere Herausforderung vor allem in handgeschriebenen historischen Sammlungsetiketten steckt. Ausgeblichene oder verwischte Tinte, Randnotizen, kopfübergeschriebene Wörter, kleine Zeichnungen, unterschiedliche Schriften und Alphabete (z.B. Sütterlin oder Kyrillisch) verschlechtern die Maschinenlesbarkeit enorm. Spezifisch trainierte KI-Modelle könnten helfen, die Fehlerquote deutlich zu senken.

Bildverarbeitung mit maschinellem Lernen

Phillip Lücking, fachlicher Projektmanager in der KI-Ideenwerkstatt, legte in seiner Präsentation den Fokus auf einen anderen wichtigen Aspekt im Sammlungsmanagement: die Bilderkennung und -verarbeitung mit Hilfe von KI. Welcher Pixel gehört zu welchem Objekt? Am Beispiel von Insektenkästen demonstrierte er, wie moderne Modelle Objekte erkennen, segmentieren und klassifizieren können. Er gab außerdem einen historischen Überblick über die Entwicklung neuronaler Netzwerke.

Insekten unter der Lupe: wie Sammlungen helfen können, biologische Fragen zu beantworten

Anhand von drei Beispielen zeigte Dr. Théo Léger, wissenschaftlicher Leiter der Sammlung Lepidoptera und Trichoptera am MfN Berlin, welchen Nutzen historische Sammlungsobjekte und Etiketten für die biologische Forschung haben können. Er stellte vor, wie sie zur Beschreibung neuer Arten beitragen (das Museum beherbergt viele Holotypen, anhand derer die Erstbeschreibung einer Art getätigt wurde), evolutionäre Veränderungen sichtbar machen oder Umweltanpassungen dokumentieren. Anhand von historischen Daten über 200 Jahre hinweg ließ sich etwa die Anpassung des Birkenspanners an seine Umwelt nachvollziehen: die industrielle Revolution sorgte für immer mehr verrußte Birkenrinden – woraufhin sich der Falter zunehmend mit dunklerer Flügelfärbung ausbreitete.

KIEBIDS: ein Pilotprojekt des Museums für Naturkunde Berlin und der KI-Ideenwerkstatt für Umweltschutz

Höhepunkt des Webinars war die umfassende Projektvorstellung von Dr. Christian Bölling, dem wissenschaftlichen Datenkurator am MfN Berlin. Er ordnete das Pilotprojekt in die Sammlungserschließung und -entwicklung des Hauses ein und hob die Wichtigkeit der KI-gestützten Informationsextraktion aus Etiketten hervor. Diese sind gleichermaßen Dokumentation und Basis für die Sammlungsforschung. Für ein Haus mit geschätzten 30 Millionen Sammlungsobjekten könnte der Zugang zu verborgenem Wissen dadurch deutlich verbessert werden. In seinem Vortrag beschrieb Dr. Christian Bölling die fünf Module der KI-Pipeline ausführlich und verdeutlichte, dass es für eine effektive Nutzung der KI vor allem standardisierte Rahmenbedingungen braucht.

Fragen aus der Community

An der anschließenden Diskussion beteiligten sich zahlreiche Fachleute aus internationalen Einrichtungen, darunter das Leibniz-Institut zur Analyse des Biodiversitätswandels, der Royal Botanic Garden Edinburgh, das Naturalis Biodiversitätszentrum und Museum in Leiden oder auch das Oxford University Museum of Natural History. Sie stellten u.a. Fragen zum Digitalisierungsaufwand in Hinblick auf Kosten, Teamgröße, Zeit und Facilities sowie zum Unterschied zwischen Fehlerquoten von KI-Auswertung vs. menschlicher Expertise. Auch der Auswahlprozess von Sammlungsobjekten für die Digitalisierung sowie passende Trainingsdaten für KI-Modelle insbesondere für handschriftliche Etiketten waren von Interesse.

Die Welt der Falter

Am Nachmittag traf sich eine kleine Gruppe zur Führung durch die typenreichste Sammlung von Schmetterlingen und Köcherfliegen in Deutschland im Museum für Naturkunde. Ein wahrer Schatz für die Untersuchung der Biodiversitätsentwicklung sind die ca. vier Millionen Falter und rund 75.000 Arten, die in den historischen Holzschränken des Hauses lagern. Darunter sind 6.000 Typus-Exemplare, anhand derer andere Individuen der gleichen Art bestimmt werden können. 

Théo Léger erklärte die deutlichsten Unterschiede zwischen Tag- und Nachtfaltern. Beide gehören zur gleichen Ordnung (Lepidoptera), sind aber nicht immer leicht auseinanderzuhalten. Klappt ein Falter in Ruhestellung seine Flügel nach oben zusammen, gehört er wahrscheinlich zu den Tagfaltern. Fehlen die am Ende keulenförmig verdickten Fühler und sehen eher aus wie ein Kamm, ist es ein Nachtfalter. Besonders interessant: Erwachsene Motten können im adulten Stadium nichts mehr fressen. Sie leben ausschließlich von ihren Reserven. Es bleibt ihnen ca. eine Woche Zeit, um einen Partner zu finden und sich fortzupflanzen.

Ein Sammlungsstück mit Geschichte

Als ein historisches Highlight der Sammlung stellte Théo Léger den „Schmetterlingskoffer“ des Sammlers Arnold Schultze-Rhonhof vor. Gefüllt mit tausenden von Faltern aus Kolumbien, die in Papiertüten in Zigarrenkisten gelagert waren, wurde der Koffer 1939 vor Kriegsbeginn als Schiffsfracht aufgegeben. Er kam unbeschadet in Deutschland an und wurde im Museum für seinen Besitzer eingelagert. Arnold Schultze-Rhonhof aber verstarb 1948 auf Madeira, ohne jemals wieder nach Deutschland zurückgekehrt zu sein. Durch Patenschaften konnte die Koffer-Sammlung vollständig präpariert werden. 

Besonders die Etikettierung stellte das Team vor große Herausforderungen. Viele Einträge waren nur mit Bleistift auf Papiertüten notiert. Könnte eine KI bei der Interpretation vager Fundorte wie „Santa Maria“ helfen oder bleibt das eine Aufgabe für erfahrene Fachleute, die handschriftliche Sammlungsdaten mit Tagebuchnotizen abgleichen?

Wouter Addink (Naturalis und DiSSCo) beschrieb in der Q&A-Session im Webinar den sinnvollen Einsatz von KI im Sammlungsmanagement so: „AI allows you to do the easy ones quickly so you can leave the more difficult ones to trained experts.” (Deutsch: “Die KI ermöglicht es, die einfachen Aufgaben schnell zu erledigen, so dass Sie die schwierigeren Aufgaben ausgebildeten Experten überlassen können.“) 

Arnold Schultze-Rhonhof hätte sich vermutlich gefreut, seine Sammlung heute in so gut geordnetem Zustand im Dienste der Forschung zu wissen.

Mehr erfahren

Kontakt

KI-Ideenwerkstatt für Umweltschutz
c/o Impact Hub
Rollbergstr. 28A
12053 Berlin
+49 30 72618 0959 E-Mail schreiben