Logo

CAT4KIT

  • Ansprechperson:

    Dr. Christof Lorenz (IMK-IFU)

  • Projektgruppe:

    Dr. Romy Fösig (IMK-AAF), Dr. Sabine Barthlott (IMK-ASF), Dr. Christian Werner (IMK-IFU), Dr. Manuel Schmidberger (IMK-TRO), Dr. Uğur Çayoğlu (SCC), Robert Ulrich (BIB)

  • Starttermin:

    09/2022

  • Endtermin:

    08/2024

Ziel ist es, einen FDM-Software-Stack zur einrichtungsübergreifenden Bereitstellung, Einbindung, Katalogisierung und Vernetzung von dezentralen Forschungsdaten und Repositorien zu entwickeln. Hierfür sollen Lösungen für vier Datendienste identifiziert, entwickelt, optimiert und schließlich miteinander verknüpft werden:

  • Datenserver: Stellt Daten über standardisierte und programmierbare Schnittstellen bereit und erlaubt so den Zugriff auf und die Einbindung von Remote-Daten.
  • Metadaten-Harvester: Durchsucht regelmäßig Kataloge bzw. Repositorien der Datenserver und speichert diese Informationen in einem standardisierten Format ab.
  • Katalogdienst: Publiziert Kataloge und ermöglicht so die Verknüpfung mit übergeordneten Dateninfrastrukturen.
  • Portaldienst: Frontend bzw. Datenportal zum Durchsuchen und Filtern von Datenkatalogen sowie zur benutzerfreundlichen Darstellung von (Meta-)Daten.

Die einzelnen Dienste sollen dabei als interagierende, aber eigenständige und generalisierte Module umgesetzt werden. Dadurch kann eine unabhängige Weiterentwicklung und Integration von Teilmodulen sichergestellt werden, sodass die Dienste möglichst flexibel in verschiedenen Infrastrukturen und Umgebungen am KIT hinaus genutzt werden können.

Um redundante Entwicklungen zu vermeiden und die Einstiegshürde so gering wie möglich zu halten, wird Cat4KIT auf bereits bestehenden Infrastrukturen (z.B. LSDF, Objektspeicher, GPFS, etc.) und Repositorien (z.B. RADAR4KIT, THREDDS Datenserver, etc.) an den beteiligten Einrichtungen sowie auf verfügbaren Open-Source-Lösungen aufgebaut und soll diese optimal vernetzen. Besonderer Fokus bei der Entwicklung liegt auf der Nutzung von standardisierten Schnittstellen und Protokollen, sodass die am KIT generierten Daten über Cat4KIT in übergeordnete Repositorien wie z.B. der Infrastructure for spatial information in Europe (INSPIRE) der Europäischen Kommission eingebunden werden können.

Durch die generische Entwicklung der Cat4KIT-Module werden neue Communities und Repositorien beispielsweise auf den integrierten Katalog- und Portaldienst oder die Bereitstellung von Daten über moderne Schnittstellen wie OPeNDAP zurückgreifen können. Dadurch kann das Portfolio an Nutzergruppen erweitert werden und Vorteile eines modernen Forschungsdatenmanagements weitergetragen werden.

schematische Darstellung der Komponenten von CAT4KIT
Schematische Darstellung der Komponenten von CAT4KIT