Hallo Martin und Alle,hier auch noch ein paar Bemerkungen zu PIDs für Instrumente/Forschungsinfrastrukturen:
wg. CRISes:Zunächst sei daran erinnert, dass es den Versuch gab, die Zuordnung eines Forschungsergebnisses zu einer Forschungsinfrastruktur (Beschleuniger, Forschungsschiff) durch das Zitieren eines Artikels über die Infrastruktur herzustellen (anstatt über ein mehr oder weniger explizites Acknowledgement), nämlich das Journal of large-scale research facilities (JLSRF) - wobei ich zweifle, dass gerade Externe, die "mitfahren durften", solche Zitate regelmäßig gesetzt haben (gerade in den "wichtigsten" Publikationen, wo evtl. die Anzahl der Zitate begrenzt ist.)
Eine Übersicht über die Ergebnisse aus einer Infrastruktur - etwa Polarstern über die letzten 40 Jahre, oder von FEL) mag ja interessant sein, aber für ein CRIS wird da sicher die Frage nach Expeditionen und Messkampagnen im Vordergrund stehen. Wir haben damals angeregt, die Mitfahrmöglichkeit bei einzelnen Fahrabschnitten von Expeditionen (Beamzeiten an Beschleunigern?) als Grant darzustellen ... der dann hoffentlich von Crossref aus den Acknowledgements extrahiert würde.
wg. Wissenschaft/Nachvollziehbarkeit:Da ist die Granularität "Polarstern" ("wurde von Bord Polarstern gemessen") sicher unzureichend. Allerdings mag es einen Hinweis auf die Qualität der Messung geben, wenn man weis, dass eine Bestimmung des Temperatur mit einem bestimmten Pt100-Sensor in einer CTD-Sonde ("Seabird SBE 9") in der Rosette, die fest auf Polarstern installiert ist, durchgeführt wurde. Diese Beziehung könnte man sicher mit Instrument PIDs (mit Eltern-Kind-Beziehung) abbilden.
Bei der Beurteilung der Ergebnisse solcher Sensoren ist allerdings auch wichtig zu wissen, wann sie kalibriert wurden oder wann welche Version einer Firmware installiert wurde. (Beispiel warum das wichtig ist: In einem Teil der Ursprungsserie der ARGO Bojen - ich sage immer: die größte Forschungsinfrastruktur auf der Erde - war eine Bauserie von Druckdosen zur Tiefenbestimmung verbaut, welche eine ungewöhnliche Drift aufwiesen. Sie zeigten dann z.B. an der Meeresoberfläche "5 m über der Oberfläche" an. Dummerweise hat eine Firmware der Boje die unplausiblen Werte auf Null gesetzt https://doi.org/10.1175/2011JTECHO831.1 - die Werte waren dann nicht mehr nachträglich zu "retten".)
Die Granularität der Instrument-Information hat also (mindestens) zwei Dimensionen: Eltern-Kind-Beziehungen (ggf. bis herunter zu Bauteilen bzw. einzelnen Sensoren) und Zeit (um den Zustand abzubilden). Ersteres ist m.E. noch sinnvoll durch PIDs abzubilden, letzteres nicht. Siehe z.B. https://sensor.awi.de/?site=search&q=rosette .
beste Grüße, Hans (Pfeiffenberger) Am 07.12.22 um 18:29 schrieb Koehler, Martin:
Lieber Ulrich, vielen Dank. In der Tat geht das in Richtung PIDs für Instrumente, die wichtig sind, um bei einem gefundenen Datensatz entscheiden zu können, an welchem Gerät dieser erzeugt wurde. Hierbei scheint mir die in der verlinkten Studie gemachte Unterscheidung zwischen "technischen PIDs" und "administrativen PIDs" sehr wichtig, vielleicht braucht es aber auch noch eine feinere Granularität bei den "technischen PIDs"?! Für die Zuordnung eines Datensatzes zu einem Instrument wäre eine "administrative technische PID" nötig (diese entspricht der technischen PID in der Studie?!), während für eine Nachnutzung im Sinne von FAIR m.E. auch berücksichtigt werden muss, in welchem Zustand sich das Gerät zum Zeitpunkt der Messung befand ("Feine technische PID"). Eine "administrative technische PID" allein reicht daher vermutlich nicht aus, da diese ggf. nicht die nötigen Informationen zur (physikalischen) Konfiguration enthält. Beispiel: Die Elektronenquelle eines Freien Elektronen Lasers (FEL) wird geändert. Wird jetzt eine neue "Feine technische PID" vergeben, so verkompliziert es die Zuordnung zum Gerät (Der "FEL" ist ja noch dieselbe Maschine - "administrative technische PID" ist unverändert) und ist damit ggf. auch sehr fehleranfällig bzw. benötigt komplexe workflows. Andererseits ist es für die Interpretation/Nachnutzung der Daten (vermutlich) wichtig, welche Quelle konkret verwendet wurde. Die Metadaten zu den Daten müssen hier alle relevanten Informationen enthalten (d.h. ggf. die Art der Elektronenquelle) und damit auf eine gewisse Art konsistent und vollständig sein. Ein Verweis per PID ("administrative technische PID") des Gerätes reicht ggf. nicht. Man kann sich aber sicher aus Sicht eines Datenmodells einen Verweis auf einen passenden "Normdatensatz" z.B. innerhalb des Repositoriums, welches die Daten speichert vorstellen, damit hier bei vielen Datensätzen nicht redundant Information gespeichert werden muss. Ob man dann für diesen "Normdatensatz" eine ("feine technische") PID benötigt hängt vermutlich von der Art der Speicherung/Repräsentation ab, ist aber m.E. nicht zwingend nötig, sofern sichergestellt ist, dass die Verknüpfung persistent ist. Vielen Dank noch einmal für Ihren Hinweis auf die interessante verlinkte Studie! Ich bin auch sehr gespannt, wie sich RAiD weiter entwickeln wird :-) Einen schönen Abend wünscht Martin Köhler ------------------------------------------------------------------------ Dr. Martin Köhler Head of library and documentation Deutsches Elektronen-Synchrotron DESY Building 01d Room O1.443 phone: +49-40-8998-1814 Notkestr. 85 fax: +49-40-8994-1814 22607 Hamburg e-mail: Martin.Koehler@desy.de Germany ------------------------------------------------------------------------ ----- Original Message -----From: "Ulrich Herb" <u.herb@scidecode.com> To: "Expertenforum für die Informationsplattform Open Access (http://open-access.net/)" <ipoa-forum@lists.fu-berlin.de> Sent: Wednesday, 7 December, 2022 13:34:30 Subject: Re: [IP-OA_Forum] Überblick über Forschungsdaten der eigenen Einrichtung gewinnen Hallo Martin, ich vermute, Sie spielen hier auf PIDs für Instrumente an, das Prinzip steckt noch in den Kinderschuhen, hat aber seinen Reiz. Zum einen konzeptionell, da das Instrument ja, z.B. bei einem Einrichtungswechsel der Forscher*in, mitgenommen werden kann (etwa, wenn es durch Funding finanziert wurde), zum anderen als Beitrag zur Sicherung der wissenschaftlichen Integrität - stellt sich heraus, dass ein Gerät nicht korrekte funktionierte, kann ich Datensätze/ Publikationen retracten. Wir haben für Knowledge Exchange eine Studie zu PIDs durchgeführt, deren Bericht 01/2023 veröffentlicht werden soll, ergänzend zum Bericht werden sieben Case Studies publiziert, davon eine zu PIDs für Instrumente und eine zu PIDs für Organisationen, womit diese Diskussion startete. S. auch: https://www.knowledge-exchange.info/news/articles/30-11-22 - das als Disclaimer und Teaser zugleich. Viele Grüße Ulrich Herb Am 07.12.2022 um 10:08 schrieb Koehler, Martin:Moin,, bin mir nicht sicher, ob ROR hier alleine reicht. Selbst wenn bei allen ROR implementiert ist, muss man ggf erst einmal wissen welche Repos es überhaupt gibt, damit man dort suchen kann. Natürlich hilft da z.B. re3data, ... und auch Metasuchmaschinen wie z.B. BASE aber ich bin nicht sicher wie vollständig die sind? Richtig spannend wird es aber, wenn man auch erfassen möchte, welche Daten mit Hilfe der eigenen Maschinen (durch Nutzende) gemessen wurden und dann zum Teil nicht bei der Einrichtung, wo/mit deren Gerät die Messung erfolgt ist abgelegt werden. Da ist dann im Allgemeinen (natürlich) keine ROR der eigenen Einrichtung drin. Gerade für die HGF als Betreiberin von Großgeräten wird das m.E. in Zukunft wichtiger werden um die Sichtbarkeit der eigenen Dienste zu erhöhen. Just my 2cts Gruß, Martin PS: Noch ein paar Fragen: BASE harvested ja z.B. Zenodo, Dryad und diverse FigShare Instanzen, aber, soweit ich sehen kann z.B. nicht hepdata, inspire, BioRxiv, (...) . Gibt es Ansätze/Erfahrungen die Suchen, die Markus unter "andere Erfahrungen" beschrieben hat mit Metasuchmaschinen wie z.B. BASE durchzuführen? Welche anderen Metadatensuchmaschinen kämen noch in Frage? Wie vollständig sind diese? Danke PPS: Es geht auch hier nicht um das Einsammeln und kopieren der Daten, sondern "nur" um eine Bibliographie ------------------------------------------------------------------------ Dr. Martin Köhler Head of library and documentation Deutsches Elektronen-Synchrotron DESY Building 01d Room O1.443 phone: +49-40-8998-1814 Notkestr. 85 fax: +49-40-8994-1814 22607 Hamburg e-mail: Martin.Koehler@desy.de Germany -------------------------------------------------------------------------- Dr. Ulrich Herb scidecode science consulting http://scidecode.com/en +49 (0)156 7842 0346 twitter.com/scidecode _______________________________________________ ipoa-forum mailing list ipoa-forum@lists.fu-berlin.de https://lists.fu-berlin.de/listinfo/ipoa-forum Liste verlassen: https://lists.fu-berlin.de/listinfo/ipoa-forum#options_______________________________________________ ipoa-forum mailing list ipoa-forum@lists.fu-berlin.de https://lists.fu-berlin.de/listinfo/ipoa-forum Liste verlassen: https://lists.fu-berlin.de/listinfo/ipoa-forum#options
-- Hans Pfeiffenberger Consultant, scientific data infrastructures & policies www.hans-pfeiffenberger.de