FU Logo
  • Startseite
  • Kontakt
  • Impressum
  • Home
  • Listenauswahl
  • Anleitungen

Re: [IP-OA_Forum] Überblick über Forschungsdaten der eigenen Einrichtung gewinnen

<-- im Thema/Thread -->
<-- nach Datum -->
  • From: Hans Pfeiffenberger <hp@hans-pfeiffenberger.de>
  • To: ipoa-forum@lists.fu-berlin.de
  • Date: Thu, 8 Dec 2022 14:38:02 +0100
  • Ui-outboundreport: notjunk:1;M01:P0:zhUPDA8dyVg=;IpeWP1Qnc3RMwq1arCgcxPRoRw3 /7T5jqgfyA+435o36trCN/x3uo6g+V/TKUkSrMVRJJPznJsTgCYSRUxgsqAl4odajOw0cJhdC BYRDp6CVepSE5myQtnylMk8atKkPVo23QliYtNrz2VE5THduhMx6ea+6SaONtdCu4q10Kt6p3 Xg8BFjS73/tFPGnTHr6P/KDxUHZGLWWUzNv5dqjJPSHK8YIxhcIcHzibqGm48vO7/FlKvTqha VlSLkOnZYkszD5GjHYMq9/0mEb4ZpJQiS9NNng+QVH2CyM+D4Nidq+5T8i9eDFDnBSKWivf6b 5P7vK1rTrE+SIbcpOvDJu4psiMgfY2H0ZzFqzpyJLlIffFeKWabm6+fk6LdUetwCImA2uqhA3 RAHWcMRI330agKxR04hxNEvVfoDqfxhonvjWMslNshp3T299u5+2Ki7NKSzIzjXZAv1RIfNd5 F7CEk/INdlZuqgwNH0G5y/siWYlqM0vEX2AEs95yBx5SBh6psbmtHGjpQh2NGDsmuGptVYo4P UnKzOil83LJvhLC0nfzvYOk9jvyixlHnFBldqfJhcrnmFX5N7QhxajAQKCEzsui4aDqCL5Dco bCaAS8OBiQ4hfKpWVwI+NPm6NjM71yrPZlXfnD6Yn74qZOp2o7cUSYMub4I8q5WgEKQawAQdi Crq71J1FkE2dQtqTDLEBeWndVBrbqgh0+8RSlSdXeA==
  • Subject: Re: [IP-OA_Forum] Überblick über Forschungsdaten der eigenen Einrichtung gewinnen

Hallo Martin und Alle,

hier auch noch ein paar Bemerkungen zu PIDs für Instrumente/Forschungsinfrastrukturen:

wg. CRISes:

Zunächst sei daran erinnert, dass es den Versuch gab, die Zuordnung eines Forschungsergebnisses zu einer Forschungsinfrastruktur (Beschleuniger, Forschungsschiff) durch das Zitieren eines Artikels über die Infrastruktur herzustellen (anstatt über ein mehr oder weniger explizites Acknowledgement), nämlich das Journal of large-scale research facilities (JLSRF) - wobei ich zweifle, dass gerade Externe, die "mitfahren durften", solche Zitate regelmäßig gesetzt haben (gerade in den "wichtigsten" Publikationen, wo evtl. die Anzahl der Zitate begrenzt ist.)

Eine Übersicht über die Ergebnisse aus einer Infrastruktur - etwa Polarstern über die letzten 40 Jahre, oder von FEL) mag ja interessant sein, aber für ein CRIS wird da sicher die Frage nach Expeditionen und Messkampagnen im Vordergrund stehen. Wir haben damals angeregt, die Mitfahrmöglichkeit bei einzelnen Fahrabschnitten von Expeditionen (Beamzeiten an Beschleunigern?) als Grant darzustellen ... der dann hoffentlich von Crossref aus den Acknowledgements extrahiert würde.

wg. Wissenschaft/Nachvollziehbarkeit:

Da ist die Granularität "Polarstern" ("wurde von Bord Polarstern gemessen") sicher unzureichend. Allerdings mag es einen Hinweis auf die Qualität der Messung geben, wenn man weis, dass eine Bestimmung des Temperatur mit einem bestimmten Pt100-Sensor in einer CTD-Sonde ("Seabird SBE 9") in der Rosette, die fest auf Polarstern installiert ist, durchgeführt wurde. Diese Beziehung könnte man sicher mit Instrument PIDs (mit Eltern-Kind-Beziehung) abbilden.

Bei der Beurteilung der Ergebnisse solcher Sensoren ist allerdings auch wichtig zu wissen, wann sie kalibriert wurden oder wann welche Version einer Firmware installiert wurde. (Beispiel warum das wichtig ist: In einem Teil der Ursprungsserie der ARGO Bojen - ich sage immer: die größte Forschungsinfrastruktur auf der Erde -  war eine Bauserie von Druckdosen zur Tiefenbestimmung verbaut, welche eine ungewöhnliche Drift aufwiesen. Sie zeigten dann z.B. an der Meeresoberfläche "5 m über der Oberfläche" an. Dummerweise hat eine Firmware der Boje die unplausiblen Werte auf Null gesetzt https://doi.org/10.1175/2011JTECHO831.1 - die Werte waren dann nicht mehr nachträglich zu "retten".)

Die Granularität der Instrument-Information hat also (mindestens) zwei Dimensionen: Eltern-Kind-Beziehungen (ggf. bis herunter zu Bauteilen bzw. einzelnen Sensoren) und Zeit (um den Zustand abzubilden). Ersteres ist m.E. noch sinnvoll durch PIDs abzubilden, letzteres nicht. Siehe z.B. https://sensor.awi.de/?site=search&q=rosette .

beste Grüße,

Hans (Pfeiffenberger)

Am 07.12.22 um 18:29 schrieb Koehler, Martin:
Lieber Ulrich,
vielen Dank. In der Tat geht das in Richtung PIDs für Instrumente, die wichtig sind, um bei einem gefundenen Datensatz entscheiden zu können, an welchem Gerät dieser erzeugt wurde.
Hierbei scheint mir die in der verlinkten Studie gemachte Unterscheidung zwischen "technischen PIDs" und "administrativen PIDs" sehr wichtig, vielleicht braucht es aber auch noch eine feinere Granularität bei den "technischen PIDs"?!

Für die Zuordnung eines Datensatzes zu einem Instrument wäre eine "administrative technische PID" nötig (diese entspricht der technischen PID in der Studie?!), während für eine Nachnutzung im Sinne von FAIR m.E. auch berücksichtigt werden muss, in welchem Zustand sich das Gerät zum Zeitpunkt der Messung befand ("Feine technische PID"). Eine "administrative technische PID" allein reicht daher vermutlich nicht aus,  da diese ggf. nicht die nötigen Informationen zur (physikalischen) Konfiguration enthält. Beispiel: Die Elektronenquelle eines Freien Elektronen Lasers (FEL) wird geändert. Wird jetzt eine neue "Feine technische  PID" vergeben, so verkompliziert es die Zuordnung zum Gerät (Der "FEL" ist ja noch dieselbe Maschine - "administrative technische PID" ist unverändert) und ist damit ggf. auch sehr fehleranfällig bzw. benötigt komplexe workflows.

Andererseits ist es für die Interpretation/Nachnutzung der Daten (vermutlich) wichtig, welche Quelle konkret verwendet wurde.
Die Metadaten zu den Daten müssen hier alle relevanten Informationen enthalten (d.h. ggf. die Art der Elektronenquelle) und damit auf eine gewisse Art konsistent und vollständig sein. Ein Verweis per PID ("administrative technische PID") des Gerätes reicht ggf. nicht. Man kann sich aber sicher aus Sicht eines Datenmodells einen Verweis auf einen passenden "Normdatensatz" z.B. innerhalb des Repositoriums, welches die Daten speichert vorstellen, damit hier bei vielen Datensätzen nicht redundant Information gespeichert werden muss. Ob man dann für diesen "Normdatensatz" eine ("feine technische") PID benötigt hängt vermutlich von der Art der Speicherung/Repräsentation ab, ist aber m.E. nicht zwingend nötig, sofern sichergestellt ist, dass die Verknüpfung persistent ist.

Vielen Dank noch einmal für Ihren Hinweis auf die interessante verlinkte Studie!
Ich bin auch sehr gespannt, wie sich RAiD weiter entwickeln wird :-)

Einen schönen Abend wünscht
  Martin Köhler

------------------------------------------------------------------------
Dr. Martin Köhler
Head of library and documentation
                         Deutsches Elektronen-Synchrotron DESY
Building 01d Room O1.443
phone:  +49-40-8998-1814                                   Notkestr. 85
fax:    +49-40-8994-1814                                   22607 Hamburg
e-mail: Martin.Koehler@desy.de                             Germany
------------------------------------------------------------------------

----- Original Message -----
From: "Ulrich Herb" <u.herb@scidecode.com>
To: "Expertenforum für die Informationsplattform Open Access (http://open-access.net/)" <ipoa-forum@lists.fu-berlin.de>
Sent: Wednesday, 7 December, 2022 13:34:30
Subject: Re: [IP-OA_Forum]  Überblick über Forschungsdaten der eigenen Einrichtung gewinnen
Hallo Martin,


ich vermute, Sie spielen hier auf PIDs für Instrumente an, das Prinzip
steckt noch in den Kinderschuhen, hat aber seinen Reiz. Zum einen
konzeptionell, da das Instrument ja, z.B. bei einem Einrichtungswechsel
der Forscher*in, mitgenommen werden kann (etwa, wenn es durch Funding
finanziert wurde), zum anderen als Beitrag zur Sicherung der
wissenschaftlichen Integrität - stellt sich heraus, dass ein Gerät nicht
korrekte funktionierte, kann ich Datensätze/ Publikationen retracten.

Wir haben für Knowledge Exchange eine Studie zu PIDs durchgeführt, deren
Bericht 01/2023 veröffentlicht werden soll, ergänzend zum Bericht werden
sieben Case Studies publiziert, davon eine zu PIDs für Instrumente und
eine zu PIDs für Organisationen, womit diese Diskussion startete. S.
auch: https://www.knowledge-exchange.info/news/articles/30-11-22 - das
als Disclaimer und Teaser zugleich.


Viele Grüße

Ulrich Herb



Am 07.12.2022 um 10:08 schrieb Koehler, Martin:
Moin,,
bin mir nicht sicher, ob ROR hier alleine reicht. Selbst wenn bei allen
ROR implementiert ist, muss man ggf erst einmal wissen welche Repos es
überhaupt gibt, damit man dort suchen kann. Natürlich hilft da z.B.
re3data, ... und auch Metasuchmaschinen wie z.B. BASE aber ich bin nicht
sicher wie vollständig die sind?
Richtig spannend wird es aber, wenn man auch erfassen möchte, welche
Daten mit Hilfe der eigenen Maschinen (durch Nutzende) gemessen wurden
und dann zum Teil nicht bei der Einrichtung, wo/mit deren Gerät die
Messung erfolgt ist abgelegt werden. Da ist dann im Allgemeinen
(natürlich) keine ROR der eigenen Einrichtung drin. Gerade für die HGF
als Betreiberin von Großgeräten wird das m.E. in Zukunft wichtiger
werden um die Sichtbarkeit der eigenen Dienste zu erhöhen.
Just my 2cts
Gruß,
   Martin

PS: Noch ein paar Fragen:
BASE harvested ja z.B. Zenodo, Dryad und diverse FigShare Instanzen,
aber, soweit ich sehen kann  z.B. nicht hepdata, inspire, BioRxiv, (...) .
Gibt es Ansätze/Erfahrungen die Suchen, die Markus unter "andere
Erfahrungen" beschrieben hat mit Metasuchmaschinen wie z.B. BASE
durchzuführen?
Welche anderen Metadatensuchmaschinen kämen noch in Frage? Wie
vollständig sind diese? Danke

PPS: Es geht auch hier nicht um das Einsammeln und kopieren der Daten,
sondern "nur" um eine Bibliographie


------------------------------------------------------------------------
Dr. Martin Köhler
Head of library and documentation
                          Deutsches Elektronen-Synchrotron DESY
Building 01d Room O1.443
phone:  +49-40-8998-1814                                   Notkestr. 85
fax:    +49-40-8994-1814                                   22607 Hamburg
e-mail: Martin.Koehler@desy.de                             Germany
------------------------------------------------------------------------

--
Dr. Ulrich Herb
scidecode science consulting
http://scidecode.com/en
+49 (0)156 7842 0346
twitter.com/scidecode

_______________________________________________
ipoa-forum mailing list
ipoa-forum@lists.fu-berlin.de
https://lists.fu-berlin.de/listinfo/ipoa-forum

Liste verlassen: https://lists.fu-berlin.de/listinfo/ipoa-forum#options
_______________________________________________
ipoa-forum mailing list
ipoa-forum@lists.fu-berlin.de
https://lists.fu-berlin.de/listinfo/ipoa-forum

Liste verlassen: https://lists.fu-berlin.de/listinfo/ipoa-forum#options

--
Hans Pfeiffenberger
Consultant, scientific data infrastructures & policies
www.hans-pfeiffenberger.de


<-- im Thema/Thread -->
<-- nach Datum -->
  • References:
    • [IP-OA_Forum] Überblick über Forschungsdaten der eigenen Einrichtung gewinnen
      • From: "Putnings, Markus" <markus.putnings@fau.de>
    • Re: [IP-OA_Forum] Überblick über Forschungsdaten der eigenen Einrichtung gewinnen
      • From: Paul Vierkant <paul.vierkant@datacite.org>
    • Re: [IP-OA_Forum] Überblick über Forschungsdaten der eigenen Einrichtung gewinnen
      • From: "Putnings, Markus" <markus.putnings@fau.de>
    • Re: [IP-OA_Forum] Überblick über Forschungsdaten der eigenen Einrichtung gewinnen
      • From: Paul Vierkant <paul.vierkant@datacite.org>
    • Re: [IP-OA_Forum] Überblick über Forschungsdaten der eigenen Einrichtung gewinnen
      • From: "Koehler, Martin" <martin.koehler@desy.de>
    • Re: [IP-OA_Forum] Überblick über Forschungsdaten der eigenen Einrichtung gewinnen
      • From: Ulrich Herb <u.herb@scidecode.com>
    • Re: [IP-OA_Forum] Überblick über Forschungsdaten der eigenen Einrichtung gewinnen
      • From: "Koehler, Martin" <martin.koehler@desy.de>
  • ipoa-forum - Dezember 2022 - Archiv sortieren nach:
    [ Thema/Thread ] [ Betreff ] [ Autor(in) ] [ Datum ]
  • Archiv der Mailingliste ipoa-forum
  • Infoseite zu dieser Mailingliste...

Hilfe

  • FAQ
  • Dienstbeschreibung
  • ZEDAT Beratung
  • postmaster@lists.fu-berlin.de

Service-Navigation

  • Startseite
  • Listenauswahl

Einrichtung Mailingliste

  • ZEDAT-Portal
  • Mailinglisten Portal