Institutionen-Kodierung für Adressdaten wissenschaftlicher Publikationen
Lenke C, Taubert NC (2024)
Bielefeld University.
Datenpublikation
Download
Institutionen-Kodierung-Dokumentation.pdf
243.22 KB
Disambiguation_Documentation.pdf 240.78 KB
institutional-coding.zip 2.72 MB
Disambiguation_Documentation.pdf 240.78 KB
institutional-coding.zip 2.72 MB
GitLab Projekt URL
Abstract / Bemerkung
Die Institutionen-Kodierung ist ein Verfahren zur Normierung von Adressinformationen in Metadaten wissenschaftlicher Publikationen. Neben der Vereinheitlichung der Adress-Schreibung ordnet der Algorithmus die Adressen real existierenden Forschungseinrichtungen zu. Der Einsatzbereich der Institutionen-Kodierung beschränkt sich auf Deutschland und deutsche Forschungseinrichtungen. Entwickelt wurde die Institutionen-Kodierung im Rahmen des BMBF-geförderten Kompetenznetzwerks Bibliometrie (https://bibliometrie.info) und dient dort zur Bereinigung der Adressinformationen der beiden proprietären Bibliometriedatenbanken Web of Science und Scopus. Erfahrungen mit der Institutionen-Kodierung haben aber gezeigt, dass Anwendungsszenarien weit über die genannten Datenbanken hinausgehen. Im Grunde schließen sie sämtliche Anlässe ein, bei denen es um eine Vereinheitlichung von unterschiedlichen Schreibungen und die Zuordnung von Adress-Informationen deutscher Forschungseinrichtungen geht. Die vorliegende Dokumentation möchte einen Überblick über das Verfahren geben und die praktische Nachnutzung der Institutionen-Kodierung unterstützen. Sie richtet sich an Personen, die bereits mit relationalen Datenbanken und SQL gearbeitet haben und über entsprechende Kompetenzen verfügen. In der Dokumentation finden sich Informationen bereit, die für die Erstellung einer Kodierung notwendig sind. Sie erläutert die Grundzüge des Verfahrens (2), fasst die für die Anwendung der Institutionen-Kodierung notwendigen Voraussetzungen zusammen (3), beschreibt die für die Anwendung der Institutionen-Kodierung notwendigen Prozeduren (4) dokumentiert die Ergebnistabellen (5) und gibt einen Ausblick auf die fortlaufenden Kuratierungsarbeit (6).
Disambiguation of address data is a procedure for standardizing address information in metadata of scientific publications. In addition to standardizing the spelling of the address, the algorithm allocates the addresses to existing research institutions. The scope of application is limited to Germany and German research institutions. The procedure of disambiguation of address data was developed as part of the BMBF-funded Competence Network Bibliometrics (https://bibliometrie.info) and is used to clean the address information of the two proprietary bibliometric databases Web of Science and Scopus. However, experiences have shown that scenarios of application go far beyond the two databases. Basically, they include all occasions in which the standardization of different spellings and the allocation of address information of German research institutions is required. Such information can, for example, originate from specialist databases, institutional or subject-specific repositories or personal data collections. In addition to the databases already mentioned, successful tests were carried out with address information from CrossRef, Dimensions and OpenAlex. This documentation aims to provide an overview of the procedure and to support its practical reuse. It is aimed at people who have already worked with relational databases and SQL and who have the relevant skills. The documentation contains information that is necessary for the creation of a coding. It gives an overview of the components (2), summarizes the prerequisites for its application (3), describes the steps necessary for its application (4), documents the tables showing the results (5) and provides an outlook on the curation work (6).
Disambiguation of address data is a procedure for standardizing address information in metadata of scientific publications. In addition to standardizing the spelling of the address, the algorithm allocates the addresses to existing research institutions. The scope of application is limited to Germany and German research institutions. The procedure of disambiguation of address data was developed as part of the BMBF-funded Competence Network Bibliometrics (https://bibliometrie.info) and is used to clean the address information of the two proprietary bibliometric databases Web of Science and Scopus. However, experiences have shown that scenarios of application go far beyond the two databases. Basically, they include all occasions in which the standardization of different spellings and the allocation of address information of German research institutions is required. Such information can, for example, originate from specialist databases, institutional or subject-specific repositories or personal data collections. In addition to the databases already mentioned, successful tests were carried out with address information from CrossRef, Dimensions and OpenAlex. This documentation aims to provide an overview of the procedure and to support its practical reuse. It is aimed at people who have already worked with relational databases and SQL and who have the relevant skills. The documentation contains information that is necessary for the creation of a coding. It gives an overview of the components (2), summarizes the prerequisites for its application (3), describes the steps necessary for its application (4), documents the tables showing the results (5) and provides an outlook on the curation work (6).
Erscheinungsjahr
2024
Copyright und Lizenzen
Page URI
https://pub.uni-bielefeld.de/record/2999367
Zitieren
Lenke C, Taubert NC. Institutionen-Kodierung für Adressdaten wissenschaftlicher Publikationen. Bielefeld University; 2024.
Lenke, C., & Taubert, N. C. (2024). Institutionen-Kodierung für Adressdaten wissenschaftlicher Publikationen. Bielefeld University. https://doi.org/10.4119/unibi/2999367
Lenke, Christopher, and Taubert, Niels Christian. 2024. Institutionen-Kodierung für Adressdaten wissenschaftlicher Publikationen. Bielefeld University.
Lenke, C., and Taubert, N. C. (2024). Institutionen-Kodierung für Adressdaten wissenschaftlicher Publikationen. Bielefeld University.
Lenke, C., & Taubert, N.C., 2024. Institutionen-Kodierung für Adressdaten wissenschaftlicher Publikationen, Bielefeld University.
C. Lenke and N.C. Taubert, Institutionen-Kodierung für Adressdaten wissenschaftlicher Publikationen, Bielefeld University, 2024.
Lenke, C., Taubert, N.C.: Institutionen-Kodierung für Adressdaten wissenschaftlicher Publikationen. Bielefeld University (2024).
Lenke, Christopher, and Taubert, Niels Christian. Institutionen-Kodierung für Adressdaten wissenschaftlicher Publikationen. Bielefeld University, 2024.
Alle Dateien verfügbar unter der/den folgenden Lizenz(en):
Creative Commons Namensnennung - Weitergabe unter gleichen Bedingungen 4.0 International Public License (CC BY-SA 4.0):
Volltext(e)
Name
Access Level
Open Access
Zuletzt Hochgeladen
2024-12-17T13:35:34Z
MD5 Prüfsumme
6b810883fed97ed71fb0a970398cdf81
Name
Disambiguation_Documentation.pdf
240.78 KB
Access Level
Open Access
Zuletzt Hochgeladen
2024-12-17T13:35:34Z
MD5 Prüfsumme
da7b55548e5b766c90b3c693b84507c1
Name
institutional-coding.zip
2.72 MB
Access Level
Open Access
Zuletzt Hochgeladen
2024-12-17T13:58:17Z
MD5 Prüfsumme
4828f83f3d162047586615cc524fc54c