Flora Batava (1800-1934): From Historical Citizen Science to Plant Humanities Dataset

Occurrence Observation
Dernière version Publié par FLORON Plant Conservation Netherlands le avr. 12, 2026 FLORON Plant Conservation Netherlands

Téléchargez la dernière version de la ressource en tant qu'Archive Darwin Core (DwC-A), ou les métadonnées de la ressource au format EML ou RTF :

Données sous forme de fichier DwC-A (zip) télécharger 11 565 enregistrements dans Néerlandais (447 KB) - Fréquence de mise à jour: non planifié
Métadonnées sous forme de fichier EML télécharger dans Anglais (11 KB)
Métadonnées sous forme de fichier RTF télécharger dans Anglais (9 KB)

Description

Flora Batava: people, plants, locations lists 11,500+ records of all species in the first illustrated flora of the Netherlands, published in 28 volumes between 1800 and 1934. The dataset includes information about the plants, the people who observed them in each locality, and the publication of each volume. KB, the National Library of the Netherlands holds both original and digitized source material. From the latter, data was segmented and extracted using a generative AI model (OpenAI’s GPT-4), then checked and corrected manually. Including social (e.g., observers’ names, sex) and historical information (e.g., old plant names, publication history), this dataset facilitates research in plant humanities, botanical heritage, and social history of science.

Enregistrements de données

Les données de cette ressource occurrence ont été publiées sous forme d'une Archive Darwin Core (Darwin Core Archive ou DwC-A), le format standard pour partager des données de biodiversité en tant qu'ensemble d'un ou plusieurs tableurs de données. Le tableur de données du cœur de standard (core) contient 11 565 enregistrements.

Cet IPT archive les données et sert donc de dépôt de données. Les données et métadonnées de la ressource sont disponibles pour téléchargement dans la section téléchargements. Le tableau des versions liste les autres versions de chaque ressource rendues disponibles de façon publique et permet de tracer les modifications apportées à la ressource au fil du temps.

Versions

Le tableau ci-dessous n'affiche que les versions publiées de la ressource accessibles publiquement.

Comment citer

Les chercheurs doivent citer cette ressource comme suit:

Teixeira-Costa L, van Gelder E, Sparrius L, Karsdorp, F (2026). Flora Batava (1800-1934): From Historical Citizen Science to Plant Humanities Dataset. Version 1.1. FLORON Plant Conservation Netherlands. Occurrence dataset. https://www.verspreidingsatlas.nl/ipt/resource?r=flora-batava&v=1.1

Droits

Les chercheurs doivent respecter la déclaration de droits suivante:

L’éditeur et détenteur des droits de cette ressource est FLORON Plant Conservation Netherlands. Ce travail est sous licence Creative Commons Attribution (CC-BY) 4.0.

Enregistrement GBIF

Cette ressource a été enregistrée sur le portail GBIF, et possède l'UUID GBIF suivante : 863890c7-c5ce-4fd2-ad32-c3bdf510c2b2.  FLORON Plant Conservation Netherlands publie cette ressource, et est enregistré dans le GBIF comme éditeur de données avec l'approbation du Netherlands Biodiversity Information Facility.

Mots-clé

Occurrence; Observation

Contacts

Laurens Sparrius
  • Créateur
  • Personne De Contact
FLORON Plant Conservation Netherlands
Nijmegen
NL
Luiza Teixeira-Costa
  • Fournisseur Des Métadonnées
Royal Netherlands Academy of Arts & Sciences (KNAW)
Amsterdam
NL
Esther van Gelder
  • Curateur Des Données
KB nationale bibliotheek
Den Haag
NL
Folgert Karsdorp
  • Chercheur Principal
Royal Netherlands Academy of Arts & Sciences (KNAW)
Amsterdam
NL

Couverture géographique

The Netherlands and surroudings

Enveloppe géographique Sud Ouest [49,325, 1,978], Nord Est [53,645, 8,438]

Couverture temporelle

Date de début / Date de fin 1790-01-01 / 1934-12-31

Données sur le projet

Pas de description disponible

Titre Flora Batava

Les personnes impliquées dans le projet:

Luiza Teixeira-Costa
Esther van Gelder
Laurens Sparrius
Folgert Karsdorp

Méthodes d'échantillonnage

Scans of the journal's pages were processed with Optical Character Recognition and Handwritten Text Recognition. Text segmentation was used to classify paragraphs with labels such as “species names”, “flowering time”, “classification”, “sexual characteristics”, “species traits”, “habitat”, “medicinal use”, “domestic use”. Observations were extracted from the habitat sections using Generative AI. Geocoding for locality names was done with Nominatim (R) and Generative AI. Data was enriched by combining data from the national checklists and a database with historical observers of flora and fauna.

Etendue de l'étude Observations of plants and fungi published in the Flora Batava journal (1800–1934).
Contrôle qualité After data extraction, all entries were individually checked against the source material and manually corrected if needed regarding spellings and correctness of the information. Entries were again manually checked during geocoding and data enrichment.

Description des étapes de la méthode:

  1. For a detailed description see https://openhumanitiesdata.metajnl.com/articles/10.5334/johd.497

Citations bibliographiques

  1. Teixeira-Costa L, van Gelder E, Sparrius LB, Karsdorp, F (2026). Flora Batava (1800-1934): From Historical Citizen Science to Plant Humanities Dataset. Journal of Open Humanities Data 12: 4. https://doi.org/10.5334/johd.497

Métadonnées additionnelles

Identifiants alternatifs 863890c7-c5ce-4fd2-ad32-c3bdf510c2b2
https://www.verspreidingsatlas.nl/ipt/resource?r=flora-batava