Gegevens en datastandaarden
Remote sensing en geofysisch onderzoek leveren diverse soorten gegevens (= data) op. De kwaliteit van deze gegevens is van invloed op de mogelijkheden van verder onderzoek en daarmee op de zeggingskracht van het onderzoek. Bij alle stappen van onderzoek: van inwinning tot analyse tot deponeren van deze gegevens kan er sprake zijn van een transformatie waarbij gegevens veranderen. Het toepassen van standaarden en de juiste bestandsformaten kan de reproduceerbaarheid en herleidbaarheid van onderzoek versterken.
Ruimtelijke Gegevens
De gegevens die geproduceerd worden bij remote sensing en geofysisch onderzoek hebben altijd een ruimtelijke component. Om deze in de ruimte te kunnen plaatsen wordt gebruik gemaakt van geografische coördinaten. Het nationale Nederlandse coördinatensysteem is het Stelsel van de Rijksdriehoeksmeting (RD) met Onze Lieve Vrouwentoren in Amersfoort als centraal punt (https://www.kadaster.nl/zakelijk/registraties/basisregistraties/rijksdriehoeksmeting/rijksdriehoeksstelsel). Het vastleggen van internationale standaarden van coördinatenstelsels en projecties gebeurt volgens de ISO 19111:2019 norm en wordt beschreven door de EPSG (https://epsg.org). Het Nederlandse RD-stelsel betreft EPSG:28992 (https://epsg.org/crs_28992/Amersfoort-RD-New.html).
Datamodellen
Twee groepen ruimtelijke gegevens worden onderscheiden: vector- en rasterdata (afbeelding 1). Vectordata bestaat uit punten, lijnen of polygonen (vlakken) waarbij van ieder punt de exacte coördinaten bekend zijn. Bij lijnen of polygonen worden de punten met elkaar verbonden door middel van lijnen. Aan ieder object in een vector kunnen één of meerdere eigenschappen (attributen) worden verbonden. Rasterdata betreffen gegevens die in een raster worden geplaatst. Een raster is vergelijkbaar met een schaakbord. Iedere vierkante cel in het raster heeft daarbij één getalsmatige waarde. Een rasterbestand is geschikt voor het weergeven van graduele ruimtelijk veranderingen, terwijl een vectorbestand meer bedoeld is voor het weergeven van elementen die duidelijk begrensd zijn.

De kwaliteit van vector- en rasterbestanden is afhankelijk van diverse zaken. Ten eerste spelen schaal en resolutie een rol. Resolutie heeft betrekking op rasterbestand. Hoe hoger de resolutie des te kleiner zijn de individuele cellen van eenrasterbestand. Wanneer een cel bijvoorbeeld 1 cm2 is kunnen zeer nauwkeurige getalsmatige veranderingen in de ruimte worden vastgelegd. Bij een resolutie van bijvoorbeeld 1 km2 kunnen grootschalige landschappelijke veranderingen worden bestudeerd, maar zullen kleinere elementen als grafheuvels niet worden beschreven. Voor vectorbestanden wordt de schaal vaak gebruikt om iets te zeggen over de mate van nauwkeurigheid. De schaal waarop een kaart en een GIS-bestand is gemaakt is, zegt veel over de bruikbaarheid. De Nederlandse topografische kaart Top10NL (https://www.pdok.nl/introductie/-/article/basisregistratie-topografie-brt-topnl) is gemaakt op een schaal van 1:10.000, wat betekent dat 1 cm op de gedrukte kaart in werkelijkheid 100 m is. Een grafheuvel met een diameter van 10 m heeft dan een diameter van 1 mm op de kaart. De relatie tussen schaal en resolutie is beschreven door Tobler (1987). vectorschaal = rasterresolutie (in meters) * 2 * 1000 of andersom: rasterresolutie = vectorschaal / (2 * 1000), en is weergegeven in onderstaande tabel:

Verdieping X
Er bestaat een standaard voor het kalibreren en valideren van remote sensing data. Dit betreft de “ISO/TS 19124-1:2023 Geographic information — Calibration and validation of remote sensing data and derived products” (https://www.iso.org/standard/79352.html). Tot dusver zijn er weinig tot geen (bewuste) toepassingen van deze standaard gevonden in het internationale en nationale archeologische werkveld.
Tijdens de analyse van gegevens uit geofysisch of remote sensing onderzoek worden gegevens soms omgezet van raster naar vector of omgekeerd. Puntmetingen ingewonnen met behulp LiDAR worden vaak omgezet in een rasterbestand door middel van interpolatie, waarbij de meetdichtheid de resolutie van het rasterbestand sterk beïnvloed. Bij de interpretatie van rasterbestanden worden soms vectorbestanden geproduceerd die bijvoorbeeld de omlijning van waargenomen sporen of structuren weergeven. Rasterbestanden kunnen ook worden samengevoegd waarbij het bestand met de laagste resolutie de minimale resolutie van het samengevoegde bestand bepaald (zie o.a. Conolly and Lake 2006; Lillesand et al. 2015 voor verdere bewerking van bestanden).
Datastandaarden
Vanwege de aard van de verschillende gegevens zijn de bestandsformaten voor rasterdata en vectordata verschillend. DANS stelt een aantal voorkeursformaten die op de lange termijn duurzaam bruikbaar, toegankelijk en robuust zijn: https://dans.knaw.nl/nl/bestandsformaten/ . Voor vectorbestanden is het daarom aan te raden om gebruik te maken van het bestandsformaat Geopackage (https://www.geopackage.org/). Rasterbestanden kunnen het beste worden opgeslagen als een GeoTIFF (https://trac.osgeo.org/geotiff/). Beide formaten zijn open bestandsformaten en kunnen in vrijwel alle gangbare GIS-software worden geopend en bewerkt.
De KNA (https://www.sikb.nl/archeologie/richtlijnen/brl-sikb-4000) stelt in het Protocol 4010 Depotbeheer (versie 4.2) dat bij protocollen VO en Opgraven de projectdocumentatie met pakbon conform OS17 (water- of landbodem) moet worden aangeleverd conform DS05. Een deel van de opgravingsgegevens kan aangeleverd worden conform protocol SIKB0102 (zie ook Boasson & Visser 2017). Voor de overige bestanden geldt: “De computerbestanden worden aangeleverd in het native (eigen) bestandsformaat van een ten tijde van de aanlevering binnen de Nederlandse archeologie gangbaar computerprogramma.” Daarnaast moeten bestanden worden voorzien van metadata. Deze protocollen besteden geen expliciete aandacht aan bestanden uit remote sensing of geofysisch onderzoek. De in de voorgaande alinea genoemde voorkeursbestanden kunnen het beste gedeponeerd worden voorzien van metadata. Daarnaast is aanleveren van paradata onontbeerlijk in het kader van herleidbaar en reproduceerbaar onderzoek, omdat hiermee het proces van onderzoek wordt beschreven (Huvila et al 2024). Zorg daarom dat tijdens het onderzoek een logboek wordt bijgehouden.
Metadata en paradata
Metadata en paradata zijn beiden beschrijvingen van de data, waarbij de eerste meer gericht is op een beschrijving van de bestanden en inhoud en de tweede meer op het proces. De Nederlandse overheid heeft een aantal standaarden op dit gebied op de lijst met ‘Pas toe leg uit’ standaarden gezet (https://www.forumstandaardisatie.nl/open-standaarden/verplicht).
Metadata is de beschrijving van de bestanden en de dataset. Door metadata te beschrijven, is het mogelijk om van bestanden te weten in hoeverre ze bruikbaar zijn, zonder de bestanden te hoeven openen. De bekendste metadatastandaard betreft de Dublin Core (https://www.dublincore.org/) voor het beschrijven van de metadata op projectniveau. Voor het beschrijven van geografische gegevens bestaat een Nederlands profiel voor metadata (ISO 19115: https://docs.geostandaarden.nl/md/mdprofiel-iso19115/). Standaarden voor het deponeren van gegevens staan uitgelegd op de website van DANS: https://dans.knaw.nl/nl/handleiding-data-deponeren/tijdens-het-deponeren_ds/ en richten zich vooral op de dataset en de bestanden in de dataset, zodat de data eenvoudig herbruikbaar is.
Het doel van paradata is het vastleggen van het proces, zodat toekomstige gebruikers bekend zijn met de verschillende beslissingen en handelingen die zijn uitgevoerd bij de totstandkoming van de gegevensset. Hieronder vallen vele factoren die een rol spelen bij geofysisch onderzoek en remote sensing. Hier kan gedacht worden aan de weersomstandigheden, omgevingstoestanden, vlieghoogte of de plaatsing van sensoren. Daarnaast kan de toepassing van bepaalde software of algoritmes ook beschreven worden als onderdeel van de paradata.
Referenties/verder lezen
Boasson, W., & Visser, R. M. (2017). SIKB0102: Synchronizing Excavation Data for Preservation and Re-Use. Studies in Digital Heritage, 1(2), 206–224. https://doi.org/10.14434/sdh.v1i2.23262
Conolly, J., & Lake, M. (2006). Geographical information systems in archaeology. Cambridge University Press.
Gillings, M., Hacigüzeller, P., & Lock, G. R. (Eds.). (2020). Archaeological spatial analysis: A methodological guide. Routledge.
Huvila, I., Andersson, L., & Sköld, O. (Eds.). (2024). Perspectives on Paradata: Research and Practice of Documenting Process Knowledge (Vol. 13). Springer International Publishing. https://doi.org/10.1007/978-3-031-53946-6.
Kraak, M.-J., & Ormeling, F. (2020). Cartography: Visualization of Geospatial Data, Fourth Edition (4th ed.). CRC Press. https://doi.org/10.1201/9780429464195.
Lillesand, T., Kiefer, R. W., & Chipman, J. W. (2015). Remote Sensing and Image Interpretation, 7th Edition (7th ed.). Wiley.
Lozić, E., & Štular, B. (2021). Documentation of Archaeology-Specific Workflow for Airborne LiDAR Data Processing. Geosciences, 11(1), Article 1. https://doi.org/10.3390/geosciences11010026.
Schmidt, A., Linford, P., Linford, N., David, A., Gaffney, C., Sarris, A., & Fassbinder, J. (2015). EAC Guidelines for the Use of Geophysics in Archaeology Questions to Ask and Points to Consider. Europae Archaeologia Consilium (EAC), Association Internationale sans But Lucratif (AISBL).
Thomson, G. H. (1994). A Practical Method of Determining the Ground Sampled Distance in Small Scale Aerospace Photography. The Journal of Photographic Science, 42(4), 129–132. https://doi.org/10.1080/00223638.1994.11738589.
Tobler, W. (1987). Measuring spatial resolution. Proceedings, Land Resources Information Systems Conference, Beijing, 1987, 12–16.
Waagen, J. (2025). Documenting drone remote sensing: A reality-based modelling approach for applications in cultural heritage and archaeology. Drone Systems and Applications, 13, 1–14. https://doi.org/10.1139/dsa-2023-0138.
Worldbank (2021) Open Night Lights. https://github.com/worldbank/OpenNightLights.