[NUUG kart] Gjentagelser i OSM kildedata

Sandor Seres sandors39 at outlook.com
Tue Oct 10 09:07:20 CEST 2017


Noen uker siden foregikk det en diskusjon på en OSM global forum om det finnes noen kart som viser kildedata uten korreksjoner. Emnet er essensielt for kartografer for å oppdage feil i deres egne eller andres oppdateringer. Dessverre, det finnes ikke slike kart i dag og dermed store mengder av feil bare akkumuleres. Norge er heller ikke immun mot en slik infeksjon. Det finnes store mengder av logiske feil i kildedata som er vanskelig å se i dagens offentlige OSM kart.

De fleste av de nevnte kart bruker inngangs data fra osm2pgsql forberedelses prosedyre og tilsvarende database. Innen denne prosessen «inspektører» oppdager og reparerer/ignorerer for det meste bare formelle feil (systemkrasj feilene) og dermed er det igjen enorme mengder av logiske feil. Med forbehold av at en «feil» er avhengig av hva man mener med korrekt/riktig, mange kartvisere (for eksepel raster bilede baserte) kan leve med slike anomalier. Samtidig, moderne vektor baserte GIS systemer og digital kartografi kan ikke tolerere dem. La meg illustrere en slik klasse feil, nemlig, data gjentagelse (eller data replikka) feil i innsjøer fra Sør-Norge.

I bildet fra lenken https://goo.gl/Uz9BRV  viser en distribusjon av innsjø gjentagelser i Sør-Norge (og det er mange av dem). Farger i markører representerer forskjellige gjentagelses/replikka klasser som eksakt, korridor, redundant… osv. Til eksempel, vi sier at en polygon P1 er en korridor replikka av en annen P2 dersom alle punkter av P1 ligger i en korridor/belte langs P2. Bredden av korridoren er parameter og en slik gjentagelse ansees som unaturlig. Lenken https://goo.gl/hDf8i3 viser en utsnitt fra den forrige distribusjonen men med selve innsjøen og tilsvarende øyer/huller. Cyan marker er brukt for korridor og magenta for eksakt replikka. Bildet i lenken https://goo.gl/5Aa8Ta viser en detalj fra innsjøens utterste (outer) grense og man kan se den korridor type overlappen. Samme type detalj ser vi her https://goo.gl/8w4ESR men fra innerste/hull gjentagelsen. Bildet i den siste lenken her https://goo.gl/FPkdpJ viser en typisk eksakt gjentagelse. Husk at det finnes mengder av kombinasjons gjentagelser og mange med forskjellige hull strukturer (overskrivelser, kjent som “missing islands”). Ved siden av data redundans, gjentagelser krever ekstra prosessering og aller viktigst, er flaskehals i data generalisering.

En robust dataforberedelses prosedure (data preparation tool chain) skulle oppdage og reparere slike gjentagelses/replikka feilene.

Sandor


Sent from Mail<https://go.microsoft.com/fwlink/?LinkId=550986> for Windows 10

-------------- next part --------------
An HTML attachment was scrubbed...
URL: https://lists.nuug.no/pipermail/kart/attachments/20171010/bd5af6f5/attachment.htm 


More information about the kart mailing list