[NUUG kart] Gjentagelser i OSM kilde data

SandorS sandors39 at gmail.com
Tue Oct 10 14:34:13 CEST 2017


Noen uker siden foregikk det en diskusjon på en OSM global forum om det finnes noen kart som viser kildedata uten korreksjoner. Emnet er essensielt for kartografer for å oppdage feil i deres egne eller andres oppdateringer. Dessverre, det finnes ikke slike kart i dag og dermed store mengder av feil bare akkumuleres. Norge er heller ikke immun mot en slik infeksjon. Det finnes store mengder logiske feil som er vanskelig å se i dagens offentlige OSM kart.    
De fleste av de nevnte kart bruker input data fra den osm2pgsql forberedelses prosedyre og tilsvarende database. Innen denne prosessen «inspektører» oppdager og reparerer/ignorerer for det meste bare formelle feil (systemkrasj feilene) og dermed er det igjen store mengder av logiske feil. Med forbehold av at en «feil» er avhengig av hva man mener med begrepet korrekt/riktig, mange kart visere kan leve med slike anomalier. Samtidig, moderne vektor baserte GIS systemer og digital kartografi kan ikke tolerere dem. La meg illustrere en slik klasse feil, nemlig, data gjentagelses/replikk feil fra innsjø objekt klasse i Sør-Norge.
Bildet fra lenken https://goo.gl/Uz9BRV  viser  en fordeling av innsjø gjentagelser i Sør-Norge (og det er mange av dem). Farger i markører representerer forskjellige replikk typer som eksakt, korridor, redundant… osv. Til eksempel,  vi sier at en polygon P1 er i korridor av en annen P2 dersom alle punkter av P1 ligger i korridor/belte langs P2. Korridorens bredde er en parameter og korridor overlapper er unaturlige (høyt usannsynlige) i realiteten. Lenken https://goo.gl/hDf8i3 viser en ekstrakt fra distribusjonen, en innsjø med sine øyer/huller. Cyan marker er brukt for corridor, magenta for eksakt... gjentagelse typer. Bildet i lenken https://goo.gl/5Aa8Ta viser en detalj fra innsjøens utterste (outer) grense og man kan se den korridor type overlappen. Samme type fei ser vi her https://goo.gl/8w4ESR men fra indre/hull repetisjon. Bildet i den siste lenken her https://goo.gl/FPkdpJ viser typisk eksakt repetisjon. Husk at det finnes mengder av kombinasjons gjentagelser og mange med forskjellige hull strukturer (overskrivelser kjent som “missing islands”). Ved siden av data redundans, object data gjentagelser krever ekstra prosesering og aller viktigst, er flaskehals i data generalisering. 
En robust dataforbredelses process (data preparation tool chain) skulle oppdage og reparere slike anomalier.
Sandor


Sendt fra E-post for Windows 10

-------------- next part --------------
An HTML attachment was scrubbed...
URL: https://lists.nuug.no/pipermail/kart/attachments/20171010/d749b26a/attachment.htm 


More information about the kart mailing list