[NUUG kart] Forslag til dugnad: import av vann og arealdekke

Sandor Seres sandors39 at gmail.com
Wed Mar 18 13:27:47 CET 2015


Hei. Med all og stor respect for den entusiastiske innsatsen i forbindelse
med N50 baser masse/bulk editering av OSM, som den visa importen er, la meg
få lov å si/legge til noen få kritiske meninger. Jeg spesielt reagerer på
uttalelser som «jeg er usikker...», spekulative estimater for eventuelle
korreksjoner med mer. Situasjonen er mye, mye, mer alvorlig enn bare det.
Det er mange årsaker til det. La meg nevne noen få:

-Endring av OSM kildedata, spesielt masseendring, uansett hvor kommer den
fra, har innvirkning på alle (mange) som lager kart for store ommråder
(Skandinavia, Europa, Verden ...). Utfordringen kan være nye feiltyper, mye
ekstraarbeide osv.

-For å vite at noe er feil vi må vite hva er korrekt/riktig. For mange av
begrepene, desverre, vi vet ikke hva er korrekt på grunn av mangelfull og
vage definisjoner i OSM wiki. Derfor, noe som jeg oppfater som feil andre
kan kanskje levemed (fe. ordiner veiseksjon tagget som rundkjøring, eller
omvent, replika av konsekutive noder, vektorer, replika av arela
grenser/seksjoner, nesten overlappende repliserte arealer, river-line som
løper utenfor den tilsvarende river-area osv).

-Mange av feilene er usynlige for editorer som importerer/laster opp data
(de er ikke engang klar over at de lagde feil). Samt, brukere som lager kart
må oppdage og reparere slike feil fordi de kan være «show» stoppere og/eller
degradere kartets kvalitet. Det er stor mengde (enormt stor) av slike feil i
OSM kildedata. Heldigvis de fleste kan programatisk repareres med en robust
«data-preparation-tool-chain». Vær obs på at diff filer hjelper veldig lite
her (tvert imot, de akumulerer feilmengden i brukerdatabasen), samme med
«do-ovracy» (som er veldig treg). Osv.

Nettopp i nat ble jeg ferdig med «data-preparation-...») på den siste
OSM-dumpen (jeg anntar og ser at visa-importen er delvis der). Og det er
mange feil der (dog, jeg peker ikke på noen) spesielt den typen som Vidar
peker på. For illustrasjon jeg legger til to bilder av feil, relaterte til
insjøer i Norge (natural_water, water_lake). Bilde 2 er med lit større skala
for sør Norge.

-De røde markørene viser posisjoner av åpne insjøgrenser som kunne ikke
programatisk repareres (som regel, altfor stor brudd eller åpning mellon
endepunktene). Disse, som regel, ignoreres i videre arbeide.

-De magenta markørene viser posisjoner til flere ganger repliserte
insjøgrenser/polygoner som er ikke overlappende. Mer presist, en polygon
ligger i en tynn korridor langs andre polygonen. I konsekvense, som regel,
areal er rendered som union, øyer forvinner, problemer i generalisering...
Også, dersom man bruker skan-linje (kontra enkelt areal-per-areal) basert
fill algoritme resultat blir fulstendig feil. Det er mange årsak scenarier
til dette men som oftest, impotøren ser ikke (eller kan ikke finne ut) at
allerede det eksisterer en versjon av grense-polygonen der. Og når mann
oppdager (nesten) repliserte, spørsmålet er hvilken versjon skal slettes.

-De grønne markørene viser posisjoner av eksakt repliserte insjø areal
grenser/polygoner (en overlapper den/de andre). Konsekvenser er nesten det
samme som i førrige tilfelle men årsakene vrrierer mere. På første blikk ser
det ganske enkelt ut å oppdage disse feilene, men det er det ikke. Husk at
det er mange tilfeller hvor en av grensepolygonene inhoolder noder
...A,B,B,B,C... eller ...A,B,C,D,C,D,C,D,E... mens den andre har ikke slike
replikasjoner. Så, enkelt test av noderekker hjelper veldig lite. 

Så, oppgaven å reparere konsekvensene av den nevnte masseimporten er langt
fra «enkelt». Og, i hvert fall, kan ikke gjøres i noen titals timer.

Derfor, mit forslag er at hele importen reverseres og gjøres en grundig
eksperimentering/testing før en endelig import bestemmelse.

Beklager omfanget, Sandor.

 

 

 

From: kart-bounces at nuug.no [mailto:kart-bounces at nuug.no] On Behalf Of Vidar
Gundersen
Sent: 17 March 2015 07:07
To: Torstein Ingebrigtsen Bø
Cc: kart at nuug.no
Subject: Re: [NUUG kart] Forslag til dugnad: import av vann og arealdekke

 

Vedlagt et lite uttrekk fra et område med slike duplikater. Linjer i dette
datasettet (resultat av JOSM søket: highway=* user:visa-import version:1)
som ligger på eller inntil andre ways med nesten samme tagging skal bort. En
utfordring er endepunkter som er hektet i ikke-duplikater.

http://www.vidargundersen.com/uttrekk-visa-import-duplikater.osm.bz2

 

 

 

2015-03-16 22:54 GMT+01:00 Torstein Ingebrigtsen Bø <torsteinibo at gmail.com>:

Hei, jeg er er usikker. Tror ikke det. Men hvis du gir meg et eksempel så
kan jeg se hva jeg får til.




Hilsen
Torstein

 

17. mars 2015 kl. 07.24 skrev Vidar Gundersen <vibrog+osm at gmail.com>:

Kan verktøyet ditt brukes til å rydde opp i duplikater (og triplikater) i
etterkant av import?

Dvs rydde opp i slurvete importer av Kartverkets data gjort av brukeren
visa-import.

 

 

 

-------------- next part --------------
An HTML attachment was scrubbed...
URL: http://lists.nuug.no/pipermail/kart/attachments/20150318/cc7c2e9f/attachment-0001.htm 
-------------- next part --------------
A non-text attachment was scrubbed...
Name: NUUG_Eksempels.docx
Type: application/vnd.openxmlformats-officedocument.wordprocessingml.document
Size: 98889 bytes
Desc: not available
Url : http://lists.nuug.no/pipermail/kart/attachments/20150318/cc7c2e9f/attachment-0001.bin 


More information about the kart mailing list