[NUUG kart] Stor import med masse feil.

Gustav Foseid gustavf at gmail.com
Tue Jul 15 22:59:04 CEST 2008


2008/7/15 Michael Eric Menk <mikemenk at yahoo.no>:

> >  * Fjelltopper som ligger i daler (node 277970744, 277959087)
> >  * Bygder og gårder som ligger midtfjords (node 277972183),
> >    eller ihvertfall ute i fjorden (node 277959087, 277948142, 277959779)
>
> Dataene er hentet inn over en lag periode, de elste dataene er orginalt
> lagret i grader og minutter, dette gir en feil på 1nm, ved en desimal på
> minuttet, er det en kabellengde feil, feilen øst/vest blir pga vi ikke
> er på ekvator.


Jeg synes dette er for stor feilmargin for å legge data rett inn.

Hvilken algoritme brukte du for å luke ut steder som allerede lå i kartet?


> >  * Elvenavn som ikke ligger ved en elv, og hvor nærmeste elv er *feil*
> Det er endel elver som går i rør, bl.a. så er det er elv i Bergen, som
> nå er i dagslys, etter 25 år i rør.(den skal settes i nytt rør)


Denne feilen gjelder ikke bare i Bergen, jeg har sett samme problemet på
Finnskogen. Der er det ikke mange elver som går i rør...


>
> >  * Feilstavede stedsnavn (en del)
> >
> >
> Har samme problemet her. Stedsnavnene er helt bananas, og er HELT like
> de som står på statens kartverk sine kart...., dvs. at de er også helt
> bananas. Navnene som ble tatt her er de offisielle navnene, og ikke de
> som var markert som alias.
>

Feil. Jeg har sett Øveråsberget (Statens Kartverk bruker det korrekte
Overåsberget), Finnskogan (muligens ment å være Finnskogene), Store
Vingersjø (Statens Kartverk bruker det korrekte Vingersjøen), Store Helgen
(Statens Kartverk bruker Helgen) osv... Jeg har slettet og korrigert etter
beste evne, men det er fortsatt maaange timers jobb igjen på Finnskogen.


> > Jeg foreslår at hele denne importen trekkes tilbake, og at vi heller
> > legger scriptet for å importere dem et eller annet sted så folk kan
> > plukke inn enkeltområder som de kjenner godt når de føler for det.
> > Ellers ender vi opp med en hel haug med data på kartet som er genuint
> > feil og i tillegg nesten umulig å debugge.
>
> Jeg er ikke enig at hele datasettet skal trekkes til bake, det er mye
> nyttig her, antar at 90% er bra nok. Jeg tror, at det er flere navn som
> klareres å brukes, som ellers vi ikke hadde funnet. (viker, fjell, osv
> har ikke stedsnavnskilt.).


Jeg tror, dessverre, at vi er nærmere 10% enn 90%.


> > I de tilfellene hvor stedsnavnene er rett er det ofte fordi stedet er
> > stort nok til at noen hundre meter fra eller til ikke gir feil. En
> > mulighet er derfor å bare importere veldig store features fra dette
> > datasettet, og ihvertfall unnlate alt av gårdsnavn, fjelltopper etc.
> >
> Alle bydeler/bygder/tettsteder/byer, som ikke er
> hovedstad/fylkeshovedstad er definert som Populatet Place.


Da er jeg redd at populated place må sjekkes manuelt før det legges inn.


> Problemet vi har her, er litt behovproblems. Områder nær Oslo, er tett
> befolket, mens rund Bergen, blir det fort ingenting. Veldig mange av av
> navnene er lette å sjekke med landsatt, men så og si umulig å finne ut
> av selv, for ikke å snakke om områder med mindre enn 50 innbyggere, med
> flere hundre km2 rund seg.


Problemet vi har er at stedsnavnene ser ut til å ligge tettere jo mer
grisgrendt området er, der har vi mindre folk som jobber med å korrigere
data, og der har vi endt opp med uendelige mengder stedsnavn vi ikke har noe
forhold til.


> Etter min vurdering, så er dataene av minst like høy kvalitet som
> kystlinjen vår[1]... Dataene var tilgjengelig spøkbart på nettet i et
> halvt år i vinter. (november til mai), og ble ikke brukt.


Og ettersom ingen søkte på dem, så var beste løsning å legge dem rett inn i
kartet?


> Det er noen tags her, som står om de er sjekket ut, så det er fort å
> finne ut om de er gjort noe med. Denne ideen er tatt fra tiger importen.


Jeg var ikke med på Tiger-importen, så den skal jeg ikke uttale meg om. Så
vidt jeg har forstått var det imidlertid del av en plan for hvordan dataene
skulle forbedres.

Skal slike mengder data inn, fra en kilde som vi nå vet har sterkt variabel
kvalitet, _må_ det gjøres noen testimporter først og erfaringene fra disse
før så store datamengder legges inn. Noen områder fra ulike landsdeler og
ulike typer terreng (kyst, fjell, by) burde være med i en slik testimport,
ihverfall. Så kan man se hva som er mulig å ta inn maskinelt, hva som må
sjekkes manuelt og hva som ikke er brukbart.

Jeg foreslår at, med "farm", at vi lar de ligge en stund, og sletter de
> etter f.eks. en måned som har note:nga:*:revised=no, og sletter dem, har
> følsesn av at de er de mest problematiske. Naturlige plasser (vann,
> odder, vik osv) er lettere å fikse, og passer er også lette i griskhente
> strøk.


Farm er en av de største problemene, men også mange hamlet er rart plassert.
Det er også mange vann som er vanskelig å skille fra hverandre og elver på
noder er også litt rart. Et annet betydelig problem er langs kysten, dette
er et typisk område utenfor kysten av Troms:
http://www.openstreetmap.org/edit?lat=69.7889&lon=18.1705&zoom=12

En sjekk på Norgesglasset viser at dette er ganske urent farvann, men jeg
kan ikke skjønne at vi har noen mulighet for å kontrollere at slike grunner
og skjær har rett navn og er plassert riktig.

Mvh,

Gustav
-------------- next part --------------
An HTML attachment was scrubbed...
URL: http://lists.nuug.no/pipermail/kart/attachments/20080715/f7b921a7/attachment.htm 


More information about the kart mailing list