[NUUG kart] SSR Sentralt Stedsnavnregister import

Karl Ove Hufthammer karl at huftis.org
Thu Jul 30 11:05:27 CEST 2015


Den 29. juli 2015 16:33, Andreas Bertheussen skreiv:
> On 07/29/15 10:19, Karl Ove Hufthammer wrote:
>> Den 25. juli 2015 21:52, Andreas Bertheussen skreiv:
>>> ### 3. Uavklarte/uspesifiserte ting
>>> - Håndtering av flere språk for samme objekt.
>> Dette handterer skriptet mitt (ssr2osm). Både norsk, nordsamisk,
>> lulesamisk og sørsamisk er støtta (det er dei språka som finst i SSR).
> Men hvordan håndteres det? Dvs, stemmer det med forslaget som ligger på
> wiki? Jeg har vanskelig med å forstå R-script.

Eg veit ikkje kva wikiside du referer til, men det skal iallfall følgja 
reglane i OSM:

Det offisielle namnet vert tagga som «name». Viss det finst fleire 
offisielle namn (eksakte dupliktar vert fjerna), vert det *sist 
vedtekne* brukt. Det neste vert då «alt_name».  Viss det finst fleire 
språk, vert «name» henta frå det norske namnet. For kvart ekstra språk 
objektet har namn på, vert den same regelen brukt, men då med suffiks 
(:se for nordsamisk, :smj for lulesamisk og :sma  for sørsamisk, og 
språkkoden som ligg i SSR for eventuelle andre språk).

*Viss* det skulle finnast objekt med tre eller fleire offisielt vedtekne 
namn på *same språk*, kjem ikkje dei ekstra namna (namn 3 og utover) 
med. Trur ikkje det er noko stort problem. (Kvart objekt skal vel 
uansett ifølgja mållova (?) berre ha eitt offisielt namn.) Og sidan me 
brukar dei *sist* vedtekne namna, burde me vera sikra at me har dei 
meste relevante namna.

> - Håndtering av flere objekter på samme koordinat.
>> Finst det eksempel på dette? Uansett, alt slikt *må* handterast manuelt.
>> Det er mykje «rart» i SSR, både (litt) feil posisjonar, rare namn, ulike
>> objekt (til dels veldig *mange*) som har fått same namn. Alt må flettast
>> manuelt.
> Det kan godt være at det kommer av feil. Eksempler:
>
> http://faktaark.statkart.no/SSRFakta/faktaarkfraobjektid?enhet=766016

Akkurat dette er kategori 108, Bruk, som eg bevisst har ekskludert. Det 
ser ut til at dette vanlegvis er eit enkeltbruk (hus) som har fått 
namnet til garden/grenda/bygda det ligg i. Og det er gjerne *mange* slik 
bruk(objekt) med same namn. Det er altså mest støy.

Men generelt, om det ligg fleire objekt oppå kvarandre, må det 
handterast manuelt (for øvrig akkurat som med *alle* andre objekt/namn … 
:) ).

>> Ifølgje importlista er slike ting ikkje velkommen i OSM. Eg har derfor
>> følgt regelen om å berre ha med standardtaggane (name=*, natural=*,
>> osv.) når eg har brukt data frå SSR, og *ingen* taggar med
>> kartverk-/SSR-prefiks. Eg hadde vel helst føretrekt å hatt med ID og
>> gjort ting systematisk (spesielt når det gjeld framtidige
>> oppdateringar), men dette er til å leva med.
> Jeg kan se hvorfor "..:objid" er lurt, både for oversikt over hvilke
> navn som er importert (fremdrift på import),

Akkurat til dette er det ein dårleg indikator. Alle namna i SSR verken 
kan eller bør verta importerte. Det er for mykje rart der til det.

> og for å finne igjen objektet senere ved synkronisering mot SSR.

Ja, det hadde vore ein fordel med ID-en der. Men i praksis trur eg ikkje 
det vert noko regelmessig synkronisering. Folk importerer delar frå SSR, 
etter det dei synest er viktigast å importera (viktige fjelltoppar, namn 
på vatn og viker, osv.), og over tid. Og i praksis er det ikkje så 
vanskeleg å sjå kva som er importert og ikkje. Merk òg at sjølv om me 
hadde hatt ein ID, ville ikkje den kunna brukast til å synkronisera med 
framtidige versjonar av SSR for alle dei objekta som alt finst i OSM med 
same namn som i SSR, men som ikkje vart importert frå SSR. Ein meir 
farbar veg (når mykje var importert) ville kanskje vore å samanlikna 
namn i OSM med namn (på nærliggande objekt) i SSR, utan å ta omsyn til ID.

> - Valg av OSM-tags. ssr og osm2ssr bruker hver sine tabeller;
> https://github.com/huftis/ssr2osm/blob/master/data/objekttypar.csv  og
> https://github.com/relet/ssr/blob/master/scripts/manual.py#L48-L225
> Dette er vel ryddigst å starte med på wiki. Enig?
>> Tja, eg synest «pull requests» til GitHub fungerer vel så bra. Då kan
>> ein også diskutera kvar førespurnad på «issues»-sida for førespurnaden.
> Jeg synes ikke det er lurt å spre informasjonen ut over flere sider. Da
> blir det vanskeligere å følge med på endringer, og vite hvilke som er
> styrende.

Eg er einig i at informasjonen bør lagrast éin plass. Men ei wikiside er 
ikkje så maskinlesbar. Så eg føretrekker ei CSV-fil (eller ei JSON-fil, 
eller anna eigna maskinlesbart format folk føretrekker) i eit 
versjonskontrollsystem.

>   Wiki har også en diskusjonsside.

Diskusjonar kan me ev. ta her på lista (wiki-diskusjonssider oppfattar 
eg mest som sider der folk skriv og aldri les :) ).

-- 
Karl Ove Hufthammer


More information about the kart mailing list