[NUUG kart] Automatisk oppdatert status for adressenodeimport

Ruben Undheim ruben.undheim at gmail.com
Mon Sep 29 07:23:33 CEST 2014


Hei,

Jeg mener å huske at dette har blitt diskutert tidligere her og at noen
hadde funnet ut at disse tegnkodingsproblemene har oppstått før release av
sosi-filene, men jeg har ikke sjekket dette selv. Hvis det er mulig å finne
en en-til-en mapping mellom bokstavfeil i datasettet med riktige bokstaver,
er dette selvfølgelig foretrukket. Men jeg tror det ble observert at så
enkelt er det ikke. En liste over skrivefeil vil dermed løse det selv om
det kanskje vil bli litt ekstra jobb å få den ferdig.

Mvh
Ruben
29. sep. 2014 00:05 skrev "Gnonthgol" <gnonthgol at gmail.com> følgende:

> Den 28. sep. 2014 23:54, Ruben Undheim skreiv:
>
>> Hei,
>>
>> addrnodeimport-programmet bruker nå en liste over skrivefeil i
>> Kartverkets data når den genererer opplysninger:
>>      https://github.com/rubund/addrnodeimport/blob/master/
>> xml/corrections.xml
>>
>> Dette har spesielt økt prosenten vist for Kautokeino og Karasjok på
>> http://osm.beebeetle.com/addrnodeimportstatus.php
>>
>
> Det er litt mistenklig liste. Det ser ut som feil med tegnsettet. SOSI
> filene frå Kartverket kjem i ISO-8859-10 som standard, dette er eit
> teiknsett som inneholder samiske teikn. Sosi2osm konverterer dette til
> UTF-8 som er brukt i XML formatet til OSM. Det virkar som om ein eller
> annan plass blir namna konvertert til ASCII og ukjende teikn erstatta med ?.
>
> Kan du dobbeltskjekke at sosi2osm gir UTF-8 filer med korekte samiske
> teikn, og at python koden har det korrekte teiknsettet satt over alt?
>
> Knut
>
-------------- next part --------------
An HTML attachment was scrubbed...
URL: http://lists.nuug.no/pipermail/kart/attachments/20140929/97539149/attachment.html 


More information about the kart mailing list