On Mon, Apr 07, 2003 at 06:49:40PM +0200, Petter Reinholdtsen wrote:
Det gleder meg å se at folk både hos Språkrådet, standardorganisasjonene er interessert i dette. Jeg håper vi kan endre opp med _et_ konsistent dokument som kan brukes som grunnlag for å lage et korrekt og fritt tilgjengelig locale for bokmål og nynorsk. Jeg tror URL:http://std.dkuug.dk/cultreg/registrations/narrative/nb_NO,_4.5 er et godt utgangspunkt, men at dette dokumentet må korrigeres og redigeres før det kan brukes.
Jeg mener det kan brukes nå, men med endringer. Og jeg mener vi gjerne skal påvirke NTS så de feil som der er, blir rettet.
F.eks. er det umulig å lage entydig og automatiserbar sortering når rekkefølgen er udefinert, slik som "There is no explicit ordering of accents specified in "Tanums store rettskrivningsordbok", and whether case or accents are the most important is not specified." legger opp til. Disse uklarhetene må klargjøres, hvis ikke vil forskjellige systemer ende opp med forskjellig sorteringsrekkefølge.
En måte å klargjøre dette er at bruke den europeiske sorteringsstandarden CEN ENV 13710 eller den internasjonale sorteringsstandarden ISO/IEC 14651 til å utfylle dette tomrom. ISO 14651 er faktisk laget til å følge Linux-standarden for sortering, og er beregnet til å ha endringer til seg.
[Keld Jørn Simonsen]
NTS anbefaling, at utelate tusenskilletegn i vanlige tall, skal ses på denne bakgrunnen. Den relaterer seg til all utskrift af tall fra programvare, og også til all innlesing av tall. Det er ikke en anbefaling som er beregnet på presentasjon i en løpende tekst, men på utskrifter av beregninger, tabeller mm. Hodeformålet er å komme den utbredte praksis med anvendelse av punktum som desimalskilletegn til livs. Anbefalingen gjelder også for tall hvor ikke komma inngår.
Mht. anbefalingen omkring beløpsangivelser bygger anbefalingen fra NTS på at punktum benyttes som tusenskilletegn i de fleste banker og i finansiel programvare. Det er også oppfattelsen at et mellomrom som tusenskilletegn er forvirrende når det er flere tall som presenteres. Her kan det være svært at se hvornår et tall holder opp og hvornår det neste starter, hvis mellomrom brukes. Bruk av punktum øker her lesevennligheten og er stadig kulturellt akseptabelt.
Programmer som skriver ut tall på et locale-avhengig format, og så forventer å kunne lese dem inn igjen, har lagt tvilsomme forutsetninger til grunn, og jeg ville ansett et slikt program som defekt hvis jeg kom over dem.
Et korrekt programm som forventer å kunne lese inn verdiene igjen, må skrives dem ut på et format som er uavhengig av satt locale, og problemområdet vi diskuterer her kommer dermed ikke til anvendelse. Vi diskuterer her hvordan det norske localet skal se ut. Data skrevet ut på locale-avhengig format kan kun brukes til presentasjon, og ikke lese inn igjen uten større møye og mye manuell sjekking.
Jeg vet ikke om du har hørt om Linux:-) Der er det mye anvendt at utdata fra et program sendes videre til et annet program. Det heter et rør, på engelsk "pipe". Røret kan f.eks være et program det gjør at du får vist en side av gangen, some "less". Det kan også være et program det sorterer linjene i utdata, "sort" heter det. Sort kan sortere numerisk.
Et program vet ikke hvordan utdata fra det skal brukes etter det er laget. Det kan hende at data bare skal brukes som de er - og derfor leses av et menneske, som gjerne skal ha utdata presentert i et format som er lesevennligt for vedkommende. På norsk bør det så for talls vedkommende være med komma som desimalskilletegn. Det kan også hende at utdata skal sorteres først, før de presenteres, eller etterbehandles på annen måte. Da skal tall formateres så det etterfølgende program kan behandle dem på skikkelig måte. Derfor er det nødvendig at tall formateres både så de er kulturellt akseptable og at det kan forstås av programmer. POSIX tillater dette og spesifikasjonerne fra NTS beskriver dette som det bør lages i POSIX-overholdende systemer i norske omgivelser.
Vennlig hilsen Keld Simonsen