Godt det er nokon som kan dette, det er langt utanom mi verd. Imponert over arbeidet.
Den 15.06.2026 21:51, skreiv Karl Ove Hufthammer:
Karl Ove Hufthammer skreiv 05.06.2026 20:06:
Arkiv over innlegg til lista er som alltid ope tilgjengeleg. Og me har no ei mykje betre teknisk løysing for arkivet. Førebels vert berre *nye* innlegg lagde i arkivet, men planen er å importera alle tidlegare innlegg. Det er ein del tekniske ting å rydda opp i der først, men arbeidet pågår.
No er *heile* arkivet med tidlegare meldingar importert! Takk til Johnny A. Solbu for den tekniske importen.
De finn arkivet her: https://lists.nuug.no/lister3/hyperkitty/list/l10n-no@nuug.no/latest Det er mogleg både å bla og å søkja i.
Arkivet går no heilt tilbake til juli 2001, og det er snakk om til saman nesten 12 000 meldingar! Det er mykje interessant lesnad.
Her er litt tekniske detaljar for dei som måtte vera interesserte. Det eg har gjort før importeringa, er:
Har fjerna enorme mengder spam / «uønskt e-post». I starten var e-postlistene våre heilt opne og umodererte (kven som helst kunne senda meldingar, òg ikkje-medlemmar) noko som gjorde at det etter kvart kom inn *veldig mykje* spam. Moderering av innlegg for ikkje-medlemmar tvinga seg til slutt fram (sjå diskusjonane om dette), noko som reduserte omfanget vesentleg.
Meldingane som er fjerna, var anten rein reklame, svindelforsøk (eks. Nigeria-svindel), virus/ormar (spesielt ormen Sobig herja stygt ein periode) og automatiske returmeldingar (hovudsakleg frå spam der e-postlistene våre var oppgitt som falsk avsendar). Alle desse meldingane er fjerna manuelt. Eg trur eg har fått med meg det aller meste, men det kan vera ei og anna melding eg ikkje har fanga opp.
Har slått saman meldingar frå *alle* dei historiske listene våre, dvs. i18n-nb (bokmålsdiskusjonar), i18n-nn (nynorskdiskusjonar), i18n-no (ikkje-målformsspesifikke diskusjonar) og (gamle) l10n-no.
Har filtrert ut alle robotmeldingar (frå The Translation Project) frå desse listene og heller flytta desse over til arkivet for lista l10n-no-robot. Før gjekk robotmeldingane direkte til i18n-nb og i18n-nn, og dei utgjorde faktiske storparten av meldingane på desse listene. Det ville berre vera støy å ha dei i arkivet, så det er best å ha dei filtrert ut (dvs. på ei anna liste).
Har retta nokre tekniske feil i arkivfilene (mbox-filer). Det var snakk om linjer som tilfeldigvis begynte med teksten «From », men som ikkje var starten på ei ny melding, noko som skapar krøll for ulike program som leser mbox-arkivfiler.
Har retta nokre ekstremt feil datoar i nokre meldingar. Dei kom frå personar som tydelegvis hadde systemklokka stilt fleire år feil når dei sende meldingane. Sidan meldingane då hadde hamna i heilt feil månadsarkiv, var det greiast å retta dette. Datoen/klokkeslettet for desse meldingane er sett til tidspunktet der meldingane kom *fram* til lista (som jo er tidspunktet alle lesarane fekk meldinga). Meldingar der datoane berre var nokre få dagar feil, har eg ikkje gjort noko med. (Grunnen til slike avvik kunne vera at meldingane låg i modereringskø på lista ei stund, eventuelt i kø på avsendarmaskina.)
E-postlista i18n-sme, for diskusjonar om omsetjing av fri programvare / Skulelinux til nordsamisk, har eg òg ei arkivfil for (og eg har fjerna spam frå denne). Men meldingane der har eg *ikkje* lagt inn i arkivet for l10n-no. Diskusjonane der gjekk dels på norsk og dels på nordsamisk, og dei kan vera IT-historisk interessante, men eg synest ikkje dei passar i l10n-arkivet. Men viss arbeidet med omsetjing til (nord)samisk nokon gong startar opp igjen, kan ein gjerne importera meldingane til ei eventuell *ny* diskusjonsliste.
Elles er det ein teknisk ting å vera obs på: På tidleg 2000-talet strevde me dessverre framleis med bokstavar som æ, ø og å i datasamanheng (sjølv om teiknkodinga UTF-8, som me alle brukar no, vart til tidleg på 1990-talet!). Dei ulike e-postprogramma varierte mykje i kor godt dei handterte slike «internasjonale» teikn (og i om dei var sette rett opp). Det finst derfor ein del meldingar i arkivet der slike særnorske bokstavar ikkje vert viste rett, anten i emnefeltet eller i (heile eller til og med *delar av*) meldingsteksten. Dette er ikkje ein feil med importen; problemet var der for dei som las meldingane den gong då òg. Men det gjer at søk på ord med desse bokstavane ikkje *nødvendigvis* vil finna alle meldingane som faktisk finst. Og det kan vera litt trøblete å lesa meldingane; æ, ø og å kan for eksempel visast som spørsmålsteikn eller som heilt andre teikn (såkalla mojibake). Dette får me berre leva med.