Den 10. nov. 2008 kl. 11.10 skrev Lars Ivar Igesund:
On Monday 10 November 2008 09:53:38 Sjur Nørstebø Moshagen wrote:
Konklusjon: i staden for å kritisera sorteringsreglane, vil eg heller retta kritikken mot OS-produsentane - dei kan gjera det betre enn dei gjer det no!
Dette er då vitterleg ikkje eit teknisk problem i seg sjølv, men derimot at ord og namn ikkje kjem med informasjon om korleis dei sorterast (utover seg sjølv for å sei det sånn). Om det var vanleg at ord hadde innebygde sorteringsmetadata, så hadde dette vore løyst forlengst. Og sidan ein ikkje kan krevje at den som skriv inn noko legg ved slik informasjon, er einaste reelle tekniske moglegheita og fornuftige løysinga at ordlister vert utvida med sorteringsinformasjon.
Vel, det var akkurat det eg skreiv. Språkteknologi bruker ein nettopp til å få fram ulik informasjon om orda (og setningane, m.m.) i ein tekst. Og grunndata for all språkteknologi er nettopp "ordlister" i ein eller annan forstand.
Det eg peika på er at sjølv om slike lister finst (og dei finst), og sjølv om språkteknologi finst (som eg skreiv), så blir det ikkje brukt i dei vanlege OS-a i dag.
Eller sagt på ein annan måte:
Du treng teknologi for å henta fram slik informasjon som vi diskuterer her (korrekt sorteringsdata), og denne teknologien heiter språkteknologi. Det er ei svakheit ved OS-a at dei ikkje bruker tilgjengeleg teknologi og data (dvs "ordlister") for å gje det resultatet brukarane vil ha. Eg står fast på konklusjonen min om at det er OS-produsentane som burde gjera ein betre jobb.
Sjur
PS. Eg har sett "ordlister" i hermeteikn, fordi datagrunnlaget for språkteknologi vanlegvis er meir komplekst enn berre lister. Men litt forenkla er det ok å prata om ordlister, det er sjølvsagt lange lister med ord som er ein viktig del av datagrunnlaget. DS.