On Monday 10 November 2008 12:35:01 Sjur Nørstebø Moshagen wrote:
Den 10. nov. 2008 kl. 11.10 skrev Lars Ivar Igesund:
On Monday 10 November 2008 09:53:38 Sjur Nørstebø Moshagen wrote:
Konklusjon: i staden for å kritisera sorteringsreglane, vil eg heller retta kritikken mot OS-produsentane - dei kan gjera det betre enn dei gjer det no!
Dette er då vitterleg ikkje eit teknisk problem i seg sjølv, men derimot at ord og namn ikkje kjem med informasjon om korleis dei sorterast (utover seg sjølv for å sei det sånn). Om det var vanleg at ord hadde innebygde sorteringsmetadata, så hadde dette vore løyst forlengst. Og sidan ein ikkje kan krevje at den som skriv inn noko legg ved slik informasjon, er einaste reelle tekniske moglegheita og fornuftige løysinga at ordlister vert utvida med sorteringsinformasjon.
Vel, det var akkurat det eg skreiv. Språkteknologi bruker ein nettopp til å få fram ulik informasjon om orda (og setningane, m.m.) i ein tekst. Og grunndata for all språkteknologi er nettopp "ordlister" i ein eller annan forstand.
Det eg peika på er at sjølv om slike lister finst (og dei finst), og sjølv om språkteknologi finst (som eg skreiv), så blir det ikkje brukt i dei vanlege OS-a i dag.
Vel, om ein kanskje ser vekk i frå Windows, så er det sjeldan OS'et si oppgåve å sortere noko som helst. For dei fleste operativsystem er ikkje eingong filsystemet ein del av OS'et, og filsystema gjer uansett fint lite utanom å gi deg ein haug med usorterte (dog ofte grupperte) data.
Og sjølv om desse listene finnast, så betyr ikkje det at det ikkje finnast duplikatar på andre språk som ikkje skal sorterast etter norsk måte - korleis veit ein at noko faktisk er meint å skulle tolkast som norsk? Må brukaren krysse av for det dersom det er snakk om eit søkjefelt?
Eller sagt på ein annan måte:
Du treng teknologi for å henta fram slik informasjon som vi diskuterer her (korrekt sorteringsdata), og denne teknologien heiter språkteknologi. Det er ei svakheit ved OS-a at dei ikkje bruker tilgjengeleg teknologi og data (dvs "ordlister") for å gje det resultatet brukarane vil ha. Eg står fast på konklusjonen min om at det er OS-produsentane som burde gjera ein betre jobb.
Det er kanskje MS sin feil at det ikkje er implementert noko slikt i Windows, og tilsvarande for Apple og OSX - men som oftast vil du sjå mangelen på bruk av slik teknologi i programvare som ingen av dei har laga (og på Linux og andre OS har sjeldan distributørane ansvar for slikt i programvaren som dei leverar). Vidare må ein sjå på kor mange språk der dette faktisk er ei relevant problemstilling - engelsk som ofte får litt for stor relevans i utvikling av slag teknologi har det definitivt ikkje. Vidare vil ein for all del ikkje kople inn slik teknologi alle plassar der noko skal sorterast, spesielt ikkje berre fordi norsk _kan_ vere i bruk, ettersom det ville gjere eit trivielt sorteringsproblem (basert på numerisk eigenverdi av teksten) om til ein merkbart dyrare operasjon (iallfall isolert sett, på ein desktop PC vil ein sannynlegvis ikkje tenkje over dette). Vidare må det nemnast at det på ingen måte er ein teneste frå operativ-systemet å sortere tekst, derimot er dette noko som er implementert om att og om att opp og ned i mente, og å endre alle desse til å bruke ein sentralisert teneste (ikkje nødvendigvis ein dum ide reint teknisk) ville vere eit enormt arbeid (men ikkje teknisk vanskeleg). Dersom nokon faktisk ynskte å gjere noko sånt, så vil eg tru at ein raskast kunne få effekt i programvare slik som KDE, der ein i det minste har standard listekomponentar for bruk i GUI, men eg veit ikkje om dei forskjellige applikasjonane som brukar desse komponentane også brukar felles sorteringsfunksjonalitet (normalt sett er det ikkje noko problem å spesialisere dette per applikasjon).
Personleg meiner eg det vil vere fullstendig feil å ha "norsk sortering" ein einaste plass i normal programvare, utanom i lister der ein veit at der kun skal vere eigennamn, og at desse er norske - og det einaste tilfellet som alle vil møte er kontaktlister (telefonkatalogar, etc) og kanskje sortering av epost på avsendar. Desse kan/bør i så tilfelle handterast spesielt. Sjølv søk vil verte skadelidande dersom norsk sortering er i bruk, dersom ein ikkje også sjekkar om søkjetermen kanskje kan vere eit norsk særnamn (men kanskje er det ikkje det, det er berre skrive som eit norsk særnamn).
Jamnt over kan eg seie (som ein som til dagleg utviklar programvare og teoretisk sett kunne ha vorte tvinga til å implementere dette) at det vil vere eit semantisk mareritt å få 100% korrekt, men at å bruke numerisk sortering vil vere rett (og alltid enklast) i suverent flest tilfelle.
Mvh, Lars Ivar Igesund