Den 11. nov. 2008 kl. 01.43 skrev Lars Ivar Igesund:
Orsak at eg kverulerar litt - er ikkje prinsipielt mot korrekt sortering, stiller meg berre litt tvilande til at ein slik sorteringsteneste vil verte tilgjengeleg med det fyrste.
Der kan vi vera samde - eg peika berre på at det faktisk er mogleg (og eigentleg ganske enkelt) å løysa dei aller fleste utfordringane som vart nemnde i starten på diskusjonen
Det er mange plassar ein har bruk for å sortera data. Det vi her pratar om gjeld brukargrensesnittet, dvs korleis OS-et presenterer ein viss datatype (lister) til brukaren, og korleis brukaren venter seg at slike lister skal presenterast (t.d. sortert alfabetisk korrekt etter reglane for språket brukaren har valt i grensesnittet).
Mitt poeng er at eg i utgangspunktet ikkje ser på dette som OS-et si oppgåve, først og fremst fordi OS-et ikkje har data som vil ha behov for slik sortering. Men det kan for all del ha ein slik teneste.
Andre kan ha ei anna oppfatning om kva OS-et bør gjera ;)
Og på eit vist nivå skal jo OS-et handtera brukardata, som av og til omfattar slike som vi her har diskutert. På Linux vil det kanskje vera i KDE (som du ikkje ser på som ein del av OS-et, om eg har oppfatta deg rett), på MacOS X blir dette sett på som ein del av dei tenestene som OS-et skal tilby for å få konsistent oppførsel.
Jau, eg er godt kjent med collation, både gjennom ICU og bibliotek som eg sjølv har vore med å utvikla.
Ok.
Det er då heller ikkje dette eg ser på som eit problem (orsak, utfordring som er til for å løysast).
Der er vi usamde. Vi konstaterte at dei tilgjengelege algoritmane for å sortera aa korrekt i ein norsk (og dansk) kontekst ikkje er tilstrekkelege i og med at vi ikkje får det resultatet vi ynskjer, og eg peikte på ei (språkteknologibasert) løysing for å ta fram nok metadata til å gje korrekt resultat i dei aller fleste tilfella.
Det underliggjande poenget mitt er at jo meir tekst vi produserer, jo større trong til språkteknologi vil det vera: det gjeld indeksering og søking, tekstbehandling (stavekontroll, grammatikkontroll, orddeling), sortering, talesyntese, m.m. I Linux-miljøa (og største delen av open- kjeldekodemiljøa i det heile) er kunnskapen om slik språkteknologi og kva han kan gjera svært mangelfull, både på eit allment plan og i form av handfaste kunnskapar om korleis ein kan koda slik teknologi. Dette har konsekvensar for brukarane, og for Linux på lengre sikt, fordi særleg MS satsar mykje pengar på språkteknologi (vår venn Bill har jo i åretal hevda at "snart treng vi berre prata med datamaskina" - det har ikkje hendt enno, men MS byggjer stadig inn meir avansert språkteknologi i Windows). I framtida kan det som skil kommersielle OS (og store programpakker) frå gratisvariantar vera nettopp tilgangen på språkleg "intelligens" i systema.
Dessverre er innsatsen til MS (og delvis andre aktørar) mykje styrt av kva engelskspråklege brukarar treng, og språkteknologien er tilsvarande "skeiv". Dette ser vi t.d. i MacOS X og indekseringssystemet Spotlight. Det er eit godt system for engelsk, og delvis brukbart for norsk, men gjer ein håplaus jobb med språk som finsk og samisk pga ordstrukturen i språka. Dersom det hadde vore mogleg å leggja til ein indekseringsanalysator (=språkteknologi) i MacOS X, ville det plutseleg vera svært enkelt å søkja i samiske og finske tekstar på Mac-en, men det er det pr i dag ikkje mogleg å gjera.
Det finst teikn til betringar, fyrst og fremst fordi språkteknologimiljøa sjølve har oppfatta at teknologien deira må bli open kjeldekode for at vi skal få framdrift som gagnar brukarane (sjå t.d. https://kitwiki.csc.fi/twiki/bin/view/KitWiki/HfstHome). I beste fall vil det vera mogleg å ta att noko av det forspranget MS har fått, og til og med gå forbi, særleg i språkteknologistøtta for små språk. Divvun-prosjektet (www.divvun.no) handlar nettopp om det - å utvikla grunnleggjande språkteknologiinfrastruktur for små språk (med hovudvekt på samisk).
Beste helsing Sjur N. Moshagen Samediggi · Sametinget Prosjektleiar for Divvun-prosjektet http://www.divvun.no/ http://www.samediggi.no/ +358-9-49 75 29 (a) +358-505 634 319 (m)