Hva mener vi nøyaktig med at et ord er sammensatt, nærmere bestemt: hvilken informasjon er vi ute etter i feltet COMPOSITE-WORD? Mener vi sufikser, infikser og prefikser, altså stavelser, også, eller bare rene ord? (Og med ord kan vi selvsagt også mene ord som er sjeldne eller helt ute av bruk, og kanskje er alle stavelser egentlig tidligere ord, for å komplisere det litt).
For å ta et eksempel:
WORD: meningsløsheter STATUS: + COMPOSITE-WORD: menings=løsheter EDITOR: Axel Bojer axelb@skolelinux.no
«Mening» og «løs» er to ord, «heter» er - slik det er ment i dette ordet - intet ord, men en (eller to) stavelser, som i skjønnhet, varhet osv.
Men ønsker vi oppføringa COMPOSITE-WORD: menings=løsheter eller COMPOSITE-WORD: menings=løs=heter eller COMPOSITE-WORD: men=ings=løs=het=er da også -er er en stavelse, ofte brukt i norske ord. (Det første leddet kan forsvares med at «men» her kommer av verbet å mene).
Eksempelet fra http://no.speling.org/filformat.html er: ord=bøker. Tar vi det til følge, så mener vi iallfall ikke det siste. Jeg har hittill tolket det som at vi ikke har ment det andre heller, men tror vi trenger en avklaring :-)
Mvh Axel
Axel Bojer skrev:
Hva mener vi nøyaktig med at et ord er sammensatt, nærmere bestemt: hvilken informasjon er vi ute etter i feltet COMPOSITE-WORD? Mener vi sufikser, infikser og prefikser, altså stavelser, også, eller bare rene ord? (Og med ord kan vi selvsagt også mene ord som er sjeldne eller helt ute av bruk, og kanskje er alle stavelser egentlig tidligere ord, for å komplisere det litt).
For å ta et eksempel:
WORD: meningsløsheter STATUS: + COMPOSITE-WORD: menings=løsheter EDITOR: Axel Bojer axelb@skolelinux.no
«Mening» og «løs» er to ord, «heter» er - slik det er ment i dette ordet
- intet ord, men en (eller to) stavelser, som i skjønnhet, varhet osv.
Men ønsker vi oppføringa COMPOSITE-WORD: menings=løsheter eller COMPOSITE-WORD: menings=løs=heter eller COMPOSITE-WORD: men=ings=løs=het=er da også -er er en stavelse, ofte brukt i norske ord. (Det første leddet kan forsvares med at «men» her kommer av verbet å mene).
Eksempelet fra http://no.speling.org/filformat.html er: ord=bøker. Tar vi det til følge, så mener vi iallfall ikke det siste. Jeg har hittill tolket det som at vi ikke har ment det andre heller, men tror vi trenger en avklaring :-)
Det avgjørende er selvsagt hva vi skal bruke denne orddelinga til. Petter mente vi behøver den, Hva bruker vi/databasefila/skriptene denne informasjonen til? Er det bare ordboksord som er interessante?
Mvh Axel
* Axel Bojer (2006-03-21 20:02):
Men ønsker vi oppføringa COMPOSITE-WORD: menings=løsheter eller COMPOSITE-WORD: menings=løs=heter
I dette tilfellet hadde eg ikkje vore i tvil, det må vera menings=løsheter som er fasit.
Det avgjørende er selvsagt hva vi skal bruke denne orddelinga til. Petter mente vi behøver den, Hva bruker vi/databasefila/skriptene denne informasjonen til? Er det bare ordboksord som er interessante?
Det hadde vore kjekt og fått ei avklåring her. Til det siste spørsmålet trur eg svaret er ja, men kva med til dømes "mirakelkrosstoget" som eg fekk i dag? (Kva er forresten sjansen for at nokon nokon gong skal skriva dette ordet igjen?) Skal det delast i forlekk og etterlekk slik: mirakel=krosstoget, eller skal samansetjinga av etterlekken òg markerast slik: mirakel=kross=toget? Og kva med slike sære ting som grape=frukt, skal samansetjinga markerast der?
Erik
[Erik Haugan]
I dette tilfellet hadde eg ikkje vore i tvil, det må vera menings=løsheter som er fasit.
Enig.
Det hadde vore kjekt og fått ei avklåring her. Til det siste spørsmålet trur eg svaret er ja, men kva med til dømes "mirakelkrosstoget" som eg fekk i dag? (Kva er forresten sjansen for at nokon nokon gong skal skriva dette ordet igjen?) Skal det delast i forlekk og etterlekk slik: mirakel=krosstoget, eller skal samansetjinga av etterlekken òg markerast slik: mirakel=kross=toget? Og kva med slike sære ting som grape=frukt, skal samansetjinga markerast der?
Hvis jeg har forstått det riktig, så bruker programmet som bygger stavekontrolldatabasen informasjon om ordskille til å se hvor stor del av ordet som skal tas med når den forsøker å finne bøyningsmønstre når mange ord samenlignes. Derfor er det viktigst at det siste ordet i et sammesatt ord kan skilles ut. Dvs. at for mirakelkrosstoget er det viktig å markere ut 'toget' som eget ord. Det er antagelig en fordel å markere ut de andre delene for å kunne se om alle orddelene finnes fra før i databasen, men jeg tror ikke det er noe automatikk som gjør dette i dag.
Jeg anbefaler derfor å markere sammensetninger slik: 'mirakel=kross=toget' og 'grape=frukt'. Når det gjelder hvor ofte ordene brukes, dvs. ordfrekvens, så har vi tilgang til endel kilder for slik informasjon, og den brukes til å utelukke sjeldne ord fra de ordene som blir med i selve stavekontrollen. Det er dermed ikke noe problem om sjeldne ord blir godkjent og lagt i orddatabasen, og dere trenger derfor ikke tenke på om andre noensinne kommer til skrive ordet igjen, men kun på om det er korrekt stavet. :)
Erik Haugan kirjoitti 24. mar. 2006 kello 09.11:
- Axel Bojer (2006-03-21 20:02):
Men ønsker vi oppføringa COMPOSITE-WORD: menings=løsheter eller COMPOSITE-WORD: menings=løs=heter
I dette tilfellet hadde eg ikkje vore i tvil, det må vera menings=løsheter som er fasit.
Som orddelingsgrense, sjølvsagt, og ikkje som samansetjingsgrense.
Det avgjørende er selvsagt hva vi skal bruke denne orddelinga til. Petter mente vi behøver den, Hva bruker vi/databasefila/skriptene denne informasjonen til? Er det bare ordboksord som er interessante?
Det hadde vore kjekt og fått ei avklåring her. Til det siste spørsmålet trur eg svaret er ja, men kva med til dømes "mirakelkrosstoget" som eg fekk i dag? (Kva er forresten sjansen for at nokon nokon gong skal skriva dette ordet igjen?) Skal det delast i forlekk og etterlekk slik: mirakel=krosstoget, eller skal samansetjinga av etterlekken òg markerast slik: mirakel=kross=toget? Og kva med slike sære ting som grape=frukt, skal samansetjinga markerast der?
De har vel også regelbasert orddeling? Viss det finst regelbasert orddeling, kan den manuelt markerte avgrensast til tilfelle der reglane ikkje strekk til, som i menings=løsheter, som vil gje delinga me-nings-lös-he-ter. meningslösheter vil derimot bli delt me-ning-slös-he-ter. Derfor er = viktig.
Trond.
---------------------------------------------------------------------- Trond Trosterud t +47 7764 4763 Institutt for språkvitskap, Det humanistiske fakultet m +47 950 70140 N-9037 Universitetet i Tromsø, Noreg f +47 7764 5216 Trond.Trosterud (a) hum.uit.no http://www.hum.uit.no/a/trond/ ----------------------------------------------------------------------