Jeg ble usikker på Composite-word feltet på to ord jeg fikk tilsendt i dag. Dette har jeg ikke tenkt på før, men ble brått usikker nå.
Hvilke eksempel nedenfor stemmer?
lastebilpatrulje: 1) laste=bil=patrulje 2) lastebil=patrulje
overnattingsvirksomhet: 1) over=nattings=virksomhet 2) overnattings=virksomhet
Før har jeg alltid delt opp ordene slik som 1) viser.
Hilsen Espen Talberg
Espen Talberg wrote:
Jeg ble usikker på Composite-word feltet på to ord jeg fikk tilsendt i dag. Dette har jeg ikke tenkt på før, men ble brått usikker nå.
Hvilke eksempel nedenfor stemmer?
lastebilpatrulje:
- laste=bil=patrulje
- lastebil=patrulje
overnattingsvirksomhet:
- over=nattings=virksomhet
- overnattings=virksomhet
Før har jeg alltid delt opp ordene slik som 1) viser.
Jeg ville egenrelt gått for 1, slik du har gjort før. Så lenge hvert ledd er et gyldig norsk ord, så er det vel rett med en delestrek.
Laste, bil og patrulje er greie, men «nattings» er vel tvilsom, der kanskje variant 2 bør velges :-)
-Axel
Axel Bojer:
lastebilpatrulje:
- laste=bil=patrulje
- lastebil=patrulje
overnattingsvirksomhet:
- over=nattings=virksomhet
- overnattings=virksomhet
Før har jeg alltid delt opp ordene slik som 1) viser.
Jeg ville egenrelt gått for 1, slik du har gjort før. Så lenge hvert ledd er et gyldig norsk ord, så er det vel rett med en delestrek.
Når ein først skal merka orddelingsinfo, kunne ein godt gjort dette på fleire nivå, for bruk i ev. seinare fleirnivåorddelingsalgoritmar.
Eksempel på høgaste nivå (nivå 1):
lastebil-patrulje
Neste nivå (nivå 2):
laste-bilpatrulje
Neste nivå (nivå 3):
las-te-bil-pa-trul-je
Nokre ord har ingen orddelingar (som «hei»), andre har berre orddelingar av nivå 3 («ha-ge»), andre har orddelingar av nivå 1 og 3 men ikkje 2 (barne-hage/bar-ne-ha-ge), og andre andre har av alle (barnehagetante). Godt mulig det er behov for fleire nivå / andre kodesystem, men det var desse eg kom på i farten.
Spørsmålet jeg lurer på litt i samme gaten er om man skal sette inn mage Composite-word felt? For å bruke eksemplene til Espen:
WORD: lastebilpatrulje STATUS: ? # COMPOSITE-WORD: laste=bil=patrulje # COMPOSITE-WORD: lastebil=patrulje CORRECTION: lastebilpatrulje EDITOR: Svenn Inge Ingebrigtsen svenn@online.no
Og hvis det er slik jeg forstår, så er det slik at feltene COMPOSITE-WORD brukes for å finne "nye" ord fra sammensatte ord... og når man da tenker på et ord som "lastebil", så er det jo særlig lite trolig at man er "nyskapende", om man mener at man har funnet to "nye" ord, da jeg vil tro at både "laste", og "bil" er ord som allerede ligger i de ordlistene som man har tatt utgangspunkt i. Derfor er det vel kanskje ikke alltid verdt bryet med å sitte å dele opp ord som "fotball", "stemmerett", "Kåre-Johnny", "tier" osv. da disse orddelene sikkert allerede ligger i ordlista fra før?
Grunnen til at jeg spør er at jeg er lat, og sjelden liker å gjøre mer jobb enn nødvendig - samtidig som jeg synes det er moro å få være med å bidra....
Dog er det mer frustrerende å sitte å lese korrektur på ord som ligger i ordlista allerede som er av typen:
stortings boligspekulasjonens drosjesjåførenes
da dette er bøyninger av ord.. Var det ikke tidligere snakk om å forsøke å utarbeide noe hvor man stort sett bare satt og leste korrekturer på grunnstammen av ordene?? Jeg bare spør for jeg har vært borte ei stund fra denne lista... Dvs. lest lite på den... Og så fikk jeg også sjansen til å spore av fra det denne tråden egentlig handler om...
Svenn Inge Ingebrigtsen
Da vil jeg tro at det fungerer greit med:
2) lastebil=patrulje 2) overnattings=virksomhet
Om det ikke er noen innvendinger mot dette så kommer jeg til å fortsette slik fremover også.
Svenn Inge Ingebrigtsen wrote:
Dog er det mer frustrerende å sitte å lese korrektur på ord som ligger i ordlista allerede som er av typen:
stortings boligspekulasjonens drosjesjåførenes
da dette er bøyninger av ord. Var det ikke tidligere snakk om å forsøke å utarbeide noe hvor man stort sett bare satt og leste korrekturer på grunnstammen av ordene?
Jeg setter på «ROOT:» på de ordene som ikke er grunnstamme.
Espen Talberg
Espen Talberg wrote:
Da vil jeg tro at det fungerer greit med:
- lastebil=patrulje
Jeg ville ha delt opp laste=bil=patrulje, siden det er de tre *ordene* det består av, dette tilsvarer 1+2 i Karl Oves oppstilling. Såvidt jeg har forstått så brukes dette foreløpig nettopp til å gjenkjenne ord og ikke noe annet, Petter kan sikkert forklare detaljene, men jeg mener man finner det i arkivet et sted også, for den som vil lete :-)
- overnattings=virksomhet
Ja
Hilsen Axel