Hei alle sammen
Den 24 januar hadde vi et lite møte på irc, og la grunnlaget for et prosjekt med målet "Norsk grammatikkontroll".
Vi diskuterte litt omfanget av en slik programvare, og bestemte oss for å fokusere på én bestemt type feil i første omgang:
Ord delings feil [sic]
Dette synes å være en bra type feil å begynne med, siden det ikke synes å finnes noen grammatikkontroll som tar denne typen feil. Derfor burde dette prosjektet være interessant som studie også, kanskje som en masteroppgave for noen?
En del tekniske ting er bestemt, som * LanguageTool som verktøy * infoside på http://no.speling.org (kommer) * wiki på http://wiki.debian.org/SpellNorwegian/grammar/ * kildekode på samme server som norsk stavekontroll
Det er allerede åpnet mapper for grammatikkontroll under kildekoden. Kontrollen fungerer med noen enkle, grunnleggende feiltyper som er kopiert fra engelsk (repeterte ord, stor bokstav i begynnelsen av en setning, feil med mellomrom osv).
Nå er vi på jakt etter personer eller organisasjoner som kan tenke seg å arbeide på prosjektet. Vi trenger både lingvister, programmerere og testere.
Etter å ha loddet stemningen litt, ønsker vi også å komme i kontakt med organisasjoner som kan tenke seg å støtte programmet "offisielt". Organisasjoner som Språkrådet, div universiteter og andre som kan omfavne eller anerkjenne prosjektet. Det finnes mange ildsjeler på denne mailinglisten, men vi innser jo at et godt prosjekt blir raskere utviklet hvis det finnes en viss grad av økonomisk støtte også, i tillegg til den rent tekniske, faglige og moralske.
Håper noen flere der ute kan være interessert i å delta - det er ikke noe krav om å være en kløpper på data, interesse for [godt norsk] språk holder lenge.
Død over ord delings syken!
Møtereferat 24 jan 2011 (som vedlagt): http://wiki.debian.org/SpellNorwegian/M%C3%B8te/2011-01-24
mvh Arno Teigseth
[Olav, siden du spurte om dette,] min offentlige GPG-nøkkel (0x273C0630) er: -----BEGIN PGP PUBLIC KEY BLOCK----- Version: GnuPG v1.4.9 (GNU/Linux)
mQGiBEkKrIkRBADLsY65M0dNA5w4I9PG3EhUzeT/pPBMlejOJADg78oadsJYtoIq bCsk5WcRDoiF6zu4l2VIT9Q/MxF5Es/dDMbEFmZ+BjPka5wQWHS2k2C/KWO3JLDq rXubFrNNWzB7CjFgjD7/MNICXqZumfLmsTuNSMjBowdSqAdrj+KtXdBEywCg/f9H zzfefE5GOSVPHlsACNdQ3TsD/1wGlXUwOWNz1ly6Peifsx/O4dzu8j2F17TV5pNx wqDgfV/mOkR15Yd54KGQGs2lQitbOfcdKoN87K3rjSGturhoQbXRKPSn2j8OwXkx jhfJcmSoF8C0CE5RJYyPD/ksdXGA6AALdwQU/cEM5FlRh1eaGjvXFAd04d1lsjAK loYCA/4kIv6ML+c60OfHvwfl/J6Yep1Pz1FosyBgfaAjZDtblpnJSV8Jlg46cCV3 P8o4WkwiXQXeHbRZw6AUXTwm5E8RUpBeBU/ZPamw1GejqLlVJsx5RhCUXhsbbwnr tYT5/4JzQO+rcYpjZl9ZGf9k9xU8E2U3R3+9aXbF9O72RF8MrLQgQXJubyBUZWln c2V0aCA8YXJub0B0ZWlnc2V0aC5ubz6IaQQTEQIAKQIbAwUJEswDAAYLCQgHAwIE FQIIAwQWAgMBAh4BAheABQJKL21xAhkBAAoJEBDCBlQnPAYwjJ8AnjhzgrdEXuhP nB9IA13IRK+d3TeBAKDUdxvWfEUGWeegPq0DXan+G3WyNohmBBMRAgAmBQJJCqyJ AhsDBQkSzAMABgsJCAcDAgQVAggDBBYCAwECHgECF4AACgkQEMIGVCc8BjClbQCe O0jJuul9Gs5RdL8Q3GJFzNRIDu4AoKDP312L1xLesOyJDhj9tvGvSOTKiEYEEBEC AAYFAko2Sr8ACgkQSayuscDMnqHNNwCeJs5IZwnmQb0lQG5VS931Nx/HUO8AoOXq NhAxNnStt/j6ItEEKaSQWSaztCJBcm5vIFRlaWdzZXRoIDxhcm5vdGl4ZUBnbWFp bC5jb20+iGYEExECACYFAkovbHwCGwMFCRLMAwAGCwkIBwMCBBUCCAMEFgIDAQIe AQIXgAAKCRAQwgZUJzwGMNnnAKC5vXz9JW7nMhy1fwiyabiqfa6QWQCfddz8iOza fSa5+zb6zv0XFkBJTNK0KEFybm8gVGVpZ3NldGggPGFybm8udGVpZ3NldGhAc29u bmljby5ubz6IZgQTEQIAJgUCSykwCwIbAwUJEswDAAYLCQgHAwIEFQIIAwQWAgMB Ah4BAheAAAoJEBDCBlQnPAYwvQkAoKDqywS1Z2orIYl7CN9AcuAm3olGAJ91BiFJ nQhla4hDob6kQpKD+M00VrkEDQRJCq0VEBAAluRJEVTtOe4Jw3+jeExq96DvfTV6 +3vZpkqkEeeh5bqw80o/sf0GtmhfZTJM6lVJfNSWXroVKhtkCDPdF0GAjTa45kvM f/4dqYGzhwsk21MrwaA9sVGqfEAo0QNJVBQoVW5eEtvOSR65YfKtqV3sNmmktEQ9 rTNMoY0DLCQ51Q+sVflbjxDq171J5E2rymEsnYannrg3ZymACFTJbUJlnMr1p4dk c6j7YTvE8TuNQG2wMVjyw9PbKhmBqIDAsC0rQJPib6JVDrMH/PdJkPtuckrNHdsv z7op28lOZ1gbCH2sgZvFt9re11Lm0Pn7I9pG3Tw4//Rmh+widKuZyRgPsKSkvkDX cjYoIBOHvVha1ZlhDtWXZTGcybNMpzfnjMlkCjIqG4jKOqaQmnhn+r6Nt38cQfwu CtmqqGDLVAxIZB1NmjGwdGr9sVtkjXtFO8ZjYUUW5tFv9HNOA4/RswhF5Wlk+Zha tbLco4x938RzPUSWHG1+bXcZHSJJquObqNfp4MVyuvZX1O2xZkIksGn0VXGX37Mx 7hBeLqpcHFg3AdpqFS6NHMTeKDio8z6ONtOAwDb2PCsXFtwFHkyJou0ypf2oGhgd qpTvt8jblwKXvmAn9qXaM8qHS26n3peA85UkmvrYM7EFLn4cvfnX2lbgMi2Gra/e o/G+eSuwRSNR1V8ABA0P/RM1QDP2hfYNOQDrI8Aw2brltc7jy6SQg65VthBoJdvg T8SyMuVntRWp7rCEw3tNK4Q0ksD4kpk9a57K2OPEJ2Om/mKYXTIRMVjwkqwvvvXW vPY4ugDLGj5m0DjtULEjUyswSHEOcdgNSjOILmwxgo6PxYJQR+vZlARz6U5jEZut IsxPYbdK9WiBP8bBd83L3wEQs+CGRKC87effpVyI+6QEfhdgJkMLwBKUwFDcTP7L rfFextelh2GmHpiy2FIKO2+c8ssHtxJG+ltD2nO0mUl+mX5RW1gyja+kQKJEeUu5 XbwRx9mhdCmGGAUokxpyqzcgCZfNFX6eKXHfHm+xTM52dNvLBB7wlJkeypSE/mda b1pY48rcP6ONQCXSJJue/vDaYg/1rp0k0sZMZN+Ktt+N+jUqv4mRfN0ivHn/6KkT JU84oI9fm7gdgpo422wNqW/wJWBqfnFJH9y1fPNaq4TOSzeii/SyDmMqEIPP5SuS 7cjE+zhQSgRhbzsY6gUmywGvnLf9TnXp5+J4qE7eU6Y27KNgI1qWgvoyYd0k0lAP 6Rq57cKlbpRTGPMkNDBK+jkWW87bd1jsUrBWluet/lpOt9Pfgm1ayW5Kz85UZ5Ip d6RvLNrxUajRZ4ko/IvFWvFAGCfdGtTA3jrIoqxowKdsiG1NfkYnkIa0yWFcTriZ iE8EGBECAA8FAkkKrRUCGwwFCRLMAwAACgkQEMIGVCc8BjDk9gCgyWdyXlmLW1pk sD026s+us3Fb0l0AoO1AhO02X2cNALNxMsGuE/sVROAW =KvmZ -----END PGP PUBLIC KEY BLOCK-----
Hei
Det finnes programm til dansk orddeling. Jeg tror at dansk og norsk orddeling er veldig like.
Hilsen keld
On Tue, Jan 25, 2011 at 01:28:07AM -0500, Arno Teigseth wrote:
Hei alle sammen
Den 24 januar hadde vi et lite møte på irc, og la grunnlaget for et prosjekt med målet "Norsk grammatikkontroll".
Vi diskuterte litt omfanget av en slik programvare, og bestemte oss for å fokusere på én bestemt type feil i første omgang:
Ord delings feil [sic]
Dette synes å være en bra type feil å begynne med, siden det ikke synes å finnes noen grammatikkontroll som tar denne typen feil. Derfor burde dette prosjektet være interessant som studie også, kanskje som en masteroppgave for noen?
En del tekniske ting er bestemt, som
- LanguageTool som verktøy
- infoside på http://no.speling.org (kommer)
- wiki på http://wiki.debian.org/SpellNorwegian/grammar/
- kildekode på samme server som norsk stavekontroll
Det er allerede åpnet mapper for grammatikkontroll under kildekoden. Kontrollen fungerer med noen enkle, grunnleggende feiltyper som er kopiert fra engelsk (repeterte ord, stor bokstav i begynnelsen av en setning, feil med mellomrom osv).
Nå er vi på jakt etter personer eller organisasjoner som kan tenke seg å arbeide på prosjektet. Vi trenger både lingvister, programmerere og testere.
Etter å ha loddet stemningen litt, ønsker vi også å komme i kontakt med organisasjoner som kan tenke seg å støtte programmet "offisielt". Organisasjoner som Språkrådet, div universiteter og andre som kan omfavne eller anerkjenne prosjektet. Det finnes mange ildsjeler på denne mailinglisten, men vi innser jo at et godt prosjekt blir raskere utviklet hvis det finnes en viss grad av økonomisk støtte også, i tillegg til den rent tekniske, faglige og moralske.
Håper noen flere der ute kan være interessert i å delta - det er ikke noe krav om å være en kløpper på data, interesse for [godt norsk] språk holder lenge.
Død over ord delings syken!
Møtereferat 24 jan 2011 (som vedlagt): http://wiki.debian.org/SpellNorwegian/M%C3%B8te/2011-01-24
mvh Arno Teigseth
[Olav, siden du spurte om dette,] min offentlige GPG-nøkkel (0x273C0630) er: -----BEGIN PGP PUBLIC KEY BLOCK----- Version: GnuPG v1.4.9 (GNU/Linux)
mQGiBEkKrIkRBADLsY65M0dNA5w4I9PG3EhUzeT/pPBMlejOJADg78oadsJYtoIq bCsk5WcRDoiF6zu4l2VIT9Q/MxF5Es/dDMbEFmZ+BjPka5wQWHS2k2C/KWO3JLDq rXubFrNNWzB7CjFgjD7/MNICXqZumfLmsTuNSMjBowdSqAdrj+KtXdBEywCg/f9H zzfefE5GOSVPHlsACNdQ3TsD/1wGlXUwOWNz1ly6Peifsx/O4dzu8j2F17TV5pNx wqDgfV/mOkR15Yd54KGQGs2lQitbOfcdKoN87K3rjSGturhoQbXRKPSn2j8OwXkx jhfJcmSoF8C0CE5RJYyPD/ksdXGA6AALdwQU/cEM5FlRh1eaGjvXFAd04d1lsjAK loYCA/4kIv6ML+c60OfHvwfl/J6Yep1Pz1FosyBgfaAjZDtblpnJSV8Jlg46cCV3 P8o4WkwiXQXeHbRZw6AUXTwm5E8RUpBeBU/ZPamw1GejqLlVJsx5RhCUXhsbbwnr tYT5/4JzQO+rcYpjZl9ZGf9k9xU8E2U3R3+9aXbF9O72RF8MrLQgQXJubyBUZWln c2V0aCA8YXJub0B0ZWlnc2V0aC5ubz6IaQQTEQIAKQIbAwUJEswDAAYLCQgHAwIE FQIIAwQWAgMBAh4BAheABQJKL21xAhkBAAoJEBDCBlQnPAYwjJ8AnjhzgrdEXuhP nB9IA13IRK+d3TeBAKDUdxvWfEUGWeegPq0DXan+G3WyNohmBBMRAgAmBQJJCqyJ AhsDBQkSzAMABgsJCAcDAgQVAggDBBYCAwECHgECF4AACgkQEMIGVCc8BjClbQCe O0jJuul9Gs5RdL8Q3GJFzNRIDu4AoKDP312L1xLesOyJDhj9tvGvSOTKiEYEEBEC AAYFAko2Sr8ACgkQSayuscDMnqHNNwCeJs5IZwnmQb0lQG5VS931Nx/HUO8AoOXq NhAxNnStt/j6ItEEKaSQWSaztCJBcm5vIFRlaWdzZXRoIDxhcm5vdGl4ZUBnbWFp bC5jb20+iGYEExECACYFAkovbHwCGwMFCRLMAwAGCwkIBwMCBBUCCAMEFgIDAQIe AQIXgAAKCRAQwgZUJzwGMNnnAKC5vXz9JW7nMhy1fwiyabiqfa6QWQCfddz8iOza fSa5+zb6zv0XFkBJTNK0KEFybm8gVGVpZ3NldGggPGFybm8udGVpZ3NldGhAc29u bmljby5ubz6IZgQTEQIAJgUCSykwCwIbAwUJEswDAAYLCQgHAwIEFQIIAwQWAgMB Ah4BAheAAAoJEBDCBlQnPAYwvQkAoKDqywS1Z2orIYl7CN9AcuAm3olGAJ91BiFJ nQhla4hDob6kQpKD+M00VrkEDQRJCq0VEBAAluRJEVTtOe4Jw3+jeExq96DvfTV6 +3vZpkqkEeeh5bqw80o/sf0GtmhfZTJM6lVJfNSWXroVKhtkCDPdF0GAjTa45kvM f/4dqYGzhwsk21MrwaA9sVGqfEAo0QNJVBQoVW5eEtvOSR65YfKtqV3sNmmktEQ9 rTNMoY0DLCQ51Q+sVflbjxDq171J5E2rymEsnYannrg3ZymACFTJbUJlnMr1p4dk c6j7YTvE8TuNQG2wMVjyw9PbKhmBqIDAsC0rQJPib6JVDrMH/PdJkPtuckrNHdsv z7op28lOZ1gbCH2sgZvFt9re11Lm0Pn7I9pG3Tw4//Rmh+widKuZyRgPsKSkvkDX cjYoIBOHvVha1ZlhDtWXZTGcybNMpzfnjMlkCjIqG4jKOqaQmnhn+r6Nt38cQfwu CtmqqGDLVAxIZB1NmjGwdGr9sVtkjXtFO8ZjYUUW5tFv9HNOA4/RswhF5Wlk+Zha tbLco4x938RzPUSWHG1+bXcZHSJJquObqNfp4MVyuvZX1O2xZkIksGn0VXGX37Mx 7hBeLqpcHFg3AdpqFS6NHMTeKDio8z6ONtOAwDb2PCsXFtwFHkyJou0ypf2oGhgd qpTvt8jblwKXvmAn9qXaM8qHS26n3peA85UkmvrYM7EFLn4cvfnX2lbgMi2Gra/e o/G+eSuwRSNR1V8ABA0P/RM1QDP2hfYNOQDrI8Aw2brltc7jy6SQg65VthBoJdvg T8SyMuVntRWp7rCEw3tNK4Q0ksD4kpk9a57K2OPEJ2Om/mKYXTIRMVjwkqwvvvXW vPY4ugDLGj5m0DjtULEjUyswSHEOcdgNSjOILmwxgo6PxYJQR+vZlARz6U5jEZut IsxPYbdK9WiBP8bBd83L3wEQs+CGRKC87effpVyI+6QEfhdgJkMLwBKUwFDcTP7L rfFextelh2GmHpiy2FIKO2+c8ssHtxJG+ltD2nO0mUl+mX5RW1gyja+kQKJEeUu5 XbwRx9mhdCmGGAUokxpyqzcgCZfNFX6eKXHfHm+xTM52dNvLBB7wlJkeypSE/mda b1pY48rcP6ONQCXSJJue/vDaYg/1rp0k0sZMZN+Ktt+N+jUqv4mRfN0ivHn/6KkT JU84oI9fm7gdgpo422wNqW/wJWBqfnFJH9y1fPNaq4TOSzeii/SyDmMqEIPP5SuS 7cjE+zhQSgRhbzsY6gUmywGvnLf9TnXp5+J4qE7eU6Y27KNgI1qWgvoyYd0k0lAP 6Rq57cKlbpRTGPMkNDBK+jkWW87bd1jsUrBWluet/lpOt9Pfgm1ayW5Kz85UZ5Ip d6RvLNrxUajRZ4ko/IvFWvFAGCfdGtTA3jrIoqxowKdsiG1NfkYnkIa0yWFcTriZ iE8EGBECAA8FAkkKrRUCGwwFCRLMAwAACgkQEMIGVCc8BjDk9gCgyWdyXlmLW1pk sD026s+us3Fb0l0AoO1AhO02X2cNALNxMsGuE/sVROAW =KvmZ -----END PGP PUBLIC KEY BLOCK-----
i18n-no mailing list i18n-no@lister.ping.uio.no https://lister.ping.uio.no/mailman/lister.ping.uio.no/listinfo/i18n-no
On Tue, Jan 25, 2011 at 10:25:32AM +0200, Keld Simonsen wrote:
Hei
Det finnes programm til dansk orddeling. Jeg tror at dansk og norsk orddeling er veldig like.
jeg mener reglene for dansk og norsk orddeling er like, programmet bør derfor kunne genbrukes, med andre data.
Det finnes et progrm poabc som kan finne blunders slik som manglende stort begynnelsesbokstav mm. Finnes i en Ubuntupakke.
Hilsen keld
Hilsen keld
On Tue, Jan 25, 2011 at 01:28:07AM -0500, Arno Teigseth wrote:
Hei alle sammen
Den 24 januar hadde vi et lite møte på irc, og la grunnlaget for et prosjekt med målet "Norsk grammatikkontroll".
Vi diskuterte litt omfanget av en slik programvare, og bestemte oss for å fokusere på én bestemt type feil i første omgang:
Ord delings feil [sic]
Dette synes å være en bra type feil å begynne med, siden det ikke synes å finnes noen grammatikkontroll som tar denne typen feil. Derfor burde dette prosjektet være interessant som studie også, kanskje som en masteroppgave for noen?
En del tekniske ting er bestemt, som
- LanguageTool som verktøy
- infoside på http://no.speling.org (kommer)
- wiki på http://wiki.debian.org/SpellNorwegian/grammar/
- kildekode på samme server som norsk stavekontroll
Det er allerede åpnet mapper for grammatikkontroll under kildekoden. Kontrollen fungerer med noen enkle, grunnleggende feiltyper som er kopiert fra engelsk (repeterte ord, stor bokstav i begynnelsen av en setning, feil med mellomrom osv).
Nå er vi på jakt etter personer eller organisasjoner som kan tenke seg å arbeide på prosjektet. Vi trenger både lingvister, programmerere og testere.
Etter å ha loddet stemningen litt, ønsker vi også å komme i kontakt med organisasjoner som kan tenke seg å støtte programmet "offisielt". Organisasjoner som Språkrådet, div universiteter og andre som kan omfavne eller anerkjenne prosjektet. Det finnes mange ildsjeler på denne mailinglisten, men vi innser jo at et godt prosjekt blir raskere utviklet hvis det finnes en viss grad av økonomisk støtte også, i tillegg til den rent tekniske, faglige og moralske.
Håper noen flere der ute kan være interessert i å delta - det er ikke noe krav om å være en kløpper på data, interesse for [godt norsk] språk holder lenge.
Død over ord delings syken!
Møtereferat 24 jan 2011 (som vedlagt): http://wiki.debian.org/SpellNorwegian/M%C3%B8te/2011-01-24
mvh Arno Teigseth
[Olav, siden du spurte om dette,] min offentlige GPG-nøkkel (0x273C0630) er: -----BEGIN PGP PUBLIC KEY BLOCK----- Version: GnuPG v1.4.9 (GNU/Linux)
mQGiBEkKrIkRBADLsY65M0dNA5w4I9PG3EhUzeT/pPBMlejOJADg78oadsJYtoIq bCsk5WcRDoiF6zu4l2VIT9Q/MxF5Es/dDMbEFmZ+BjPka5wQWHS2k2C/KWO3JLDq rXubFrNNWzB7CjFgjD7/MNICXqZumfLmsTuNSMjBowdSqAdrj+KtXdBEywCg/f9H zzfefE5GOSVPHlsACNdQ3TsD/1wGlXUwOWNz1ly6Peifsx/O4dzu8j2F17TV5pNx wqDgfV/mOkR15Yd54KGQGs2lQitbOfcdKoN87K3rjSGturhoQbXRKPSn2j8OwXkx jhfJcmSoF8C0CE5RJYyPD/ksdXGA6AALdwQU/cEM5FlRh1eaGjvXFAd04d1lsjAK loYCA/4kIv6ML+c60OfHvwfl/J6Yep1Pz1FosyBgfaAjZDtblpnJSV8Jlg46cCV3 P8o4WkwiXQXeHbRZw6AUXTwm5E8RUpBeBU/ZPamw1GejqLlVJsx5RhCUXhsbbwnr tYT5/4JzQO+rcYpjZl9ZGf9k9xU8E2U3R3+9aXbF9O72RF8MrLQgQXJubyBUZWln c2V0aCA8YXJub0B0ZWlnc2V0aC5ubz6IaQQTEQIAKQIbAwUJEswDAAYLCQgHAwIE FQIIAwQWAgMBAh4BAheABQJKL21xAhkBAAoJEBDCBlQnPAYwjJ8AnjhzgrdEXuhP nB9IA13IRK+d3TeBAKDUdxvWfEUGWeegPq0DXan+G3WyNohmBBMRAgAmBQJJCqyJ AhsDBQkSzAMABgsJCAcDAgQVAggDBBYCAwECHgECF4AACgkQEMIGVCc8BjClbQCe O0jJuul9Gs5RdL8Q3GJFzNRIDu4AoKDP312L1xLesOyJDhj9tvGvSOTKiEYEEBEC AAYFAko2Sr8ACgkQSayuscDMnqHNNwCeJs5IZwnmQb0lQG5VS931Nx/HUO8AoOXq NhAxNnStt/j6ItEEKaSQWSaztCJBcm5vIFRlaWdzZXRoIDxhcm5vdGl4ZUBnbWFp bC5jb20+iGYEExECACYFAkovbHwCGwMFCRLMAwAGCwkIBwMCBBUCCAMEFgIDAQIe AQIXgAAKCRAQwgZUJzwGMNnnAKC5vXz9JW7nMhy1fwiyabiqfa6QWQCfddz8iOza fSa5+zb6zv0XFkBJTNK0KEFybm8gVGVpZ3NldGggPGFybm8udGVpZ3NldGhAc29u bmljby5ubz6IZgQTEQIAJgUCSykwCwIbAwUJEswDAAYLCQgHAwIEFQIIAwQWAgMB Ah4BAheAAAoJEBDCBlQnPAYwvQkAoKDqywS1Z2orIYl7CN9AcuAm3olGAJ91BiFJ nQhla4hDob6kQpKD+M00VrkEDQRJCq0VEBAAluRJEVTtOe4Jw3+jeExq96DvfTV6 +3vZpkqkEeeh5bqw80o/sf0GtmhfZTJM6lVJfNSWXroVKhtkCDPdF0GAjTa45kvM f/4dqYGzhwsk21MrwaA9sVGqfEAo0QNJVBQoVW5eEtvOSR65YfKtqV3sNmmktEQ9 rTNMoY0DLCQ51Q+sVflbjxDq171J5E2rymEsnYannrg3ZymACFTJbUJlnMr1p4dk c6j7YTvE8TuNQG2wMVjyw9PbKhmBqIDAsC0rQJPib6JVDrMH/PdJkPtuckrNHdsv z7op28lOZ1gbCH2sgZvFt9re11Lm0Pn7I9pG3Tw4//Rmh+widKuZyRgPsKSkvkDX cjYoIBOHvVha1ZlhDtWXZTGcybNMpzfnjMlkCjIqG4jKOqaQmnhn+r6Nt38cQfwu CtmqqGDLVAxIZB1NmjGwdGr9sVtkjXtFO8ZjYUUW5tFv9HNOA4/RswhF5Wlk+Zha tbLco4x938RzPUSWHG1+bXcZHSJJquObqNfp4MVyuvZX1O2xZkIksGn0VXGX37Mx 7hBeLqpcHFg3AdpqFS6NHMTeKDio8z6ONtOAwDb2PCsXFtwFHkyJou0ypf2oGhgd qpTvt8jblwKXvmAn9qXaM8qHS26n3peA85UkmvrYM7EFLn4cvfnX2lbgMi2Gra/e o/G+eSuwRSNR1V8ABA0P/RM1QDP2hfYNOQDrI8Aw2brltc7jy6SQg65VthBoJdvg T8SyMuVntRWp7rCEw3tNK4Q0ksD4kpk9a57K2OPEJ2Om/mKYXTIRMVjwkqwvvvXW vPY4ugDLGj5m0DjtULEjUyswSHEOcdgNSjOILmwxgo6PxYJQR+vZlARz6U5jEZut IsxPYbdK9WiBP8bBd83L3wEQs+CGRKC87effpVyI+6QEfhdgJkMLwBKUwFDcTP7L rfFextelh2GmHpiy2FIKO2+c8ssHtxJG+ltD2nO0mUl+mX5RW1gyja+kQKJEeUu5 XbwRx9mhdCmGGAUokxpyqzcgCZfNFX6eKXHfHm+xTM52dNvLBB7wlJkeypSE/mda b1pY48rcP6ONQCXSJJue/vDaYg/1rp0k0sZMZN+Ktt+N+jUqv4mRfN0ivHn/6KkT JU84oI9fm7gdgpo422wNqW/wJWBqfnFJH9y1fPNaq4TOSzeii/SyDmMqEIPP5SuS 7cjE+zhQSgRhbzsY6gUmywGvnLf9TnXp5+J4qE7eU6Y27KNgI1qWgvoyYd0k0lAP 6Rq57cKlbpRTGPMkNDBK+jkWW87bd1jsUrBWluet/lpOt9Pfgm1ayW5Kz85UZ5Ip d6RvLNrxUajRZ4ko/IvFWvFAGCfdGtTA3jrIoqxowKdsiG1NfkYnkIa0yWFcTriZ iE8EGBECAA8FAkkKrRUCGwwFCRLMAwAACgkQEMIGVCc8BjDk9gCgyWdyXlmLW1pk sD026s+us3Fb0l0AoO1AhO02X2cNALNxMsGuE/sVROAW =KvmZ -----END PGP PUBLIC KEY BLOCK-----
i18n-no mailing list i18n-no@lister.ping.uio.no https://lister.ping.uio.no/mailman/lister.ping.uio.no/listinfo/i18n-no
i18n-no mailing list i18n-no@lister.ping.uio.no https://lister.ping.uio.no/mailman/lister.ping.uio.no/listinfo/i18n-no
-----BEGIN PGP SIGNED MESSAGE----- Hash: SHA256
On 01/25/2011 07:28 AM, Arno Teigseth wrote:
Håper noen flere der ute kan være interessert i å delta - det er ikke noe krav om å være en kløpper på data, interesse for [godt norsk] språk holder lenge.
Hva med å kontakte Språkteigen på NRK P2? Det er sikkert mange av Språkteigens lyttere som kan være interessert i dette prosjektet.
Andreas Noteng
On Tue, 2011-01-25 at 10:25 +0200, Keld Simonsen wrote:
Hei
Det finnes programm til dansk orddeling. Jeg tror at dansk og norsk orddeling er veldig like.
Så bra.
Hvor?
mvh Arno
Et annet spørsmål vi ikke på straksen visste var om det finnes detaljerte regler nedskrevet for ordsammensetninger på norsk?
I så fall, hvor finner man dem? De bør man jo kunne bruke som et utgangspunkt. Mulig en norsk grammatikkbok er nok (jeg har ingen tilgjengelig). (Apropos: Stavekontrollen foreslår her: grammatikk bok, grammatikk-bok, grammatikkboks, grammatikkboka og grammatikkbolk. Den nest siste er veldig nære, men likevel får jeg rød strek :-/)
Jeg vet om fuge-s, og vi lurte på om det noen gang forekommer to substantiver etter hverandre på grammatisk korrekt vis? Vi fant iallfall ingen eksempler, og spørsmålet er om ikke regelen:
Foreslå alltid å slå sammen når to substantiver står etter hverandre
vil være bedre enn å ikke foreslå noe og oftere rett. Legger vekt på foreslå, Arno hadde en ide med en kort ledsagende tekst/forklaring også, men vet ikke hvor mye arbeide dette er o.l. (Av typen: mente du kanskje: orddeling?)
Regler for bøyning av ulike ord og ordklasser finnes det jo lister for, og de bør jo tas med. Eller kanskje Hunspell allerede gjør dette, Arno?
Mvh Axel Bojer
2011/1/25 Axel Bojer axelb@skolelinux.no:
Jeg vet om fuge-s, og vi lurte på om det noen gang forekommer to substantiver etter hverandre på grammatisk korrekt vis? Vi fant iallfall ingen eksempler, og spørsmålet er om ikke regelen:
Foreslå alltid å slå sammen når to substantiver står etter hverandre
• «Hun fortalte sine /barn eventyr/ hver onsdag.» • «Han solgte /Arne sykkelen/ sin.» • «Han reparerte /naboens sykkel/.»
2011/1/25 Axel Bojer axelb@skolelinux.no:
Jeg vet om fuge-s, og vi lurte på om det noen gang forekommer to substantiver etter hverandre på grammatisk korrekt vis? Vi fant iallfall ingen eksempler, og spørsmålet er om ikke regelen:
Foreslå alltid å slå sammen når to substantiver står etter hverandre
«Hun fortalte sine /barn eventyr/ hver onsdag.» «Han solgte /Arne sykkelen/ sin.» «Han reparerte /naboens sykkel/.»
Takk! Gode eksempler! Da er spørsmålet om dette er vanligere enn særskrivning? Og hva skiller dette fra særskrivning, så vi ev. kan lage en regel som oppdager når det er det ene og når det andre?
Mvh Axel
On Tue, 2011-01-25 at 18:59 +0100, Axel Bojer wrote:
Et annet spørsmål vi ikke på straksen visste var om det finnes detaljerte regler nedskrevet for ordsammensetninger på norsk?
I så fall, hvor finner man dem? De bør man jo kunne bruke som et utgangspunkt.
Høres bra ut.
Vi bør også bestemme lisens så fort som mulig.
Regler for bøyning av ulike ord og ordklasser finnes det jo lister for, og de bør jo tas med. Eller kanskje Hunspell allerede gjør dette, Arno?
Ja, til en viss grad. Hunspell har regler for bøying i .aff-filen sin, men bare per ord. Samsvarsbøyning (flerE rødE bilER) må ordnes med grammatikkontroll. I hunspell's .aff kan det for eksempel stå (litt forenklet):
SFX V 3 <div tall > e et e # fortid; skrell en E og legg til ET <div tall > e ede e # adjektiv; hentEDE, skrell en E og legg til EDE <div tall > e s e # verb; henteS, skrell en E og legg til ES
så inneholder .dic-filen bare hente/V poste/V
flagget V forteller hunspell at ordet kan behandles/bøyes som under seksjon V i .aff-filen.
Dermed godtar hunspell 6 ord selv om .dic bare inneholder 2: hente (rotord) hentet hentede hentes poste (rotord) postet postede postes
osv. Veldig bra for språk med mye regelrett bøying. Quichua har for eksempel [minst] 34 bøyninger av hvert verb, så med bare _ett_ rot-verb godtar hunspell 35 forskjellige ord:)
Spansk er også fint her, 16 tider av verbet × 6 personer = 96 varianter av hvert verb. Ett rotord->97 aksepterte varianter.
Norsk er litt verre fordi det ikke er så regelrett, men jeg tror nok det hjelper en del med hunspell uansett.
Selvfølgelig er det ikke bare verb som kan bøyes, men et hvilket som helst ord.
Arno
• «Hun fortalte sine /barn eventyr/ hver onsdag.» • «Han solgte /Arne sykkelen/ sin.» • «Han reparerte /naboens sykkel/.»
Takk! Gode eksempler! Da er spørsmålet om dette er vanligere enn særskrivning? Og hva skiller dette fra særskrivning, så vi ev. kan lage en regel som oppdager når det er det ene og når det andre?
Man må da kartlegge transitivitet til verb, så man kan gjøre en analyse av setningsleddene. Genitiv må bare aksepteres som en nomenfrase, men man kan se om det finnes en vanlig sammensetning som bruker fuge-S med de ordene først.
Tror jeg ville tatt kontakt med de som håndterer programmet for Informatikk: språk og kommunikasjon på UiO. studieinfo@ifi.uio.no tar seg av ev. videresending. Kan jo hende det kunne være interesse for dem å utlyse det som en masteroppgave, men de liker jo å ha en ekstern veileder. :/
Jeg mener for så vidt at MS Office har hatt retting av særskrivingsfeil i mange år, så det er ikke helt sikkert at de synes det er noe nytt å forske på, men de er glad i åpen kilde på UiO, da.
Vh. Sigmund Hansen
On Tue, 2011-01-25 at 16:48 +0100, Andreas Noteng wrote:
Hva med å kontakte Språkteigen på NRK P2? Det er sikkert mange av Språkteigens lyttere som kan være interessert i dette prosjektet.
Høres ut som en god idé. Håper bare vi rekker å få opp en nogenlunde presentabel forside/wikiside først.
Arno
On Tue, 2011-01-25 at 20:54 +0100, Sigmund Hansen wrote:
• «Hun fortalte sine /barn eventyr/ hver onsdag.» • «Han solgte /Arne sykkelen/ sin.»
3: Han solgte Arne naboens sykkel. :)
Takk for eksempler.
Jeg skal se om vi kan få opp languagetool-grammatikksjekking av norske wikipediasider; da vil vi sikkert få veldig mange falske positiver, ihvertfall til reglene blir mer gjennomtenkt :D
Da er spørsmålet om dette er vanligere enn særskrivning? Og hva skiller dette fra særskrivning, så vi ev. kan lage en regel som oppdager når det er det ene og når det andre?
Man må da kartlegge transitivitet til verb, så man kan gjøre en analyse av setningsleddene.
Om det: Languagetool har en fast rutine for sjekking av setninger.
1) Teksten deles opp i hele setninger (avsluttet med punktum eller ny linje). Lett.
2) Linjene deles opp i ord. Lett.
3) Ordene tildeles "part-of-speech"-merkelapp (tag) (grammatikalsk funksjon?) eksempel: "biler"=(substantiv, flertall, ubestemt) ELLER (verb,presens)
---------------------------- Det er vel her brorparten av tenkingen må gjøres, så ordene får rett merkelapper tildelt. ----------------------------
4) Regler kjøres over de oppdelte setningene ---------------------------- Regler er bra, men hvis merkelappene er feil, vil nok reglene slå ut feil også. ----------------------------
se også http://www.languagetool.org/development/
Tror jeg ville tatt kontakt med de som håndterer programmet for Informatikk: språk og kommunikasjon på UiO. studieinfo@ifi.uio.no tar seg av ev. videresending. Kan jo hende det kunne være interesse for dem å utlyse det som en masteroppgave, men de liker jo å ha en ekstern veileder. :/
Høres ut som en god idé. Hvis de trenger en ekstern veileder, må jo denne også hjelpe prosjektet :D
Arno