torsdag 16. mars 2006, 13:20, skrev Erik Haugan:
- Axel Bojer (2006-03-16 11:18):
Du har rett, hvis der du mener er at synonymordlista bare inneholder synonymer til grunnformen, så har du rett. Testet i går ordet «car» og «cars». Bare det første ordet fantes det synonymer til, enda forskjellen ikkekan sies å være stor. Skal vi følge samme mønster, og det tror jeg vi bør, så må vi skrive synonymer til «bil» og ikke «bilene, biler, bilens» osv. Hvis vi skal ha med synonymer mener jeg altså at vi også trenger feltet ROOT :-)
Eg er usikker på om det er du som har misforstått meg eller eg som har misforstått deg. Mitt poeng er at "hoppet" har ROOT = "hoppe", som igjen har synonym "merr". Tilsvarande med "hang" som har ROOT = "henge" som har synonym "henrette". ROOT differensierer altså ikkje mellom dei to orda som har "hoppe" eller "henge" som grunnform, så dersom ein brukar ROOT i samband med synonymordlista, får ein mange merkelege resultat.
Jeg kan ikke se hvorfor «Hoppe» skulle gi underlige resultater. La oss si jeg fyller inn følgende:
WORD: hoppe STATUS: + SYNONYM: Merr, hest EDITOR: Axel Bojer axelb@skolelinux.no
Så kan jeg ikke se at det på noen måte blir feil, selv om det finnes et ord til som er slik:
WORD: hoppe STATUS: + SYNONYM: sprette EDITOR: Axel Bojer axelb@skolelinux.no
For disse ordene vil da vel ikke bli slått sammen allikevel, men stå hver for seg i databasen. Det vil heller ikke være noe problem for en som ser på oppføringa å vite hvilket ord som har hvilken av de to betydningene, så jeg klarer ikke å se hvor du mener problemet skulle oppstå :-)
Dessutan har me problemet med ord som har ulike skrivemåtar i grunnforma, til dømes "farve" og "farge", "service" og "sørvis", og for nynorsk er det endå verre, for der har alle verb alternativ infinitivsending på "a" eller "e", td. "gjera" eller "gjere".
De er da synonymer til hverandre, f.eks.: WORD: farve SYNONYM: farge
Ser ikke hvorfor det skulle være et problem større en for bil og bilen, som også får samme synonym (siden vi skriver synonymer til grunnformen). Vi burde forøvrig få en måte å få synonymrekkene til å dukke opp samme hvilket av synonymordene en slår opp på, altså ikke bare på bil, men også på kjerre, selv om jeg skrev inn synonymet på ordet bil.
Mitt syn er at før ein byrjar samla inn data, må me vera sikre på at me kan nytta oss av det.
Så lenge ikke databasen blir mer ødelagt så kan jeg ikke skjønne at dette like godt kan løses i etterkant? Hvis synonymfeltet er rett fylt ut så har vi notert korrekt informasjon, og kan vel siden hente ut den på hvilken måte vi nå vil, all den tid dette er en database, så er det ikke den som bestemmer hva vi gjør med den og hvordan, men de skriptene vi kjører mot den etterpå, eller?
Mvh Axel
[Axel Bojer]
Jeg kan ikke se hvorfor «Hoppe» skulle gi underlige resultater. La oss si jeg fyller inn følgende:
WORD: hoppe STATUS: + SYNONYM: Merr, hest EDITOR: Axel Bojer axelb@skolelinux.no
Det er ikke lurt å bruke stor bokstav i synonymer som ikke er egennavn. De kopieres direkte inn i 'WORD', og da blir det feil.
så jeg klarer ikke å se hvor du mener problemet skulle oppstå :-)
Jeg tror ikke du har forstått hvordan "databasen" fungerer. Det som kan skje er at det ligger tre oppføringer for hoppe, slik:
WORD: hoppe STATUS: + SYNONYM: hest EDITOR: Axel Bojer axelb@skolelinux.no
WORD: hoppe STATUS: + SYNONYM: merr EDITOR: Petter Reinholdtsen pere@hungry.com
WORD: hoppe STATUS: + SYNONYM: sprette EDITOR: Axel Bojer axelb@skolelinux.no
Det er da ingenting som knytter 'hest' og 'merr' sammen som synonymer for samme betydning, og ingenting som skiller det fra 'sprette'
Mitt syn er at før ein byrjar samla inn data, må me vera sikre på at me kan nytta oss av det.
Jeg er litt enig i at vi må ha gjort endel forarbeide, men har ingen tro på at vi klarer å gjøre alt i forkant så vi må bare starte innsamlingen og lære mens vi går.
Så lenge ikke databasen blir mer ødelagt så kan jeg ikke skjønne at dette like godt kan løses i etterkant? Hvis synonymfeltet er rett fylt ut så har vi notert korrekt informasjon, og kan vel siden hente ut den på hvilken måte vi nå vil, all den tid dette er en database, så er det ikke den som bestemmer hva vi gjør med den og hvordan, men de skriptene vi kjører mot den etterpå, eller?
Joda. Men hvis det er feilinformasjon i databasen eller informasjon som mangler, så kan ikke scriptene gjenskape eller korrigere det.
F.eks. hvis følgende oppføring finnes, så er det ingen måte å notere at det er feil synonym:
WORD: hoppe STATUS: + SYNONYM: bil EDITOR: Petter Reinholdtsen pere@hungry.com
Vennlig hilsen,
Jeg tror ikke du har forstått hvordan "databasen" fungerer. Det som kan skje er at det ligger tre oppføringer for hoppe, slik:
WORD: hoppe STATUS: + SYNONYM: hest EDITOR: Axel Bojer axelb@skolelinux.no
WORD: hoppe STATUS: + SYNONYM: merr EDITOR: Petter Reinholdtsen pere@hungry.com
WORD: hoppe STATUS: + SYNONYM: sprette EDITOR: Axel Bojer axelb@skolelinux.no
Det er da ingenting som knytter 'hest' og 'merr' sammen som synonymer for samme betydning, og ingenting som skiller det fra 'sprette'
Det er vel her det må komme inn skille på ordklasser. Hoppe er både substantiv og verb...
Ikke for å banne i kirka, men hvordan er dette løst i f. eks. Microsofts ordlister???
Hvis man ikke bare høyreklikker og velger et ord, men går inn og ser hva synonymordboka foreslår, så står ordklassen bak forslagene i parantes. Og når det gjelder ordet "hoppe" - så står ikke det oppført som substantiv i deres ordlister. Hadde man løst dette hadde man gått forbi Bill Gates i synonymordbok utviklinga. :)
Mvh.
Svenn Inge Ingebrigtsen
torsdag 16. mars 2006, 15:18, skrev Petter Reinholdtsen:
[Axel Bojer]
Jeg kan ikke se hvorfor «Hoppe» skulle gi underlige resultater. La oss si jeg fyller inn følgende:
WORD: hoppe STATUS: + SYNONYM: Merr, hest EDITOR: Axel Bojer axelb@skolelinux.no
Det er ikke lurt å bruke stor bokstav i synonymer som ikke er egennavn. De kopieres direkte inn i 'WORD', og da blir det feil.
så jeg klarer ikke å se hvor du mener problemet skulle oppstå :-)
Jeg tror ikke du har forstått hvordan "databasen" fungerer. Det som kan skje er at det ligger tre oppføringer for hoppe, slik:
WORD: hoppe STATUS: + SYNONYM: hest EDITOR: Axel Bojer axelb@skolelinux.no
WORD: hoppe STATUS: + SYNONYM: merr EDITOR: Petter Reinholdtsen pere@hungry.com
WORD: hoppe STATUS: + SYNONYM: sprette EDITOR: Axel Bojer axelb@skolelinux.no
Det er da ingenting som knytter 'hest' og 'merr' sammen som synonymer for samme betydning, og ingenting som skiller det fra 'sprette'
Jo, jeg har forstått det. Men hvilken skade gjør det? Ingen av disse oppføringene er feil, det eneste vi mangler er å knytte dem sammen. Er det ikke slikt man har relasjonsdatabaser til? Du savner kanskje en automatikk som føyer det hele helt korrekt sammen, men vil vi få det? Og hvilken skade gjør det å ha tre oppføringer som alle er korrekte, men feilen er at de ikke er slått sammen der det trengs (typisk to av de tre ovenfor).
Mitt syn er at før ein byrjar samla inn data, må me vera sikre på at me kan nytta oss av det.
Jeg er litt enig i at vi må ha gjort endel forarbeide, men har ingen tro på at vi klarer å gjøre alt i forkant så vi må bare starte innsamlingen og lære mens vi går.
Noe slikt jeg også mente med at vi allerede nå samler inn synonymer (til root-delen) og ser hva vi kan får gjort med dem.
Så lenge ikke databasen blir mer ødelagt så kan jeg ikke skjønne at dette like godt kan løses i etterkant? Hvis synonymfeltet er rett fylt ut så har vi notert korrekt informasjon, og kan vel siden hente ut den på hvilken måte vi nå vil, all den tid dette er en database, så er det ikke den som bestemmer hva vi gjør med den og hvordan, men de skriptene vi kjører mot den etterpå, eller?
Joda. Men hvis det er feilinformasjon i databasen eller informasjon som mangler, så kan ikke scriptene gjenskape eller korrigere det.
F.eks. hvis følgende oppføring finnes, så er det ingen måte å notere at det er feil synonym:
WORD: hoppe STATUS: + SYNONYM: bil EDITOR: Petter Reinholdtsen pere@hungry.com
Vennlig hilsen,
Det er riktig, men det er heller ikke et problem vi kom mer utenom. At personer fører opp feil kan man aldri gardere seg mot, noe av det som var mitt poeng i siste post også :-)
Mvh Axel
* Axel Bojer (2006-03-16 16:29):
Mitt syn er at før ein byrjar samla inn data, må me vera sikre på at me kan nytta oss av det.
Jeg er litt enig i at vi må ha gjort endel forarbeide, men har ingen tro på at vi klarer å gjøre alt i forkant så vi må bare starte innsamlingen og lære mens vi går.
Noe slikt jeg også mente med at vi allerede nå samler inn synonymer (til root-delen) og ser hva vi kan får gjort med dem.
Berre så ingen misforstår meg: eg har aldri teke til orde for at me skal gjera "alt i forkant". Poenget mitt er enkelt og greitt at eg ikkje ser for meg korleis den innsamla informasjonen (dvs. synonym til grunnformene) skal kunna nyttast til noko som helst. Då tykkjer eg det er rimeleg dumt og frekt å engasjera folk i innsamlingsarbeidet.
Men dersom nokon kan fortelja meg korleis dette skal gjerast, er ingenting betre enn det. Men då må det meir enn insistering til.
F.eks. hvis følgende oppføring finnes, så er det ingen måte å notere at det er feil synonym:
WORD: hoppe STATUS: + SYNONYM: bil EDITOR: Petter Reinholdtsen pere@hungry.com
Vennlig hilsen,
Det er riktig, men det er heller ikke et problem vi kom mer utenom. At personer fører opp feil kan man aldri gardere seg mot, noe av det som var mitt poeng i siste post også :-)
Problemet er ikkje at folk gjer feil, men at det ikkje er nokon måte å retta opp feila i etterkant.
Erik
- Axel Bojer (2006-03-16 16:29):
Mitt syn er at før ein byrjar samla inn data, må me vera sikre på at me kan nytta oss av det.
Jeg er litt enig i at vi må ha gjort endel forarbeide, men har ingen tro på at vi klarer å gjøre alt i forkant så vi må bare starte innsamlingen og lære mens vi går.
Noe slikt jeg også mente med at vi allerede nå samler inn synonymer (til root-delen) og ser hva vi kan får gjort med dem.
Berre så ingen misforstår meg: eg har aldri teke til orde for at me skal gjera "alt i forkant". Poenget mitt er enkelt og greitt at eg ikkje ser for meg korleis den innsamla informasjonen (dvs. synonym til grunnformene) skal kunna nyttast til noko som helst. Då tykkjer eg det er rimeleg dumt og frekt å engasjera folk i innsamlingsarbeidet.
Skjønner ikke bekymringen. Synonymet knyttes til grunnformen, og føres opps ammen med den i en synonymordliste. Slår man opp på et grunnord, så får man de tisvarende synonymene. Bortsett fra at synonymene (som alt annet) kan inneholde feil, hvor er problemet?Det du, og Petter, har argumentert med er at det (kan) oppstå feil i databasen, men jeg kan ikke se på hvilken måte det skulle være unikt for synonymene.Det mangler også en metode for entydig å angi hvilket ord som menes, selv om man bruker ROOT. Det bør selvsagt også løses, kanskje ved å angi «I» og «II», kanskje ved å legge til f.eks. (verb) ordet. Men, som før nevnt, så gjør det bare databasen mangelfull, og det er den allerede, og den blir ikke mer mangelfull av at vi legger til nye ord.
Men dersom nokon kan fortelja meg korleis dette skal gjerast, er ingenting betre enn det. Men då må det meir enn insistering til.
F.eks. hvis følgende oppføring finnes, så er det ingen måte å notere at det er feil synonym:
WORD: hoppe STATUS: + SYNONYM: bil EDITOR: Petter Reinholdtsen pere@hungry.com
Vennlig hilsen,
Det er riktig, men det er heller ikke et problem vi kom mer utenom. At personer fører opp feil kan man aldri gardere seg mot, noe av det som var mitt poeng i siste post også :-)
Problemet er ikkje at folk gjer feil, men at det ikkje er nokon måte å retta opp feila i etterkant.
Men det vil da som nevnt gjelde *all* slags feil, så hvis det er argumentet, så burde vi vel bare vente med å sende ut e-poster til noen som helst? Mvh Axel
[Axel Bojer]
Skjønner ikke bekymringen. Synonymet knyttes til grunnformen, og føres opps ammen med den i en synonymordliste. Slår man opp på et grunnord, så får man de tisvarende synonymene. Bortsett fra at synonymene (som alt annet) kan inneholde feil, hvor er problemet?
Nei, synonymet knyttes ikke opp mot grunnformen i ROOT, det knyttes opp mot WORD. Det er slik scriptet som henter ut synonymene virker i dag.
Det gir jo heller ikke mening å oppgi synonymer for grunnformen i oppføringen for de avledede formene, når en heller kan oppgi synonymene i oppføringene for grunnformen direkte. Dvs. dette gir ikke mening:
WORD: bilen STATUS: + ROOT: bil SYNONYM: kjøretøy EDITOR: ...
En slik oppføring av synonymer for bil bør heller føres slik:
WORD: bilen STATUS: + EDITOR: ...
WORD: bil STATUS: + SYNONYM: kjøretøy EDITOR: ...
Det du, og Petter, har argumentert med er at det (kan) oppstå feil i databasen, men jeg kan ikke se på hvilken måte det skulle være unikt for synonymene.
Da tror jeg ikke du helt forstår hvordan "databasen" fungerer. Ta en titt på selve databasen på URL:http://tyge.sslug.dk/~korsvoll/nb.speling.org/htdocs/status/source.gz og legg merke til hvordan samme ord har flere oppføringer.
Systemet er kun i stand til å håndtere feil i WORD-feltet. Måten det håndteres er at kun ord som har fått mange 'STATUS: +' vil dukke opp i listen med ord som er godkjent av flere. STATUS-verdien peker kun til WORD-feltet.
Alle de andre feltene (som f.eks. ROOT og SYNONYM) har ikke en tilsvarende statusverdi, og det er dermed ikke mulig å markere at en mener at disse feltene er gale.
Men det vil da som nevnt gjelde *all* slags feil, så hvis det er argumentet, så burde vi vel bare vente med å sende ut e-poster til noen som helst?
Nei, det gjelder ikke alle slags feil. WORD-feltet håndterer feiloppføringer helt greit med det gjeldende systemet, så vi kan korrekturlese ord i dag. Men alle de andre infofeltene har vi problemer med.
[Axel Bojer]
Skjønner ikke bekymringen. Synonymet knyttes til grunnformen, og føres opps ammen med den i en synonymordliste. Slår man opp på et grunnord, så får man de tisvarende synonymene. Bortsett fra at synonymene (som alt annet) kan inneholde feil, hvor er problemet?
Nei, synonymet knyttes ikke opp mot grunnformen i ROOT, det knyttes opp mot WORD. Det er slik scriptet som henter ut synonymene virker i dag.
Javel, da forstår jeg bedre. Men er ikke dette noe man (lett?) kan endre på i dette skriptet? Feilen er vel da i skriptet og ikke databasen som sådan? Ser f.eks. følgende i databasen: Class burde vært navneord, en ny innsending vil bare gi enda en oppføring med substantiv istedenfor navneord, med datoen burde vel da kunne fortelle hvem av dem som er riktig?Kunne vi hatt et felt som heter f.eks CORRECTED: + og når det er angitt, så vil andre oppføringer med samme verdi for word enten slettes eller markeres som feil/unøyaktige?Eller kan skriptene vi kjører mot denne lista ta hensyn til datofeltet? Hvis ja, har vi vel løst problemet med rettelser ved at siste oppføring alltid er riktigst?Enda bedre ville det selvsagt vært om systemet kunne sendt en e-post tilbake med alle oppføringene hvis man skriver inn et ord som allerede finnes og be om at man syr sammen en korrekt versjon, bruke feltet over til å angi at nå er f.eks de to oppføringene nedenfor slått sammen og korrigert? WORD: actionspill STATUS: + CLASS: navneord CONJUGATION: Entall, ubestemt HYPHENATION: ac~ti~on~spill CORRECTION: actionspill COMPOSITE-WORD: action=spill EDITOR: Axel Bojer axelb@skolelinux.no DATE: 20060209
WORD: actionspill STATUS: + EDITOR: Rune Klevelands ordliste DATE: 20051112
Det gir jo heller ikke mening å oppgi synonymer for grunnformen i oppføringen for de avledede formene, når en heller kan oppgi synonymene i oppføringene for grunnformen direkte.
javel. Men er det ikke mulig å endre dette til at hvis ROOT er utfylt, så henter skriptet dette som grunnlag for synonymet? Er dette en vanskelig jobb? :-)
Det du, og Petter, har argumentert med er at det (kan) oppstå feil i databasen, men jeg kan ikke se på hvilken måte det skulle være unikt for synonymene.
Systemet er kun i stand til å håndtere feil i WORD-feltet. Måten det håndteres er at kun ord som har fått mange 'STATUS: +' vil dukke opp i listen med ord som er godkjent av flere. STATUS-verdien peker kun til WORD-feltet.
Greit. Men når det allerede finnes et ord og jeg legger det til en gang til med status + og får en dobbeltoppføring av samme ord. Er ikke det nettopp feil, vi ville vel at informasjonen i to ulike skulle bli slått sammen?Vil status=- slette alle oppføringer, hvis det er flere, med akkurat dette ordet? Altså er vel ikke håndteringen helt god der heller? :-)
Alle de andre feltene (som f.eks. ROOT og SYNONYM) har ikke en tilsvarende statusverdi, og det er dermed ikke mulig å markere at en mener at disse feltene er gale.
Hvis dette er viktig, hvor vanskelig er det å legge til noe tilsvarende for disse også?
Men det vil da som nevnt gjelde *all* slags feil, så hvis det er argumentet, så burde vi vel bare vente med å sende ut e-poster til noen som helst?
Nei, det gjelder ikke alle slags feil. WORD-feltet håndterer feiloppføringer helt greit med det gjeldende systemet, så vi kan korrekturlese ord i dag. Men alle de andre infofeltene har vi problemer med.
På hvilken måte håndteres disse feilene? Mener du ved at man kan sende inn STATUS: - ?Eller mener du at man legger inn en dobbeltoppføring ved å skrive STATUS: + og få enda en oppføring? (det siste har vi vel regnet som uheldig, så da er det vel i høyden det første som er rett, altså må vedl da heller ikke denne kunne sies å være helt på plass?) Mvh Axel