Petter Reinholdtsen wrote:
Bra å se framgang. Noen kommentarer:
[Axel Bojer]
- «Databasen» på tyge ...
Dette er ingen ordentlig database, men en tekstfil, noe som nok bidrar til de problemene vi har med å endre oppføringer i etterkant, systematisere/rangere/autorisere dobbeltoppføringer mm.
Hvorfor tror du lagringsmekanismen har betydning for de problemene vi ser? Slik jeg ser det er problemets elementer "e-post -> {processeringsprogram} -> {lagring}", og problemet er hvordan {processeringsprogram} oppfører seg, ikke hvordan resultatet lagres. Det er dermed her endringen må gjøres, og å bytte ut {lagring} fra til til SQL vil kanskje gjøre det enklere å endre på {processeringsprogram}, men ikke påvirke eksistensen av eventuelle problemer i {processeringsprogram}.
Vår tanke var at i en database kan man angi relasjonene mer presist enn i en tekstfil, og dermed f.eks. angi at ord som er meldt inn fra ordbanken alltid har prioritet og andre oppføringer av samme ord får status som forkastet (men ikke slettet). På lignende vis tenker jeg meg at man lettere kan lage en metode for å behandle dobbeltoppføringer (koble en nettside til databasen f.eks. slik at man vha. nettleseren kan avgjøre hvem av oppføringene som skal ha status som den rette), og man kan angi at f.eks. stattus er en feilstaving av status -- slike ting.
Er ikke det en bedre struktur? Hvis databasen allerede angir hvilke ord som er riktige, så er det kanskje lettere å mate dem inn i norsk.words også?
Hvis dette skulle være feil vil jeg gjerne vite hvordan det egentlig fungerer :-)
Hilsen Axel