[Lars Aronsson]
Finns det någon bra algoritm för att avgöra om en viss text är skriven på danska, bokmål eller nynorsk? Kan det avgöras med regexp-matchning? Trebokstavsföljder?
Kanskje metoden til An Crúbadán, URL:http://borel.slu.edu/crubadan/, kan brukes? Så vidt jeg forstår ser den på frekvensen av ord for å søke etter dokumenter på bestemte språk.
Vennlig hilsen,