Axel Bojer wrote:
Ja, den var intressant. Men dessvärre är alla ord omvandlade till lowercase (oslo, kristiansand) före sammanräkningen, vilket gör listan mindre användbar för att analysera rättstavning. Visserligen bör de 10.000 vanligaste orden finnas med i stavningsordlistan, men de "intressanta" orden (cigarett eller cigarrett?) är mycket mindre vanliga än så.
Jag lagade nu en statistik om de norska orden i Projekt Runeberg, som ni kan ladda hem och leka med, http://runeberg.org/words/frekvens-20070122.html