[an error occurred while processing this directive] [an error occurred while processing this directive][an error occurred while processing this directive] [an error occurred while processing this directive] [an error occurred while processing this directive] [an error occurred while processing this directive] (none) [an error occurred while processing this directive] [an error occurred while processing this directive] [an error occurred while processing this directive] [an error occurred while processing this directive] [an error occurred while processing this directive][an error occurred while processing this directive] [an error occurred while processing this directive][an error occurred while processing this directive] [an error occurred while processing this directive][an error occurred while processing this directive] [an error occurred while processing this directive] [an error occurred while processing this directive] [an error occurred while processing this directive] (none) [an error occurred while processing this directive] [an error occurred while processing this directive] [an error occurred while processing this directive][an error occurred while processing this directive]
 
[an error occurred while processing this directive] [an error occurred while processing this directive]
Skåne Sjælland Linux User Group - http://www.sslug.dk Home   Subscribe   Mail Archive   Forum   Calendar   Search
MhonArc Date: [Date Prev] [Date Index] [Date Next]   Thread: [Date Prev] [Thread Index] [Date Next]   MhonArc
 

Re: [LOCALE] Test-database design



Jacob Sparre Andersen wrote:
> Generelt ja, men da samme stavning kan tilhøre flere
> ordklasser kom jeg frem til at det nok er at foretrække at
> man tager mellemløsningen, hvor folk så vidt muligt ikke
> skal _taste_ noget ind, men godt kan blive udsat for at
> skulle vælge et punkt på en liste.

Jag är ju ny här och jag blir lite nyfiken: Vad är syftet med det här
omfattande systemeringsarbetet?  För mig som arbetat med Extreme
Programming, verkar detta som en Big Design Up Front (BDUF).

Om syftet är att enbart skapa en stavningsordlista, så behöver man
inte veta vilka ordklasser som orden tillhör.

Om syftet är att skapa ett uppslagsverk med långa definitioner av
varje ord, så rekommenderar jag Wikipedia (da.wikipedia.org).
(Då behöver man inte heller veta vilka ordklasser orden tillhör.)

Kunskapen om både ordlistor och uppslagsverk kallas lexikografi och
jag rekommenderar varmt boken "Nordisk lexikografisk ordbok", 1997,
ISBN 82-00-22901-7.


Jag som driver både susning.nu och runeberg.org har behov av
stavningsordlistor för två syften: Dels nya texter som skrivs nu och
där författaren behöver hjälp med stavningen, dels gamla texter som är
inscannade från gamla böcker och där OCR-programmet har läst fel.

Gamla svenska texter har annan stavning än modern text.  T.ex.
avskaffades dt- och hv-stavningen i svenska skolor år 1906, och
verbens pluralböjning (jag skriver, vi skriva) avskaffades 1970.
Det är alltså fel att idag skriva "hvarför", så detta ord bör inte
finnas med i words-sv.sq, men däremot måste det godkännas om
OCR-programmet har läst in det ur en gammal bok.  Därför behövs en
tilläggsordlista med alla gamla ord, och jag har börjat sammanställa
en sådan lista för svenska.

Teoretiskt skulle man kunna ha flera olika ordlistor för 1870, 1910,
1950, o.s.v. eller _en_ ordlista där man för varje ord anger vilka
årtal ordet användes (hvarför 1800-1920, varför 1900-2020).  Men jag
tror att 99% av användningen handlar om nutid (words-sv.sq) och genom
att bara addera _en_ ordlista med gamla tilläggsord, får man ett
system som fungerar rimligt bra.  Det betyder förvisso att "varför"
kommer att godkännas i texter från 1870, en "false positive".


-- 
  Lars Aronsson (sslug@sslug)
  Aronsson Datateknik
  Teknikringen 1e, SE-583 30 Linuxköping, Sweden
  tel +46-70-7891609
  http://aronsson.se/ http://elektrosmog.nu/ http://susning.nu/



 
Home   Subscribe   Mail Archive   Index   Calendar   Search

 
 
Questions about the web-pages to <www_admin>. Last modified 2005-08-10, 20:53 CEST [an error occurred while processing this directive]
This page is maintained by [an error occurred while processing this directive]MHonArc [an error occurred while processing this directive] # [an error occurred while processing this directive] *