Joukahainen > Ohjeita > Muut kentät

Perusmuoto

Eräät sanat voidaan teknisistä syistä kirjata Joukahaiseen omiksi tietueiksiin, vaikka käytännössä on kyse saman sanan kirjoitusasuista. Jos nämä sanat halutaan perusmuotoon palautuksessa (mm. hakusovellukset) palauttaa johonkin muuhun muotoon kuin tietueen kirjoitusasuihin, voidaan tämä perusmuoto asettaa perusmuoto-kentän avulla. Tällä hetkellä kenttä on käytettävissä taipumattomilla sanoilla, joissa esimerkiksi "hupsista" palautetaan perusmuotoon "hupsis".

Sana Wikissä

Joukahaisessa ei ole mahdollisuutta yksityiskohtaisten sanaselitysten säilyttämiseen. Jos tällaiselle on tarvetta, on parempi käyttää esimerkiksi vapaata Wiktionary-sanakirjaa. Tähän kenttään voi laittaa URL-osoitteen sivulle, josta tarkempi sanan selitys löytyy. Vain http-alkuiset osoitteet hyväksytään. Suomenkielinen Wikipedia ja Wiktionary ovat suositeltavimpia linkin kohteita, mutta tarvittaessa muihinkin lähteisiin voi linkittää.

Yleisyysluokka

Tämä on kokonaislukukenttä, johon sanan yleisyys merkitään seuraavan asteikon mukaan:

YleisyysluokkaSanan yleisyys suomen kielessäEsimerkkejä
14 yleisintä sanaaolla, ja, ei, että
25. - 16. yleisimmät sanatminä, niin
317. - 64. yleisimmät sanataika, suuri
465. - 256. yleisimmät sanatoma, mennä
5257. - 1 024. yleisimmät sanattieto, oikeus
61 025. - 4 096. yleisimmät sanatpuolue, pöytä
74 097. - 16 384. yleisimmät sanatsanonta, pata
816 385. - 65 536. yleisimmät sanaterkkeri, vihta
965 537. - 262 144. yleisimmät sanatiguaani, turku (vanha "tori")
10262 145. yleisin ja sitä harvinaisemmat sanatpetruska, hyvälistö

Yllä oleva taulukko perustuu arvioihin ja Googlen käyttöön. Erityisesti sanojen yleisyys suomen kielessä on arvioitu hyvin suurpiirteisesti, ajatellen johdosten ja yhdyssanojen olevan omia sanojaan. Järkevintä on yleisyysluokkaa määritettäessä verrata sanaa esimerkkisanoihin ja valita se luokka, joka niiden perusteella tuntuisi parhaimmalta. Jos yleisyysluokkaa ei ole määritetty, sen arvioidaan olevan 7. Yleisyysluokan voi asettaa oman arvion mukaan, sen tarkalla arvolla ei ole suurta merkitystä vaan useimmat sovellukset käyttävät sitä ainoastaan sanaston rajaamiseen sekä sanojen tunnistamisen apuvälineenä.


Creative Commons License Tämän sivun sisältö on käytettävissä GPL 2.0 -lisenssillä, tai vaihtoehtoisesti Creative Commons Attribution-ShareAlike 2.5 -lisenssillä. Käyttö ja levitys on sallittu myös molempien mainittujen lisenssien uudempien versioiden ehdoilla.