KESKUSTELUT > MUUT AIHEET > TILASTOJA

303. Tilastoja

Pulmailija16.9.2003 klo 00:43
Toisen otsikon alla oli kysymys OSuin aikanaan tekemästä tilastossa, niin tein nopeasti skriptin pätkän, joka kasasi seuraavan yhteenvedon. Foorumissa on kirjoiteltu yhteensä 293 aiheesta 5669 kirjoitusta 308 eri nimimerkin voimin.

Suosituimmat aiheet (TOP-20):
203 maisterin tontilla
174 Paikkakuntia
141 Vappuvisa
86 Ei kasteessa annettuja
77 Nimihenkilö
70 Laatijan huonoja valintoja
67 Vertaillen
66 Aluset?
64 Arvosteluasteikko ?
61 etymologiaa
61 Kadunnimi
61 Sana-aiheinen kilpailu
60 Älykkyystesti
59 Verbejä
58 Mikä on ratkaisu?
56 Iltalehti
52 Peliasiaa
50 Todennäköisyys
50 Monikot
49 Kapulakieltä

Viestit kuukausittain:
2003-03 82
2003-04 670
2003-05 1433
2003-06 1053
2003-07 661
2003-08 1202
2003-09 568

Viestit tunneittain:
0.00 - 0.59 152
1.00 - 1.59 100
2.00 - 2.59 94
3.00 - 3.59 71
4.00 - 4.59 46
5.00 - 5.59 38
6.00 - 6.59 26
7.00 - 7.59 86
8.00 - 8.59 182
9.00 - 9.59 334
10.00 - 10.59 322
11.00 - 11.59 402
12.00 - 12.59 375
13.00 - 13.59 302
14.00 - 14.59 326
15.00 - 15.59 301
16.00 - 16.59 306
17.00 - 17.59 334
18.00 - 18.59 236
19.00 - 19.59 259
20.00 - 20.59 342
21.00 - 21.59 368
22.00 - 22.59 376
23.00 - 23.59 291
2. Pulmailija16.9.2003 klo 00:46
Nimimerkit ovat otettu juuri niinkuin ne on kirjoitettu viesteihin, mitään yhdistämisiä ei ole tehty.

Eniten postauksia nimimerkittäin (TOP-20):
550 Eki
366 OSui
350 Jouni
341 Kravattimies
323 Antti Viitamäki
300 jupejus
243 ile
223 Titta
190 Kotsa
164 jepsjuu
161 Timppa
157 J Takala
120 Pena
114 Matti
111 ++juh
105 iso S
103 Maiju
101 Helge
94 Ani
88 Make

Osallistunut useimpaan eri aiheeseen (TOP-20):
176 Eki
118 Jouni
115 OSui
98 Antti Viitamäki
88 Kravattimies
87 ile
85 jupejus
83 Timppa
77 Titta
76 Kotsa
69 Matti
67 J Takala
48 Maiju
46 Helge
46 Make
45 ++juh
42 Pena
41 iso S
39 Ani
38 terok
3. Pena16.9.2003 klo 08:16
Kiitos Pulmailijalle. Eihän näistä varsinaista hyötyä ole(?) mutta on muuten vaan mukava katsella. d:)
4. iso S16.9.2003 klo 08:18
Erinomaista. Pääset ilmeisesti lukemaan suoraan tiedon lähteeltä kulkematta reittiä selaa-leikkaa-liimaa-laske. Aikaisempaan verrattuna oli uutuuksiakin: "Viestit kuukausittain" ja "Osallistunut useimpaan eri aiheeseen ".

Omalla mielenkiintoisella tavallaan kirjoittajien luonnekuvaa kartoittaisi, jos saisi vielä listat "Ensimmäisenä vastannut" ja "Viimeisen sanan sanonut". Jälkimmäisestä voisi olla hyvä suodattaa pois ne keskustelut, joihin on luultavimmin tulossa jatkoa, eli esimerkiksi tuoreimmat 1-2 viikkoa. Näitä kaikkia kun vertailisi keskenään niin tilastohullut pysyisivät päivän poissa muusta pahanteosta!
5. Pulmailija17.9.2003 klo 22:50
Tässä vielä iso S:lle ja muillekin muutama TOP10 lista. Näissä on jo sen verran enemmän hajontaa, että kymmenen kärki riittäköön. Itse en ole kyllä kovin ihastunut noihin nimimerkkikohtaisiin listoihin, jokainen kyllä tietäneen kuinka useasti on tänne kirjoitellut. En jaksanut suodattaa uusimpia viestejä pois tuolta viimeisestä listalta, sillä tuskin olisi ollut suurta vaikutusta lopputulokseen.

Kyllä tuo aineisto on ihan webin kautta haettu, mutta pienestä ohjelmointikokemuksesta on hyötyä ja koneen voi antaa tehdä mekaanisen työn :)

Ei kai noista voi päätellä muuta kuin, että aktiivisimmat kirjoittelijat ovat aktiivisimpia joka suhteessa ja suomalaiset ovat heinäkuussa lomalla :)
Lisäksi vain 4 postausta on merkitty sensuroiduiksi ja 9 aihetta on sensuroitu tai hävinneet bittien taivaaseen.

Aloittanut useimpia uusia aiheita (TOP-10):
39 Jouni
27 ile
19 Eki
18 Titta
13 Kravattimies
11 Pena Porvoosta
11 Timppa
9 Pena
8 Matti
7 Jukkis

Ensimmäisenä vastannut (TOP-10):
68 Eki
25 Jouni
18 Antti Viitamäki
18 OSui
13 Kravattimies
10 Timppa
8 Ani
8 Titta
8 ile
8 jupejus

Sanonut useimmin viimeisen sanan (TOP-10):
37 Eki
22 Kravattimies
17 OSui
15 jupejus
12 Jouni
12 Matti
12 Pena
12 Timppa
9 ile
8 Titta
6. iso S17.6.2004 klo 12:06
Kauniin ja vähälumisen kesän kunniaksi pukkaan tilastoa. Tässä on mukana säikeet 1-900. Säikeitä on 886, 14 on sensuroitu. Viestejä on laskelmissani 19579. Nimimerkkejä on 769 ja vähintään kolmesti kirkaisseita 229. Kymmeneen kertaan äityneitä on 115, viidenkympin villitsijötä 59 ja satakerta-kommentaattoreita 39..

Aktivistien 20 kärjessä (nimimerkit yhdistetty, jos ne ovat samat isoiksi kirjaimiksi muunnettuna ja blankot poistettuna):

1819 Eki
1289 Pena
1094 iso S
977 Titta
966 jupejus
883 Kravattimies
820 Timppa
757 Jouni
702 ile
623 J Takala
569 Matti
495 Antti Viitamäki
387 OSui
380 Henry Haapalainen
269 jepsjuu
241 Helge
235 Maiju
225 tjn
213 Tane
209 Tuomas L.

33 säiettä on jäänyt vaille vastausta, 96.4 prosenttia on saanut vähintään yhden palautteen. Ensimmäinen kuittaus on tullut nopeimmillaan samalla minuutilla, hitaimmillaan reilussa 6 kuukaudessa, keskimäärin 2059 minuutissa. Muutama hidas nostaa keskiarvon korkeaksi. 61.8-prosenttisesti ensimmäinen vastaus tulee tunnin sisällä.

Pulmailija voisi ystävällisesti päräyttää omat tilastonsa juhlan kunniaksi kun tuhannes säie näkee päivänvalon. Ennustan sen tapahtuvan Unikeonpäivänä 27.7.2004.
7. Eki17.6.2004 klo 12:47
Kiitos, iso S. OSuin kanssa olisit kakkonen.

Ja taas napsahti piste Ekille :)
8. Titta17.6.2004 klo 13:11
Minä veikkaan 12.8. :)
9. Eki17.6.2004 klo 13:15
Tähän voi jokainen vaikuttaa paljon enemmän kuin Saken bongailuun, jonka veikkauksen Just voitti yli 100 kilometrin etäisyydeltä eli telepatia oli ainut tapa vaikuttaa, eikä sekään.

Veikkaan 15.8.
10. Pena17.6.2004 klo 13:40
Milloin veikkausaika päättyy?

Saattaisin veikata jos olisi joku palkinto jaossa! xD
11. iso S17.6.2004 klo 14:00
Kiitos kiitoksista, Eki Ykkönen. Juupati juu, OSuin kanssa olisin kakkonen, mutta Penan kanssa ykkönen. Meidän olisi pitänyt älytä yhdistää voimat ettet olisi ukkona tunkiolla. Jos menneisyyden haamut kaivetaan, niin kakkossijani olisi tosiasia mutta niukka - Pena Porvoosta toisi 60 ääntä Penalle.

No, tämän suoritteen jälkeen johdan Penaa tässä säikeessä 3-2, joten ei kannata tuudittautua siihen uskoon että hopea olisi ikuisesti hallussa.

Tämä ei liity ristikoihin, mutta Penalle tiedoksi: tänään höyryän Porvooseen. Perjantaina klo 17:48 lakkasin olemasta yksinkertainen isoisäpuoli tuloksella 52 cm, 4320 grammaa. Nyt mennään katsomaan onko poika kasvanut sitten viime näkemän.
12. Titta17.6.2004 klo 14:03
Onneksi olkoon, iso S! :) :) :)

Ei hätää, minä menen tänään paikkaamaan paikkakuntasi sanaseppovajetta! :D
13. Pena17.6.2004 klo 14:09
Onnittelut iso ässälle, ja muillekin osallisille! Potra poika tuommoisilla mitoilla.

Itse olen höyrynnyt jo pari viikkoa kotiseudulla Pohjois-Karjalassa. Ei liity ristikoihin, mites se nyt (taas) tälleen? :D
14. Eki17.6.2004 klo 14:11
Onnea onnea! Nyt kannattaa onnitella, kun samalla piste rapsahtaa :)
15. iso S17.6.2004 klo 14:33
Kuten puolisuudesta selviää, olen tässä(kin) asiassa vailla omia ansioita. Varsinaisten osallisten puolesta tuhannet kiitokset. Kannattaisiko jakaa kukin kiitos omaksi pisteekseen...

Kiitos, Titta, noin se luonnon tasapaino säilyy ja luonnollisen poistuman aiheuttama aukko täyttyy. Kukahan on poissa Pohjois-Karjalasta, ettei Pena aiheuta liiallista ristikkopainetta?
16. Titta17.6.2004 klo 14:39
Ja kuka tulee Lappeenrantaan...?
17. iso S17.6.2004 klo 14:47
No tietysti se Pohjois-Karjalan X, ettei kehä kasva liian pitkäksi!
18. iso S17.11.2005 klo 10:04
Alkukirjainketjussa RA esitti 16.11.2005 klo 22:58 arvion:

"Tuhat" uutta oikein kelvollista "infoa" olen sepustanut!
-> Sitten: "Aha-roskikseen!!!"

Ilmeisesti 1302 infoa ei ole ollut oikein kelvollisia, koska 47 säikeen jälkeen, 16.11.2005 klo 23:00, RA johtaa AKK-tilastoa 2302 viestin tuloksella. 30 kärjessä -lista:

1. RA: 2302
2. Arska: 1321
3. Eki: 1225
4. kirre: 994
5. Juhani Heino: 905
6. mor: 786
7. iso S: 592
8. matts: 450
9. Tsööts: 418
10. jupejus: 356
11. Matias-Myyrä: 271
12. Sakke: 246
13. marjaana: 174
14. Olavi Kivalo: 147
15. TT: 146
16. Kaitsu: 143
17. tero: 143
18. Juha N: 130
19. Arja: 125
20. Urputtaja: 121
21. Heljä-Maija: 119
22. Egon: 116
23. Pena: 100
24. Artsi: 86
25. Eleth: 78
26. Tupu: 61
27. Ritu: 60
28. Suzie Q: 53
29. tonimikael: 41
30. kummeli: 37

Viestejä on yhteensä 12161. Niistä RA:n osuus on 18,9 %, 10 ahkerimman 76,9 % ja 30 ahkerimman 96,6 %. Eri lähettäjiä on 154, kun isot ja pienet kirjaimet lasketaan samanarvoisiksi ja sulkumerkit on eliminoitu. Edelleen jää ilmeisiä saman henkilön nimimerkkejä mutta nämä ovat vähäisiä lipsauksia eivätkä kokonaiskuvaa hetkauta.

Edellisen tilaston tein 31. säikeen kohdalla. Sen jälkeisten aktivistien "likainen tusina" on RA, Arska, Juhani Heino, Eki, kirre, mor, iso S, matts, Tsööts, jupejus ja Sakke. Näillä on yli 150 viestiä. Muut kärkipäässä keikkuvat ovat mukana vanhoilla näytöillä.
19. RA17.11.2005 klo 14:39
Iso S,
tarkoitin, että "tuhat" viestiä olen laittanut suoraan roskikseen huomattuani olevani myöhässä. Eli kaipa sitten olen tehnyt yhteensä 3302 viestiä!

- Niin, ja usein esitettyyn kysymykseen vielä kerran vastaus: Ei, ei minulla ole (ollut) parempaa tekemistä. :-)
20. iso S17.11.2005 klo 14:55
Jaa, sitten oletkin väärinymmärretty AKK-nero. Jatkaakseni väärinymmärtämistä: jos nainen huomaa 1000 kertaa olevansa myöhässä niin siihen tarvitaan aikaa noin 83 vuotta, mikä ei ole enää normaalia :)

Jos joku sattuisi olemaan sellainen masokisti että haluaisi kahlata AKK:n läpi kaikessa kauneudessaan ja kauheudessaan, niin tässä on osien 1-46 säienumerot:
1359, 1365, 1386, 1406, 1423, 1469, 1479, 1486, 1496, 1516, 1522, 1528, 1532, 1547, 1551, 1557, 1562, 1577, 1581, 1592, 1596, 1601, 1610, 1623, 1635, 1643, 1655, 1671, 1685, 1717, 1752, 1790, 1821, 1827, 1840, 1858, 1877, 1907, 1941, 1966, 1995, 2021, 2035, 2060, 2100, 2120
21. RA17.11.2005 klo 15:28
Noh, noh! Laskujeni mukaan aikaa tarvitaan vain noin 5½ tuntia. Ei kokeneelta myöhässäolijalta kulu yhteen myöhässäolonsa huomaamiseen kuin parikymmentä sekuntia.
22. Matti17.11.2005 klo 17:21
iso S, pöh.
23. iso S13.6.2007 klo 11:56
Höh, tilastosuonessa on taas painetta.

Laitoin Excelin tunnistamaan sanoja ja laskemaan niiden yleisyyttä ristikkokeskustelussa. Lähdemateriaalina oli keskustelut sivuston julkistamisesta (4.3.2003) suunnilleen ensimmäisen vuoden loppuun eli noin 22.12.2003 asti.

Sanaksi makro tunnisti vähintään 3 kirjainta pitkät tekstipätkät joita rajasi välilyönti tai joku erotinmerkki. Sellaiseksi tulkitsin merkit
. , ; : ? ! ( ) / ' - "

Hakasulut olisi voinut ottaa mukaan mutta eipä tullut mieleen. Esimerkiksi numeroita sisältäviä merkkijonoja systeemi ei hyväksynyt sanoiksi, koska niissä kirjaimia ei rajannut joku noista erottimista. Tavuviivan käsittelyssä oli erikoissääntö: kahden kirjaimen välissä oleva viiva tulkittiin sanaan kuuluvaksi tavuviivaksi, muuten erottimeksi.

Systeemi tunnisti tekstimössöstä 382238 "sanaa". Joukossa oli tietysti kaikenkarvaisia lyhenteitä ja kirjoitusvirheitä, sellaisia kuten aajr ja sittl, mutta yllättävän vähän. Erilaisia sanoja oli 105650. Taivutusmuodot ja monikot tietysti laskettiin eri sanoiksi, eihän koneparalla ollut niin paljon älliä että se olisi osannut muuttaa sanoja perusmuotoon. Silmämääräisen erittäin karkean arvion mukaan perusmuotoja olisi noin puolet koko määrästä.

Yli 500 kertaa esiintyneiden Top-53:

1. 4330 että
2. 3404 mutta
3. 2597 kun
4. 2257 jos
5. 2143 oli
6. 2107 niin
7. 2028 kuin
8. 1844 ole
9. 1419 tai
10. 1269 sen
11. 1244 olla
12. 1241 myös
13. 1086 ovat
14. 1079 kyllä
15. 1052 voi
16. 1007 nyt
17. 994 joka
18. 991 vain
19. 969 olisi
20. 943 sitten
21. 913 vielä
22. 877 sitä
23. 856 mitä
24. 854 olen
25. 816 ihan
26. 726 hyvä
27. 683 ollut
28. 670 ainakin
29. 670 siis
30. 666 mikä
31. 660 itse
32. 655 hän
33. 654 joku
34. 653 tämä
35. 642 vaikka
36. 619 kaikki
37. 612 vaan
38. 606 siitä
39. 589 eikä
40. 589 joskus
41. 574 tuo
42. 570 minä
43. 559 sana
44. 542 eli
45. 535 koska
46. 531 tässä
47. 530 mitään
48. 529 siinä
49. 523 aika
50. 516 aina
51. 516 tulee
52. 506 vai
53. 503 onko

Listalta löytyy sattuman satona syntyneenä lähes järkevää tekstiä: "... joka vain olisi sitten vielä sitä mitä olen: ihan hyvä!" ja "siinä aika aina tulee."

Erästä tiettyä ötökkää käsittelevä keskustelu ei ollut vielä roihahtanut, se mainittiin vain 17 kertaa. Linkkivinkkejä annettiin yhtä monta kuin on päiviä karkausvuodessa: http oli 366 kertaa.

Sijamuotojen yleisyyttä voisi havainnollistaa toisella ötökällä:
EKI 306
EKIHÄN 5
EKIKIN 8
EKILLE 29
EKILLÄ 11
EKILTÄ 19
EKIN 120
EKIÄ 8

Matematiikka ei ihan pelaa: Ekille - Ekiltä = 29-19=10, mutta Ekillä = 11. Ilmeisesti Ekillä oli yksi omasta takaa, en vain tiedä mikä.

Ekittä ei oltu kertaakaan, mistä tuli niin turvallinen olo :-)
24. sini13.6.2007 klo 13:29
häh
25. iso S5.7.2007 klo 09:46
Törmäsin netissä tiedostoon Words.finnish. Tämä tuntuu tutulta; ihan kuin joku olisi äskettäin kysynyt suomalaisia sanoja sisältävää tiedostoa ja silloin tämä olisi mainittu.

Tiedostossa on 287698 sanaa, perusmuotoisia ja taivutettuja. Kirjoitusvirheitä, epäsanoja ja ulkomaisia sanoja (tiedoston nimestä huolimatta) on joukossa, esimerkiksi viimeinen sana åäni ei kuulosta selkosuomelta. Skandit ovat poskellaan jos tiedoston imaisee ilman jotain erikoistemppuja.

Mitenkään täydellisen kattava tiedosto tuo ei ole, jos ajattelee sieltä saavansa suomalaisten sanojen hakemiston omaan käyttöönsä. Kaikkia sanoja ei ole, taivutusmuotoja on mukana ja toisaalta läheskään kaikkia sanan taivutusmuotoja ei ole. Vaikuttaa siltä että tämä on jostakin melko laajasta lähteestä koneellisesti seulottu otos. Tämäkin tuntuu tutulta - joku lehti joka ei halunnut nimeään mainittavan tässä yhteydessä?

Vertailun vuoksi: vastaavalla perusteella koneellisesti poimien eli taivutusmuodot, epäsanat, kirjoitusvirheet ja ulkomaankieliset laskien näillä palstoilla on esiintynyt vuosina 2003-2005 yhteensä 322803 erilaista sanaa. Aineistojen koko on karkeasti ottaen sama, Words-tiedosto noin 10 % pienempi.

A-alkuisissa sanoissa lukemat ovat 15368 ja 21784, Words on noin 30 % pienempi. Jostain syystä täällä käytetään suhteellisesti enemmän A-luokan sanoja! Sanastot eivät ole kovin hyvin päällekkäisiä, vain 5823 on sellaisia että sana (tai taivutusmuoto) esiintyy molemmissa. Ihan "kunnollisissa" perusmuotoisissa sanoissa osuvuus on varmasti paljon parempi, mutta puutteita on puolin ja toisin.

AA-alkuisia sanoja pikaisesti vertaillen totesin että Words-tiedostosta puuttuu sanat aakkosto, aallotar, aaltokone, aami, aamukahvi, aamukampa, aamunraikas, aamuposti, aamupuuro, aamurusko, aamuruuhka, aamuvoimistelu, aamuvuoro, aamuyö, aarpora, aasiatar, aasinsilta, aateloida, aatesuunta, aateveli, aattoilta, aavesärky ja aavikkomyrsky.

Vastaavasti täällä ei ole käytetty ainakaan perusmuodossa ja ennen vuotta 2006 sanoja aallonpohja, aaltoliike, aamiaisaika, aamuherätys, aamuhetki, aamujuna, aamukone, aamumessu, aamuruoka, aamurytmi, aamusoitto, aarrearkku, aarrekammio, aarteenetsintä, aarteenmetsästys, aasiserenadi, aatehistoria, aatelisarvo, aatelismies, aatelisneiti, aateluus, aatetoveri, aatteeton, aaveprikaati ja aavikkorotta.

Härpätihää, Words: sen sisältö ei parantunut pätkääkään mutta täälläpä on nyt käytetty noita puuttuneita!

Näytteenä yhteisestä sisällöstä 30 ensimmäistä: aaa, aaah, aab, aabrahamilla, aah, aahas, aake, aakkoset, aakkosia, aakkosilla, aakkosjärjestykseen, aakkosjärjestyksessä, aalberg, aale, aalloilla, aalloissa, aallokko, aallokossa, aalloksi, aallon, aallonharjalla, aallonpituudella, aallonpituuksilla, aallonpituus, aallonpohjassa, aallosta, aallot, aaltio, aalto, aaltoa.
26. iso S5.7.2007 klo 12:22
Löytyi: Ari antoi 16.2.2007 klo 21:36

säikeessä 434 tiedoston osoitteen

ftp.univie.ac.at/security/dictionaries/Finnish/wor ds.finnish

ja linkin
ftp.cerias.purdue.edu/pub/dict/dictionaries/Finnis h/words.finnish.FAQ
jossa kerrotaan tiedoston taustasta ja puutteista. Kyseessä on nimeltä mainitsemattoman aikakauslehden muutaman vuosikerran sanasto.

Historia toisti itseään 400 säikeen välein:
34. L-loppuiset suomen kielen sanat
434. L-loppuiset sanat
27. iso S1.11.2007 klo 15:14
IS 1.11.2007 11:25
Airbusin superjumbon ensimmäisenä laivastoonsa saaneella Singapore Airlinesilla on erikoinen toive: älkää liittykö kymppikerhoon täällä!

Ei sitten, joten perustin kymppikymppikerhon niistä ketkä ovat kirjoittaneet tänne lokakuussa (10. kuukausi) vähintään 10 kertaa. Laskujeni mukaan viime kuussa tänne tuli lokakuussa 189 eri lähettäjänimeltä 5279 viestiä 98 säikeeseen. Kerhoon päässeistä muodostuu tällainen suunapäänä-lista:

1. RA: 721
2. Eki: 626
3. Libero: 592
4. Matias-Myyrä: 390
5. Hakro: 355
6. Arska II: 333
7. Arja: 291
8. iso S: 223
9. Jaska: 149
10. Juhani Heino: 117
11. Miimu: 102
12. Seppo: 102
13. Ari: 101
14. matts: 88
15. mor: 85
16. eikka: 84
17. Arska: 72
18. Tsööts: 57
19. Aikku: 45
20. Olavi Kivalo: 39
21. Jukkis: 36
22. Matti: 31
23. hah: 27
24. HT: 27
25. nassakka: 26
26. EJlo: 23
27. Taata: 23
28. [ra]: 22
29. [Libero]: 14
30. Lauri Kultti: 14
31. Mäkis-Tartti: 14
32. kalkkuna: 13
33. Römpsä: 13
34. Tuomas L.: 13
35. alex: 12
36. tonimikael: 12
37. Heppu: 11
38. airisto: 10
39. MP: 10
40. Sikar: 10

Oma vika tai taktista oveluutta jos on käyttänyt erilaisia nimimerkkejä. Isot ja pienet kirjaimet tilastointi tulkitsi samanarvoisiksi mutta erilaiset lisukkeet ja kirjoitusvirheet aiheuttivat armotta eri nimeksi tulkitsemisen.
28. iso S1.11.2007 klo 15:17
Maailma muuttuu ja osittain ei mitään uutta auringon alla. Vertailun vuoksi vastaava lista viime vuoden lokakuulta.

6512 viestiä 229 lähettäjältä 171 säikeeseen:

1. RA: 913
2. Eki: 545
3. Arska: 500
4. Libero: 354
5. Juhani Heino: 350
6. Tsööts: 297
7. eikka: 285
8. Jyrki: 239
9. Taata: 192
10. iso S: 171
11. Jaska: 159
12. kp: 146
13. airisto: 131
14. Jukkis: 120
15. matts: 116
16. <Default>: 113
17. mor: 105
18. Sikar: 105
19. Ari: 95
20. Arska II: 77
21. JPQ: 69
22. Ritu: 69
23. Pena: 68
24. Sini: 66
25. Seppo: 64
26. Matti: 62
27. ö: 52
28. JTak: 46
29. qwer: 41
30. Arja: 40
31. Antti Ylönen: 37
32. jupejus: 37
33. Marko: 37
34. Tuomas L.: 36
35. [ra]: 35
36. pekka: 31
37. tapiiri: 30
38. alex: 29
39. Sakke: 29
40. Aikku: 27
41. tonimikael: 23
42. Dosentti Samuel: 21
43. Antti Viitamäki: 19
44. Hui_hai: 19
45. jarkko: 19
46. Kravattimies: 19
47. marjaana: 18
48. Miimu: 14
49. sanasieppo: 12
50. Seija: 12
51. [Jyrki]: 11
52. EJlo: 11
53. kari kämäräinen: 11
54. raukoo: 11
55. Dicell: 10
56. Marianna: 10
57. yngve: 10

Default oli häirikkö joka pommitti satunnaisesti valitsemaansa säiettä 2850.
29. ö1.11.2007 klo 19:37
Katoavaista on mainen kunnia. Vuonna 2003 olin Jouni-nimimerkilläni peräti kolmantena ja viime vuonna ö:nä 27:s.
Tänä vuonna en päässyt enää listalle.
Pelkään joutuneeni sivuraiteelle.
30. tonimikael2.11.2007 klo 01:23
Ei tuo välttämättä niin huonokaan suunta ole, ö..? Koeta kestää ja pärjätä! :)
31. iso S2.11.2007 klo 09:01
ö, se on joskus pienestä kiinni. Jäit yhden pisteen päähän julkisuuskynnyksestä. Yhdeksällä äänellä heltiää oikealla nimimerkin valinnalla 41. sija. Tilastoni laittaa tasapelin sattuessa nimimerkit aakkosjärjestykseen, joten Jounina olisit pärjännyt paremmin. Nyt edellesi kiilaavat Hiekkaharjun hyeena, Kravattimies, Pena ja T.Avis. Olet listallani 45:s.

Vielä ei pääse sanomaan että tästä on vain yksi suunta, ylöspäin. Toivoa kuitenkin on - ahkeruus harmaankin kiven voittaa ja luja tahto vie miehen läpi kovan onnen tai jotain.

Lisää kliseitä: tärkeintä ei ole voitto vaan jalo kilpa eikä hienointa ole määrä vaan laatu.

Vuoden kun treenaat ja muistat levon ja rasituksen oikean suhteen niin lokakuussa 2008 kymmenen repliikkiä irtoaa vaivattomasti ja olet oikeutettu mukaan tälle perinteiselle kymppikymppilistalle joka julkaistiin nyt ensimmäisen kerran ja mahdollisesti samalla viimeisen, mutta se ei himmennä tulevan kunniasi loistetta.

Huonommin on käynyt seuraaville 154 lähettäjälle, jotka ovat lopettaneet tai olivat nyt jäähyllä: Jyrki, kp, <Default>, Ritu, jupejus, Marko, tapiiri, Dosentti Samuel, Antti Viitamäki, marjaana, sanasieppo, [Jyrki], raukoo, Dicell, yngve, Jussi, This is the end, ­, Artsi, marja, Utami Tatami, (Jyrki), E, MRRR, Ana Soliip, corona, Demondes, Hyvä kysymys, ma, tjn, (arska), eila kuusamosta, H. Lavonius, HooTee, Kepa, larza, lol, MM, Pekka Harne, ripa, Y, -, Alalle ehkä aikova?, Alf Simberg, arjatuula, Asko, Gabby, Jonttu-fantti, Moisku, Pessimisti, pikkuiisakki, topi, ­­, (Antti Ylönen), (ra), (sori sotku), (uusiksi), ...kertakaikkiaan..., : (, [heh], ^¨, ~*~, ahti, Ahti Lehtonen, Ale, apuva, Apu-va, Arka™, Arksa™, Atulatehtailija, Candyman can, ehdotus, Ehkä alalta aikova, enni, enni kuka kertoo v:hen loppuva, Epäilevä, Eräs, F, Far, google, Hans Lankari, heh, Helena, heli k, Heljä-Maija, Hessu, h-r, hui, huuhaa, hönötär, ile, J.., JiiTee, JP Ikäheimonen, Justiina, Jäi vähän hämäräksi, Jäähyväiset, Kaino, katariina, Kiitos sinulle, kirre, korttihai, kummeli, kurinpito, lasse, Lopulliset jäähyväiset, lööppi, Maiju, Maikol, Malvoisin, meillä rallipiireissä, mia, mitä kummaa, Moi, Moka, MOLLAAJA, Nippe, noksis, noutaja, pelsepuupi, Pete, POLLE, pr, RA + SMG, rauhaa, Reino, Reppumies, Riti, S, sanna, Satunnainen kävijä, Se ei käy..., Seija ja Hallikaisen Joel, Seija ja Panaman konsuli, Seija, Jarkko & Laura, Siltä ainakin tuntuu, suvi, TB, Teemu, Tekari, Thelma, tiina, Tiita, Tosi lopulliset jäähyväiset, totoro, trurl, Tsk-tsk, tumpz, Tyhmä kysymys, Tytti Kulhia, velho, voi itku, xfh ja Yki.

Uusia tulokkaita oli 110: Hakro, HT, nassakka, kalkkuna, Römpsä, Heppu, ,-viilari, Hemppa, häh, [Hakro], [Arska II], [eikka], [Matias-Myyrä], 1000kauno, Hedvig, Keno, Mummu, tapsa, Vili, Anonymous, kudos, leppis, pikku S, Selittäjä, sps, [mäkistartti], Ananias, hra47, Je-Kyll, joku, JTL, keppana, maan alta, Maikki, muori, ok, pink and brown pig, Pirkkonen, Rakkine, sijamuotogallup, Tonttu, !, (Libero), [+ la], [Arska], [JH], [Voitto], aamu virkku radio amatööri, Aika Kone, aromisuolatar, Arska 2, Arska IIl, Aulikki Nenonen, cee-cee, della, Egon, Eihän tämä..., Éki, Eki§, Esa, GABRIELLA, gallup, hilda, hu-huu, Icewalker, i-sti, Jaana, jatkuu, johan, Johto Lennon, Joopajoo, jsi, Juha K, Jukka S, Kalli Grafi, Katri, konsta, kvartsinikkari, kysyn vaan, lyrics mp3, maan alta - viimeinkin!, Masi, mati, MB, Mervi, Olkis, onervab, pajen, pekka lekka kermanekka, Pentti, 41, Pohojalaanen, Queen fani, ratkee, Roope Ankka, sanonko liikaa?, sattuma, sattuma 2, Sensuroitu, she, Siis:, taitais jatkua, Teimu, tillooja, toinen televote, Warum?, veileh, yaketi yak, zap, äiti ja äänestyksen tulos.

Kympin nyt saavuttaneista 27 pystyi edellisellä listalla samaan, 7 tyytyi vähempään ja 6 oli uusia tulokkaita. Pörssi vakaa, vaihto kohtalainen.
32. hah4.11.2007 klo 10:08
Hauska tilasto...

hähhäh ja hahhah :D
33. Tsööts4.11.2007 klo 18:51
Tjaah, tuollainen pudotus tilastoissa - olenko laiskistunut vai hankkinut (netin) ulkopuolisen elämän?:-)
34. Tsööts4.11.2007 klo 18:54
[*huokaus* ...vai hankkinut (netin ulkopuolisen) elämän?:-)
35. RA4.11.2007 klo 18:59
Juu, kärjessä olevillahan ei (tunnetusti) ole elämää. Huokaus.
36. RA4.11.2007 klo 19:03
[*huokaus* ... kärjessä oleviSSahan ei...]
37. RA4.11.2007 klo 20:30
Nimim.:llä "Kokemusta on" laskeskelin, että yhden viestin kirjoitus vie keskimäärin minuutin (joskus huomattavasti vähemmän, joskus huomattavasti enemmän).

Iso S:n tilaston mukaan olen siis käyttänyt tämän vuoden lokakuussa 721 minuuttia täällä. Se tarkoittaa, että olen "roikkunut ja selostanut" täällä kuukauden aikana noin 12 tuntia. Se taas tarkoittaa keskimäärin puolisen tuntia / päivä.

Vaikka nuo arvioimani lukemat kerrottaisiin kahdella, pääsisimme sittenkin vain tuntiin / päivä.

Juu, kyllä elämäni on täällä. Onneksi on edes tuo ½-1 elämää päivässä. ;-)
38. iso S16.5.2008 klo 00:15
Lisää faktaa kehiin, onhan sanaristikot.net viettänyt 5-vuotispäiviään jokin aika sitten. Avausviesti näki päivänvalon 4.3.2003. Vähän yli kuukaudessa, 8.4.2003, saavutettiin 50 keskustelijan raja. Nuo 50 "perustajajäsentä" olivat:

1. Eki
2. Jukkis
3. Taneli
4. P.P.
5. Antti Kanerva
6. Teemu Pallonen
7. Reima Mäkinen
8. Markku Mäkelä
9. Pirkko
10. terok
11. MInna
12. kahviporukka
13. kysyjä
14. Jyrki
15. Jyrki Takala
16. Patrik Mattsson
17. Mervi
18. Kryptoilija
19. Jani Enilä
20. Auri
21. Antti Viitamäki
22. Armi
23. YKÄ
24. Team Katalin
25. Ratkoja J
26. Artesaani-77
27. Maiju
28. Aulis Ahvenjärvi
29. Kotsa
30. Tapio "Kotsa" Kotipelto
31. Älämölö
32. Sinikka
33. Hannele
34. Antsu
35. Tuula Saarela
36. Päivi
37. Irene Andela, Hollanti
38. Irene, Hollanti
39. Jouni
40. Mats
41. Uka
42. tonimikael
43. KokitHurjana
44. Ratkoja Turusta
45. Yksi 77:stä
46. Kimbe
47. ratko-ja
48. Matti Keravalta
49. Lätsä
50. ++juh

Jo tuostakin listasta näkee että sama henkilö on todennäköisesti kirjoittanut eri nimimerkeillä. Eivätköhän nuo hollantilaiset ole sama henkilö ja yhtä luultavaa on että MInna on sama kuin myöhemmin esiintynyt Minna.

Itse myöhästyin hiukan startista; liityin mukaan 14.4.2003 järjestysnumerolla 62. Tätä myöhäisherännäisyyttä olen kyllä myöhemmin runsaasti kompensoinut.

Kehitys on kehittynyt numeroiden valossa seuraavasti (vuosi, käsiteltyjen säikeiden määrä, viestien määrä, merkkien määrä miljoonina, merkkien määrä per säie, kirjoittajien määrä, viestien määrä per kirjoittaja ja merkkien määrä per kirjoittaja):

2003: 605, 12810, 3.86, 301.18, 538, 23.81, 7171.33
2004: 786, 18143, 5.29, 291.43, 890, 20.39, 5940.86
2005: 1171, 71899, 10.43, 145.13, 1378, 52.18, 7572.12
2006: 1191, 78048, 13.47, 172.53, 1747, 44.68, 7708.04
2007: 828, 55064, 13.37, 242.73, 1812, 30.39, 7376.18

Yht.: 3743, 235964, 46.41, 196.69, 5277, 44.72, 8795.05
5 v: 3857, 249449, 50.50, 202.43, 5181, 48.15, 9746.28

"Yht." on kalenterivuodet 2003-2007, "5 v" viisi ensimmäistä vuotta eli 4.3.2003 - 3.3.2008.

Kirjoittajien (nimimerkkien) määrä on edelleen kasvussa mutta muuten näyttää siltä että 2006 oli määrällisesti huippuvuosi ja siitä on vähän notkahdettu. Viestien keskipituus on nousemassa vuosien 2005-2006 lukemista takaisin kohti alkuvuosien lukemia. Ketjuinto laantumassa tai ketjujen yhteenvedot pidentyneet?

Nimimerkit on laskettu apaattisella tarkkuudella, sortumatta järjen käyttöön. Pienikin ero kirjoitusasussa riittää, mukaanlukien isojen ja pienten kirjainten käyttö. Esimerkiksi ra, RAja [ra] on tulkittu eri nimiksi, vaikka on syytä epäillä että kyseessä on sama AKK-kuningatar.
39. iso S16.5.2008 klo 00:31
Sitten mennään reilusti henkilökohtaisuuksiin. Tässä on vuoden 2007 top-100 viestien määrällä mitattuna. Kaksi jälkimmäistä lukua ovat merkkien määrä ja viestien keskipituus.

1. RA: 7444, 707988, 95.11
2. Eki: 4103, 438437, 106.86
3. Arska II: 3993, 199400, 49.94
4. Libero: 3124, 1762156, 564.07
5. Hakro: 2843, 193195, 67.95
6. iso S: 2652, 3105793, 1171.11
7. Arska: 2377, 223634, 94.08
8. Juhani Heino: 2090, 293739, 140.54
9. Miimu: 1786, 129549, 72.54
10. Matias-Myyrä: 1570, 30956, 19.72
11. Jaska: 1543, 349366, 226.42
12. matts: 1480, 118543, 80.10
13. Ari: 1308, 1791099, 1369.34
14. Tsööts: 941, 91887, 97.65
15. mor: 889, 96653, 108.72
16. Arja: 725, 35552, 49.04
17. eikka: 710, 14881, 20.96
18. Seppo: 603, 100898, 167.33
19. Matti: 531, 36449, 68.64
20. Jukkis: 505, 122409, 242.39
21. KU: 467, 14010, 30.00
22. Aikku: 434, 5874, 13.53
23. Sikar: 405, 19592, 48.38
24. Taata: 357, 93168, 260.97
25. HT: 318, 97336, 306.09
26. Olavi Kivalo: 303, 76168, 251.38
27. hah: 291, 18369, 63.12
28. tonimikael: 258, 45267, 175.45
29. Tuomas L.: 254, 58357, 229.75
30. airisto: 248, 33144, 133.65
31. jh: 238, 10248, 43.06
32. Pena: 237, 46687, 196.99
33. [ra]: 235, 21045, 89.55
34. Jyrki: 233, 63812, 273.87
35. pekka: 232, 35482, 152.94
36. EJlo: 218, 51842, 237.81
37. Römpsä: 209, 24272, 116.13
38. JPQ: 203, 31241, 153.90
39. alex: 195, 8124, 41.66
40. qwer: 184, 38310, 208.21
41. tero: 157, 15110, 96.24
42. Mäkis-Tartti: 153, 26159, 170.97
43. -: 148, 3870, 26.15
44. ö: 135, 23219, 171.99
45. igglu: 124, 5432, 43.81
46. T.Avis: 123, 9925, 80.69
47. kalkkuna: 117, 1825, 15.60
48. Lauri Kultti: 111, 49368, 444.76
49. she: 108, 10461, 96.86
50. Kravattimies: 102, 38557, 378.01
51. JTak: 101, 15874, 157.17
52. jupejus: 94, 29561, 314.48
53. Kasperi: 94, 17697, 188.27
54. Thelma: 94, 14093, 149.93
55. Ritu: 87, 37828, 434.80
56. Hui_hai: 86, 14889, 173.13
57. Timppa: 84, 11566, 137.69
58. MP: 81, 12518, 154.54
59. kudos: 79, 18809, 238.09
60. jarkko: 77, 12855, 166.95
61. corona: 76, 17250, 226.97
62. Sini: 76, 4592, 60.42
63. Hillevi: 71, 12105, 170.49
64. Bella: 69, 13484, 195.42
65. Antti Viitamäki: 67, 64292, 959.58
66. Sakke: 67, 10056, 150.09
67. Antti Ylönen: 66, 6300, 95.45
68. [Arska II]: 66, 5911, 89.56
69. Mummu: 63, 8932, 141.78
70. Hiekkaharjun hyeena: 63, 3671, 58.27
71. [Libero]: 59, 17791, 301.54
72. Satu: 59, 1226, 20.78
73. Arska™: 57, 2760, 48.42
74. Kaljas Undolin: 54, 3872, 71.70
75. JTL: 53, 1911, 36.06
76. just: 52, 4775, 91.83
77. nimetön: 48, 7545, 157.19
78. sivullinen: 45, 16558, 367.96
79. marjaana: 44, 6568, 149.27
80. jepsjuu: 42, 27602, 657.19
81. kari kämäräinen: 42, 4214, 100.33
82. Ylläpito: 42, 4045, 96.31
83. Je-Kyll: 42, 3269, 77.83
84. IiKoo: 41, 12619, 307.78
85. ,-viilari: 40, 17088, 427.20
86. Pekka Harne: 40, 11112, 277.80
87. Marianna: 40, 8106, 202.65
88. Heppu: 39, 17335, 444.49
89. (Eki): 38, 11489, 302.34
90. Tiina H: 37, 4853, 131.16
91. pösilö: 35, 10919, 311.97
92. [Miimu]: 35, 2620, 74.86
93. [mäkistartti]: 34, 13878, 408.18
94. Ananias: 34, 7182, 211.24
95. <Default>: 33, 14028, 425.09
96. korppi: 33, 3151, 95.48
97. nassakka: 33, 2626, 79.58
98. Utami Tatami: 33, 2620, 79.39
99. piisX: 32, 1310, 40.94
100. tjn: 28, 4907, 175.25

Listalta voi poimia ainakin kolme voittajaa: RA saa viestimestaruuden, minä merkkimestaruuden ja Ari pituusmestaruuden. Pieni keskipituus on yleensä ahkeran ketjuilijan tuntomerkki.
40. iso S16.5.2008 klo 00:35
Vielä vastaava maratontaulukko vuosilta 2003-2007:

1. RA: 26217, 2548079, 97.19
2. Eki: 23011, 3556323, 154.55
3. Juhani Heino: 12042, 1565451, 130.00
4. iso S: 11269, 7518679, 667.20
5. Arska: 10088, 1098298, 108.87
6. Libero: 9377, 3118323, 332.55
7. Tsööts: 7930, 796792, 100.48
8. mor: 5925, 514267, 86.80
9. Arska II: 4625, 263941, 57.07
10. matts: 3897, 351485, 90.19
11. Jaska: 3887, 930276, 239.33
12. Pena: 3847, 1072673, 278.83
13. Matti: 3549, 551936, 155.52
14. eikka: 3466, 87567, 25.26
15. Ari: 3260, 2155380, 661.16
16. kp: 2962, 473984, 160.02
17. kirre: 2854, 150722, 52.81
18. Hakro: 2843, 193195, 67.95
19. jupejus: 2815, 838526, 297.88
20. Kravattimies: 2567, 919056, 358.03
21. Matias-Myyrä: 2554, 116072, 45.45
22. marjaana: 2129, 227510, 106.86
23. Jukkis: 2127, 535532, 251.78
24. Miimu: 2029, 147049, 72.47
25. Taata: 1851, 694930, 375.43
26. Sikar: 1632, 71783, 43.98
27. tonimikael: 1626, 314002, 193.11
28. Timppa: 1576, 240128, 152.37
29. Sini: 1567, 163131, 104.10
30. Jyrki: 1543, 473610, 306.94
31. Arja: 1535, 85347, 55.60
32. Sakke: 1507, 170312, 113.01
33. Aikku: 1491, 40150, 26.93
34. Hui_hai: 1358, 295124, 217.32
35. Antti Viitamäki: 1322, 1022688, 773.59
36. Seppo: 1310, 197342, 150.64
37. Titta: 1223, 205826, 168.30
38. Tuomas L.: 1189, 284900, 239.61
39. ile: 1084, 448603, 413.84
40. airisto: 1074, 114921, 107.00
41. Jouni: 1057, 207608, 196.41
42. ö: 1023, 168289, 164.51
43. JTak: 935, 147550, 157.81
44. Heljä-Maija: 929, 151206, 162.76
45. JPQ: 897, 135713, 151.30
46. Tiina: 897, 58037, 64.70
47. ljj: 839, 25186, 30.02
48. J Takala: 817, 159536, 195.27
49. Henry Haapalainen: 803, 217090, 270.35
50. Olavi Kivalo: 772, 167334, 216.75
51. tero: 744, 171982, 231.16
52. Korppi: 722, 37591, 52.07
53. kari kämäräinen: 698, 93056, 133.32
54. Juha-Pekka Kuusela: 689, 114460, 166.12
55. tjn: 657, 152844, 232.64
56. ripa: 638, 21045, 32.99
57. V-R: 634, 124128, 195.79
58. ++juh: 600, 147166, 245.28
59. Antti Ylönen: 588, 77779, 132.28
60. Kaitsu: 566, 249291, 440.44
61. [ra]: 561, 59891, 106.76
62. MM: 551, 96916, 175.89
63. Artsi: 523, 70024, 133.89
64. Ritu: 516, 207044, 401.25
65. Hessu: 505, 120095, 237.81
66. Nanna: 498, 11149, 22.39
67. jarkko: 482, 93365, 193.70
68. Suzie Q: 469, 17547, 37.41
69. KU: 467, 14010, 30.00
70. Juha N: 461, 258042, 559.74
71. qwer: 449, 86948, 193.65
72. Teppo: 449, 79972, 178.11
73. Seija: 446, 49398, 110.76
74. Maiju: 443, 84936, 191.73
75. tapiiri: 443, 29692, 67.02
76. pekka: 427, 66520, 155.78
77. marjuska: 426, 5027, 11.80
78. Egon: 403, 61858, 153.49
79. raukoo: 393, 52379, 133.28
80. Lettu: 384, 138277, 360.10
81. Just: 378, 42058, 111.26
82. EJlo: 375, 120148, 320.39
83. OSui: 366, 197423, 539.41
84. KP: 365, 69035, 189.14
85. TT: 360, 32062, 89.06
86. Marianna: 344, 84275, 244.99
87. Esko Kalervo: 341, 184089, 539.85
88. HT: 335, 103965, 310.34
89. IiKoo: 328, 111236, 339.13
90. alex: 326, 10641, 32.64
91. jepsjuu: 320, 139678, 436.49
92. corona: 314, 101932, 324.62
93. Tupu: 312, 37138, 119.03
94. hah: 299, 21064, 70.45
95. erämies: 299, 7244, 24.23
96. Helge: 289, 56568, 195.74
97. Antti Skyttä: 258, 151934, 588.89
98. T.Avis: 251, 22003, 87.66
99. Marko: 249, 28730, 115.38
100. Dicell: 243, 10523, 43.30

On kiintotähtiä ja toisaalta vaihtuvuuttakin.
41. Kravattimies16.5.2008 klo 00:54
Kiitos, iso S!

Mutta miksi lopetit 50 perustajajäseneen, kun muissa listoissa oli 100? Tai tässä tapauksessa älä lopetakaan sataan, vaan julkista niin monta perustajajäsentä kuin tila sallii yhdellä kertaa. Olisi mukava tietää monentenako on.
42. iso S16.5.2008 klo 07:45
Älä (tilasto)hullua yllytä... tässä 150 lisää niin saadaan ristikkoeduskunta koolle!

51. Ihmettelijä
52. Sanasepon toimituskunta
53. MM
54. Suomalainen
55. Tuomas Lähteenmäki
56. Hessu
57. Pete
58. sanaristikot.net - ylläpito
59. Make
60. jepsjuu
61. dj fragile
62. Ossi
63. Timppa
64. laina
65. Tytsä
66. Aatu
67. iippo
68. +-köh
69. Seppo
70. Kotsa (alias Tapio Kotipelto)
71. ile
72. L.T.
73. OSui
74. Pönttö
75. Ylläpito
76. Ibis
77. Erkko Lehtonen
78. Titta
79. Ile
80. Anttu
81. Minna
82. Patrik M.
83. Eero Pulkkinen
84. Santa Culaus
85. Reservin aukki
86. JiiTee
87. Ritu
88. justjuu
89. jepsuu
90. Eero
91. Kalle Ristikko
92. Mirja Pilhjerta/Kuopio
93. make
94. Juha
95. Marianna
96. Mr.Jonez
97. tellu
98. Heljä-Maija
99. Pete Tuomola
100. Osui
101. Helge
102. Ani
103. Kravattimies
104. Zuge
105. osui
106. Marco Pyyström
107. Tapsa
108. Kravttimies
109. Matti Keravalta.
110. Elsi
111. Leiska
112. Tuomas L.
113. Kauko
114. POP
115. Sensuroitu
116. ArtoP
117. koululainen
118. Koululainen
119. Aikuisopiskelija
120. Öinen harhailija
121. aloittelijaharrastaja
122. aloittelija
123. Just
124. Kalle Hauskuus
125. I.SUSIKOSKI
126. Urpo
127. Toinen aloittelija
128. Éki
129. Irina
130. Kauko Kirveli
131. Heikki Lavonius
132. Komea isäntä Helmut
133. Tyrki jalkaa
134. Patrik
135. Sepposka
136. Helena
137. hannu-tapani
138. Sirkka ja Hulta
139. PER SAUKKO
140. J Takala
141. martti
142. E.M.
143. Aulikki
144. Surfraketti
145. Reijo tai Pale
146. Ratkojasta laatijaksi
147. Ratkoja
148. Juha Kukkonen
149. jupejus
150. Jari
151. Antti Ylönen
152. Vorssasta poijjaat
153. Matti (Keravalta)
154. Matti
155. Aulikki Nenonen
156. o.s. Kala
157. Esa Arrak
158. Kaikin kaima
159. Arto Pöllänen
160. Kaitsu
161. Zebraze
162. Axel Dovier II
163. Eli
164. Tietämätön
165. Pulmailija
166. turhantarkka
167. Pena Porvoosta
168. Tuomas Lehti
169. Auli
170. Jansu
171. toinen nimetön
172. saraseeni
173. Hoo Moilanen
174. jepujus
175. aaretti_lyly@luukku.com
176. seesee
177. Reima
178. Ratkoja A.K.
179. Peepin' Tom
180. T.V. Jones
181. Mimmi
182. horhhe
183. jupelus
184. M.O.
185. T.H.
186. T.K.
187. lp
188. Surffari
189. Anu
190. Haavi(sto) auki
191. Index sormi
192. Apu lehteä saamattomille?
193. Ekku
194. Midfinger
195. lara
196. Pertti
197. Matias-Myyrä
198. Hieman toistoa
199. Ahti
200. asko-a
43. iso S16.5.2008 klo 08:01
Sijat 201-350:

201. Tehtävien tekijä
202. Brotha
203. Minna Walhroos
204. Eki/Rafflesia
205. Sebalus
206. Minna Wahlroos
207. 14-vuotias ratkoja- Karppa
208. Karppa
209. Eki/Marko/Mats
210. Rafflesia
211. Eki/Zebraze
212. Eki/T.H.
213. 14-vuotias ratkoja
214. AKu
215. Anu ja Per Saukko
216. finn
217. että näin tällä kertaa!
218. Sakke
219. K. Alan von Kale
220. Siluettiin hurahtanut
221. mats
222. Aulis
223. Uuno T.
224. Sopuli
225. Reke-65
226. Marja-Liisa Sirkiä
227. tapsa
228. AD II
229. Jaska
230. Hui hai
231. Pasi Ryhänen
232. Adson
233. voke helsingistä
234. Ode
235. Krakaäijä
236. JUPEJUS
237. Toinen yritys
238. Jussi
239. Ellen
240. Saku
241. saku
242. Simple Simon
243. Akuja ahminut
244. Marja-Liisa
245. Kummisetä ja perhe
246. Turhantarkka
247. Antti Peltola
248. Vierailija
249. Timo Ronkainen
250. I
251. Krakatau
252. asd
253. Ensi hätään
254. pekka.harne@mission.fi
255. Valle
256. Pekka Pietari
257. turhautunut
258. Aikku
259. Hienoa!
260. Alkukielellä
261. OSuin tuuraaja
262. Ossi Suikki
263. thy
264. Pena
265. Vähäpuheinen
266. Nykänen
267. OSuin taustapiru
268. Maken taustapiru
269. ExOSui
270. paavo
271. Antti K.
272. iso S
273. Epyktomologi
274. Iso S
275. Janatuinen
276. Esko
277. OSui harhaan
278. Pia
279. Mandi
280. marja-liisa
281. Repe
282. Raakile
283. Kukkelmann
284. hoo
285. Syltty
286. 10ho
287. Šaahi
288. sakke
289. sakari
290. Urmas
291. Pelle Hermanni
292. Erkko
293. Martti
294. Bad moon shining
295. tjn
296. Ruma S
297. taukki n.
298. JP Ikäheimonen
299. Vähän köyhempi
. eero.pee
301. helena62
302. neropatti
303. KeToLa
304. PP
305. iso
306. KuuHullu
307. Ristikkotukiäiti
308. sihteeri
309. Emma
310. Hämeen hitain
311. Juoni
312. Majiu
313. Sakari
314. Lempirotta
315. Egon
316. Ensimmäinen ristisana?
317. zebraze
318. Yks vaan
319. Liisa
320. Kaks vaan
321. Allapito
322. Kalamies
323. Teon alla ?
324. isoS
325. Lauri Kultti
326. Iippo
327. miukumauku
328. Menu etti
329. välikäsi
330. sanoittaja
331. Sanoittaja
332. !
333. UniMatti
334. d:)
335. 8-(
336. kari
337. A.K.
338. irak
339. Valdemar
340. Akuuttitapaus
341. Perskarvalakki
342. Kans pervo likka
343. Matleena
344. PatrikM
345. matti
346. Satunnainen räksyttäjä
347. Webmaster
348. Aaahh
349. Antti
350. kyllä kyllä
44. iso S16.5.2008 klo 08:02
ja vielä 500 täyteen:

351. Wagner
352. Viivi
353. tauno
354. heljä-maija
355. Tyhymä
356. auliksen ystävä
357. Jussi Hämäläinen
358. Arska
359. Salottisipuli-ile
360. Esko Härkönen
361. Floora
362. Ujo
363. Ratkoja 2
364. Perkka Vuotsila
365. Antsa
366. Mirja Pihlajamäki
367. lars
368. innostunut ratkoja
369. Tane
370. Arslka
371. Halme'n nimeen
372. Rarkoja
373. idols
374. Tanja 10v.
375. Gin-Agent
376. Bengt
377. wagner
378. vertailua
379. t
380. C
381. juprjus
382. Vekuttamista
383. maape
384. jue'pejus
385. Hoo
386. Mao
387. Kaino
388. zikzak
389. Idols
390. Saimaalainen
391. Vivaldi
392. Eero.pee
393. pENA
394. Sepe-Susi
395. Pena-"vanhus"
396. T
397. Alf Simberg
398. Hoo Moi
399. J Takalan
400. Tattarinsuolainen
401. Nääsman
402. N N
403. Kuukuilija
404. jousimies
405. xyz
406. Jorma
407. Matti (myöhäinen)
408. Jorma taas
409. Noonis
410. Nimim. M Salminen
411. aulis
412. qwerty
413. Miina
414. A D II
415. Kaisu
416. Pnea
417. isoa S
418. urpo
419. noosu
420. Helmut
421. Repa
422. Nut
423. Pekka Joutsi o
424. Pekka Joutsi
425. Pepe
426. Still Alive
427. Ukki
428. Hexi
429. Henry Haapalainen
430. Simppa
431. cosmos blue
432. Taas uusi nimimerkki!
433. Pasi Kullero
434. Faijan haamu
435. Höyrypää
436. Porvoon Pena
437. Mooses Hitler
438. Logosti
439. Suomalainen rakentaja
440. Dynaaninen johtaja
441. Dynaaminen johtaja
442. Liisa Nurmela
443. sa
444. Chat-työryhmä
445. HH
446. J
447. Nimimerkeistä pitävä
448. aneP
449. Jani Enil'
450. Seuraileva
451. toimitus@sanaristikot.net
452. Katja Kauhanen
453. Katja
454. Heppu
455. Jääkaapilla kävijä
456. Kukahan minä olen?
457. Ilmi Kulkushelke
458. reima porkkasuihki
459. Sama kuin edellä
460. Reima Porkkasuihki nro 2
461. Lemmi Lauhamaa
462. Krea Punapipo
463. Lauha Lepoloma II
464. Suhina Suksikorpi
465. Reissu Iltatähti
466. Suhina Suksikorpi II
467. Hilli Voisilmä
468. Riuska Ruisranne
469. Keto Intokukka
470. Omppu Kanelikorva II
471. Lehmus Terho-oksa
472. Gabriel Voimasiipi
473. Hymy Hellähuoma
474. Juhla Kokoloma
475. Nyytti Omppukontti
476. Seurailija
477. Hörhöilijä
478. Ville Liimatainen
479. Keimo Pakarinen
480. Kravattimes
481. Juhani Heino
482. Secam
483. sten (uusi)
484. Ratkoja (vanha)
485. Vanha ratkoja
486. Sanastaja
487. Ejlo
488. Jupisija
489. Ratkoja uusi
490. Paitsio
491. Artsi
492. Matti (täysikuun kunniaksi)
493. Saimaanmainiot
494. Janne Uusitalo
495. vanha höyry
496. Ratkoja (uusin) (toistaiseksi)
497. Johtaja
498. Annikki
499. pirkko
500. tapsa + pirkko
45. Jukkis16.5.2008 klo 10:25
Noista määrään perustuvista listoista pitäis saada julki myös sellainen, joista on ketjut raakattu pois. Nähtäis, ketkä on olleet asialinjalla.

Terv. nimim. "Pistesijoille keinolla millä hyvänsä"
46. Tsööts16.5.2008 klo 15:05
Pitkässä juoksussa siis sijoitukseni on parempi (7.) kuin viime vuoden top-100:ssa (14.) - aikomukseni hankkia (netin ulkopuolinen) elämä lienee siis toteutumassa:-)
47. Miimu16.5.2008 klo 18:10
Jukkis varmaan vitsaili.... - Sanokaa, että Jukkis vitsaili!!

:o)
48. iso S16.5.2008 klo 19:07
Ketjuilijoiden lisäksi pitäisi raakata keljuilijat, rönsyilijät ja muut poikkeavat, nimittäin otsikon aiheesta poikkeavat. Pitäisi perustaa arvovaltainen raati paukuttamaan henkseleitä harhaoppisten viestien päälle. Tästä tulee tietysti linjariitoja.

On yksinkertaisempikin tapa: määritellään kaksi hyväksymiseen riittävää kriteeriä. Viesti on kelvollinen jos se alkaa sanoilla "Lähettäja: Jukkis" tai jos jatkossa otetaan selkeän myönteisesti kantaa johonkin viestiin joka on hyväksytty ensimmäisen kriteerin perusteella. Jo vain alkaisi pistesija olla hanskan ulottuvilla, ellei suorastaan voitto häämöttäisi! :-)

Ai pahus, ei tuo toimikaan eikä suorastas joudu kärsimään tappion karvaisesta kalkista. Tulisi riitaa siitä mikä on riittävän myönteistä ollakseen selkeän myönteistä. Ei kai auta muu kuin odottaa että kärki läkähtyy. Onhan suunta joka tapauksessa nousujohteinen: maratontaulukon 23. sija on kohentunut viime vuoden 20. sijaksi. Tasaisen tappavan vauhdin taulukon mukaan valta vaihtuu 7 vuoden kuluttua ja vuonna 2015 RA huomaa olevansa lyöty mies (edellyttäen että masentuu kukistumisestaan niin pahasti että menee radikaaliin leikkaukseen jossa ei operoida sukupolvia mutta jotakin sinne päin).

Jukkis, älä hosu, kyllä sä pistesijoille selviät! Tsööts ostaa elämäsi! (näin kannustaa tilastoijapoika ystävällisesti)
49. Jukkis18.5.2008 klo 17:14
Kun iso S se vaan pilkkaa, niin ei auttanut muu kuin tehdä sitten oma tilasto. Tässä asiakirjoittajien top 100, joka on syntynyt niin, että kaikista 18.5.2008 klo 11.19 mennessä kirjoitetuista viesteistä (267340 kpl) on poistettu ne, jotka sisältyvät helposti tunnistettavissa oleviin ketjusäikeisiin. Nuo ketjut sisältävät 157868 viestiä, joten allaoleva lista perustuu 109472 viestiin. Noissa viesteissä on mukana ketjuja, ja pois jätetyissä ketjuissa on myös keskustelua, mutta kuten iso S tuossa edellä ivaamisensa seassa toteaa, tällaista tilastoa on aika mahdoton tehdä tarkaksi.

1. Eki: 10277
2. iso S: 6336
3. RA: 4671
4. kp: 2951
5. Jaska: 2826
6. Matti: 2745
7. Juhani Heino: 2588
8. Pena: 2506
9. Kravattimies: 2446
10. jupejus: 1991
11. Jukkis: 1742
12. Taata: 1740
13. tonimikael: 1633
14. Timppa: 1473
15. Antti Viitamäki: 1344
16. Libero: 1273
17. Titta: 1166
18. Tsööts: 1120
19. marjaana: 1057
20. Jouni: 1054
21. ö: 1053
22. ile: 1021
23. HT: 1018
24. Jyrki: 1017
25. Ari: 965
26. matts: 925
27. Henry Haapalainen: 821
28. Tuomas L.: 806
29. J Takala: 805
30. JTak: 800
31. mor: 742
32. JPQ: 738
33. airisto: 711
34. Hui_hai: 681
35. Bella: 653
36. Sakke: 618
37. ++juh: 598
38. Arska: 590
39. Matias-Myyrä: 584
40. tjn: 561
41. V-R: 551
42. MM: 541
43. kari kämäräinen: 517
44. Juha-Pekka Kuusela: 488
45. Olavi Kivalo: 487
46. Hessu: 483
47. Ritu: 460
48. pekka: 456
49. qwer: 454
50. Hakro: 448
51. kirre: 444
52. Maiju: 428
53. Kaitsu: 417
54. TJV: 416
55. Arska II: 415
56. raukoo: 392
57. EJlo: 387
58. Teppo: 386
59. Seppo: 385
60. Lettu: 382
61. tero: 367
62. Aksu: 367
63. OSui: 366
64. KP: 363
65. Seija: 349
66. Heljä-Maija: 344
67. IiKoo: 344
68. Marianna: 342
69. Juha N: 338
70. Esko Kalervo: 334
71. PP: 320
72. jepsjuu: 315
73. Römpsä: 314
74. Just: 293
75. Helge: 284
76. eikka: 273
77. pelaaja: 269
78. Artsi: 268
79. Owlie: 266
80. Mäkis-Tartti: 259
81. Antti Skyttä: 253
82. Aikku: 252
83. Arja: 230
84. Urpo: 220
85. mats: 218
86. Tapsa: 215
87. Ylläpito: 214
88. HH: 213
89. corona: 211
90. Egon: 207
91. Tane: 207
92. Floora: 201
93. hah: 197
94. Arskis: 197
95. Kotsa: 193
96. Lauri Kultti: 192
97. Teemu Pallonen: 186
98. ?: 185
99. terok: 185
100. Sini: 183

Ei tullut pistesijaa.
50. Jukkis18.5.2008 klo 17:18
Edellä mainitut "helposti tunnistettavat ketjusäikeet" on listattu täällä:http://drzf55.googlepages.com/ketjut.txt

Nuo siis sisältävät 157868 viestiä, ja noiden ketjuviestien top 100 on tässä:

1. RA: 23890
2. Eki: 15172
3. Juhani Heino: 10208
4. Arska: 9776
5. Libero: 9712
6. Tsööts: 7219
7. iso S: 6008
8. mor: 5340
9. Arska II: 4211
10. Hakro: 4121
11. matts: 3585
12. eikka: 3264
13. Ari: 3094
14. Matias-Myyrä: 3090
15. Arskis: 2679
16. kirre: 2410
17. Miimu: 2239
18. Jaska: 1803
19. Arja: 1742
20. Marco Poloinen: 1684
21. Sikar: 1506
22. Aikku: 1414
23. Pena: 1413
24. Matti: 1386
25. Sini: 1385
26. jh: 1377
27. Seppo: 1252
28. marjaana: 1073
29. Sakke: 890
30. jupejus: 826
31. Tiina: 789
32. Korppi: 709
33. Hui_hai: 683
34. ljj: 672
35. Heljä-Maija: 580
36. ripa: 565
37. [ra]: 554
38. Jyrki: 532
39. Jukkis: 484
40. Nanna: 475
41. jarkko: 462
42. Antti Ylönen: 446
43. KU: 440
44. Tuomas L.: 426
45. marjuska: 426
46. Suzie Q: 398
47. airisto: 383
48. tero: 377
49. TT: 327
50. alex: 291
51. Olavi Kivalo: 288
52. tapiiri: 281
53. erämies: 269
54. hah: 265
55. Artsi: 255
56. Maikki: 252
57. T.Avis: 235
58. JPQ: 234
59. Tupu: 232
60. Dicell: 232
61. EJlo: 230
62. Sari: 212
63. Juha-Pekka Kuusela: 201
64. Taata: 197
65. Egon: 197
66. (ra): 188
67. Kravattimies: 186
68. kari kämäräinen: 184
69. hv: 184
70. Hiekkaharjun hyeena: 182
71. -: 179
72. JTak: 176
73. Urputtaja: 169
74. Kaitsu: 154
75. Topias: 149
76. Tiina H: 149
77. Jukka: 147
78. Herkku: 136
79. Juha N: 133
80. igglu: 123
81. kalkkuna: 120
82. Marko: 119
83. <Default>: 112
84. Timppa: 111
85. Escord: 111
86. Utami Tatami: 109
87. korppi: 105
88. corona: 103
89. tjn: 101
90. she: 98
91. Seija: 97
92. ansku: 93
93. [Libero]: 93
94. (Eki): 92
95. tonimikael: 92
96. [RA]: 91
97. Arska™: 90
98. Eleth: 89
99. TMC: 85
100. Just: 85
51. Jukkis18.5.2008 klo 17:22
Täydelliset tilastot kirjoittajista on nähtävissä täällä:

Kaikki viestit:http://drzf55.googlepages.com/lista_kaikki .txt

Asiaviestit:http://drzf55.googlepages.com/lista_ei ketjut.txt

Ketjuviestit:http://drzf55.googlepages.com/lista_k etjut.txt

Ja nuo siis perustuvat tilanteeseen tänään klo 11.19.
52. iso S18.5.2008 klo 19:39
Jukkiksen täydellinen tilasto selvisi liput ja paidanhelma liehuen pikatestistä. Helposti kävisi niin että tyhjä lähettäjän nimi jäisi tunnistamatta mutta sieltäpä se löytyy tämä huumorin huippu kaikkien listalta sijalta 161 tuloksella 117.

Tuosta vakuuttuneena en uskalla edes ajatella virheen mahdollisuuden epäilemistä. Heikkouskoisempien varalta kuitenkin pyydän vahvistusta. Jukkis, eihän systeemisi vain laske viestiksi sellaista tapausta missä siteerataan jotain aikaisempaa, tyyliin
Lähettäjä: Jukkis 18.5.2008 klo 17:22

Eihän tuosta napsahtaisi Jukkis-pistettä, eihän? Kovin paljon tuollaiset tapaukset eivät suuria linjoja heilauta mutta periaatteessa saattavat ratkaista sen kumpi kahdesta tarjokkaasta pääsee pistesijalle ja kumpi jää seuraamaan katseella.

Yksi tapa luokitella viestit vuohiin ja lampaisiin olisi se että luottaisi Ylläpidon tekemään jakoon Ristikot/Muut. Tämä kaatuu kahteen ongelmaan: systeemin hoipertelun vuoksi säikeet hyppelevät aidan yli ja läheskään kaikkea vanhaa hömppää ei ole siirretty Muiden puolelle, olipa kuinka selvästi tunnistettavaa ketjuilua tahansa.

Pitää siis tyytyä Jukkiksen tapaan aistinvaraiseen arvosteluun, vaikka ketjupuolella on asiaakin ja asiapuolella asiattomuuksia. Jäämme odottamaan sitä että joku luotettava taho vie tutkimuksen viestitasolle ja vielä luotettavampi taso arvioi asiallisuuden ja asiattomuuden suhteen viestien sisältäkin.
53. Jukkis18.5.2008 klo 20:01
Juu ei sotke laskentaa tekstissä oleva Lähettäjä: Joku. Minun systeemi parsii html-koodin seasta nuo otsikkotiedot käyttäen hyväksi otsikkojen tyylimäärittelyjä.

Mistä tulikin mieleen, että ehkäpä tämä sotkee minun systeemini:

<span class=ots_5>Lähettäjä: iso S</span>

Saas nähdä, miten tuo näkyy tekstissä.
54. Jukkis18.5.2008 klo 20:02
Ei sotke tuo. Entäköhän tämä:

<span class=ots_5>Lähettäjä: iso S</span>
55. Jukkis18.5.2008 klo 20:05
No ei sotke tuokaan, koska systeemi muuttaa väkäset entiteeteiksi (vai mitä "entities" onkaan suomeksi?)
56. Libero18.5.2008 klo 21:29
iso S: Miten ketjuja koostaneiden lukuisat viestit runsaine merkkimäärineen näkyvät tilastotiedoissa?

Kun katson 1 762 156 merkin saldoani viime vuodelta, niin rohkenen arvella, että siinä ovat mukana monien muidenkin kirjoittajien ketjuihin liittämät erisisältöiset merkkijonot. Samat merkkijonot vielä toistuvat toistumistaan, mikäli ketju jatkuu säikeestä toiseen.
57. iso S18.5.2008 klo 21:50
Ketjun koostamisviestit menevät koostajan piikkiin. Yhdyssanaketju nostaa omaa lukemaani noin 1800 viestillä ja melkoisella merkkimäärällä. Tämä näkyy jossain määrin myös viestien keskipituudessa, vaikka siinä on kyllä jonkin verran "itse aiheutettuakin" mukana.

Siis minä ja muut koostajat hyödymme tai kärsimme (miten nyt kukin suhtautuu noihin määriin) sellaisesta minkä joku toinen on alunperin kirjoittanut, ja meidän sankarillinen panoksemme koostuu kopioimisesta. Tosin koostamiseen sisältyy myös näkymätöntä työtä, joissakin ketjuissa enemmän kuin toisissa, joten nuokin viestit ja merkit on ansaittu keskimäärin vähintään samalla hikimäärällä kuin suoraan hatusta roiskaistut.

Kukaan ei kuitenkaan voi liittää toisen piikkiin merkkijonoja muuten kuin käyttämällä toisen nimimerkkiä. Lähettäjän nimiin menee oman viestin sisältö ja seuraavat viestit menevät niiden lähettäjien kontolle.
58. Miimu18.5.2008 klo 22:01
Olen täysin asiaton saitilla kävijä? En päässyt Jukkiksen asialliseen tilastoon ollenkaan. Höh, ette kai te tosissanne ole sitä mieltä että ketjut olisi jotenkin ala-arvoisempia kuin ristikkokeskustelut? - Sanokaa, että ette ole!

Sanoilla leikitään kejuissakin ja mielestäni sekin vaatii omanlaista lahjakkuutta ja nokkeluutta. Keskustelujen taso ei kyllä kaikisti ole yltänyt ketjujen tasoon. Jos multa kysytään...

:o)
59. Libero18.5.2008 klo 23:33
Kiitokset, iso S!
60. iso S18.5.2008 klo 23:40
Miimu: kopioitko osoitteen oikein? kaikki ennen http:tä pois ja toisella rivillä oleva osuus mukaan. Se ei tule automaattisesti jos vain maalaa molemmat rivit. kopioi ja sitten liittää selaimen osoitekenttään. Pitää kopioida kahdessa osassa tai kierrättää tekstrurin kautta ja poistaa siellä rivinvaihto.

Tietenkin ketjut ovat ala-arvoisempia, ei kai kukaan kunniallinen nainen tai rehellinen mies voi muuta tunnustaa! Se on kuin aikanaan Hymylehden kanssa: kukaan ei muka ikinä ostanut mutta tiesi kyllä jutut kun oli sattumalta parturissa nähnyt. Tai saippuasarjat: kukaan ei katso mutta tietää kyllä kuka on milloinkin kenenkin kaa kun on naapurilta kuullut.

Molemmissa puolissa on omat ansionsa ja ansiottomuutensa.
61. Jukkis18.5.2008 klo 23:43
En minäkään ketjuja mitenkään halveksi. Teen niitä aina parturissa.
62. iso S19.5.2008 klo 00:08
Jukkis, katseletko samalla hymähdellen saippiksia?

Koostamisen vaikutuksesta vielä. Yhdyssanaketjussa on nyt menosa 60. osa. nsimmäisessä ei tietenkään koostetta ollut, joten niitä tarvitaan 59 ja niissä on 1 + 2 + 3 + ... + 59 säikeen kooste, yhteensä 1770 viestiä, plus yksi viesti jossa kerrotaan ketjun säännöt. Tuon selitysviestin merkkimäärä on 1053 ja 60. osan koosteen merkkimäärä 179796, siis keskimäärin 3047 merkkiä per säie.

Kun otetaan huomioon että kerran, muistaakseni ennen puoliväliä, Arska hoiti koostamisen, voidaan arvioida että tuon yhden ketjun koostamisesta on tililleni napsahtanut noin 1750 viestiä ja noin 5.3 miljoonaa merkkiä. Jos homma olisi jäänyt hoitamatta tai sen olisi hoitanut se moneen ehtivä Joku Muu, putoaisin sekä viestien että merkkien määrän mukaan laskettuna pari pykälää.

Pelkästään yhden ketjun koostamisella olisi hallussa paikka top-30:ssä. Jukkis voittaisi hiukan viestien määrässä mutta häviäisi raskaasti merkkien määrässä. Ketjussa on roimaa koostomiehen voimaa!
63. Ari19.5.2008 klo 14:03
Kiitos iso S:lle ja Jukkikselle tilastoista.

Vielä kun saisi tiedot siitä mistä säienumerosta löytyy minkäkin nimimerkin ensimmäinen viesti niin voisi itse kukin muistella miten sattui tulemaan tälle foorumille.
64. Ari19.5.2008 klo 16:20
Edellisestä pyynnöstäni:
Jos tuon listan joku tekee, niin laittakoon sen Jukkiksen säikeeseen 3990. Vanhojen keskustelujen selailu.
65. Ari29.5.2008 klo 14:40
Joskus oli puhetta siitä miten paljon levytilaa nämä sivuston sivut vievät. Nyt olen sen testannut:
Säikeet 0-4013 html-tiedostoina 29.5.08 klo 14:21 vie tilaa 194 Megatavua ja zipattuna 36 Megaa.
66. Jukkis29.5.2008 klo 16:04
Levytilan nykyhinnoilla näiden keskustelujen arvo on siis noin 3 senttiä. Zipattuna noin puoli senttiä. Suhtautukaamme siis näihin juttuihin noiden lukujen edellyttämällä kunnioituksella.
67. Ari29.5.2008 klo 17:29
Levytilaa säästyi hieman kun sivut 0,2,7,26,33,35,36,37,153,262,317 ovat tyhjiä jostain syystä.
68. Jukkis29.5.2008 klo 17:42
Joo, jos noissa kaikissa olisi esim. tyypillinen HS-säie, niin veisivät yhteensä n. 4 megaa tilaa. Eli saitin kokonaisarvo nousisi noin 6 senttisenttiä, eli noin 6 millisenttiä per HS-säie. Taas ihan hyvin todellisuutta vastaava lukuarvo.
69. iso S2.7.2008 klo 23:07
Kun nyt tilastoasiat tulivat taas puheeksi (ai niin, se olin minä itse toisessa säikeessä...) niin tässä on viestien määrän mukaan kesäkuun top-50. Sekä asia- että hömppäpuolen viestit on laskettu mukaan:

1. RA 946
2. Eki 662
3. PP 470
4. Libero 370
5. Maikki 362
6. Juhani Heino 270
7. Antti 226
8. HT 223
9. TJV 216
10. toippa 215
11. Bella 213
12. matts 213
13. iso S 185
14. Matti 168
15. Marco Poloinen 163
16. Arskis 159
17. Ari 152
18. turutar 150
19. Arska 138
20. Aksu 137
21. Jaska 130
22. Hakro 127
23. pelaaja 118
24. katti 97
25. Owlie 93
26. Akka 90
27. Miimu 86
28. Matias-Myyrä 68
29. marjuko 60
30. T.Avis 58
31. Jukkis 56
32. Jondalar 53
33. otv-a 51
34. esko 50
35. Henry 48
36. Jukka 48
37. mari 46
38. Taata 44
39. Mäkis-Tartti 42
40. ? 39
41. Hemuli 35
42. [ra] 34
43. Ripa 32
44. Henry Haapalainen 31
45. mor 31
46. [RA] 28
47. geirge 28
48. Arja 27
49. Aikku 25
50. ö 22

Tuossahan menee Seitsemän veljeksen oppimat aakkoset osittain uusiksi: ö on kyllä viimeinen, mutta ensimmäinen on RA!
70. PP3.7.2008 klo 08:49
Eikös tämän säikeen pitäisi näkyä ristikkosäikeiden etusivulla 2.7.2008 aktiivisena olleiden säikeiden kohdalla?
Ei ainakaan minulla näy, löysin säikeiden koosteesta (suosikeistani) ctrl F:llä. Saa nähdä, tuleeko tämän viestin jälkeen näkyviin.
71. PP3.7.2008 klo 08:51
Ei tullut!!!
72. RA3.7.2008 klo 08:53
iso S, voisitko tilastoida, montako kertaa olen käyttänyt sanaa "normaali" (tai jotakin sen alkuista)? Yleensä tai AKK:ssa. Kiitos!
73. PP3.7.2008 klo 09:09
Tämän sivun alussa lukee minulla 'keskustelut: ristikot'
Tämä tulee esille nyt 'keskustelut: muut aiheet' alta. ja näkyy
muissa aiheissa etusivulla. Olen ymmällä.
74. Ari3.7.2008 klo 11:24
PP, jos tulit tähän sivuun jonkin linkin kautta niin se on mahdollista, sillä tuo teksti määräytyy linkin mukaan mutta löytää kuitenkin sivun oli se sitten kummalla puolella hyvänsä.

Mielestäni tämä kuuluisi kyllä muihin aiheisiin.
75. Jukkis3.7.2008 klo 11:33
Tuota PP:n havaitsemaa ilmiötä käsittelin avatessani 18.5. säikeen 3990. Vanhojen keskustelujen selailu. Eli
-http://www.sanaristikot.net/keskustelut/index.php ?p1=vast.php&id=3990
76. PP3.7.2008 klo 12:03
Jukkis: Sinä väänsit utamille rautalangasta riittävän vastauksen säikeessä 3990. Se ei kuitenkaan selitä, miksi koneellani ei aamulla näkynyt 2.7. lähetetty viesti, vaikka kaiken järjen mukaan olisi jommassa kummassa, ristikoissa tai muissa asioissa, pitänyt olla ihan alkupäässä. Siitähän tämä 'häiriköintini 'alkoi ja loppuu nyt tähän. En minä oikkuile, vaan tämä rakkine...
77. Jukkis3.7.2008 klo 12:32
No PP, jos teen asiasta kokemusperäisen diagnoosin, niin n. 95 % todennäköisyydellä tämä systeemi toimi ihan oikein, käyttäjä (eli sinä) vaan tulkitsi väärin, sen mitä tapahtui ja luuli näkevänsä ja kokevansa jotain muuta kuin todellisuudessa näki ja koki. Loput 5 % on sitten varattu sille, että käyttämässäsi kone/laajakaistapalvelu -yhdistelmässä tapahtui joku ihmeellinen välimuistihässäkkä, joka sai aikaan sen, että sinulle tuli näkeviin sivun vanhentunut versio.

Minä kun olen (luultavasti) hieman kokeneempi tietokonesysteemien käyttäjä, niin minun itseni kokemissa vastaavissa hämärän tuntuisissa vikatilanteissa tuo käyttäjän oman sekoilun todennäköisyysprosentti on ehkä hieman pienempi kuin 95, ehkä vain 93 %.
78. PP3.7.2008 klo 13:48
No kerran vielä. Sekoilemisen kyllä osaan 100 %:sesti, siinä olen varmasti parempi kuin sinä. Minulla ei yksinkertaisesti tullut aamulla näkyviin mitään versiota, ei vanhaa eikä uutta. Kaivoin sen vanhan esille suosikit -kohdasta, jonne olin säiekoosteen tallentanut.

Voi hyvinkin olla, että kyseessä oli välimuistihässäkkä, tämä härveli kun juuri silloin aloitti suojausskannauksen. Muuta selitystä en keksi.

(Ps. En tunne itseäni ihan avuttomaksi tietotekniikan kanssa, vaikka siitä on jo hetki vierähtänyt, kun toimin ns.pääkäyttäjänä ja järjestelmävastaavana.)
79. Jukkis3.7.2008 klo 13:57
No minähän annoin sinulle tommoisen kokeneen käyttäjän sähläysprosentin eli niinkin pienen kuin 95. Mutta sovitaan nyt sitten että se on sama kuin minulla eli 93 %. Mutta ilmeisesti nyt sitten siitä jäljelle jäävästä 7 %:sta löytynee selitys.
80. Ari3.7.2008 klo 14:08
PP, silloinhan selitys löytyy tuosta 3.7.2008 klo 11:24.

Aihe määräytyy linkissä olevan numeron mukaan:
0=Ristikot ja 1=Muut aiheet.
81. PP3.7.2008 klo 14:46
Jukkis: Sähläyssekoiluprosenttini on täydet 100%, siinä ei auta mitkään selittelyt. Olen oppinut menneisyydestäni vain sen, mikä monella iäkkäämmällä mummelilla on ongelmana: konetta ei tarvitse pelätä. Voi painella muitakin näppylöitä kuin käynnistä ja sammuta. Sovitaanko mulle 100 % ja saan edelleenkin sählätä. Sinun antamasi 93 % asettaisi liikaa paineita. :-D :-D

nimim. Asia pihvi!
82. iso S3.7.2008 klo 21:30
RA 3.7.2008 klo 08:53: voisin, mutta enpä ainakaan ihan heti tilastoi. Nykyiset systeemini eivät ilman lisäohjelmointia taivu noinkaan normaaliin suoritukseen ja nyt on muissa hommissa "bisibitti päällä".

Näppituntumalla vastaan: useammin kuin monta kertaa!
83. Jukkis31.7.2008 klo 17:04
Päivitin tilastoja:

drzf55.googlepages.com/listoja.html
84. 8. ihme?10.8.2008 klo 15:30
Päivitäpä vielä sellainen tilasto, jossa nähdään kronologisesti, milloin esim. nimim. "RA" on päivästä/viikosta/vuodesta toiseen viestejään lähetellyt.

Sitten voidaan kaikki yhdessä ihmetellä, miten joku voi roikkua täällä 24 tuntia/vrk edes nukkumatta välillä.
85. RA10.8.2008 klo 15:42
Näkyypä tuo ihmettely sujuvan ilman tilastojakin. ;-)
86. Jukkis10.10.2008 klo 18:32
Tilastojen päivittämisen yhteydessä tehdyllä virityksellä löytyi vihdoin vastaus RA:n 3.7.2008 klo 08:53 esittämään kysymykseen: 475 kertaa, joista 407 AKK-säikeissä.
87. RA10.10.2008 klo 18:38
OK. Kiitos! Lienee normaalirajoissa.
88. Ari10.10.2008 klo 18:58
Kiitos Jukkis.

Kyllä ketjujen koostaminen kannattaa. ;)
89. iso S5.11.2008 klo 19:17
Huomasin että olen imuroinut kesäkuussa 2006 Wikisanaston (tämän löytää kun antaa Googlelle hakusanaksi sanalista). Silloin löytyi 30515 sanaa. Nyt sanoja on 96563. Sanojen keskipituus on 10.81 kirjainta ja tässä tilastohullujen iloksi pituuksien jakauma (1-kirjaimiset eliminoitu):

2: 32, 0.033
3: 203, 0.210
4: 1070, 1.108
5: 3193, 3.307
6: 4376, 4.532
7: 6324, 6.549
8: 8882, 9.198
9: 11586, 11.998
10: 12655, 13.105
11: 11094, 11.489
12: 9348, 9.681
13: 8045, 8.331
14: 6516, 6.748
15: 4713, 4.881
16: 3035, 3.143
17: 2122, 2.198
18: 1321, 1.368
19: 872, 0.903
20: 493, 0.511
21: 335, 0.347
22: 152, 0.157
23: 85, 0.088
24: 55, 0.057
25: 28, 0.029
26: 13, 0.013
27: 5, 0.005
28: 7, 0.007
29: 1, 0.001
30: 2, 0.002

Sarakkeet ovat sanan pituus, sanojen lukumäärä ja prosenttiosuus. Tässä on (jälleen kerran) eväitä puolustaa sitä näkemystä että kolmikirjaimisia sanoja ei pitäisi yleensä sallia ja nelikirjaimisten osuuttakin kannattaa minimoida: kolmikirjaimisia on vain 203 ja nelikirjaimisiakin 1070 mikä on vähän verrattuna viisikirjaimisten määrään 3193. Osa sanoista on lisäksi kirjainrakenteeltaan hankalia joten niiden sijoittaminen ristikkoon on vaikeaa, jolloin joistakin lyhyistä sanoista muodostuu helposti niitä ärsyttäviä "joka ristikossa" toistuvia.

Lisäksi tilastosta näkyy että eniten on 10-kirjaimisia sanoja. Ristikoissa operoidaan enimmäkseen selvästi keskiarvoa lyhyemmillä sanoilla.
90. iso S5.11.2008 klo 19:25
Kirjaimet eivät ole tasa-arvoisia. Jotkut esiintyvät useammin kuin toiset ja tämä jakauma lisäksi vaihtelee sen mukaan missä kohdassa sanaa kirjain on. Seuraavassa taulukossa on kirjainten (ja parin erikoismerkin jakauma. Sarakkeet: kirjain, osuus kaikista, sanan alkukirjaimista, 2. kirjaimista, 3. kirjaimista, kolmanneksi viimeisistä kirjaimista, toiseksi viimeisistä kirjaimista ja viimeisistä kirjaimista.

': 0.003, 0.000, 0.000, 0.003, 0.000, 0.000, 0.000
-: 0.090, 0.000, 0.004, 0.018, 0.008, 0.000, 0.000
A: 11.438, 4.339, 22.630, 4.361, 8.991, 4.614, 23.987
B: 0.162, 0.754, 0.025, 0.318, 0.053, 0.076, 0.002
C: 0.024, 0.110, 0.007, 0.053, 0.015, 0.030, 0.007
D: 0.749, 0.675, 0.358, 1.494, 0.773, 1.606, 0.016
E: 6.723, 2.330, 11.358, 3.858, 5.676, 11.552, 5.546
F: 0.180, 0.777, 0.065, 0.247, 0.088, 0.067, 0.007
G: 0.281, 0.450, 0.066, 0.430, 0.443, 0.196, 0.026
H: 2.170, 6.279, 1.219, 4.654, 1.722, 1.073, 0.026
I: 11.552, 2.190, 13.753, 10.213, 9.086, 4.878, 18.264
J: 1.328, 2.650, 0.261, 1.068, 0.180, 4.257, 0.000
K: 6.424, 15.017, 0.956, 6.593, 6.215, 8.249, 0.035
L: 5.790, 6.741, 3.372, 8.728, 6.032, 8.541, 0.133
M: 3.009, 6.606, 1.053, 3.886, 1.602, 3.695, 0.057
N: 6.544, 3.037, 1.495, 7.346, 15.003, 3.718, 13.312
O: 5.416, 2.436, 9.414, 5.317, 3.677, 1.852, 7.752
P: 3.005, 10.180, 1.175, 3.969, 2.138, 1.928, 0.029
Q: 0.002, 0.005, 0.006, 0.005, 0.002, 0.000, 0.000
R: 3.916, 5.272, 2.642, 10.142, 2.892, 4.573, 0.197
S: 7.394, 10.010, 1.597, 6.811, 8.472, 3.761, 13.507
T: 8.669, 8.942, 1.012, 6.517, 14.981, 16.088, 1.254
U: 6.642, 1.410, 14.490, 6.049, 6.706, 10.523, 5.060
V: 2.322, 6.935, 0.440, 2.767, 0.490, 2.732, 0.002
W: 0.005, 0.001, 0.011, 0.005, 0.002, 0.002, 0.009
X: 0.002, 0.001, 0.002, 0.007, 0.000, 0.000, 0.005
Y: 2.193, 1.920, 4.644, 1.740, 1.992, 3.706, 1.420
Z: 0.009, 0.021, 0.010, 0.030, 0.008, 0.008, 0.002
Š: 0.005, 0.010, 0.008, 0.011, 0.004, 0.006, 0.003
Ž: 0.002, 0.000, 0.001, 0.000, 0.001, 0.003, 0.000
Á: 0.000, 0.000, 0.000, 0.001, 0.000, 0.001, 0.000
Â: 0.000, 0.000, 0.000, 0.001, 0.000, 0.000, 0.000
Ä: 3.204, 0.726, 6.624, 2.299, 2.482, 1.883, 7.628
Å: 0.000, 0.001, 0.000, 0.000, 0.000, 0.000, 0.000
È: 0.000, 0.000, 0.000, 0.000, 0.001, 0.000, 0.000
É: 0.001, 0.000, 0.004, 0.000, 0.001, 0.000, 0.004
Ê: 0.000, 0.000, 0.000, 0.001, 0.001, 0.000, 0.000
Ô: 0.000, 0.000, 0.000, 0.000, 0.001, 0.000, 0.000
Õ: 0.000, 0.000, 0.001, 0.000, 0.001, 0.000, 0.000
Ö: 0.743, 0.173, 1.296, 1.058, 0.261, 0.381, 1.710
Û: 0.000, 0.000, 0.000, 0.000, 0.000, 0.001, 0.000
Ü: 0.000, 0.000, 0.000, 0.000, 0.000, 0.001, 0.000

Taulukosta löytyy selitys joihinkin laadintaan liittyviin ilmiöihin. Esimerkiksi A on yleinen kirjain, mutta alkukirjaimina ihan tavallinen pulliainen. Se kukoistaa erityisesti toisena ja viimeisenä kirjaimena.

Sanalistassa on pääasiassa yksikkömuotoisia sanoja joten siitäkin syystä jakauma olisi toisennäköinen jos tilasto laskettaisiin ristikoista poimituista sanoista. Silloin T:n osuus loppukirjaimena kasvaisi oleellisesti.
91. iso S5.11.2008 klo 19:26
Edellinen tilasto vielä absoluuttisilla lukumäärillä:

': 27, 0, 0, 3, 0, 0, 0
-: 938, 0, 4, 17, 8, 0, 0
A: 119413, 4190, 21852, 4210, 8679, 4455, 23163
B: 1694, 728, 24, 307, 51, 73, 2
C: 255, 106, 7, 51, 14, 29, 7
D: 7824, 652, 346, 1442, 746, 1551, 15
E: 70189, 2250, 10968, 3724, 5479, 11155, 5355
F: 1881, 750, 63, 238, 85, 65, 7
G: 2937, 435, 64, 415, 428, 189, 25
H: 22651, 6063, 1177, 4493, 1662, 1036, 25
I: 120606, 2115, 13280, 9859, 8771, 4710, 17636
J: 13862, 2559, 252, 1031, 174, 4111, 0
K: 67069, 14501, 923, 6364, 5999, 7965, 34
L: 60446, 6509, 3256, 8425, 5823, 8247, 128
M: 31411, 6379, 1017, 3751, 1546, 3568, 55
N: 68316, 2933, 1444, 7091, 14483, 3590, 12854
O: 56542, 2352, 9090, 5133, 3549, 1788, 7486
P: 31368, 9830, 1135, 3831, 2064, 1862, 28
Q: 21, 5, 6, 5, 2, 0, 0
R: 40885, 5091, 2551, 9790, 2792, 4416, 190
S: 77188, 9666, 1542, 6575, 8178, 3632, 13043
T: 90504, 8635, 977, 6291, 14461, 15535, 1211
U: 69346, 1362, 13992, 5839, 6473, 10161, 4886
V: 24240, 6697, 425, 2671, 473, 2638, 2
W: 55, 1, 11, 5, 2, 2, 9
X: 22, 1, 2, 7, 0, 0, 5
Y: 22891, 1854, 4484, 1680, 1923, 3579, 1371
Z: 98, 20, 10, 29, 8, 8, 2
Š: 56, 10, 8, 11, 4, 6, 3
Ž: 20, 0, 1, 0, 1, 3, 0
Á: 2, 0, 0, 1, 0, 1, 0
Â: 1, 0, 0, 1, 0, 0, 0
Ä: 33454, 701, 6396, 2219, 2396, 1818, 7366
Å: 1, 1, 0, 0, 0, 0, 0
È: 3, 0, 0, 0, 1, 0, 0
É: 11, 0, 4, 0, 1, 0, 4
Ê: 1, 0, 0, 1, 1, 0, 0
Ô: 1, 0, 0, 0, 1, 0, 0
Õ: 1, 0, 1, 0, 1, 0, 0
Ö: 7756, 167, 1251, 1021, 252, 368, 1651
Û: 1, 0, 0, 0, 0, 1, 0
Ü: 1, 0, 0, 0, 0, 1, 0
92. Jukkis16.11.2008 klo 21:50
Tilastotieto: Semmoinenkin vaikutus viime aikojen nimimerkkitapahtumilla on ollut, että tilastopaikan

drzf55.googlepages.com/listoja.html

kuluneen viikon kävijämäärä on sama kuin edeltävien 16 viikon kävijämäärä. (Tuon ajan siellä on ollut kävijätilastointi.)

Päivitin tilastot aamupäivällä.
93. Marco Poloinen4.11.2009 klo 21:33
Mitähän - ja missä - lienee tapahtunut, kun yllämainitusta osoitteesta ei enää löydy listoja. Linkkisivu kyllä avautuu, mutta linkin takaa ei löydy sivua. Jos muut löytävät niin sitten kyseessä on varmaan "henkilökohtainen ongelma".
94. Jukkis4.11.2009 klo 21:43
Google on lakkauttanut tuon googlepages-homman. Tai oikeammin muuttanut palvelun Google Sites -palveluksi. Laitan jossain vaiheessa toimimaan tuolla uudessa paikassa.
95. Maikki4.11.2009 klo 21:45
Kiitos tiedosta, samaa asiaa olen manannut kuin Marcokin. Joskus tarvitsee kirjailijoita tarkistaa.
96. Marco Poloinen4.11.2009 klo 21:55
Kiitos tiedosta, tässä tapauksessa se vähentää tuskaa!
97. Ari4.11.2009 klo 22:20
Olen tallettanut tuon sivun suosikkeihin ja se toimii ainakin minulla aivan normaalisti.
98. Marco Poloinen4.11.2009 klo 22:27
No sehän veikeätä. Suosikeissa se on minullakin, mutta linkkien alukset ovat tyhjää täynnä. Ettet ole tallettanut pysyvästi koneellesi?
99. Ari4.11.2009 klo 22:36
Kyllä ne on pysyvästikin tannennettu mutta suosikeista se tulee suoraan netistä.
100. Marco Poloinen4.11.2009 klo 22:41
Tiedostoa ei löytynyt

Tiedostoa ei löytynyt sijainnista /tmp/sanar_ots.html.

* Tarkista, että tiedostonimi on kirjoitettu virheettömästi ja oikealla kirjainkoolla.

* Tarkista, ettei tiedostoa ole poistettu, siirretty tai nimetty uudelleen.

Tuommoista tekstiä tulee...
101. Maikki4.11.2009 klo 22:49
Mulle työntää samanlaista tekstiä.

Lieneekö vika selaimessa, mulla Firefox?
102. Marco Poloinen4.11.2009 klo 22:58
Samma här. Kirjanmerkkejähän ne "suosikit" Firefoxissa ovat, mutta sama asia. Mutta eipä hätiä mitiä, odottelen rauhassa Jukkiksen toimenpiteitä.
103. Maikki4.11.2009 klo 23:05
Tehkäämme näin, ja odotellen lisäinformaatiota.
104. HT4.11.2009 klo 23:57
drzf55.googlepages.com/listoja.html osoiteriville heitettynä tuo esiin kysymyksen, haluaako avata vai tallentaa tarjolla olevan jutun, ja sieltä ne listat sitten löytyvät. Näin minun koneeni selaimissa IE, Opera ja Firefox.
105. Marco Poloinen5.11.2009 klo 00:14
Aivan samoin tapahtuu minullakin, mutta etu-(linkki-)sivulta vain ei linkkien alta löydy kuin ym. ilmoitus. Aiemmin ei ole ollut mitään vaikeuksia. Selaimen asetuksia en ole muutellut miesmuistiin - en tiedä, pitäisikö.
106. Jukkis5.11.2009 klo 09:10
Tuon listapaikan uusi osoite Googlen toteuttaman uudelleenjärjestelyn jälkeen on

_http://sites.google.com/site/drzf55/listoja.html

mutta ei tuokaan kunnolla toimi, eli tulee "haluatko tallentaa vai avata"-kysely sen sijaan että sivu aukeaisi selaimessa normaaliin tapaan.

En minä ymmärrä, miksi se noin toimii. Yritän ehtiessäni katsella, olisiko jotain tehtävissä.
107. Jukkis5.11.2009 klo 11:07
No selvis. Syy kaikkeen tähän on se, että tuo Goole Sites on ihan paska. Sinne ei voi siirtää itse tekemiään html-tiedostoja, tai siis voi siirtää, mutta homma on tehty niin, että muualla tehdyt ja tuonne siirretyt html-tiedostot ei tule näkyviin selaimessa normaaleina web-sivuina, vaan selain kyselee tuon "tallentaa vai avata"-jutun.

Tämä tarkoittaa sitä, että en minä voi tuota enää tuolla Googlessa ylläpitää. Pitäis tehdä jollain Google Sitesin naurettavalla sivueditorilla sivut ja sinne niiden html-koodin sekaanleikepöydän kautta siirrellä nuo listat. Höh.

No, löysin jo lupaavan uuden paikan, Angelfiren. Sinne toimii jopa FTP, mikä tarkoittaa sitä, että voin ylläpitää noita listoja täysin automaattisesti käsin koskematta. Kerron osoitteen sitten kun olen saanut paikan pystytettyä.
108. Jukkis5.11.2009 klo 11:45
No niin, tässä uusi osoite:
_http://drzf55.angelfire.com/listoja.html

Tuon voisi ehkä päivittääkin.
109. Maikki5.11.2009 klo 11:50
Suurkiitos, Jukkis!

Nyt löytyy tälläkin koneella.
110. Marco Poloinen5.11.2009 klo 14:08
Hyvin pelittää. Kiitos!
111. Ari5.11.2009 klo 14:22
Toimii, mutta jäikö piilotiedostot vielä pois tuolta?
112. Jukkis5.11.2009 klo 17:15
Piilotiedostot? Eh?
113. Ari5.11.2009 klo 17:16
En löytänyt tiedostoa HS_nimim.html.
114. Ari5.11.2009 klo 19:35
Nyt löytyi.
115. iso S10.11.2009 klo 23:31
Paljonko on paljon? Kyllä. Olen keräillyt sanoja eri tavoilla noin vuodesta 1996 alkaen. Nämä ristikkojutut tuntuvat äkkiseltään mainiolta lähteeltä, käsitelläänhän täällä keskimääräistä enemmän sellaisia sanoja jotka ovat ainakin ristikkokelpoisia elleivät suorastaan ristikoissa esiintyneitä.

Mutta voi! Suomi on keräilijän kannalta siitä kelju kieli että kaikenkarvaisten taivutusten ja muiden lisukkeiden vuoksi vain osa sanoista on perusmuodossa. Lisäriesana on se että tahallisia ja tahattomia pianohirveitä on enemmän kuin iltapäivälehtien urheilusivuilla ja se on jo aika ilkeästi sanottu!

Mikään ei estä tilastohullua yrittämästä ja pieni sellainen asuukin minussa. Tässä kylmää vettä niskaani aikaväliltä 3/2003 - 10/2009:

Excel-makroni, joka ei erota satunnaista kirjainjonoa merkityksellisestä sanasta, löysi 13799332 vähintään 2-kirjaimista "sanaa", kaikkiaan 785010 erilaista. Revi siitä sitten huumoria tai todellisten sanojen listaa ilman että parta harmaantuu.

Ennestään tunnistettuihin vertaamalla osoittautui että rilaisten lista sisältää
78891 perusmuotoista sanaa,
54254 taivutettua sanaa,
12894 monikkoa ja
19661 epäsanaa tai sellaista kökkösanaa jota ei tekisi mieli laittaa ristikkoon edes hätätilassa.

Jäljelle jäisi setvittäväksi jää 619310 sanaa joista 400767 on pituudeltaan ristikkoon yleisimmin päätyvää luokkaa eli 4-12 kirjainta. Kuulostaa urakalta joka parantaa tilastohulluudenkin.

anojen taajuusjakaumasta saa jonkinlaisen käsityksen näistä tunnusluvuista:
76 sanaa vähintään 10000 kertaa
179 sanaa vähintään 5000 kertaa
1136 sanaa vähintään 1000 kertaa
47439 sanaa vähintään 50 kertaa
126136 sanaa vähintään 10 kertaa
180697 sanaa vähintään 5 kertaa
46368 sanaa 3 kertaa
108350 sanaa 2 kertaa
423993 sanaa kerran.

Aletaan lähestyä inhimillisen kärsimiskyvyn aluetta jos rajaisi pois harvoin esiintyvät, esimerkiksi alle 10 kertaa esiintyneet.
116. iso S10.11.2009 klo 23:34
Tutkimukseni mukaan sanaristikko.netin 100 kärjessä on:

1. 467505 LÄHETTÄJÄ
2. 172346 ON
3. 164997 JA
4. 92492 EI
5. 66005 ETTÄ
6. 58771 SE
7. 52496 RA
8. 48913 MUTTA
9. 48766 EKI
10. 44303 KUN
11. 42715 NIIN
12. 38066 OLI
13. 35833 HTTP
14. 35440 EN
15. 35377 OLE
16. 34224 JOS
17. 28820 NYT
18. 28532 TAI
19. 27371 SEN
20. 27163 KUIN
21. 24429 OLLA
22. 23884 JO
23. 21708 VAIN
24. 21301 ISO
25. 21249 JUHANI
26. 20552 IHAN
27. 20377 VOI
28. 19833 SITTEN
29. 19189 THE
30. 19070 LIBERO
31. 18690 COM
32. 18548 ARSKA
33. 18516 PP
34. 18504 SITÄ
35. 18214 VIELÄ
36. 18136 HEINO
37. 17915 OVAT
38. 17666 OLEN
39. 17624 OLISI
40. 17449 SIIS
41. 17326 OSA
42. 17122 KYLLÄ
43. 16575 MYÖS
44. 16016 JOKA
45. 15113 OLLUT
46. 15027 MAIKKI
47. 14938 MATTI
48. 14911 BLOGSPOT
49. 14746 MITÄ
50. 14578 VAAN
51. 14555 WWW
52. 13865 URL
53. 13829 TÄMÄ
54. 13408 VAIKKA
55. 13251 TUO
56. 13043 HEMULI
57. 12404 SIITÄ
58. 11943 NE
59. 11745 KAIKKI
60. 11720 NO
61. 11534 TÄSSÄ
62. 11413 MINÄ
63. 11277 SAA
64. 11176 OIKEIN
65. 11050 YKSI
66. 11035 SIINÄ
67. 11014 AINA
68. 10891 SANA
69. 10846 TAAS
70. 10826 AINAKIN
71. 10684 JOKU
72. 10538 AIKA
73. 10524 ITSE
74. 10513 ARSKIS
75. 10472 ARI
76. 10379 TULEE
77. 9972 ELI
78. 9923 SÄIE
79. 9903 EIKÄ
80. 9678 ONKO
81. 9636 TSÖÖTS
82. 9521 HAKRO
83. 9519 MITÄÄN
84. 9473 MIKÄ
85. 9443 JASKA
86. 9411 TULI
87. 9348 ANTTI
88. 9217 HÄN
89. 9140 HYVÄ
90. 9077 VAI
91. 8980 SIIHEN
92. 8883 NÄIN
93. 8741 EHKÄ
94. 8596 KP
95. 8564 JOHN
96. 8448 KAI
97. 8444 TOINEN
98. 8370 TÄÄLLÄ
99. 8363 JPG
100. 8289 AIVAN

Aivan, ylivoimainen voittaja on Lähettäjä, koska makroni ei diskannut viestien otsikkoriviä, vaikkakin poisti siitä kellonajan, eli klo ei juhli tuolla listalla.
117. iso S10.11.2009 klo 23:36
Keskustelun tasosta saa synkän kuvan jos listaa 50 aakkosjärjestyksessä ensimmäistä ja viimeistä kerran esiintynyttä sanaa:

ÃÂ
AAA-A
A-A-AA-AAA
AA-AA-AA-AA-AA
AAAAAAAAA-A
AAAAAAAAAAAAA
AAA-AA-AAA-AA-AAA-AA-AAA-AA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAGH
AAAAAAAAAAA-PUUUUUUU-VAAAAAAAAAAAAAAA
AAAAAAAAAAC
AAAAAAAAABW
AAAAAAAAAGH
AAAAAAAAAGY
AAAAAAAAAHHHHHHHHHHHH
AAAAAAAAAIU
AAAAAAAAAJU
AAAAAAAAANS
AAAAAAAAAPE
AAAAAAAAAXK
AAAAAAAAAYE
AAAAAAAAB-C
AAAAAAAABES
AAAAAAAABLG
AAAAAAAABPK
AAAAAAAABSS
AAAAAAAABXC
AAAAAAAABYO
AAAAAAAACTQ
AAAAAAAADIO
AAAAAAAADIS
AAAAAAAADIY
AAAAAAAAEIM
AAAAAAAAEUI
AAAAAAAAGAO
AAAAAAAAH
AAAAAAAAIHS
AAAAAAAANAI
AAAAAAAAQBI
AAAAAAAASDC
AAAAAAAHHHHHHH
AAAAAARGH
AAAAAARGHPORAAJA
AAAAAARRRGGHHH
AAAAAARRRRGGGHHHH
AAAAAAVAAAAAAAAAAAAAAAA
AAAAAAWC
AAAAAH
AAAAA-KUVAN
ÖÖLIINKIN
ÖÖLIJONOT
ÖÖLIKUONOA
ÖÖLILLE
ÖÖLINJUONTI
ÖÖLINKITTAAJIEN
ÖÖLINSÄ
ÖÖLIPERÄISELTÄ
ÖÖLISSÄ
ÖÖLISTÄ
ÖÖLIT
ÖÖLITUPAAN
ÖÖLITÖLKIN
ÖÖLIÄMPÄRITTÖMÄNÄKÄÄNKINKÖ
ÖÖLIÖKIN
ÖÖMANNI
ÖÖMÄINEN
ÖÖNÄÄN
ÖÖNÖ
ÖÖPILLE
ÖÖREPRUUSSA
ÖÖRFIILA
ÖÖRFIILAT
ÖÖRG
ÖÖRI
ÖÖRNIIN
ÖÖRTELIT
ÖÖRTELIÄ
ÖÖS
ÖÖTKIN
ÖÖTSILLE
ÖÖTTÖMIÄ
ÖÖTTÖMÄLLE
ÖÖTTÖMÄN
ÖÖTTÖMÄSTÄ
ÖÖTUOTA-MIES
ÖÖVAIKUSES
ÖÖVAIN
ÖÖWIN
ÖÖY
ÖÖÖ-MAINEN
ÖÖÖPSIS
ÖÖÖT
ÖÖÖTOTA
ÖÖÖTUOTATUOTA
ÖÖÖYYYMMLLÄÄÄOOOOPPPP
ÖÖÖÖT
ÖÖÖÖÖÖÖÖÖ
ÖÖÖÖÖÖÖÖÖÖÖÖÖÖÖ
ÖÖÖÖÖÖÖÖÖÖÖÖÖÖÖÖÖÖ

(No, nyt taso parani: nuo kaikki ovat esiintynet toisenkin kerran eivätkä jatkossa tule vastaavalle listalle!)
118. iso S10.11.2009 klo 23:39
Hiukan lohdullisemmalta näyttää jos listaan joka 4239. kerran esiintyneen sanan (100 sanaa):

AIDANTAA
AKITIERAISIN
ALKUPIILOTTOMUUDESSA
ANKEAKIN
ARRASSA
ATELIERCADOVI
AY-ENNE
BREDBAND
CORELLILLAKO
DOPINGTESTIIN
EKSYTTIN
ENSIMMÄISEKSIHÄN
ESIMERKKIELÄMYKSET
FAIRVIEWISTÄ
GANAR-PRE
HAIT-NIMITYKSELLÄ
HAUKKUVILLE
HESARISTAKIN
HOMEOPATIA
HUULIHERPES
HÖYRYSAUNAN
IKÄKAUSIEN
IMUTELLA
ISKUKYVYN
JALKAPALLOKYSYMYKSISSÄ
JOULUPIPARIAKKOJEN
JÄMÄKÄSTÄ
KAKKOSESIMERKKI
KANVAS
KAUPANYHTEYDESSÄ
KERÄILYARVON
KIHLAUTUI
KIRJOITUSINTO
KOISISI
KOPUTUSTA
KROMOSOMEISTA
KUORITUISTA
KYMMENSENTTISELLÄ
KÖMMÄHTÄÄ
LANGATTOMIA
LEHDELLÄSI
LIEROSTA
LITRAAN
LUKITSIN
LÄHINÄ
MAGNEETTIKIINNITYKSELLÄ
MASKULIINEISSA
METALLIALALLA
MITTELY
MULTITUDE
MYÖHÄYÖHÖN
NAPRAPOI
NEUROPSYKOLOGISEN
NOLLAHINTA
NUUHKINEEN
OHEISPALVELU
OMPELUTAITOISENA
OTETU
PALELITKO
PAVAROTTILLE
PERÄKKÄISJÄRJESTYSTÄ
PIKSELIPUOLEN
POISHEITTÄMISEEN
PROTÓPAPPA
PUSKETAAN
PÄÄLL
RAJOILTAAN
RAUTABEE
RIISTASTA
ROCCAMATIOISTA
RUSTOKALOJA
SAKARASTA
SANTANASTA
SELITYKSIA
SIIRIÄITEEN
SIVEYSPOLIISI
SORTUMATTAKIN
SUKELLUSVENESOTAA
SUTJAKOITTAISI
SÄHKÖTYKSESSÄ
TAKAALADATTAVALLAAN
TARKOITUPERÄSTÄ
TEKSTAAMISESTA
TIETOKONETEKSTEIHIN
TOISEKSIJÄÄMÄTTÄ
TSEMAA
TUOTEPERHE
TYRSKÄHTELY
UAB
UNTUVATYYNYLLÄ
VAAHTERANLEHTIÄ
VALMISTEAAN
VASTUUIHMISEKSI
VIATTOMUUDESSA
WILJAM
VOLTTILÄHDÖSSÄ
X-FACTOR
YLLÄTÄVÄN
ÄKKIKÄYNTIAIKA
ÖYSTILÄN

Tästä voi arvioida kuinka paljon haaviin tarttuu erityyppisiä sanoja.

Tällainen tapaus tällä kertaa, ja nyt hyvää yötä!
119. RA11.11.2009 klo 00:50
LÄHETTÄJÄ ON JA EI... ETTÄ SE RA... MUTTA EKI KUN NIIN OLI HTTP... EN OLE... JOS NYT TAI SEN KUIN... OLLA JO VAIN ISO... siis (40.) tämä (53.) S ihan (26.) yksi (65.)...
120. Jukkis11.11.2009 klo 10:06
Hiukka rupesi kiinnostamaan tämä:

"Ennestään tunnistettuihin vertaamalla osoittautui että rilaisten lista sisältää
78891 perusmuotoista sanaa,
54254 taivutettua sanaa,
12894 monikkoa ja
19661 epäsanaa tai sellaista kökkösanaa jota ei tekisi mieli laittaa ristikkoon edes hätätilassa."

Miten olet tämän luokittelun saanut aikaan? Tuskin tuollainen sanojen tunnistaminen täysin automaattisesti voi tapahtua, kun se vaatisi, että olisi lista kaikista suomen kielen "ei-epä- ja ei-kökkösanoista". Ei kai sellaista listaa missään ole?
121. iso S11.11.2009 klo 16:39
Rivien välistä ja kohdasta "ennestään tunnistettuihin vertaamalla" voi aavistaa miten tunnistaminen on tapahtunut. Sanoja kerätessäni olen omin kätösin merkannut mikä on mitäkin. On tietysti uskottavaa että tässä on tapahtunut matkan varrella virhe jos toinenkin mutta suuruusluokat ovat oikein.

Esimerkiksi monikolliset sanat on suht helppo poimia joukosta: niillä on taipumus päättyä t-kirjaimeen. Näin peruskarsitusta joukosta pitää ruksata eroon ne sanat jotka eivät olekaan monikkoja.

Sen jälkeen kun taivutettuja sanoja on kertynyt jonltinenkin joukko, on mahdollista koodata ohjelma joka yrittää arvailla mielivaltaisista sanoista onko kyseessä taivutettu vai perusmuoto ja taivutetuista pystyy samoin tuottamaan arvauksen perusmuodosta, mikä vähntää näppäilytyötä. Valitettavasti suomi on tässä suhteessa vähemmän avulias kaikkine astevaihteluineen, mutta osa arvauksista sentään menee oikein.

Juu, olisi kiva jos jostakin saisi imaistuksi valmiin listan. Jonkinlaisen peruslistan voi louhia esimerkiksi Websterin sanakirjasta ja Wiktionarysta. Edellisessä on karmeita virheitä, suuresta osasta sanoja puuttuu alkukirjain. Ei jälkimmäinenkään ole virheetön.
122. Jukkis11.11.2009 klo 17:18
Aika kunnioitettava suoritus, kun olet kerännyt ja luokitellut tässä pikkuhiljaa tommoiset 165000 sanaa. Ei tuota ehkä yhdellä rysäyksellä tulisi tehtyä, mutta kyllähän tuollainen pikku hiljaa vuosien mittaan kertyy. Vaikka onhan tuossa 6,5 vuodelle jaettuna keskimäärin 70 sanaa per päivä.

kotus.fi:stä olen joskus imaissut 94110 sanaa sisältävän listan. Muistaakseni se sisältää sanat, jotka on selitetty Kielitoimiston sanakirjassa.
123. iso S11.11.2009 klo 22:50
Mistähän tuo 6,5 vuotta tuli? Ai niin, Sanaristikko.netin ikä. Kuten aiemmin mainitsin, keräilyni on alkanut vuoden 1996 paikkeilla, joten aikaa on vierähtänyt tuplasti., noin 13 vuotta. Sinä aikana kertyneeseen aineistoon olen verrannut Sanaristikko.net-sanastoa.

Kehtaako edes mainita että laskemasi 165000 sanaa on myös alakanttiin. Tuon verran on näissä kahdessa aineistossa yhteisiä sanoja. Luokitellussa aineistossani on enemmän jo perusmuotoisiakin sanoja. Kaikki eivät vain ole esiintyneet näissä keskusteluissa. Kokonaismäärä taitaa olla nyt luokkaa 400000.

Määrän pullahtamisesta voin kiittää tai syyttää Excelin uutta versiota jossa rivimäärän rajoitus 65536 on historiaa. Nyt on mahdollista tehdä taulukko jossa on yli miljoona riviä. Ilman sitä homma olisi paljon työläämpää kun pitäisi palastella aineisto esimerkiksi alkukirjaimen mukaan ja tehdä 5-10 kertaa se mikä nyt hoituu kerralla.

Laatu on kärsinyt määrän kustannuksella. Mukana on nyt paljon sanastoa mitä en soisi ristikossa näkyvän ja sellaista mitä en uskokaan näkeväni. Siitä huolimatta varmasti puuttuu ihan perussanastoakin, erikoisaloista puhumattakaan. Esimerkiksi maantieteen sanastosta olisi tarpeen löytää joku luotettava lähde.
124. Jukkis11.11.2009 klo 23:21
Mistä nuo 400000 sanaa on peräisin? Netistä? Otat talteen nettisivujen sisältöjä ja pilkot sanoiksi Exceliin?
125. iso S12.11.2009 klo 17:10
Ristikot, Webster, Kotus, oma pää, satunnaiset netistä löytyneet sanastot joita en tähän hätään muista, erinäiset nettisivut (kuten Iltis), Seitsemän veljestä ihan piruuttaan. Raamatun sanojen läpikäynti on vielä vaiheessa mutta ehkäpä valssin tahdissa (3/4 käsitelty?).

Korpelan sanasto tuli nyt mieleen. Omalla päällä tarkoitan sitä että joskus keräilyn alussa kävin läpi siihen asti löytyneitä ja sen kummemmin miettimättä kopioin/liimasin/muokkasin sanoja jos päähän pälkähti joku yhden kirjaimen muunnos kantasanasta. Silläkin tavalla sai kerrytetyksi alkuvaiheessa aika nopeasti "hyviä sanoja". Uusi - kuusi - kausi - kassi - kasti - lasti - lesti - pesti - posti - potti...
126. Jukkis23.6.2010 klo 14:31
Kun HS 2593 -säikeessä POH pyysi, niin päivitin sanaristikot.net -tilastot:
_http://drzf55.angelfire.com/listoja.html

Kuten Jondalar huomautti, tuo angelfire.com -saitti harrastaa mainontaa, myös pop-uppeja. Ei ne ole vaarallisia, ne voi saman tien sulkea. Ja ne voi kokonaan estää selaimen asetuksista.

Semmoinen jymyuutinen tilastoista, että kirjoituksien määrässä mitattuna RA:n valtakausi on ohi. Eki on kevään mittaan jyrännyt ykköseksi, 50722 - 50546.
127. Eki23.6.2010 klo 14:34
Olen syvästi järkyttynyt mutta toisaalta ylpeä aikaansaavuudestani. Kirjailijaketju lienee pääasiallinen syy.
128. Kravattimies23.6.2010 klo 14:53
Hyvä, Eki!

Jukkiksen sivulla on näköjään myös tällainenkin hauska seikka kuin kuutamollaoloindeksi!

"Nimimerkin kuutamollaoloindeksi indikoi sitä, miten suuren osan viesteistään nimimerkki on kirjoittanut kuutamon aikana."

Laskukaavan selityksen jälkeen:

"Koska kirjoittajien tarkka maantieteellinen sijainti ei ole tiedossa, on keskimääräisen virheen minimoimiseksi kaikki tähtitieteelliset laskelmat tehty olettaen kaikkien sijainniksi Suomen väestökeskipiste, joka sijaitsee Hauholla."

Hyvä, Hauho!

Ja sitten henkilökohtaisesti minulle:

"Erityisesti Kravattimiehen kuutamollaoloindeksiarvo on siis ihan puuta heinää. Kravattimiehen todellinen, Brisbanen horisontin mukainen indeksi lasketaan, jos joku riittävän arvovaltainen taho tällaisen pyynnön esittää."

Eki.... pliis!
129. iso S23.6.2010 klo 22:50
Kuinkas sattuikaan, juuri tätä säiettä olisin kohta etsinyt. Tilastoa pukkaa!

On yleisesti tiedossa oleva tosiasia että ristikoissa sanojen esiintymistiheys ei ole sama kuin "oikeassa elämässä". On myös uskottavaa että sanojen esiintymistiheys vaihtelee sen mukaan mistä lähteestä mitataan.

Ristikkosanojen taajuustilaston kärkipäätä on esitelty jossain toisaalla. Tämän vuoden alkupuolikkaalla olen keräillyt näytteitä seuraavista lähteistä: IS:n kotimaan uutiset, IS:n urheilu-uutiset, HS:n tuoreimmat uutiset ja Sanaristikot.netin pari ensimmäistä toimintakuukautta vuodelta 2003 (sitä voi verrata edellä olevaan kokonaistilastoon joka yltää vuoden 2009 lokakuuhun).

Ihan mielenkiinnon vuoksi panin Excelin rouskuttamaan myös Seitsemän veljestä, kun sen satuin netistä löytämään. Kyseinen versio on tosin sikäli huono että siellä on runsaasti ylimääräisiä tavuviivoja ja tavuviivoilta näyttäviä merkkejä joiden ascii-koodi on kuitenkin jotain muuta. Ne pätkivät osan sanoista mielivaltaisesti ja vääristävät tilastoa. Kärkipään osalta vaikutus on suht merkityksetön mutta ei olematon.

Näytteiden kokoa voi suhteuttaa sanojen lukumäärän perusteella tuohon Kiven teokseen. Sen koosta useimmilla lienee jonkinlainen mielikuva.

Sitten tuloksiin, yksi lähde per säie, 100 yleisintä jokaisesta. Kaikkea ei voi lätkäistä yhteen säikeeseen kun kerralla lähetettävän tekstin merkkimäärä on rajoitettu.
130. iso S23.6.2010 klo 22:51
sanaristikot.net (95157 sanaa, 27257 erilaista)
1. 2,558% ON
2. 2,297% LÄHETTÄJÄ
3. 2,189% JA
4. 1,279% EI
5. 1,058% ETTÄ
6. 0,880% MUTTA
7. 0,695% SE
8. 0,611% NIIN
9. 0,594% JOS
10. 0,575% OLE
11. 0,562% KUN
12. 0,500% OLI
13. 0,463% TAI
14. 0,442% KUIN
15. 0,375% EN
16. 0,374% OLLA
17. 0,373% SEN
18. 0,369% OVAT
19. 0,357% VOI
20. 0,333% EKI
21. 0,333% NYT
22. 0,315% VAIN
23. 0,305% OLISI
24. 0,305% VIELÄ
25. 0,289% MYÖS
26. 0,284% JO
27. 0,280% KYLLÄ
28. 0,278% SITTEN
29. 0,262% SITÄ
30. 0,260% ANTTI
31. 0,227% SIIS
32. 0,226% SANA
33. 0,218% TÄMÄ
34. 0,214% IHAN
35. 0,214% VAIKKA
36. 0,206% OLEN
37. 0,199% MITÄ
38. 0,197% OSUI
39. 0,191% VIITAMÄKI
40. 0,187% JEPSJUU
41. 0,185% JOKA
42. 0,184% SIITÄ
43. 0,180% JOUNI
44. 0,179% TUO
45. 0,175% ITSE
46. 0,170% NE
47. 0,169% VAAN
48. 0,169% YKSI
49. 0,167% ELI
50. 0,167% KOTSA
51. 0,167% OLLUT
52. 0,164% TULEE
53. 0,163% VAI
54. 0,162% HYVÄ
55. 0,160% MIKÄ
56. 0,157% ONKO
57. 0,156% TÄSSÄ
58. 0,156% VOISI
59. 0,153% AINAKIN
60. 0,152% AIKA
61. 0,148% SIINÄ
62. 0,147% TAKAISIN
63. 0,146% ILE
64. 0,146% KAIKKI
65. 0,143% EIKÄ
66. 0,140% OIKEIN
67. 0,140% SAA
68. 0,139% NIITÄ
69. 0,137% EIVÄT
70. 0,137% JOKU
71. 0,136% JOSKUS
72. 0,135% SANOJA
73. 0,135% VÄHÄN
74. 0,133% MUUTEN
75. 0,131% EHKÄ
76. 0,129% AINA
77. 0,127% PITÄÄ
78. 0,125% AIHEISIIN
79. 0,125% HÄN
80. 0,125% MITEN
81. 0,125% PALJON
82. 0,123% JUH
83. 0,123% RISTIKON
84. 0,119% KOSKA
85. 0,119% KUITENKIN
86. 0,118% SANAN
87. 0,116% MUKAAN
88. 0,116% SILLOIN
89. 0,116% TULI
90. 0,111% ERI
91. 0,111% MIELESTÄNI
92. 0,109% KAI
93. 0,107% NÄIN
94. 0,107% SIIHEN
95. 0,104% MIELEEN
96. 0,102% KANSSA
97. 0,102% MINÄ
98. 0,100% SUOMEN
99. 0,099% JOTEN
100. 0,099% KAKSI
131. iso S23.6.2010 klo 22:51
IS kotimaan uutiset (118266 sanaa, 32763 erilaista)
1. 2,412% JA
2. 2,249% ON
3. 1,027% EI
4. 0,986% OLI
5. 0,814% ETTÄ
6. 0,769% MUKAAN
7. 0,571% LUKIO
8. 0,455% HÄN
9. 0,429% MYÖS
10. 0,397% POLIISI
11. 0,386% OLE
12. 0,366% MIES
13. 0,331% OVAT
14. 0,329% MUTTA
15. 0,328% KUN
16. 0,309% OLLUT
17. 0,288% SE
18. 0,284% HELSINGIN
19. 0,253% NOIN
20. 0,243% JÄLKEEN
21. 0,232% VIIME
22. 0,225% KERTOO
23. 0,214% JO
24. 0,208% SEN
25. 0,201% KAKSI
26. 0,200% POLIISIN
27. 0,194% SAI
28. 0,189% TAI
29. 0,182% JOKA
30. 0,172% KERTOI
31. 0,165% VIELÄ
32. 0,164% VUONNA
33. 0,159% PÄIVITETTY
34. 0,158% NAINEN
35. 0,156% OLISI
36. 0,155% YLI
37. 0,152% MIEHEN
38. 0,151% HÄNEN
39. 0,151% KUITENKIN
40. 0,150% KELLO
41. 0,150% NYT
42. 0,148% VUODEN
43. 0,146% KUIN
44. 0,146% VOI
45. 0,145% EUROA
46. 0,145% ENNEN
47. 0,140% JOS
48. 0,134% SEKÄ
49. 0,133% VUOTIAS
50. 0,129% VAIN
51. 0,127% KANSSA
52. 0,126% SUOMEN
53. 0,125% SANOI
54. 0,124% OLIVAT
55. 0,123% LISÄKSI
56. 0,122% IS
57. 0,122% SANOO
58. 0,117% EIVÄT
59. 0,114% NIIN
60. 0,112% KOLME
61. 0,110% MUUN
62. 0,109% AIKANA
63. 0,107% LLE
64. 0,105% MUASSA
65. 0,103% KOSKA
66. 0,101% JOTKA
67. 0,100% KESKUSTAN
68. 0,099% TIISTAINA
69. 0,098% SITÄ
70. 0,098% TÄNÄÄN
71. 0,093% SIITÄ
72. 0,093% TULI
73. 0,092% EPÄILLÄÄN
74. 0,092% KIINNI
75. 0,092% SILLÄ
76. 0,091% EIKÄ
77. 0,091% SUOMESSA
78. 0,090% JOSSA
79. 0,087% JONKA
80. 0,087% YKSI
81. 0,085% OLLA
82. 0,084% MIESTÄ
83. 0,084% SATTUI
84. 0,083% MAANANTAINA
85. 0,082% ESIMERKIKSI
86. 0,081% PITÄÄ
87. 0,081% VR
88. 0,080% KOKO
89. 0,080% LÄHES
90. 0,080% SITTEN
91. 0,080% TOINEN
92. 0,079% HELSINKI
93. 0,079% ASIASTA
94. 0,079% AUTON
95. 0,079% KESKIVIIKKONA
96. 0,079% SAA
97. 0,077% ETTEI
98. 0,075% VUOKSI
99. 0,074% MITÄÄN
100. 0,073% TORSTAINA
132. iso S23.6.2010 klo 22:52
IS urheilu-uutiset (114247 sanaa, 28139 erilaista)
1. 2,414% JA
2. 2,345% ON
3. 1,075% OLI
4. 0,884% EI
5. 0,678% MUTTA
6. 0,652% ETTÄ
7. 0,610% KUN
8. 0,557% HÄN
9. 0,479% SE
10. 0,376% JÄLKEEN
11. 0,344% MYÖS
12. 0,332% JO
13. 0,309% OLE
14. 0,287% NYT
15. 0,282% KUIN
16. 0,281% KAUDEN
17. 0,270% JOKA
18. 0,270% MUKAAN
19. 0,263% OLLUT
20. 0,244% SANOI
21. 0,232% SEN
22. 0,230% OVAT
23. 0,228% VIIME
24. 0,223% VIELÄ
25. 0,218% VASTAAN
26. 0,204% ENNEN
27. 0,200% SUOMEN
28. 0,194% KANSSA
29. 0,191% KUITENKIN
30. 0,190% NIIN
31. 0,188% VAIN
32. 0,186% KAKSI
33. 0,179% OTTELUN
34. 0,178% HÄNEN
35. 0,162% KIERROS
36. 0,161% JOS
37. 0,160% OLISI
38. 0,158% SILLÄ
39. 0,151% KAUDELLA
40. 0,146% PÄIVITETTY
41. 0,144% VOITTI
42. 0,137% SITTEN
43. 0,136% SAI
44. 0,132% MAALIN
45. 0,131% HYVIN
46. 0,128% KOKO
47. 0,128% TEKI
48. 0,126% TÄLLÄ
49. 0,124% KOVALAINEN
50. 0,119% VOI
51. 0,118% SITÄ
52. 0,117% JÄI
53. 0,116% JOUKKUEEN
54. 0,116% KERTOI
55. 0,116% OLEN
56. 0,116% TULI
57. 0,116% VUODEN
58. 0,114% ENSI
59. 0,114% TÄMÄ
60. 0,114% VAIKKA
61. 0,113% PALJON
62. 0,111% KOLME
63. 0,109% OTTELUSSA
64. 0,109% PITÄÄ
65. 0,108% OLLA
66. 0,106% KAIKKI
67. 0,105% PISTETTÄ
68. 0,104% SIITÄ
69. 0,103% JOUKKUE
70. 0,102% TULEE
71. 0,099% AIKANA
72. 0,097% HYVÄ
73. 0,097% KERTAA
74. 0,097% KISAN
75. 0,097% NOUSI
76. 0,095% ERÄSSÄ
77. 0,095% EN
78. 0,094% VOITON
79. 0,093% LISÄKSI
80. 0,092% MAALIA
81. 0,092% TOISEN
82. 0,091% ENÄÄ
83. 0,091% SEKUNTIA
84. 0,090% PÄÄVALMENTAJA
85. 0,088% HIFK
86. 0,088% MITÄ
87. 0,088% IHAN
88. 0,086% SUOMI
89. 0,084% ENSIMMÄISEN
90. 0,084% HAMILTON
91. 0,084% VANCOUVERIN
92. 0,083% EIKÄ
93. 0,083% KAHDEN
94. 0,082% TAAS
95. 0,081% PELIN
96. 0,080% EIVÄT
97. 0,079% PELANNUT
98. 0,078% AIKA
99. 0,078% JANNE
100. 0,078% MITÄÄN
133. iso S23.6.2010 klo 22:52
HS uusimmat uutiset (146160 sanaa, 41183 erilaista)
1. 2,505% JA
2. 2,398% ON
3. 0,741% ETTÄ
4. 0,705% EI
5. 0,677% OLI
6. 0,605% MUKAAN
7. 0,460% OVAT
8. 0,457% MYÖS
9. 0,447% HELSINGIN
10. 0,370% HÄN
11. 0,340% KUN
12. 0,335% MUTTA
13. 0,296% SANOMAT
14. 0,296% SE
15. 0,294% OLE
16. 0,257% VIIME
17. 0,242% JO
18. 0,235% STT
19. 0,211% JOKA
20. 0,209% VUONNA
21. 0,205% JÄLKEEN
22. 0,205% VUODEN
23. 0,200% SUOMEN
24. 0,196% SEN
25. 0,193% KUIN
26. 0,185% NOIN
27. 0,182% OLLUT
28. 0,175% VOI
29. 0,173% KAKSI
30. 0,171% YLI
31. 0,169% TAI
32. 0,164% NYT
33. 0,163% SANOI
34. 0,160% VIELÄ
35. 0,157% PROSENTTIA
36. 0,151% KUITENKIN
37. 0,151% VAIN
38. 0,148% PÄIVITETTY
39. 0,148% KESKIVIIKKONA
40. 0,144% JOS
41. 0,144% KERTOO
42. 0,134% EUROA
43. 0,133% MUUN
44. 0,132% KANSSA
45. 0,131% LISÄKSI
46. 0,131% KELLO
47. 0,131% HÄNEN
48. 0,130% MUASSA
49. 0,130% SÄHKÖPOSTI
50. 0,130% SANOO
51. 0,128% SEKÄ
52. 0,128% SAI
53. 0,127% SILLÄ
54. 0,126% OLISI
55. 0,125% KERTOI
56. 0,124% KIRJOITTAJA
57. 0,122% ENNEN
58. 0,118% TAKIA
59. 0,117% TORSTAINA
60. 0,116% ENSI
61. 0,110% VASTAAN
62. 0,109% AIKANA
63. 0,107% KAIKKI
64. 0,107% KOKO
65. 0,107% OLLA
66. 0,105% SITTEN
67. 0,104% NIIN
68. 0,103% MILJOONAA
69. 0,102% EIVÄT
70. 0,102% SUOMESSA
71. 0,096% OLIVAT
72. 0,094% SIITÄ
73. 0,094% TIISTAINA
74. 0,092% AINAKIN
75. 0,092% MAANANTAINA
76. 0,090% SAA
77. 0,089% SITÄ
78. 0,088% KOLME
79. 0,088% ESIMERKIKSI
80. 0,087% JOTKA
81. 0,087% TÄNÄÄN
82. 0,086% ELI
83. 0,085% JONKA
84. 0,083% TULEE
85. 0,079% LÄHES
86. 0,078% POLIISI
87. 0,078% TOIMITTAJA
88. 0,078% SUNNUNTAINA
89. 0,077% EUROOPAN
90. 0,076% KOSKA
91. 0,076% JOSSA
92. 0,073% AIEMMIN
93. 0,073% VUOTTA
94. 0,073% OSA
95. 0,071% YKSI
96. 0,071% KERTAA
97. 0,071% MAAN
98. 0,070% TPS
99. 0,069% AUKI
100. 0,069% MIES
134. iso S23.6.2010 klo 22:52
Seitsemän veljestä (76873 sanaa, 20442 erilaista)
1. 5,518% JA
2. 1,686% MUTTA
3. 1,363% HÄN
4. 1,281% JUHANI
5. 1,071% ON
6. 0,996% NIIN
7. 0,807% KUIN
8. 0,692% NYT
9. 0,689% OLI
10. 0,618% EI
11. 0,610% HE
12. 0,531% AAPO
13. 0,518% HÄNEN
14. 0,510% MINÄ
15. 0,476% SE
16. 0,466% TIMO
17. 0,421% ETTÄ
18. 0,420% JOKA
19. 0,407% SEN
20. 0,398% VAAN
21. 0,379% TUOMAS
22. 0,367% KOSKA
23. 0,364% SIMEONI
24. 0,359% VIELÄ
25. 0,351% EERO
26. 0,330% MITÄ
27. 0,304% TÄMÄ
28. 0,299% HEIDÄN
29. 0,276% AINA
30. 0,276% SINÄ
31. 0,260% JO
32. 0,255% TÄSSÄ
33. 0,224% MYÖS
34. 0,222% SIINÄ
35. 0,220% LAURI
36. 0,216% VIIMEIN
37. 0,213% KAIKKI
38. 0,212% MIES
39. 0,208% JOS
40. 0,202% NIINKUIN
41. 0,202% VELJEKSET
42. 0,196% KERRAN
43. 0,194% KOHDEN
44. 0,187% SILLOIN
45. 0,186% TAASEN
46. 0,185% SILLÄ
47. 0,183% HÄNTÄ
48. 0,183% JUURI
49. 0,177% ALAS
50. 0,176% SIITÄ
51. 0,174% MEITÄ
52. 0,174% YLÖS
53. 0,164% KUITENKIN
54. 0,164% SITÄ
55. 0,159% JUKOLAN
56. 0,156% OIKEIN
57. 0,155% OLE
58. 0,153% KUN
59. 0,147% MIEHEN
60. 0,147% MIKÄ
61. 0,146% TÄÄLLÄ
62. 0,143% KUINKA
63. 0,143% PIAN
64. 0,142% TAAS
65. 0,140% ULOS
66. 0,139% JONKA
67. 0,139% SIELLÄ
68. 0,139% SITTEN
69. 0,138% EN
70. 0,137% HEITÄ
71. 0,135% KAKSI
72. 0,135% POIS
73. 0,131% VAIKKA
74. 0,127% TUOSSA
75. 0,126% ENNEN
76. 0,126% KAS
77. 0,122% TÄMÄN
78. 0,121% ME
79. 0,121% TUOLLA
80. 0,118% VASTAAN
81. 0,116% ITSE
82. 0,112% OLKOON
83. 0,111% UKKO
84. 0,108% POIKA
85. 0,107% VOI
86. 0,105% ILMAN
87. 0,105% KANSSA
88. 0,105% KOVIN
89. 0,105% TAI
90. 0,105% TUO
91. 0,103% MEILLE
92. 0,103% NÄIN
93. 0,103% OLEN
94. 0,100% TE
95. 0,098% SEITSEMÄN
96. 0,096% KYLLÄ
97. 0,092% VELJET
98. 0,091% MIKSI
99. 0,091% TULI
100. 0,090% KOHTA
135. iso S23.6.2010 klo 23:01
Löysin säikeestä 3644 oman noin 500 ristikosta lasketun taajuustilaston. Sen mukaan eniten esiintyneiden sanojen top 105 on tämä:

Näin laskettuna Top 105 on seuraava:

alas, taas, Atik, Utti, itara, itse, Tati, Anita, siis, anoa, aate, irti, aasi, nata, aika, ansa, Etna, teos, alati, Atte, alta, ei, itku, osata, tiit, tuta, Ural, Aral, Atso, ilta, Irak, tain, aasa, Atair, Atlas, Aton, etoa, isota, tasan, tila, Utah, Atos, Iata, akti, alias, Saar, Tott, äiti, Akaa, akka, opas, Tate, ulos, ajaa, Inari, kala, Olav, star, tali, teak, taso, Isis, osua, Alai, Alain, asua, avio, ihan, otin, rata, taos, Tito, atomi, enin, ja, lasi, Otava, taata, Tatu, auto, tosi, aisa, aste, asti, Isar, kita, oksa, tatar, Aatu, eräs, Iita, Iris, Isak, iäti, sataa, seis, sota, tana, tasa, Aasia, astia, Attu, otos, tina, vain.

Aika lailla erilainen joukko kuin nuo "luonnosta poimitut".
136. joku6.10.2011 klo 01:25
joku pyytää uutta päivitystä tilastoihin.
137. iso S7.10.2011 klo 16:29
Joku viitannee kintaalla Jukkiksen suuntaan. Minulla ei ole uutta materiaalia. Seitsemän veljeksen osalta tilanne ei varmaan olekaan muuttunut!
138. Jukkis16.10.2011 klo 20:53
Päivitinpä sitten:
_http://drzf55.angelfire.com/listoja.html
139. iso S28.1.2012 klo 20:49
Sattumalta törmäsin sivustoon
_http://www.gutenberg.org/ebooks/
josta voi ladata kirjoja eri muodoissa, esimerkiksi
Generated HTML
EPUB (no images)
Kindle (no images)
Plucker
QiOO Mobile
Plain Text UTF-8

Kirjat ovat nähtävästi enimmäkseen tai kokonaan vanhoja eli sellaisia että tekijänoikeudet ovat hautautuneet ajan patinan alle. Joukossa on 645 suomenkielistä teosta. Tässä latausten määrän perusteella suosituimmat:

Seitsemän veljestä
Lukemisia lapsille 2
Jumalainen näytelmä
Ilias
Stuifen
Baskervillen koira
Alhambra
Trois mousquetaires. Finnish
Rautatie
Amerikan löytöretken päiväkirja
Lukemisia lapsille 1
David Copperfield I
Välskärin kertomuksia 1
Suomen kansan satuja ja tarinoita
Kanteletar: Suomen kansan wanhoja lauluja ja wirsiä
Historiallinen lukukirja: Vanha ja Keski-aika
Runoja (Aaro Hellaakoski)
Faust I
Läpi neekerien maan-osan
Helsinkiin
Hamlet
Arabian nights. Selections. Finnish
Dityrambeja
Rautakorko

Imaisin kaksi "numeroteosta" eli Seitsemän veljestä ja Kolme muskettisoturia Vertaillakseni niiden sanamääriä ja sanojen keskipituutta.

Sanaksi on tässä tulkittu kirjaimista muodostuva kokonaisuus. Sanan taivutusmuodot on laskettu eri sanoiksi ja identtiset merkkijonot samaksi sanaksi. Esimerkiksi "kuusta" on laskelmassa sama sana riippumatta siitä, onko kyseessä sanan kuusi vai kuu taivutusmuoto ja kuu, kuusi ja kuusta ovat kolme eri sanaa.

Seitsemässä veljeksessä oli kaikkiaan 80770 sanaa ja 21812 erilaista sanaa. Sanat esiintyivät siis keskimäärin 3.70 kertaa. Muskettisotureissa vastaavat luvut olivat 160554, 28325 ja 5.67. Tuosta voisi päätellä että Kivi käyttää "rikkaampaa" kieltä, koska sama sana ei toistu yhtä usein. Vertailu on kuitenkin epäreilu koska sanojen kokonaismäärä on noin erilainen. On luonnollista että suhdeluku kasvaa sanojen määrän kasvaessa. Jos muskettisotureista otetaan 80770 ensimmäistä sanaa, on erilaisia sanoja 18063 ja suhdeluku 4.47. Tasapuolisessa vertailussa Kivi pärjää edelleen, mutta ei yhtä isolla marginaalilla.

Veljeksissä kaikkien sanojen keskipituus on 6.40 ja musketööreissä 6.52. Ei kovin suurta eroa. Erilaisissa sanoissa keskipituudet ovat 8.77 ja 9.64. Tässä ero on selvempi. Johtopäätös: Dumas-käännöksessä on enemmän pitkiä sanoja, mutta niitä käytetään harvemmin kuin Veljeksien vähäluikuisempia pitkiä sanoja, koska kaikista sanoista laskettu keskiarvo menee melkein tasapeliin.

Sanojen esiintymislistan kärkipäässä on runsaasti yhtäläisyyksiä, mutta myös luonnollisia eroja. Veljeksissä toistuvat sattuneesta syystä nimet Juhani, Aapo, Tuomas, Simeoni, Timo, Eero ja Lauri, muskettisotureissa ei.

Seuraavassa viestissä (ei mahdu tähän, viestillä on maksimipituus, 3500 merkkiä?) on vertailulista kirjojen 200 yleisimmästä sanasta. Ensin on veljesten yleisimmät yleisyysjärjestyksessä, sitten ne muskettisotureiden yleisimmät yleisyysjärjestyksessä jotka eivät ole veljesten 200-kärjessä. Sarakkeet ovat sana, sijoitus ja määrä tuhatta sanaa kohti Veljeksissä sekä sijoitus ja määrä tuhatta sanaa kohti Musketööreissä. Viiva merkitsee että sanaa ei ole kirjassa.
140. iso S28.1.2012 klo 20:57
Eipä mahtunut, pitää jakaa.

JA 1. 52.5690 1. 31.8211
MUTTA 2. 16.4170 12. 7.6049
HÄN 3. 12.9875 2. 21.8307
JUHANI 4. 12.4551 - -
ON 5. 10.1275 4. 13.3600
NIIN 6. 9.5085 11. 7.9786
KUIN 7. 7.6761 15. 5.9731
NYT 8. 6.6114 26. 3.3509
OLI 9. 6.5866 3. 16.6922
EI 10. 5.8809 10. 8.2838
HE 11. 5.8066 58. 1.9184
HÄNEN 12. 5.3238 7. 9.7911
AAPO 13. 5.0266 - -
MINÄ 14. 4.8657 5. 10.6133
TIMO 15. 4.5561 - -
SE 16. 4.5190 16. 5.6866
ETTÄ 17. 4.0114 6. 10.0527
JOKA 18. 4.0114 14. 6.9322
SEN 19. 3.8752 18. 4.9703
VAAN 20. 3.7885 17. 5.5495
TUOMAS 21. 3.6771 - -
KOSKA 22. 3.6028 117. 0.9031
SIMEONI 23. 3.5533 - -
VIELÄ 24. 3.4790 43. 2.4229
EERO 25. 3.3428 - -
MITÄ 26. 3.1819 19. 4.6776
HEIDÄN 27. 3.0085 95. 1.1087
TÄMÄ 28. 2.8971 74. 1.5197
AINA 29. 2.6495 171. 0.6478
SINÄ 30. 2.6371 54. 2.0678
JO 31. 2.5009 48. 2.3543
TÄSSÄ 32. 2.4638 114. 0.9467
VIIMEIN 33. 2.2409 863. 0.1370
SIINÄ 34. 2.1790 78. 1.4512
MYÖS 35. 2.1419 355. 0.3301
LAURI 36. 2.1295 - -
VELJEKSET 37. 2.1047 - -
KAIKKI 38. 2.0924 38. 2.6845
NIINKUIN 39. 2.0428 59. 1.9184
MIES 40. 2.0181 57. 1.9370
KERRAN 41. 1.9809 228. 0.5107
JOS 42. 1.9686 28. 3.0831
KOHDEN 43. 1.9190 294. 0.3924
TAASEN 44. 1.8819 9892. 0.0125
SILLOIN 45. 1.8324 86. 1.2270
HÄNTÄ 46. 1.7952 23. 3.7620
JUURI 47. 1.7581 83. 1.2581
SILLÄ 48. 1.7581 32. 2.8900
SIITÄ 49. 1.6962 46. 2.3730
KUITENKIN 50. 1.6838 511. 0.2305
MEITÄ 51. 1.6838 229. 0.5107
ALAS 52. 1.6714 429. 0.2741
YLÖS 53. 1.6714 582. 0.2055
JUKOLAN 54. 1.5847 - -
SITÄ 55. 1.5600 30. 2.9585
OIKEIN 56. 1.5352 230. 0.5107
OLE 57. 1.4733 27. 3.1765
KUN 58. 1.4609 22. 4.3724
TÄÄLLÄ 59. 1.4238 154. 0.7225
MIEHEN 60. 1.4114 146. 0.7474
KUINKA 61. 1.3990 63. 1.8436
MIKÄ 62. 1.3867 100. 1.0526
SITTEN 63. 1.3743 55. 1.9931
JONKA 64. 1.3619 37. 2.6845
PIAN 65. 1.3619 328. 0.3550
SIELLÄ 66. 1.3495 155. 0.7100
TAAS 67. 1.3495 205. 0.5606
HEITÄ 68. 1.3371 175. 0.6353
ULOS 69. 1.3247 196. 0.5855
EN 70. 1.2876 40. 2.6346
KAKSI 71. 1.2876 107. 0.9779
VAIKKA 72. 1.2876 88. 1.2083
ENNEN 73. 1.2752 231. 0.5045
POIS 74. 1.2752 129. 0.8533
TÄMÄN 75. 1.2752 172. 0.6478
TUOSSA 76. 1.2505 481. 0.2491
KAS 77. 1.2133 315. 0.3675
VASTAAN 78. 1.1762 81. 1.3017
TUOLLA 79. 1.1638 279. 0.4111
ME 80. 1.1390 75. 1.4575
ITSE 81. 1.1143 132. 0.8346
OLKOON 82. 1.1143 554. 0.2118
KOVIN 83. 1.0524 285. 0.4048
POIKA 84. 1.0524 1211. 0.0934
UKKO 85. 1.0400 10299. 0.0125
KANSSA 86. 1.0276 77. 1.4512
ILMAN 87. 1.0152 213. 0.5419
SEITSEMÄN 88. 1.0152 711. 0.1682
TUO 89. 1.0028 35. 2.7405
VOI 90. 1.0028 109. 0.9716
MEILLE 91. 0.9905 408. 0.2865
OLEN 92. 0.9905 31. 2.9336
NÄIN 93. 0.9781 257. 0.4422
TAI 94. 0.9781 56. 1.9744
KYLLÄ 95. 0.9162 62. 1.8498
IMPIVAARAN 96. 0.8790 - -
KOHTA 97. 0.8790 232. 0.5045
TULI 98. 0.8790 106. 0.9841
VELJET 99. 0.8790 - -
MIKSI 100. 0.8667 845. 0.1370
141. iso S28.1.2012 klo 20:59
MINUN 101. 0.8667 24. 3.6125
YKSI 102. 0.8667 201. 0.5668
TOINEN 103. 0.8543 126. 0.8720
MINUA 104. 0.8419 42. 2.4291
NO 105. 0.8419 66. 1.7377
TE 106. 0.8419 21. 4.4409
POJAT 107. 0.8295 - -
TAIVAAN 108. 0.8171 712. 0.1682
AIKA 109. 0.8048 324. 0.3550
ALLA 110. 0.8048 1705. 0.0623
JOSSA 111. 0.8048 136. 0.8159
SEISOI 112. 0.8048 575. 0.2055
SINUN 113. 0.8048 140. 0.7848
HÄNELLE 114. 0.7924 49. 2.3294
PÄIVÄ 115. 0.7924 459. 0.2616
SEKÄ 116. 0.7924 274. 0.4173
JOTKA 117. 0.7800 52. 2.0803
MEIDÄN 118. 0.7800 105. 0.9965
YMPÄRI 119. 0.7800 892. 0.1308
EIKÄ 120. 0.7676 111. 0.9592
TUOTA 121. 0.7676 121. 0.8907
HERRAN 122. 0.7552 694. 0.1682
TAKAISIN 123. 0.7552 128. 0.8658
VELJESTEN 124. 0.7552 - -
OLIVAT 125. 0.7429 50. 2.2858
VÄHÄN 126. 0.7305 190. 0.6042
AH 127. 0.7181 96. 1.0900
OVAT 128. 0.7181 104. 1.0152
ISTUI 129. 0.7057 801. 0.1433
PITKIN 130. 0.7057 727. 0.1619
SIIS 131. 0.7057 41. 2.5661
TUON 132. 0.7057 67. 1.6817
TÄSTÄ 133. 0.7057 373. 0.3114
JUMALAN 134. 0.6933 649. 0.1806
KAUAN 135. 0.6933 2475. 0.0436
SINUA 136. 0.6933 185. 0.6228
VASTEN 137. 0.6933 331. 0.3550
ÄLÄ 138. 0.6933 - -
NIINPÄ 139. 0.6686 499. 0.2367
YHTÄÄN 140. 0.6686 1239. 0.0934
NOIN 141. 0.6562 217. 0.5356
EIHÄN 142. 0.6438 1032. 0.1059
HEILLE 143. 0.6438 383. 0.2990
HIEMAN 144. 0.6438 1095. 0.0997
SENTÄHDEN 145. 0.6438 853. 0.1370
KOREASTI 146. 0.6314 - -
TÄNNE 147. 0.6314 195. 0.5917
JOSTA 148. 0.6190 261. 0.4360
JUMALA 149. 0.6190 421. 0.2803
MILLOIN 150. 0.6190 321. 0.3612
ÄKISTI 151. 0.6190 5000. 0.0249
HETKEN 152. 0.6067 945. 0.1183
JOTA 153. 0.6067 69. 1.6630
LAUSUI 154. 0.6067 203. 0.5606
SEISOIVAT 155. 0.6067 3773. 0.0311
ENÄÄN 156. 0.5819 - -
LUKKARI 157. 0.5819 - -
MUUT 158. 0.5819 591. 0.1993
OLLUT 159. 0.5819 39. 2.6595
SUURI 160. 0.5819 278. 0.4111
TALON 161. 0.5819 1225. 0.0934
VALLAN 162. 0.5819 219. 0.5356
ENEMMIN 163. 0.5695 - -
HERRA 164. 0.5695 13. 7.2188
HYVÄ 165. 0.5695 70. 1.6318
JUHANIN 166. 0.5695 - -
MAAILMAN 167. 0.5695 914. 0.1246
MEILLÄ 168. 0.5695 477. 0.2491
YLI 169. 0.5695 365. 0.3177
ASTI 170. 0.5571 344. 0.3363
KOKO 171. 0.5571 97. 1.0900
USEIN 172. 0.5571 658. 0.1806
ÄÄNELLÄ 173. 0.5571 245. 0.4796
LÄKSIVÄT 174. 0.5448 18106. 0.0062
MIESTÄ 175. 0.5448 176. 0.6353
MIKKO 176. 0.5448 - -
MÄKELÄ 177. 0.5448 - -
ONPA 178. 0.5448 1298. 0.0872
SILMÄT 179. 0.5448 542. 0.2180
TUOSTA 180. 0.5448 290. 0.3986
HEISTÄ 181. 0.5324 647. 0.1806
TÄLLÄ 182. 0.5324 145. 0.7536
ASTUI 183. 0.5200 226. 0.5170
KOHTAAN 184. 0.5200 165. 0.6664
LOPULTA 185. 0.5200 17699. 0.0062
OLEMME 186. 0.5076 186. 0.6166
RUPESI 187. 0.5076 356. 0.3301
SILMÄNSÄ 188. 0.5076 329. 0.3550
TAHDON 189. 0.5076 517. 0.2305
TÄHDEN 190. 0.5076 470. 0.2554
YHÄ 191. 0.5076 177. 0.6353
EMÄNTÄ 192. 0.4952 2789. 0.0374
ETTEI 193. 0.4952 548. 0.2118
KIINNI 194. 0.4952 2160. 0.0498
KÄY 195. 0.4952 837. 0.1370
LÄKSI 196. 0.4952 2944. 0.0374
SIIHEN 197. 0.4952 76. 1.4575
TEITÄ 198. 0.4952 82. 1.2893
ITSENSÄ 199. 0.4829 420. 0.2803
MEISTÄ 200. 0.4829 1490. 0.0747
142. iso S28.1.2012 klo 20:59
SANOI 208. 0.4705 8. 9.3364
D'ARTAGNAN - - 9. 9.0499
ATHOS - - 20. 4.6090
TEIDÄN 287. 0.3467 25. 3.5004
DE - - 29. 3.0582
MYLADY - - 33. 2.8526
OLISI 299. 0.3343 34. 2.7841
ROUVA - - 36. 2.7218
ARAMIS - - 44. 2.4166
HÄNET - - 45. 2.3730
PORTHOS - - 47. 2.3606
MINULLE 445. 0.2352 51. 2.1364
MITÄÄN 357. 0.2848 53. 2.0678
HUUDAHTI - - 60. 1.8748
KYSYI 1648. 0.0743 61. 1.8685
VASTASI 405. 0.2600 64. 1.8187
KARDINAALI - - 65. 1.7876
OLETTE 842. 0.1362 68. 1.6692
BONACIEUX - - 71. 1.5945
TEILLE 265. 0.3838 72. 1.5758
AIVAN 558. 0.1857 73. 1.5322
NE 201. 0.4829 79. 1.4263
NUORI 584. 0.1857 80. 1.3329
OLLA 359. 0.2848 84. 1.2581
TRÉVILLE - - 85. 1.2457
KARDINAALIN - - 87. 1.2083
FELTON - - 89. 1.1834
NAINEN 1422. 0.0867 90. 1.1647
D'ARTAGNAN'IN - - 91. 1.1585
ETT'EI - - 92. 1.1523
KUNINGAS 12277. 0.0124 93. 1.1273
MINULLA 583. 0.1857 94. 1.1273
VUOKSI 21450. 0.0124 98. 1.0588
JATKOI 9915. 0.0124 99. 1.0526
KELLO 2519. 0.0495 101. 1.0401
KOLME 205. 0.4705 102. 1.0339
LA - - 103. 1.0215
NUO 3775. 0.0371 108. 0.9779
KERTAA 816. 0.1362 110. 0.9654
HERRAT 2398. 0.0495 112. 0.9467
PLANCHET - - 113. 0.9467
OLEVAN 3804. 0.0371 115. 0.9280
ENÄÄ 520. 0.1981 116. 0.9156
NELJÄ 835. 0.1362 118. 0.9031
HYVIN 214. 0.4457 119. 0.8969
MENI 272. 0.3714 120. 0.8969
HÄNELLÄ 256. 0.3838 122. 0.8844
OH 2096. 0.0619 123. 0.8844
MINUT - - 124. 0.8782
SANGEN 4080. 0.0371 125. 0.8720
SAANUT 398. 0.2600 127. 0.8658
VOINUT 2299. 0.0619 130. 0.8533
LORD - - 131. 0.8471
KOSKAAN 221. 0.4333 133. 0.8222
SISÄÄN 225. 0.4333 134. 0.8222
ATHOKSEN - - 135. 0.8159
TIETÄÄ 1788. 0.0743 137. 0.8097
MISSÄ 215. 0.4457 138. 0.7972
OLET 358. 0.2848 139. 0.7910
TULEE 234. 0.4209 141. 0.7848
ERÄS 318. 0.3095 142. 0.7661
LUOKSE 2639. 0.0495 143. 0.7661
KUNINKAAN 2577. 0.0495 144. 0.7599
SAADA 4055. 0.0371 147. 0.7474
HERTTUA - - 148. 0.7412
EIVÄT 255. 0.3838 149. 0.7350
KUNINGATAR - - 150. 0.7350
TEIDÄT 865. 0.1362 151. 0.7350
ERÄÄN 727. 0.1486 152. 0.7287
TUNSI 1119. 0.1114 153. 0.7225
JOITA 349. 0.2848 156. 0.7038
NÄKI 310. 0.3219 157. 0.7038
WINTER - - 158. 0.7038
MYLADY'N - - 159. 0.6851
HYVÄT 1156. 0.0990 160. 0.6789
MUUTA 259. 0.3838 161. 0.6789
MUUTOIN 209. 0.4581 162. 0.6727
MYÖSKIN 474. 0.2229 163. 0.6727
PERÄSTÄ 1719. 0.0743 164. 0.6727
TOTTA 1793. 0.0743 166. 0.6664
ENEMMÄN 1550. 0.0743 167. 0.6602
KIRJEEN - - 168. 0.6540
PALJON 202. 0.4829 169. 0.6540
YSTÄVÄNI - - 170. 0.6540
KUMMINKIN 1640. 0.0743 173. 0.6415
NIITÄ 475. 0.2229 174. 0.6415
ETTE 1875. 0.0619 178. 0.6291
KAUTTA 230. 0.4209 179. 0.6291
MUKAAN 336. 0.2971 180. 0.6291
SAATTOI 241. 0.4086 181. 0.6291
TÄYTYY 425. 0.2476 182. 0.6291
YHTÄ 213. 0.4581 183. 0.6291
HETI 2400. 0.0495 184. 0.6228
AIKAAN 1858. 0.0619 187. 0.6104
SANOA 704. 0.1610 188. 0.6104
MINKÄ 14263. 0.0124 189. 0.6042
TEILLÄ 2227. 0.0619 191. 0.5979
NAISEN 3743. 0.0371 192. 0.5917
NÄYTTI 840. 0.1362 193. 0.5917
TRÉVILLE'N - - 194. 0.5917
OTTI 541. 0.1981 197. 0.5792
VAI 253. 0.3962 198. 0.5730
BUCKINGHAM - - 199. 0.5668
KIINI 11279. 0.0124 200. 0.5668
143. 28.1.2012 klo 21:32
Ossi Suikki on........



---ootti
144. 28.1.2012 klo 23:02
idi
145. iso S29.1.2012 klo 14:44
Mistä tietää että puskassa on nauta? Sieltä ammutaan.
146. iso S31.1.2012 klo 17:00
Tavallaan Gutenbergin kaltainen sivusto on Runeberg, eli sisältönä on vanhaa kirjatekstiä. Monen sanan haun yhteydessä tulee linkki Runebergin sisältämään Pieneen Tietosanakirjaan. Aiemmin se on ollut luullakseni vain sivukohtaisina pdf-tiedostoina, mutta nykyään sen saa ladatuksi neljässä osassa tekstimuodossa. Tosin se on jotain xml-muotoista, mutta nokkelammat osannevat muuttaa sen selkokieliseksi ilman teksturin korvaa-temppuja (niitä tarvitaan aika monta). Palaset löytyvät näistä osoitteista:

runeberg.org/pieni/1/
runeberg.org/pieni/2/
runeberg.org/pieni/3/
runeberg.org/pieni/4/

ja kunkin alareunassa on download-linkki.

Tästä voi vertailla tietotekstin tunnuslukuja edellisiin romaaneihin:

1080894 sanaa
232740 erilaista
4.64 kertaa sanat keskimäärin
7.8668 kaikkien sanojen keskipituus
10.9688 erilaisten sanojen keskipituus

Johtopäätös: hakusanat ovat keskimäärin pitempiä kuin selitysten sanat.

Seuraavassa viestissä lista niistä sanoista jotka esiintyvät vähintään 300 kertaa. Sanan jälkeen on esiintymiskertojen määrä. Joukossa on eräitä lyhenteitä ja sijapäätteitä. Esimerkiksi teksti "123:lla" tuottaa "sanan" lla.
147. iso S31.1.2012 klo 17:00
ja 41543, on 17677, ks 8993, tai 7328, ovat 4797, joka 4661, as 3814, sekä 3791, sen 3766, km 3714, oli 3532, jonka 3284, lat 3244, ransk 3058, sta 2880, Suomen 2829, että 2688, kreik 2604, saks 2596, myös 2573, se 2440, jossa 1987, ruots 1982, käytetään 1962, kaup 1944, jotka 1897, ei 1891, mutta 1853, engl 1699, vrt 1595, teoksia 1531, mukaan 1473, esim 1429, kuin 1357, jota 1303, kun 1280, suom 1267, eri 1207, per 1200, hänen 1183, milj 1175, pitkä 1165, vastaan 1122, nyk 1086, ne 1078, sitä 1065, vain 1059, jos 1047, it 1034, julk 1030, de 1001, jälkeen 998, Suomessa 991, oleva 986, kanssa 968, kirjailija 921, siitä 916, Kr 907, osa 897, ssa 888, jolla 882, tav 878, ole 870, niin 868, jolloin 858, sai 853, aikana 852, varten 845, kuuluva 840, pääkaup 838, luvulla 812, prof 807, suurin 801, joiden 800, niiden 798, tuli 788, ven 788, Ruotsin 777, voi 776, voidaan 776, joko 771, valtion 740, kautta 729, suuri 723, sanotaan 721, yli 721, II 718, us 715, cm 710, ensim 710, kuva 709, koko 708, varrella 708, sitten 705, von 688, rannalla 686, johon 668, maan 662, hän 656, tämän 655, ia 644, nimitys 643, ennen 634, kuuluu 633, poika 630, kaksi 628, välillä 628, olivat 622, siihen 615, käytetty 612, vars 610, joita 598, kunta 598, läänissä 588, avulla 586, Ranskan 584, joista 575, kuten 572, saadaan 570, usein 570, ollut 563, kaikki 555, Saksan 550, yleensä 549, joissa 540, Englannin 538, siten 534, luvun 528, mk 525, Turun 525, tulee 523, een 521, jo 519, ksi 518, varsinkin 517, laskee 516, Venäjän 515, josta 512, der 509, kem 503, vielä 502, eli 500, toinen 500, hyvin 491, tämä 482, meillä 481, taidemaalari 476, Helsingin 475, lla 467, alk 459, tansk 459, poliitikko 458, siinä 456, missä 455, ilman 450, laki 449, nimi 446, lähellä 445, Kaarle 443, niitä 442, syntyy 440, yleinen 434, kuningas 431, olla 427, runoilija 427, III 426, olevan 424, kahden 421, näiden 421, Yhdysvalloissa 420, osaa 419, amer 416, kat 415, kg 409, vuoksi 404, johtaja 401, valmistetaan 398, Helsingissä 396, saa 395, joki 391, ta 389, muodostaa 387, luvulta 386, saari 386, osaksi 384, niistä 383, Ruotsissa 379, pieni 377, etupäässä 374, la 373, mikä 372, paitsi 372, suuren 370, samalla 369, kirkon 368, asetus 364, ent 363, pääteos 361, tärkeimmät 360, oik 356, mus 355, yliopiston 354, useita 350, Karl 343, joutui 340, perusti 340, hallitsi 338, mm 338, sisältää 338, pohj 332, valtiomies 332, historia 331, toisen 331, toimi 330, eivät 329, joilla 328, välissä 328, esp 327, siellä 327, kenraali 326, oikeus 324, saanut 323, nämä 322, roomal 322, Viipurin 321, teki 320, tavallisesti 318, yliopisto 315, itse 312, rautatieasema 311, kuuluvat 310, vasta 309, esiintyy 306, myöhemmin 306, kreivi 305, veden 305, kieli 303, joskus 301, muita 301, norj 301, tarkoituksena 300
148. iso S14.2.2012 klo 16:57
Jos joku haluaa imuroida ratkonnan avuksi näyttelijöiden sun muiden julkkujen nimiä, täältä löytyy listoja, sivu per nimen alkukirjain. Esimerkiksi
_http://www.celebheights.com/s/A.html
listaa ne joiden sukunimi alkaa A:lla ja isoa kirjainta vaihtamalla saa muut. Joku on kerännyt tietoa julkkisten pituudesta. Tähän säikeeseen istuvasti vähän tilastoa:

5330 julkkua, yhteispituus 9303,67 metriä
Keskipituus 174,55 cm
Yleisin pituus 173 cm (315 kpl)
Pisin 272 cm (Robert Wadlow)
Lyhin 81 cm (Verne Troyer)
81 erilaista pituutta (vain välillä 150 - 199 kaikki pituudet)
Huom: pituudet olivat tuumina; vain pieni osa ilmoitettu neljännestuuman tarkkuudella => ei yhtään 200-senttistä!)

Pituuksien jakauma (pituus cm, lukumäärä)
272: 1
236: 1
232: 1
230: 1
229: 1
226: 1
218: 1
217: 2
216: 5
213: 6
211: 1
208: 2
207: 1
206: 3
204: 1
203: 4
202: 3
201: 12
199: 7
198: 25
197: 4
196: 40
195: 6
194: 20
193: 92
192: 36
191: 133
190: 5
189: 71
188: 200
187: 87
186: 16
185: 241
184: 80
183: 249
182: 132
181: 24
180: 235
179: 132
178: 292
177: 155
176: 23
175: 305
174: 144
173: 315
172: 30
171: 146
170: 300
169: 125
168: 283
167: 16
166: 103
165: 261
164: 106
163: 219
162: 11
161: 59
160: 152
159: 51
158: 3
157: 153
156: 40
155: 67
154: 16
153: 4
152: 33
151: 8
150: 9
147: 3
146: 1
145: 3
140: 1
135: 1
126: 1
119: 1
117: 1
114: 1
112: 1
109: 1
107: 3
81: 1
149. Jukkis16.2.2012 klo 16:33
Päivitin tilastot. Uutuutena vuosikohtaiset top100-listat vuosille 2003 - 2012.

_http://drzf55.angelfire.com/listoja.html
150. iso S16.2.2012 klo 19:26
Ilahduttavan monipuolisesti Jukkis on meitä listannut. Oma panokseni näkyy olevan laskusuunnassa, mutta kirjoitettujen merkkien kokonaismäärässä vielä pärjään. Aleksis Kivi on minuun verrattuna amatööri: Seitsemässä veljeksessä on vähän yli 500000 merkkiä, joten minun pari miljoonaani riittäisivät 28 veljekseen! No, iso osa on tullut leikkaa/liimaa -systeemillä mm. parin säikeen yhteenvetojen ylläpidosta. Kivi joutui kirjoittamaan joka merkin Juan Valdez -menetelmällä eli yksitellen käsin.
151. Eki16.2.2012 klo 19:34
Kiitos, jänniä nuo uudet(kin).
152. Wexi16.2.2012 klo 19:41
iso S. Eikös sulla ole ihan parikymmentä miljoonaa?
Niillähän pusaisi osapuilleen puolen tusinaa englanninkielisiä raamattuja.
Itsellä vaatimaton määrä, hyvä kun pääsee edes Hesekielin kirjaan.
153. Ari16.2.2012 klo 19:53
Oma sijoitukseni näyttää olevan, niin kuin olen itsekin huomannut, laskusuuntainen, joka ei välttämättä ole huono asia.

Jos tilastonikkareilla on mielenkiintoa/aikaa niin sellainen tilasto voitaisiin julkaista kuin "Aikaa viimeisimmästä viestistä, top 100".
154. Jukkis16.2.2012 klo 20:20
"Aikaa viimeisimmästä viestistä, top 100". Siis minkälaisella suorituksella tässä pääsisi ykköseksi?
155. Ari16.2.2012 klo 20:23
Pisimmällä ajalla viimeisimmästä viestistä.

Itsekin huomasin että jäi epäselväksi tuo...
156. Jukkis16.2.2012 klo 21:16
No se kisan voitti nimimerkki MInna, jonka ainoa viesti on myös hänen viimeisimpänsä ja kirjoitettu 10.03.2003. Tokaksi tuli kahviporukka, 11.03.2003.

Ei ehkä kaikkein kiinnostavinta listaa tästä tulisi.
157. Ari16.2.2012 klo 21:27
Ok. Kiitos. Jotenin pelkäsinkin että noin se menisi...
158. Ari16.2.2012 klo 21:30
No miten olisi sellainen lista "top 100 pisimmän tauon pitänyt", vielä viime-ja tänävuonna kirjoittaneet nimimerkit?
159. iso S17.2.2012 klo 17:00
Myönnetään, hahmotin suuruusluokan väärin. Parikymmentä miljoonaa merkkiä on niin paljon että ilman leikepöydän apua se ei tuntuisi uskottavalta. Karkean arvion mukaan se tarkoittaisi yli 100 vuorokauden naputtelua, kun en kuitenkaan mikään aavemaisen nopea kirjoittaja ole.
160. Jukkis12.10.2012 klo 09:48
Pitkästä aikaa päivitys:
drzf55.angelfire.com/listoja.html
161. Maikki12.10.2012 klo 23:26
Lämmin kiitos tilastonikkarille! Näitä on aina kiva tarkastella.

- Ketjukirjoituskuningatar -
162. Jukkis20.10.2013 klo 16:48
Oli sen verran luppoaikaa että päivitin tilaston:
drzf55.angelfire.com/listoja.html
163. Wexi22.10.2013 klo 01:51
Nuo tilastot ovat, paitsi jossain määrin mielenkiintoisia, myös mainio apu kahlaukseen määrätyillä ketjuilla.

Ps. Muistan joskus luvanneeni "pyhästi" itselleni, että kun kymppitonni menee rikki, tämä hassutus saa luvan loppua. Vähän on lipsunut.
164. iso S22.10.2013 klo 22:20
Wexi, ei vielä hätää, ethän ole Kaikki viestit -listalla edes kymppikärjessä. Olet se "lähin suremaan jäänyt". Suorituksesi ei ole edes 0.2 Ekiä, joten lipsumisen varaa on. Vaivaisella 800 lisäviestillä nouset ohitseni seitsemänneksi. Tällä hetkellä eroa on hiukan vähemmän, mutta minäkin lipsun jonkin verran. Kuten juuri nyt.
165. Wexi22.10.2013 klo 22:21
Vai niin! Tarmokkaasti iskentään!
166. Jukkis15.10.2014 klo 18:18
Koska pyydettiin, päivitin tilastot:
drzf55.angelfire.com/listoja.html
167. iso S15.10.2014 klo 18:55
Kiitos, Jukkis! Noita on mielenkiintoista selailla, varsinkin jos sattuu olemaan tilastohullu. En toki minä, tilasto-.

Onnea, taisteluparini Wexi! Menit kokonaistilanteessa reilusti ja reippaasti ohitseni. Pienellä lisäponnistelulla viides sija on saavutettavissa. Siitä nouseminen vaatii jo hihojen käärimistä. Minulla riittää tekemistä kymppipaikan puolustamisessakin. Pari vakavasti otettavaa haastajaa kärkkyy armoniskuetäisyydellä pääsyä "ristikko-Litiksi".

Ketjuviesteissä olen menettänyt otteeni ja valunut "viimeiselle semifinaalisijalle", kuudestoista. Ei-ketjuissa pistesijani on vielä melko pitkään turvattu, vaikka laiskistuisin entisestään. Sitähän me kaikki toivomme - tilaa tuoreille voimille.
168. Ari25.3.2015 klo 10:04
Tuolta Jukkiksen listasivuilta ponnahti ikkuna jossa väitettiin Low disk space! Repair...
Varmasti ei ole liian täysi levy tässä koneessa! Ja yhtä varmasti tuo on jokin haitake.

Vai mitä, Jukkis?
169. Jukkis27.3.2015 klo 08:52
Asenna selaimeen Adblock niin ei tarvi noita katella. Vaihteeksi kokeilin sallia omassa selaimessa mainokset ja hirveäähän se on tuonne tilastosivulle sitten mennä. Ilmainen paikka kun on, kustantaa itsensä mainoksilla. Pitäis viitsiä etsiä uusi paikka tuolle.
170. Ari27.3.2015 klo 09:36
Asensin Adblock (ABP) lisäosan mutta ei se mitään vaikuttanut näkymään. Edelleen tulevat nuo kaikki mainokset.
Sammutin jopa Firefoxin asennuksen jälkeen joten sen piti kyllä tulla käyttöön. Kuvakekin näkyy oik. yläkulmassa.
171. Ari27.3.2015 klo 09:41
Oletko tutustunut suntuubi.com:iin? Siellä ei käsittääkseni ole mainoksia, ainakaan minun sivuillani.
172. Ari27.3.2015 klo 09:50
Menin uudestaan ja nyt ei enää tullutkaan mainoksia!

Edelleen kuitenkin kannustaisin tutustumaan suntuubiin.
173. Jukkis26.4.2015 klo 10:14
Suntuubiin tutustuin, kelvottomaksi totesin, FTP-tiedostonsirtomahdollisuus puuttuu. Ja muutenkaan en tykännyt.

Uusi paikka löytyi Saksasta, laitan osoitteen erikseen seuraavaan viestiin. Ei mainoksia. Potentiaalinen ongelma on se, että ilmaisen version datasiirron kk-raja on vain 5 gigatavua. Seurailen, uhkaako täyttyä ja jos, niin sitten mietin että joko
a) maksan 2.79 euroa kuussa
b) etsin toisen paikan

Uudessa paikassa on ilmaisversiossa käytettävissä myös PHP ja Perl ja MySQL, maksullisessa vielä Ruby ja Python. Nämä avaa ihan uusia mahdollisuuksia. Pitäis vaan jostain saada aikaa.
174. Jukkis26.4.2015 klo 10:15
Tilastot päivitetty uuteen osoitteeseen:

_http://drzf55.atwebpages.com/listoja.html
175. Jukkis26.4.2015 klo 10:40
Uusi paikka vaikuttaa tällä hetkellä ihan paskalta, kun valikoi satunnaisia sivuja väittäen niitä toimimattomaksi, vaikka kaikissa muissa paikoissa ne toimii. Saksa on paska maa.

Päivitetyt tilastot vanhassa osoitteessa

_http://drzf55.angelfire.com/listoja.html

Mainoksia tulee, asentakaa Adblock.
176. Jukkis26.4.2015 klo 15:42
Selvisi tuo tilastojen uuden paikan toimimattomuuden syy. Ja sepäs onkin tyhmintä, mitä pitkään aikaan on tullut vastaan.

Nimittäin syy siihen, että osa tilastosivuista aiheutti virheilmoituksen "The requested page cannot be displayed" on se, että vuonna 2007 täällä esiintyivät nimimerkit "viagra" ja "viagra cialis". Tuon saksalaisen web-hotellin systeemi kieltäytyy näyttämästä www-sivuja, joilla esiintyy sana "viagra".

Paikan säännöissä sanotaan että kiellettyä on mm.

"Content that provides, sells, or offers to sell the following: controlled substances, illegal drugs and drug contraband, alcohol, weapons, pirated materials, pornography or sexual products,..."

Ja ovat sitten ilmeisesti laittaneet systeemiinsä kiellettyjen sanojen listan niin, että sivu, jolla joku sen listan sana esiintyy, jätetään vaan tylysti näyttämättä ilman että mistään käy ilmi syytä.

Saksa todellakin on paska maa.

Siis tilastot ei tuonne 26.4.2015 klo 10:15 ilmoitettuun paikkaan siirry.
177. Ari7.5.2015 klo 12:12
Nyt kuule, Jukkis löysin sivuston joka on ilmainen ja on toimiva (testasin) php-tuki, myös Java.
_http://www.000webhost.com/free-php-hosting

Mielestäni helpompi käyttää kuin angelfire jota myös kokeilin.
178. Ari7.5.2015 klo 12:19
Niin, no mainoksilta ei kai voi tuollakaan voi kai täysin välttyä... Mutta ainakaan nyt en ole omalla sivullani nähnyt kuin aluksi pomppasi yksi mainos mutta sen sai klikattua pois.
179. Ari7.5.2015 klo 22:18
Ei siellä ehkä olekaan mainoksia. Tuo ensimmäinen oli mainostus päivitykseen maksulliseen versioon (siitä oli myös maininta sähköpostissa tervetuloviestissä) , mutta nyt olen käynyt muutaman kerran sivuillani eikä siellä näy mainoksia.
180. Ari7.9.2015 klo 20:52
Enää en tuota 000webhost.com sivustoa Jukkiksen tilastolle suosittelekaan. Se nimittäin on nyt muuttunut sellaiseksi että ainakaan ilmaiskäyttäjä ei voi php-koodilla lukea muita nettisivuja ja siten tehdä niistä tilastoja automaattisesti.
181. Jukkis22.12.2015 klo 15:39
Tilastopäivitys:
_http://drzf55.angelfire.com/listoja.html

Edelleen sama paikka, ei oikein parempaa ilmaista löydy. Asenna Adblock, jos mainokset haittaa.

Ei taida miljoona viestiä tulla nykyaktiivisuudella täyteen vielä ensi vuonna.
182. iso S22.12.2015 klo 20:24
No pitää pinnistää edes yhden viestin verran lähemmäs. Initiaaliparien (säie 1017.) innoittamana tutkin mitkä nimien alkukirjaimet ovat yleisimpiä. Aineistossa oli 85705 nimeä (sellaisia jotka käyttävät yleensä pelkkää etu- ja sukunimeä), kotimaisia ja ulkomaisia. Erilaisia yhdistelmiä löytyi 768. Tässä 200 yleisintä:

1. AS: 804
2. JS: 803
3. MS: 761
4. AK: 669
5. SS: 669
6. MK: 652
7. AM: 632
8. JH: 624
9. MM: 619
10. JL: 612
11. JK: 596
12. ML: 592
13. RS: 576
14. MH: 569
15. JM: 567
16. AH: 563
17. JR: 536
18. AL: 521
19. AB: 501
20. KK: 494
21. TS: 492
22. AR: 485
23. AP: 484
24. MR: 481
25. AA: 479
26. SK: 476
27. ES: 468
28. TK: 466
29. JP: 445
30. PS: 440
31. SM: 439
32. SH: 435
33. MA: 432
34. EK: 430
35. RM: 428
36. JB: 426
37. MP: 426
38. KS: 425
39. RH: 421
40. EH: 419
41. RK: 405
42. TH: 400
43. AT: 397
44. JA: 394
45. MB: 394
46. SB: 392
47. RB: 384
48. JT: 382
49. SL: 377
50. SP: 366
51. RR: 364
52. MT: 357
53. RL: 357
54. JC: 354
55. RP: 351
56. HS: 349
57. PK: 348
58. TM: 348
59. LS: 347
60. TL: 345
61. HH: 338
62. SR: 335
63. KH: 329
64. MN: 329
65. LL: 328
66. TT: 327
67. SA: 322
68. EM: 320
69. PM: 317
70. DS: 316
71. JG: 316
72. HK: 314
73. LH: 314
74. AG: 313
75. KM: 313
76. MC: 313
77. EL: 312
78. AN: 311
79. PH: 311
80. AC: 308
81. EP: 306
82. PR: 306
83. JN: 305
84. RC: 304
85. CS: 298
86. ER: 296
87. EB: 295
88. LK: 293
89. RA: 292
90. LB: 286
91. DM: 285
92. KL: 285
93. LM: 284
94. ST: 284
95. TR: 282
96. PL: 279
97. TP: 279
98. SC: 276
99. JD: 273
100. BS: 269
101. CB: 265
102. DB: 264
103. JW: 263
104. EA: 254
105. MG: 254
106. MW: 254
107. JV: 250
108. AV: 249
109. AD: 248
110. GS: 248
111. RG: 248
112. CC: 245
113. KR: 245
114. CM: 243
115. PP: 243
116. DC: 240
117. MD: 238
118. TB: 237
119. HL: 235
120. KA: 234
121. SW: 231
122. AJ: 230
123. RT: 230
124. BB: 226
125. IS: 223
126. PA: 223
127. AW: 222
128. NS: 222
129. LP: 220
130. RW: 220
131. TA: 220
132. LR: 219
133. ET: 215
134. JF: 215
135. JJ: 215
136. PB: 214
137. NB: 212
138. IK: 211
139. PN: 210
140. GM: 204
141. HM: 204
142. KP: 204
143. KB: 203
144. SN: 203
145. KT: 202
146. DH: 201
147. MF: 201
148. JE: 200
149. AF: 199
150. MV: 197
151. HR: 196
152. SG: 196
153. DR: 195
154. MJ: 195
155. EC: 194
156. KN: 194
157. LA: 194
158. DL: 193
159. SJ: 192
160. DW: 191
161. NM: 191
162. CH: 189
163. RD: 187
164. BH: 185
165. DD: 185
166. EV: 185
167. MO: 185
168. PT: 185
169. RF: 183
170. EW: 182
171. LT: 182
172. VS: 182
173. HT: 180
174. CR: 179
175. TN: 179
176. EG: 178
177. GB: 175
178. LC: 175
179. BM: 173
180. DG: 173
181. LG: 172
182. GG: 170
183. JO: 170
184. ME: 170
185. OK: 170
186. CL: 169
187. SF: 169
188. DA: 167
189. HA: 167
190. PC: 167
191. DK: 166
192. HB: 166
193. EN: 165
194. SD: 165
195. AE: 163
196. RN: 162
197. HP: 161
198. IH: 161
199. RJ: 161
200. VK: 161
183. Jukkis1.5.2016 klo 15:39
Tilastojen päivitys sen kunniaksi, että mainittu HS-säikeessä:
_http://drzf55.angelfire.com/listoja.html

Laita Adblock jos mainos häiritsee.
184. iso S8.10.2016 klo 17:03
Tätä ei Adblock estä: mainostan Jukkiksen tilastoja, joiden linkki on edellisessä viestissä. Niitä hyödyntäen saattaisi löytyä monenlaista mielenkiintoista louhittavaa, jos Ristikkoakatemian ja yliopistojen yhteistyö saisi tuulta purjeisiin. On väitöskirjoja tehty vähäisemmistäkin asioista. Mieleen muistuvat mm. Kautokeinon alueen murteiden äänteiden kesto ja itikan polvinivelen rakenne, jotka aikoinaan mainittiin samassa Hesarissa.

Excelillä nimimerkkien saavutuksia tutkaillessa erityistä harmia aiheuttavat muutamat erikoismerkkejä sisältävät nikit. Esimerkiksi kyssäri (?) on Excelin hakufunktiossa jokerimerkki ja valitsee minkä tahansa nimimerkin joka sattuu ensimmäisenä tulemaan vastaan. Myös merkeillä "-", +" ja "=" alkavat nimimerkit vaativat lisävaivaa, koska Excel yrittää tulkita ne kaavoiksi jos ei älyä formatoida tekstiksi.

Tilastossa tiedot ovat muotoa N: V/S
missä N on nimimerkki, V on viestien määrä ja S on säikeiden määrä. Näiden erottelu mekaanisesti kolmeen sarakkeeseen menee pieleen, jos nimimerkissä on käytetty kaksoispistettä. Voin kertoa että on.

Isoja ja pieniä kirjaimia on käytetty vaihtelevasti vahingossa tai tahallaan. Löytyy esimerkiksi uusi, UUsi, Uusi, uusi ja UUSI. Näitä kohdellaan tilastossa eri nimimerkkeinä. Eihän tilastoija voikaan tietä, onko kyseessä sama vai eri henkilö. Excelin Phaku-funktio (eli Vlookup) kuitenkin näkee ne samana, mikä haittaa harrastusta. Lukemat menevät helposti väärälle nikille.

Vaikuttaa lisäksi siltä, että tilastossa on jotain hämminkiä. Esimerkiksi tilastossa "kirjoittajat järjestyksessä kirjoitettujen viestien määrän mukaan", tilastointipäivä 30.9.2016, jotkut nikit ovat sarakkeessa "kaikki viestit" kahdesti. Esimerkiksi kyssäri (?) löytyy sijoilta 102 ja 4734, [Hakro] sijoilta 142 ja 6224.

Siitä huolimatta tein omaa uteliaisuuttani tyydyttääkseni muutamia tutkailuja juuri tuon tilaston pohjalta. Otin mukaan ne nimimerkit, jotka ovat sadan eniten viestejä kirjoittaneen joukossa jossakin sarakkeessa (Yhteensä, Ketjuviestit, Ei-ketjuviestit). Näin rajaamalla listalle tuli 149 nimeä. Jos ei kiinnosta, hypätkää seuraavan viestin yli.
185. iso S8.10.2016 klo 17:05
Vain ristikkopuolella: tapio, Pähkinänsärkijä, katti, ep, apua, Rampe, uusi, kaplas, Viljami, Rapu, aawee, aloittelijatar, POH, Virkku ja Anneli

Vain ketjupuolella: Misu-Iita, Marita ja C.Anis

Vahvimmin ketjupuolella (% viesteistä), mutta myös ristikkopuolella: vh (99,96), Rakel L (99,95), juhani (99,81), Jukka (99,68), Sepeteus (99,44), upi (99,25), anni (99,2), la (98,89), lk (98,77) ja Korppi (98,75)

Vahvimmin ristikkopuolella (% viesteistä), mutta myös ketjupuolella: toippa (99,93), Tamara (99,91), Juho (99,84), Masa I (99,82), Antti Viitamäki (99,79), HT (99,77), Seitenvitonen (99,6), kp (99,59), kaart (99,58) ja Henry Haapalainen (99,55)

Tasaisimmin molemmilla puolilla (heitto %-yksikköä): - (0,48), EJlo (1,28), marjaana (3,3), Owlie (3,31), Hui_hai (3,77), Matti (4,48), Tuomas L. (5,67), Aurinkosade (6,77), Juha N (6,82), 0 (8,85)

Top 100:ssa kaikissa kategorioissa (ketjut, ei-ketjut, yhteensä): Eki, Maikki, RA, Arskis, matts, Wexi, PP, Juhani Heino, Hakro, iso S, Matias-Myyrä, Libero, Jaska, Hemuli, Arska, Marco Poloinen, Matti, Ari, tuffa Porist, Tsööts, Jukkis, marjuko, mor, ?, O, pelaaja, Aksu, T.Avis, 0, Pena, ake, TJV, otv-a, Tuomas L., EJlo, Olavi Kivalo, Owlie, jupejus, Bella, Potter, Mäkis-Tartti, Seppo, Antti, Juha N, marjaana, -, Jyrki, Sakke ja Hui_hai.

Tasapelin sattuessa kaikissa listoissa järjestys on kaikkien lähetettyjen viestien mukaan (enemmän lähettänyt ensin).
186. Jukkis8.10.2016 klo 17:21
Ei ole hämminkiä. Sijalla 102 on "?" ja sijalla 4734 on " ?". Ja sitten on "[Hakro]" ja " [Hakro]", ovat siis eri nimimerkit. Nimimerkin ekana merkkinä oleva välilyönti ei tulostu www-sivulle, koska nimimerkki on aina lihavointi-HTML-tagien sisällä. Keksin tätä kirjoittaessa, miten tuon saa korjattua. Yritän muistaa seuraavan päivityksen yhteydessä. Enpä ollut huomannut tästä, hyvä kun huomasit.
187. Jukkis8.10.2016 klo 17:23
Ja tuossakin nyt "[Hakro]" ainakin minulla jakaantui kahdelle riville. Ehkä ei kaikilla.
188. Jukkis9.10.2016 klo 11:08
Lisäsin ohjelmakoodiin kolme riviä ja tulostin uudelleen tuon hämminkitilaston. Nyt erottuu välilyönnillä alkavat nimimerkit. Se, miksi muissa listauksissa nuo välilyönnillä alkavat näkyy oikein ilman koodin korjaustakin, on hiukka hämärää.
189. Juha N29.10.2016 klo 18:18
Jukkis, miksi tämä yllä mainittu linkki

_http://drzf55.angelfire.com/listoja.html

ei avaudu? Ainakaan iPadilla ja iPhonella ei avautunut. "Safari ei voi avata sivua, koska palvelinta ei löydy."
190. Jukkis29.10.2016 klo 19:12
Enpä osaa sanoa. Näköjään moni muukin Lycosin palvelu on samassa tilassa. Firma mennyt nurin? Joutunut palvelunestohyökkäyksen kohteeksi? Unohtanut maksaa domainnimen vuosilaskun? Joku tilapäinen häiriö? Ei voi kuin seurailla, mitä tapahtuu.

Pitääköhän tässä nyt ruveta uutta paikkaa tilastoille hakemaan. Ei millään viittis.
191. iso S30.10.2016 klo 11:27
Sama vika yhdistelmällä Windows 10 ja Firefox. Jos ei tilanne viikossa laukea niin sitten pretty please ja sokeria päälle. Ikävää olisi jäädä tilastoja ikävöimään.

Kauhea ajatus: jospa ne sinun lisäämäsi kolme riviä olivat pitkän päälle liikaa ja sammuttivat Enkelitulen! :-(
192. ++juh30.10.2016 klo 14:24
Is It Down Right Now?

 http://iidrn.com/angelfire.com.html
193. Ari30.10.2016 klo 17:59
Sopiva hetki mainostaa toimivalla php-tuella varustettua sivustoa?
­http://api.hostinger.fi/redir/8784074
194. Jukkis30.10.2016 klo 20:59
Vaikuttaa aika asialliselta. Ehtiessä koekäytän.
195. Ari30.10.2016 klo 21:41
xyz-päätteiset sivut nyt tarjouksessa 0.99eur/ eka vuosi.
196. Ari11.1.2017 klo 13:07
On havaittu että uudistunut sivusto on aiheuttanut monen laitteen kanssa hitautta ja siksi tällainen pika-analyysi:

Edellisessä sivustossa sivun kuvat ym tiedot ilman teksti html-osuutta aiheuttivat latausta vaihtelevasti, riippuen sivun korkeudesta kun ladattiin ruutupohjan kuvia jotka olivat yhden ruudun kokoisia, n. 100kb:stä ylöspäin. Ruutupohja vei n. 50kb/näytön korkeus.

Nykyinen sivusto aiheuttaa latauskuormaa 854kb (enimmäkseen skriptejä)+html-osuus, joka nyt n. 55% entisestä.

Eli nykyisellään: mitä pitempi säie, sen kevyempi se on ladata, verrattuna aiempaan.


Tässä nyt näin pikainen analyysi äkkiseltään, virhemarginaali on. :)
197. Funny11.1.2017 klo 14:02
Firefoxin NoScript päällä sivut aukeavat ns. silmänräpäyksessä. Silloin ei kuitenkaan voi kirjoittaa kommentteja. Kun sitten klikkasin "salli sanaristikot.net", sivun uudelleen lataus kesti yli 30 sek. Mutta tuossa näyttää olevan paljon vaihtelua, toisinaan ei ole viivettä juuri ollenkaan.
198. iso S26.2.2017 klo 16:59
Nyt sai Excel pinnistää kykynsä äärimmilleen eikä ihan riittänytkään, noin 30 % olisi pitänyt olla enemmän kapasiteettia. Tarvitsin kaksi taulukkoa, koska yksi pystyy nielaisemaan vain noin miljoona riviä (2 potenssiin 20 eli 1 048 576). Erinäisin käsiavusteisin vaihein panin sen tilastoimaan kaikki tänne vuosina 2003-2016 kirjoitetut sanat. "Sanaksi" tunnistettiin kaikenlaiset edes jotenkin järjellisten erottimien välissä olevat merkkijonot, jolloin mukaan tuli myös suuri määrä erilaisia älähdyksiä ja ölähdyksiä.

Sanoja oli yhteensä 20 322 449 ja erilaisia sanoja oli 1 294 885. Taivutusmuodot olivat tässä mielessä erilaisia sanoja. Vertailun vuoksi: Aleksis Kiven Seitsemässä veljeksessä on 80 859 sanaa, erilaisia 21 942. Sanamäärä vastaa siis 251 Seitsemää veljestä. Taiteellinen ja historiallinen arvo ei ehkä ole aivan yhtä ylivoimainen. Yleisin sana (on) esiintyi 300 509 kertaa. Vain kerran esiintyneitä sanoja oli 658 125. Niiden luettelemisen jätän Fermatin sivulauseen tehtäväksi.

Yleisyyden perusteella top 100: on, ja, ei, että, se, mutta, kun, niin, oli, en, ole, the, http, jos, nyt, tai, sen, kuin, olla, jo, vain, ihan, voi, sitten, com, vielä, kyllä, siis, sitä, olisi, myös, ovat, olen, joka, jpg, vaan, yksi, ollut, of, www, toinen, tuo, mitä, tämä, oikein, vaikka, and, saa, siitä, no, tässä, kaikki, tulee, osa, siinä, ne, taas, sana, minä, aina, aika, joku, ainakin, eikä, itse, kiitos, eli, lähettäjä, mikä, tuli, onko, mitään, siihen, säv, näin, vai, ehkä, hyvä, blogspot, hän, vähän, in, kanssa, kai, aivan, klo, url, ristikko, paljon, täällä, koska, vihje, ilman, kuitenkin, joskus, sanat, mä, ristikon, John, pitää.

Onko tämä mielenkiintoista? Vastaan top-listan alkusanoilla: on ja ei. Totuus on katsojan silmissä.
199. i26.2.2017 klo 17:03
Sivutuotteena syntyi pikakurssi suomen keskeiseen sanastoon. Nämä opiskelemalla voi keskustella sujuvasti ristikkoihmisen kanssa. Nämä ja vain nämä 527 sanaa esiintyivät joka kuukausi:

aika, aikaa, aikaan, aikana, aina, ainakaan, ainakin, ainoa, ainoastaan, aivan, ajan, ajatus, alkaa, alkuun, aluksi, alussa, antaa, anteeksi, Antti, asia, asiaa, asiaan, asian, asiasta, asti, avulla, edelleen, edellä, edes, ehkä, ei, eikä, eikö, eiköhän, eivät, Eki, Ekin, eli, ellei, en, enemmän, enempää, ennen, ensi, ensimmäinen, ensimmäisen, enää, eri, erittäin, erityisesti, eräs, esiin, esille, esim, esimerkiksi, esittää, et, ettei, että, fi, haluaa, hauska, hei, helposti, helppo, heti, hieman, hieno, huolimatta, huomannut, huomenna, huono, hyvin, hyviä, hyvä, hyvää, hän, häntä, idea, ihan, ihminen, ihmisen, ihmisiä, ihmisten, ilman, ilmeisesti, iso, itse, itsekin, ja, jatkuu, jne, jo, johon, joiden, joissa, joita, joka, jokainen, jokin, joko, joku, jolla, jolloin, jonka, jonkun, jopa, jos, joskus, jossa, jossain, jota, jotain, jotakin, joten, jotenkin, jotka, jotkut, jotta, juuri, jäi, jälkeen, jättää, jää, jäädä, jäänyt, kahden, kai, kaiken, kaikille, kaikkea, kaikki, kaikkia, kaikkien, kaksi, kannattaa, kanssa, kantaa, kautta, keksiä, kenties, kerran, kerro, kertaa, kertoa, kesken, keskustelua, kielen, kiitos, kirja, kirjaimen, kirjaimia, kirjain, kirjainta, kiva, ko, kohdalla, kohtaa, koko, kokonaan, kolmas, kolmen, koska, koskaan, kovin, kuin, kuinka, kuitenkin, kukaan, kun, kunhan, kunnon, kuten, kuuluu, kuva, kuvaa, kuvan, kyllä, kyllähän, kyse, kyseessä, kysymys, kävi, käy, käynyt, käytetty, käytetään, käyttää, laatija, laatijan, lainkaan, laittaa, lehden, lehti, lienee, liian, liikaa, lisäksi, lle, loppuun, lopulta, lukea, luultavasti, lähes, lähinnä, läpi, löydy, löysin, löytyi, löytyy, löytänyt, löytää, mahdollista, mahtaa, meitä, melko, menee, meni, mennyt, mennä, mieleen, mielestä, mielestäni, mieltä, mihin, miksi, mikä, mikään, millään, minua, minulla, minulle, minusta, minä, minäkin, missä, mistä, mistään, miten, mitä, mitään, mm, molemmat, monen, moni, monta, muiden, muistaa, muistan, muita, mukaan, mukana, mukava, mutta, muun, muut, muuta, muutama, muutaman, muuten, muutkin, myös, mä, ne, net, niiden, niin, niissä, niitä, nimen, nimi, nimittäin, no, noita, nopeasti, nuo, nyt, nähdä, näin, näitä, näkyy, näyttää, ...

(jatkuu)
200. iso S26.2.2017 klo 17:03
oikea, oikeassa, oikeastaan, oikein, ole, olekaan, olemassa, olen, olenko, olet, oleva, olevan, oli, oliko, olin, olisi, olisiko, olisin, olisivat, olivat, olla, ollaan, ollut, oma, oman, on, onhan, onko, onneksi, osa, osaa, ottaa, ovat, pakko, paljon, perusteella, pidän, pieni, pientä, pikku, piti, pitkän, pitkään, pitäisi, pitänyt, pitää, pois, punainen, pysty, päin, päälle, pääsee, päässyt, päässä, ratkaisu, ratkaisua, ratkaisun, ratkoa, riittää, riitä, ristikko, ristikkoa, ristikkoon, ristikoiden, ristikoissa, ristikoista, ristikoita, ristikon, ristikossa, ristikosta, ristikot, saa, saada, saanut, saattaa, sain, saisi, sama, samaan, samalla, samassa, sana, sanaa, sanan, sanat, sanoa, sanoi, sanoja, sanojen, se, sekä, sellainen, sellaisia, sellaista, sen, sentään, siellä, siihen, siinä, siis, siitä, siksi, sille, silloin, sillä, silti, siltä, sinne, sinä, siten, sitten, sitä, sivulla, sopii, ssa, suomen, suoraan, suuri, syytä, taas, tahansa, tai, taida, takaisin, takana, takia, tapauksessa, tarkoitin, tarkoittaa, tarkoitus, tarpeeksi, tarvitse, tavalla, te, tehdä, tehty, tein, tiedä, tiedän, tietenkin, tietää, todella, toi, toisaalta, toisella, toisen, toisin, toista, toivottavasti, toki, tosi, tosiaan, tosin, tulee, tulla, tullut, tunne, tuntuu, tuo, tuohon, tuon, tuossa, tuosta, tuota, tuskin, tuttu, tyyliin, tähän, tällainen, tällä, tällöin, tämä, tämän, tänne, tässä, tästä, tätä, täynnä, täysin, täyttää, täytyy, täällä, usein, uusi, uusia, uutta, vaan, vai, vaiheessa, vaikea, vaikka, vaikkapa, vaikuttaa, vain, varma, varmaan, varmaankin, varmasti, varsin, varsinkin, vasta, vastaan, vastauksen, vastaus, vei, verran, vie, vielä, vihje, vihjeen, vihjeet, vihjeiden, vihjeitä, vihjettä, viikon, viime, viimeinen, viimeisen, viimeistä, virhe, voi, voisi, vuoden, vuoksi, vuotta, www, vähän, väliin, välillä, väärin, yhden, yhdessä, yhteydessä, yhtä, yhtään, yhä, yksi, yleensä, yli, ym, ymmärrä, ymmärtää, yrittää, yritän, älä
201. TJV26.2.2017 klo 17:24
Kiva, kun "ratkoa" on ennen "täyttää".
202. Jukkis26.2.2017 klo 19:06
Hmm, että on kiva, kun r on aakkosissa ennen t:tä.
203. TJV26.2.2017 klo 19:25
No jopas päästin mokan, jatkoin luettuani top 100:a kuin koko sanasto olisi yleisyysjärjestyksessä.
204. iso S26.2.2017 klo 21:55
"Laatia" pitäisi ennen kuin voi "ratkoa", mutta sitä sanaa ei käytetä tarpeeksi usein että se pääsisi listalle. Yleinen käsitys, ei välttämättä näitä lukevien keskuudessa, tuntuukin olevan ettei ristikoita tarvitse laatia. Ne vain jotenkin mystisesti putkahtelevat lehtien sivuille.

Vähän lisää tilastotietoa edellisten jatkoksi. Vaikka erilaisia sanoja onkin jo yli miljoona, näyttää siltä että pintaa on vasta raapaistu. Vuonna 2016 oli 159 121 erilaista sanaa ja niistä noin 28 prosenttia oli sellaisia joita ei ollut aiemmin käytetty. Vuosina 2004-2015 vastaavat "uutuusprosentit" olivat 58.2, 66.3, 54.8, 42.9, 48.1, 40.6, 39.4, 38.4, 37.3, 34.3, 32.9 ja 31.5. Vuoden 2003 prosenttiluku oli, yllätys yllätys, tasan 100.
205. Jukkis16.7.2017 klo 20:43
Pitkästä aikaa tilastopäivitys, kun sain viimein aikaiseksi tehdä koodiin vuodenvaihteen uudistuksen vaatimat parsintarutiinin viilaukset:

http://drzf55.angelfire.com/listoja.html

Sitä en ole saanut aikaan, että olisin etsinyt noille mainoksettoman paikan. Laittakaa Adblock tai vastaava.
206. Jukkis16.7.2017 klo 20:55
Viestejä 1003415 kpl. Pitää vissiin jossain vaiheessa selvittää, kuka kirjoitti miljoonannen viestin.
207. Jukkis16.7.2017 klo 21:34
No pitihän se selvittää saman tien.

Miljoonannen viestin kirjoitti nimimerkki Waari 9.6.2017 klo 21:08 säikeeseen 9199. Irtonumeroita 23141-->, siellä viesti no. 180.

Eläköön.
208. Ylläpito16.7.2017 klo 21:38
Jukkis, listat voisi toki sijoittaa myös sanaristikot.netin tietokantaan. Se olisi hyvä asia monessa suhteessa.
209. Jukkis16.7.2017 klo 22:03
"...voisi toki sijoittaa myös sanaristikot.netin tietokantaan". En ihan ymmärrä, mitä tämä täsmälleen tarkoittaa. Miten ne sinne "sijoitetaan"?
210. Ylläpito16.7.2017 klo 22:05
Pitää odottaa teknisen puolen töihin tuloa huomenna, ettei tule lausuttua (enempää?) hölmöyksiä.
211. Ari17.7.2017 klo 09:44
Se tarkoittanee php-koodin vääntämistä koodarille. Mahdollista ja järkevääkin, Jukkishan ei ole myöskään vastustanut tuollaista, muistelen.
Tietokannasta olisi varmasti keveintä kerätä nuo tarvittavat tiedot ilman että tarvitsee ensin ladata kaikki sivut ja tehdä niistä haluttu tietokanta, kuten ymmärtääkseni Jukkiskin tekee ulkopuolisena toimijana.
212. Jukkis17.7.2017 klo 13:46
Sadepäivän puuhaa:
http://drzf55.angelfire.com/grafiikkaa/
213. Eki17.7.2017 klo 14:02
Niin, meille kävisi, että lähettäisit julkaistavat tiedostot tänne ja keksisimme niille hyvän paikan, josta ihmiset voivat niitä helposti käydä pällistelemässä, emme siis editoisi niitä lainkaan, jos ne ovat kyllin harkittuja (esim. Jukkiksen nukkumisajat kyllä täyttävät yleiskiinnostuksen puitteet).
214. Ari17.7.2017 klo 15:20
Eikö sivuston koodari voisi sadepäivänä vääntää sen koodin ja se olisi livedataa eli ajantasalla aina kun sitä katsotaan?
Ekin ehdottama olisi aina jälkijunassa ja sitä jouduttaisiia aina ihmisvoimin (Jukkiksen ja ylläpidon) päivittämään. Itse ainakin näissä hommissa (tietokoneet) kannatan täysautomaatiota, kun se kuitenkin olisi mahdollista.
215. Eki17.7.2017 klo 15:22
Jos Jukkis lahjoittaa koodinsa käyttöön, se on kuulemma mahdollista, mutta kuulostellaan muutenkin Jukkista ensin.
216. Jukkis17.7.2017 klo 16:25
No koodia en anna, mikä on myös sen etu, joka sitä ei nyt saa. Systeemi on koodattu Perlillä, kommentointi, puhumattakaan dokumentoinnista, on mitä on, ja itsellekin on työ ymmärtää, mitä on tullut kirjoitettua, jos pidempään aikaan ei koodia katsele. Siinä on käytetty "käteviä" tapoja toteuttaa juttuja, ja just Perl on semmoinen kieli, että monimutkaisiakin juttuja voi tehdä aivan lyhyellä koodinpätkällä, josta sitten ulkopuolisen voi olla ihan mahdoton ymmärtää, että mitä ihmettä siinä tapahtuu ja miksi. Kun ei itsekään meinaa sitä ymmärtää.

Tietysti olisi järkevintä, että koodi suoraan lukisi tietokantoja, eli paikallinen koodari tekisi palvelimelle tilasto-ohjelmat. Mutta kun vaikkapa tuolle viestien poistosta seuraavalle aikaleimabugillekaan ei ole ehditty tässä puolen vuoden aikana tehdä mitään, niin noinkohan tällaiselle leikkimiselle löytyy aikaa? Jos löytyy, niin mikäs siinä, kunhan lopputulos on vähintään yhtä hyvä.

En minä ihan keksi, mitä sillä saavutettaisiin että nuo angelfirella olevat tiedostot kopsattaisiin toiseen paikkaan, eli ilmeisesti sanaristiko.net-palvelimelle. Internetissä urlin takana ne sielläkin olisi, ja edelleen ihan samanlaisella hiiren klikkauksella ne näkisi. Sinänsähän kopsaaminen ei minulta mitään lähettämistä vaatisi, tuoltahan ne tiedostot (23 kpl) saa hiiren oikella nappulalla saa tallennettua ja sitten mihin tahansa laitettua. Mutta miksi niin tehtäisiin?
217. Jukkis17.7.2017 klo 16:33
Ai niin, kun angelfiresta tiedoston kopsaa, niin sen tiedoston alussa ja lopussa on älytöntä Javascript-roskaa, jonka palvelin sinne lykkää.
218. Ari17.7.2017 klo 16:58
Jos oikein laskin, miljoonas viesti kirjoitetaan tänne sivustolle keskimäärin kahden viikon kuluttua.
219. Jukkis17.7.2017 klo 17:16
Jaa. Montako viestiä täällä mielestäsi on?

"Laskit"? Minkäslainen laskutoimitus se oli?
220. Ari17.7.2017 klo 17:27
Olettamukseni on että viestin id-numero on juokseva ja sen mukaan taskulaskimella laskin. 2003-2017=n. 13 vuotta ja n. 997500 viestiä tullut tänä aikana.
221. Jukkis17.7.2017 klo 17:31
Sitä minä vaan, että olisit ihan suoraan voinut sanoa, että "Jukkiksen tilastoissa on mielestäni jotain häikkää, koska saan eri viestien kokonaismäärän" sen sijaan, että tuollaisen vaihtoehtoisen faktan pöytään isket. Silloin olisin sanonut että "OK, pitääpä tutkia", nyt vaan ärsyynnyin, enkä tutki yhtään mitään.
222. Ari17.7.2017 klo 17:38
Anteeksi, ei ollut todellakaan tarkoitus ärsyttää, enkä tilastoihin ole tuota verrannut, siksi en ole mistään häikistä ollut tietoinen eikä tarkoitus ollut sellaista edes antaa ymmärtää että olisi.
223. Jukkis17.7.2017 klo 17:47
Et siis lue näitä viestejä, esim. eiliset tämän säikeen numerot 206 ja 207.

Ärsyynnys ohi. Ei voi id-numeroista päätellä. Säikeen 9334 ekan viestin id-numero on 1006278. Se hämmentää, että kun viestejä on kaikkiaan (tai siis oli eilen illalla) 1003415, niin millä periaatteella noita id:tä on annettu. Tuskin täältä ajan mittaa noin 3000 viestiä poistettu on. Tai mistä sen tietää.
224. Ari17.7.2017 klo 18:27
Ok, eipä olekaan sitten noin suoraviivaista kuin luulin. Luulenpa että on poistettu tuo määrä viestejä, on täällä ajan saatossa ollut niin paljon ulkomaankielisiä linkittäjähäiriköitä ynnä muita...
225. iso S18.7.2017 klo 09:46
Ketjujen numerointi ei ole aukoton, joten yksittäisten viestien lisäksi on kadonnut kokonaisia ketjuja. Ainakin osa poistetuista on ollut ylläpidon tilapäiseen testikäyttöön perustamia. Niissä olleiden viestien lukumäärää voi vain arvailla. Siinä on kolme mahdollisuutta: pieni, suuri tai siltä väliltä! Riippuu siitä, mitä on haluttu testata ja millä viestimäärällä on saatu haluttu tulos.
226. Jukkis2.10.2017 klo 19:14
A/B-C ketjunn top 20:

Eki: 23342
Maikki: 17288
RA: 7875
Sepeteus: 3085
Jukkis: 2016
Misu-Iita: 883
Libero: 796
marjuko: 689
Tsööts: 445
ripa: 393
turutar: 381
TJV: 286
Suzie Q: 273
työmies: 273
kirre: 213
Ripa: 191
Nanna: 184
Juhani Heino: 163
mor: 158
Ari: 99
227. Jukkis8.1.2018 klo 14:29
Uuden vuoden kunniaksi päivitys:

http://drzf55.angelfire.com/listoja.html
228. Jukkis7.6.2021 klo 12:23
Ihan kiva kun tämä välillä nousee esiin, ystävällinen pilleribotti. En päivitä tilastoja ennen kuin luvattu kadonneiden palautus on tehty. Jos se nyt joskus saadaan tehtyä.
229. Ari9.7.2021 klo 09:26
Tuli juuri koostettua 500. sanaketjun säie.
230. iso S17.10.2021 klo 15:54
Erinäisten vuosien kuluessa on hihaan tarttunut noin 100000 nimeä, muun muassa täältä artistien ja kirjailijoiden ketjuista. Ihan piruuttani tutkin, mitkä ovat yleisimmät etunimet ja sukunimet, sekä millaisia synteettisiä nimiä niistä syntyy yleisyysjärjestyksessä parittamalla.

Erilaisia etunimiä oli 14397, sukunimiä 48899. Tässä aika vahvasti englanninkielisiin maihin ja Suomeen painottuvassa otoksessa sukunimiä on siis yli kolminkertainen määrä etunimiin verrattuna. Tilanne voisi olla rankasti toisin jos tutkailtaisiin vain kiinalaisia nimiä. Netistä luntaten: "1,3 miljardin asukkaan Kiinassa on vain noin 700 sukunimeä. Viime vuosina viranomaiset ovatkin suunnitelleet sukunimien määrän kasvattamista sekaannuksien välttämiseksi."

Suuri yllätys ei ollut, että yleisin etunimi oli John (1296) ja yleisin sukunimi Smith (308). Tämän mukaan yleisin nimi olisi John Smith, mutta Chang Wei ja Wang Weo (nimet kiinalaisessa järjestyksessä, sukunimi etunimi) lukemattomien täyskaimojensa kanssa voivat olla eri mieltä.

Kymmenen kärki, viimeisenä yllättävä yhdistelmä:

John Smith (1296/308)
David Jones (1113/227)
Robert Williams (1028/211)
Michael Brown (841/209)
Richard Johnson (825/166)
James Taylor (687/142)
Peter Anderson (651/140)
Paul Davis (570/133)
William Lee (542/129)
Matti Wilson (443/124)

Jokainen löytyy oikeasti netistä, yllättäen myös viimeinen. David Jones löytyy helpommin kun lisää hakusanaksi Wikipedia. Muuten pitää kahlata aika monta sivua erilaisia laukkuja. William Lee, siis ensimmäinen osuma tuolla nimellä, oli mielnkiintoinen tapaus: toimi pitkään George Washingtonin henkilökohtaisena orjana ja oli ainoa orja, jonka Washington vapautti testamentissaan välittömästi kuolemansa jälkeen. Yleensähän testamentti laaditaan ennen kuolemaa, mutta parempi myöhöön kuin ei milloinkaan.

Ensimmäinen kokonaan suomalainen yhdistelmä osuu sijalle 17, Heikki Nieminen (337/103).Ensimmäinen osuma on kuvanveistäjä/taidegraafikko (1926-2016). Tämä taisi ratkaista yhden arvoituksen. Noin 40 vuotta sitten näin rintakuvan, johon oli kaiverrettu nimikirjaimet H. N. Mieleen ei tullut muuta kirjaimiin sopivaa nimeä kuin Horatio Nelson, Olin kuitenkin melko varma siitä ettei hän ainakaan ollut tuota pystiä veistänyt. Itse asiassa minulla on jossakin kaapin perällä kipsivalos Niemisen pienoisveistoksesta, sellainen 1950-luvun hymynaama.
231. pius17.10.2021 klo 21:50
Muutamia Paul Davisin kirjoja löytyy minunkin hyllystäni.
232. eol17.10.2021 klo 22:15
David Jones oli myös David Bowien oikea nimi.
233. Jukkis16.1.2022 klo 15:12
Tilastopäivitys vuodenvaihteen tilanteen mukaisesti:
https://drzf55.angelfire.com/listoja.html
234. iso S16.1.2022 klo 17:44
Kiitän. Viestien kokonaismääriä kun katselee niin voi vain ihmetellä millä välillä Eki ehtii laatimaan. Osittain hämmästys lieventyy kun katselee listaa "viestien keskimääräisen pituuden mukaan järjestettynä". Ekin viestien keskipituus on vain 85 merkkiä, jolla heltiää vain sija 364, yksi vähemmän kuin on päiviä vuodessa. Se päivä on varmaan pyhitetty laatimiselle...

(pahus, tämä heikensi omaa keskiarvoani)
235. TJV17.1.2022 klo 09:33
Niin, mistä se ammentaa?
236. iso S17.1.2022 klo 12:44
En ymmärtänyt kysymystä, mutta vastaan silti. Viittaamallani listalla minulla on kohtalaisen korkea viestien keskipituus ja se ammentaa ainakin osittain samasta lähteestä kuin Arin noin 50 % korkeampi lukema. Aikoinaan koostin muutamia ketjuja ja siinä puuhassa syntyy liki maksimipituisia viestejä. Ari on koostanut paljon enemmän ja se näkyy tuloksessa. Kaikki ei siis tule omasta päästä, vaikkakin käsistä.
237. TJV17.1.2022 klo 13:29
Anteeksi, kysymykseni koski Ekiä.
238. Eki17.1.2022 klo 13:40
Ihan siitä, että vuorokaudessa on 24 tuntia ja viikossa 7 päivää. Tietäisittepä, mitä muuta kaikkea teen ristikoiden alalla kuin laadin (ja kirjoittelen tänne) ja mitä kaikkea teen ristikoiden ulkopuolella!
239. TJV17.1.2022 klo 13:58
Kysymykseni ei ollut arvostelua, paremminkin tarkoitus oli hyväntahtoisesti arvostaa. Kun muuten tutustuin ensimmäisen kerran ristikonratkonnan SM-kisoihin, arvelin Ekiä voittajaehdokkaaksi. Sittemmin huomasin hänen olleen alkuvuosia lukuunottamatta järjestäjänä. Mestaruuskunto lienee vain lisääntynyt, sitä emme vain päässe todistamaan.
240. Jukkis17.1.2022 klo 14:30
Päivitin myös tilastografiikat:
https://drzf55.angelfire.com/grafiikkaa.html

Jos joku haluaa tuonne näkyviin samanlaiset nimimerkkiinsä liittyvät kuvaajat kuin minun nimimerkilläni siellä on, niin pyytämällä saa. Olen niitä muutamia jo uteliaisuuttani tehnytkin mutta en minä niitä ilman lupaa näkyville näytä.
241. iso S14.3.2022 klo 12:38
Tämä ei liity ristikoihin muuten kuin sikäli, että Jukkiksen mainiot tilastot pysyvät mielessä. Muuten, sanokaamme vaikka että Ukrainan puolesta.

Olen lukenut mm. Iltiksen tilanneseurantaa. Kuun vaihteessa laskin ihan piruuttani, että siellä oli 28.2. 213 päivitystä, jotka eivät suinkaan jakautuneet tasaisesti eri tunneille. Klo 9-11, 18-19 ja 21-22 oli selvä huippu ja klo 13-14 lievä huippu. Se oli näköjään juuri tuon päivän ilmiö. Nyt ajalta 12.2.-13.3. uutisten määrä tunneittain näyttää seuraavalta (aikaväli, uutisten kokonaismäärä, suluissa määrä 28.2.):

00:00-00:59 68 (3)
01:00-01:59 69 (3)
02:00-02:59 56 (5)
03:00-03:59 58 (4)
04:00-04:59 51 (4)
05:00-05:59 59 (4)
06:00-06:59 65 (5)
07:00-07:59 67 (4)
08:00-08:59 129 (7)
09:00-09:59 187 (32)
10:00-10:59 234 (26)
11:00-11:59 183 (6)
12:00-12:59 176 (6)
13:00-13:59 217 (13)
14:00-14:59 152 (5)
15:00-15:59 217 (8)
16:00-16:59 187 (8)
17:00-17:59 172 (6)
18:00-18:59 169 (25)
19:00-19:59 132 (4)
20:00-20:59 134 (4)
21:00-21:59 160 (20)
22:00-22:59 120 (7)
23:00-23:59 81 (4)

Jakauma on ainakin selvästi tasaisempi. Päivä ja yö eroavat kuitenkin toisistaan kuin... no, yö ja päivä. Vuorokaudetkaan eivät ole veljeksiä:

12.2.2022 28
13.2.2022 21
14.2.2022 27
15.2.2022 27
16.2.2022 17
17.2.2022 15
18.2.2022 37
19.2.2022 53
20.2.2022 25
21.2.2022 72
22.2.2022 119
23.2.2022 96
24.2.2022 420
25.2.2022 299
26.2.2022 121
27.2.2022 147
28.2.2022 209
1.3.2022 123
2.3.2022 130
3.3.2022 144
4.3.2022 117
5.3.2022 85
6.3.2022 90
7.3.2022 91
8.3.2022 158
9.3.2022 115
10.3.2022 103
11.3.2022 101
12.3.2022 87
13.3.2022 66

Yhteensä 3143 uutista, pyöristettynä 105 per päivä, yhtä monta kuin Talvisodassa oli päiviä. Tutkimattomat ovat sotaherran tiet.
242. Jukkis3.1.2023 klo 10:22
Tilastopäivitys vuodenvaihteen tilanteen mukaisesti:
https://drzf55.angelfire.com/listoja.html
243. iso S4.1.2023 klo 15:45
Perinteinen uuden vuoden kiitos monipuolisesta tilastosta.

Siitä voi vokotella uusia tunnuslukuja, jotka antavat lisävalaistusta joidenkin sielunmaisemasta. Ainakin tämän: viestien lukumäärä per säikeiden lukumäärä. Jos tämä indeksi on korkea, henkilöllä on paljon sanottavaa vähästä (esimerkiksi on koostanut säikeitä ja/tai on taipuvainen vääntämään jostakin eriäviä mielipiteitä herättävästä asiasta). Jos indeksi on matala, henkilöllä on vähän sanottavaa paljosta (ottaa kantaa vähän joka asiaan ja se on usein kerrasta poikki).

Vähintään kilon verran eli ainakin 1000 viestiä lähettäneitä on 118. Tuo määrä on sen verran korkea, että sitä voi pitää tilastollisesti niin merkittävänä koiraa voi katsoa karvoihin.

Keskittyneimpien top 20:

1. 86,50 ponkka: 1211/14
2. 54,18 lk: 19992/369
3. 52,09 Arskis: 45892/881
4. 51,56 PS: 26555/515
5. 46,00 Maikki: 81610/1774
6. 38,95 la: 1714/44
7. 35,78 Tarja: 14919/417
8. 32,47 toippa: 1396/43
9. 30,04 Arska II: 4626/154
10. 26,01 anni: 9181/353
11. 25,92 Wexi: 21828/842
12. 24,74 Hemuli: 16476/666
13. 23,90 eol: 4876/204
14. 23,19 Bella: 2760/119
15. 22,93 Rakel L: 2087/91
16. 21,98 Libero: 17844/812
17. 21,58 nassakka: 1856/86
18. 20,77 Eki: 107134/5157
19. 20,12 RA: 61037/3034
20. 20,08 vh: 2731/136

"Hajamielisimpien" top 20:

118. 2,05 -: 2099/1022
117. 2,06 [ra]: 1104/536
116. 2,14 ?: 1056/494
115. 2,18 ile: 1090/501
114. 2,29 : 1240/542
113. 2,30 Jouni: 1058/460
112. 2,30 kari kämäräinen: 1071/465
111. 2,38 ++juh: 1130/475
110. 2,39 Antti Viitamäki: 1427/598
109. 2,39 JPQ: 1129/472
108. 2,40 tonimikael: 2417/1007
107. 2,44 Ylläpito: 2183/893
106. 2,45 ö: 1399/571
105. 2,48 Timppa: 1642/662
104. 2,66 Seitenvitonen: 1084/408
103. 2,71 JTak: 1226/452
102. 2,86 Titta: 1225/428
101. 2,87 Ritu: 1141/398
100. 3,07 Sakke: 1526/497

Minä olen tässä painoluokassa sijalla 62. tuloksella 6,56 (22375/3411), siis melko keskinkertainen. Voi viitata ailahtelevaan luonteeseen: välillä tyyppiä A, välillä B, tai sitten seikka on saletti: olen keskinkertainen ja sillä siisti. It's hard to be a tonttu.

Kopioin taulukon Exceliin, jolloin edellä oleva tilasto syntyi helposti. Itsensä löytäminensen sijaan ei. Välilyönnin Ascii-koodi ei ollut tuttu ja turvallinen 32, vaan 160, joten haku näppäilemällä iso S ei löytänyt mitään. Tuon merkin korvaaminen blankolla koko taulukossa puolestaan ei onnistunut konstailematta, koska jotkut näsäviisaat aloittavat nikkinsä on yhtä kuin -merkillä, miikalla tai miukumaukulla. Silloin Excel tulkitsee nikin virheelliseksi kaavaksi tai funktioksi ja kieltäytyy korvaamisesta. Tuossa häntäpään listassa on muutama esimerkki näistä humoristeista. Kärkipäässä on ihan kirjaimellisia tyyppejä.
244. Jukkis4.1.2023 klo 20:48
"Välilyönnin Ascii-koodi ei ollut tuttu ja turvallinen 32, vaan 160, joten haku näppäilemällä iso S ei löytänyt mitään."

En tätä ihan tajua. Kun minä kopsaan tuolta (siis täältä: https://drzf55.angelfire.com/nimim_saikeet.html ) tekstieditoriin, niin siellä voin katsoa, että välilyöntien koodi on normaali 0x20 (eli 32), ja kun sitten kopsaan sen Exceliin, niin siellä haku ei mitenkään sekoa välilyönneistä, iso S löytyy.
245. iso S5.1.2023 klo 11:10
Minä kopioin täältä:
https://drzf55.angelfire.com/nimim_viestit.html
ja liitin suoraan Exceliin, kulkematta tekstieditorin tai lähtöruudun kautta.

Säikeiden mukainen sivu sisältää vain kaikkien viestien tilaston ja näyttää tekstimuotoiselta. Sieltä kopioituna toimii suoraan Exceliin siirrettynäkin ja blankot ovat normaaleja blankkoja. Viestien mukainen sivu on taulukkomuotoinen ja sisältää listat kokonaismäärästä, ketjuviesteistä ja ei-ketjuviesteistä.

Koska tein listani kokonaismääristä, olisin välttynyt pieniltä lisäkiemuroilta jos olisin valinnut lähteeksi Jukkiksen mainitseman sivun. Ei se mitään, harjoitus tekee mestarin, kuten pyöveliopistossa lienee tapana sanoa.
246. Jukkis5.1.2023 klo 12:36
Näköjään kun tuolla https://drzf55.angelfire.com/nimim_viestit.html kopsaa Ctrl-C:llä ja sitten Excelissä liittää Ctrl-V:llä, niin tosiaan välilyönti Excelissä sitten onkin 0xA0 (eli 160). Näin tehden sisältö menee Exceliin HTML:nä, ja jostain syystä välilyönnin koodi muuttuu. Jos sen sijaan Excelissä liittää tekstinä (mun Excelissä Edit - Paste Special... - Text, kuten eilen tein , en suinkaan vienyt tekstiä editorin kautta), niin sitten välilyönti on 0x20 (eli 32) Excelissä. Kautta aikojen merkkikoodaus on ollut joltain osin kummallista ja vaikeasti ymmärrettävää.
247. Jukkis5.1.2023 klo 12:39
Näköjään tuo 0xA0 (eli 160) on HTML:ssä sitova välilyönti, eli Exceliin HTML:nä siirrettäessä tekstin välilyönnit muuttuu sitoviksi.
248. POH24.1.2023 klo 13:50
Kiitos Jukkis taas påivityksestä.
249. iso S25.1.2023 klo 16:52
Jukkiksen monipuolisista tilastoista löytyy vastaus moneen kysymykseen, mutta ei tähän: kuka osallistuu useimpina päivinä? Perustellusti voi olettaa, että sellainen lista muistuttaa hyvin vahvasti viestien lukumäärän mukaista listaa, mutta voivathan jotkut olla kausiluontoisesti erittäin tuotteliaita ja jotkut vähän mutta lähes päivittäin kirjoittavia. Tässä epävirallinen tulos vuodelta 2022:

1. Maikki (361)
2. lk (360)
3. PS (354)
4. Arskis (341)
5. Kuju (317)
6. eol (304)
7. Tarja (295)
8. Jaska (289)
9. iso S (258)
10. Ylläpito (243)
11. Elva (242)
12. Jiikoo (240)
13. Jondalar (224)
14. kaplas (218)
15. lapatossu (184)
16. Eikka (183)
17. Matias-Myyrä (176)
18. Jukkis (162)
19. Eki (155)
20. Pike (149)
21. Rampe (146)
22. PM (141)
23. Heppu (134)
24. Funny (130)
25. mari (126)
26. Thymallus (123)
27. Ritu (112)
28. Artsi (110)
29. pelaaja (84)
30. TKu (82)
31. JPR (75)
32. Luke (73)
33. isoäiti (72)
34. Uusi (71)
35. Amatööri (68)
36. Tuomas L. (65)
37. Joutilas (62)
38. Ari (57)
39. Pekkatyttö (53)
40. Riku (51)
41. Ananias (48)
42. Juho (48)
43. Matti (47)
44. anna h (46)
45. kravattimies (45)
46. Jontte (43)
47. Pekku (41)
48. Yussuf (41)
49. happonen (38)
50. TJV (37)

Lähimmäksi kärkkymään jäivät ++juh, Pena, Satu, tschau jaTuikku 35 päivällä. Heille kunniamaininta kohtalaiseen ahkeruuteen koplatusta itsehillinnästä. Kukaan ei päässyt Matti ja Teppo -tason suoritukseen (mä joka päivä töitä teen). Päiväperhosia eli vain yhtenä päivänä esiintyneitä oli 408. Yksi heistä on nimimerkki "Joka viikko lähetän". Nikki jäi kauas karusta todellisuudesta.

Kaikkiaan nimimerkkejä oli 787. Määrä eroaa Jukkiksen tilastoista, joissa kirjainten koko on erotteleva tekijä. Minun listassani ei ole merkitystä sillä onko shiftiä painettu vai ei.

Lista on epävirallinen siksi että se on tehty koneavusteisesti ja logiikassa voi olla muutakin häikkää kuin se että jotkut lainaukset tilastoituvat viesteiksi. Näitä on varmasti ainakin Jaskaan kohdistuen kaksi ja minuun yksi.
250. iso S3.3.2023 klo 20:58
Säikeessä 11100. Laatijan haasteita kerroin laskeneeni 960 viisikirjaimisesta henkilön nimestä, miten monta kertaa mikäkin kirjain esiintyy missäkin kohdassa nimeä. Tulos oli tämä:

1. kirjaimena: A 92, B 79, S 74, M 72, T 68, C 62, L 61, K 59, R 51, J 48, H 45, N 39, E 37, P 36, D 34, G 24, V 21, W 15, F 12, O 11, I 10, Z 5, Y 4, U 3, Z 3, Q 1, Å 0, Ä 0, Ä 0
2. kirjaimena: A 237, E 135, I 123, O 121, U 70, R 64, L 59, H 21, Y 21, N 14, M 13, D 12, S 12, T 12, C 9, V 6, B 5, K 5, Ä 5, G 4, Z 4, P 3, Ä 3, F 2, W 2, J 1, Z 1, Å 1, Q 0
3. kirjaimena: R 116, I 105, L 104, N 93, A 73, E 49, T 47, S 45, M 44, O 41, U 35, D 31, C 23, G 23, K 23, B 21, Y 19, H 17, P 15, V 11, W 8, F 6, Z 6, J 5, Z 3, Q 0, Å 0, Ä 0, Ä 0
4. kirjaimena: N 114, E 97, I 97, L 80, A 67, T 67, R 60, K 54, M 41, S 41, D 40, J 34, O 29, C 27, V 22, P 21, G 15, B 12, Z 11, H 8, F 7, U 7, Y 6, W 3, Z 3, Q 0, Å 0, Ä 0, Ä 0
5. kirjaimena: A 195, E 132, I 110, Y 103, N 86, O 75, S 64, R 34, L 32, T 29, H 21, U 14, K 13, D 10, M 9, F 7, C 6, G 6, Z 5, P 4, Ä 4, Z 3, Ä 3, W 2, J 1, B 0, Q 0, V 0, Å 0

Itse kukin voi vetää tuosta omat johtopäätöksensä haluamaansa paikkaan. Itse kiinnitin huomiota mm. siihen, että A on yleisin joka kohdassa paitsi neljäntenä kirjaimena. Mistäköhän se johtuu, että nimissä on tuollainen hylkimisreaktio? Onkohan sama ilmiö muissakin sanoissa? Tuossa julkistuksessa on muuten virhe, 3. kirjaimen kohdalta puuttuu A:n lukema, joka on 237.

Numeroihin hurahtaneiden iloksi ja muiden harmiksi tutkin sanoja kolmesta eri lähteestä: Kielitoimisto sanakirja, ristikoissa vastaan tulleet sanat ja Iltiksestä vuonna 2022 imuroimani uutiset. Näistä tutkin kirjainten esiintymismääriä sanoista joiden pituus oli 4, 5 tai 6. Suodatin joukosta pois sellaiset sanat joissa oli klassiseen suomalaiseen aakkostoon kuulumattomia merkkejä. Ei siinä kovin suurta hävikkiä tullut, mutta hatulliset ja aksentilliset kirjaimet saivat väistyä, samoin väliviivalliset ja apostrofeja sisältävät. Vertailun helpottamiseksi ja maallikoiden hämäämiseksi skaalasin lukemat vastaamaan tilannetta jossa aineistossa olisi ollut 10000 mitat täyttävää sanaa ja pyöristin kokonaisluvuksi.

Esimerkiksi Kielosesta löytyi 1097 nelikirjaimista sanaa. A kirjain esiintyi ensimmäisenä kirjaimena 90 kertaa, toisena 19, kolmantena 27 ja neljäntenä 214 kertaa. Kun nuo skaalataan kertoimella 10000/1097 vastaamaan kuvitteellista tilannetta jossa sanoja olisikin 10000, saadaan vertailulukemiksi 820, 1805, 246 ja 1951.

Nuo lähteet tuottavat osittain erityyppistä sanastoa. Kielosen sanat ovat perusmuodossa ja harvat monikollisia. Ristikkosanoissa on melko runsaasti monikkomuotoja, eli voi olettaa että loppukirjaimena T runsastuu, ja lisäksi teemalauseista voi joukkoon tulla jonkin verran taivutusmuotoja. Iltiksen teksteissä on myös monikkoja, ehkä ei aivan yhtä paljon kuin ristikoissa, ja selvästi enemmän taivutusmuotoja. Viimeksi mainittu tosin näkyisi selvemmin vasta pitemmissä sanoissa, koska taivutuspäätteet harvemmin lyhentävät sanaa!

En ikävystytä teitä listaamalla koko tulosjoukkoa tässä viestissä. En kiltteyttäni, vaan siksi että viesteillä on maksimipituus joka ylittyisi. Siksi ikävystytän numerokammoisia (miksi muuten olette tilastosäikeessä?) julkaisemalla lukemat kolmessa seuraavassa viestissä.
251. iso S3.3.2023 klo 20:59
Kielitoimiston sanakirja

Sanan pituus 4, aineistossa 1097 sanaa

A: 820, 1805, 246, 1951
B: 100, 9, 82, 0
C: 82, 0, 18, 18
D: 82, 73, 292, 18
E: 356, 985, 210, 939
F: 82, 18, 64, 18
G: 73, 18, 91, 18
H: 565, 365, 492, 0
I: 328, 1449, 392, 1951
J: 447, 27, 374, 0
K: 1057, 137, 1057, 46
L: 602, 456, 966, 36
M: 556, 128, 675, 9
N: 447, 191, 665, 237
O: 392, 1048, 201, 1404
P: 747, 100, 629, 46
R: 538, 301, 930, 46
S: 839, 210, 766, 447
T: 757, 128, 1048, 91
U: 319, 1258, 164, 1258
V: 456, 27, 483, 0
W: 27, 9, 9, 9
Y: 137, 419, 36, 465
Z: 9, 0, 18, 9
Ä: 164, 638, 73, 711
Ö: 18, 201, 18, 273


Sanan pituus 5, aineistossa 3174 sanaa

A: 353, 2240, 432, 252, 2672
B: 139, 3, 50, 107, 9
C: 35, 3, 6, 3, 0
D: 79, 13, 101, 255, 6
E: 183, 1074, 337, 451, 857
F: 117, 0, 50, 28, 0
G: 69, 0, 41, 91, 3
H: 759, 113, 542, 293, 0
I: 154, 1569, 939, 551, 2300
J: 331, 19, 41, 337, 0
K: 1386, 66, 766, 1282, 6
L: 844, 202, 876, 684, 28
M: 649, 79, 343, 621, 9
N: 410, 98, 681, 573, 280
O: 132, 1068, 555, 246, 1040
P: 920, 66, 542, 463, 3
Q: 0, 0, 3, 0, 0
R: 766, 158, 888, 602, 41
S: 904, 123, 772, 929, 460
T: 816, 76, 892, 1333, 41
U: 132, 1531, 577, 236, 898
V: 611, 28, 120, 454, 0
W: 9, 9, 0, 3, 0
X: 0, 0, 0, 0, 3
Y: 88, 532, 192, 113, 306
Z: 9, 3, 3, 3, 0
Ä: 88, 668, 170, 72, 851
Ö: 16, 258, 82, 16, 186


Sanan pituus 6, aineistossa 4368 sanaa

A: 385, 1994, 584, 1092, 474, 2910
B: 110, 2, 41, 18, 11, 0
C: 37, 2, 14, 18, 9, 5
D: 85, 48, 89, 103, 112, 5
E: 208, 1005, 462, 632, 545, 678
F: 130, 14, 25, 23, 11, 0
G: 62, 5, 43, 37, 27, 5
H: 714, 130, 428, 197, 14, 7
I: 165, 1385, 1213, 717, 1190, 1655
J: 332, 41, 121, 103, 142, 0
K: 1474, 85, 565, 1348, 1092, 9
L: 753, 334, 804, 389, 492, 27
M: 524, 69, 442, 293, 245, 41
N: 362, 130, 705, 456, 554, 497
O: 190, 1033, 522, 417, 398, 723
P: 1030, 60, 449, 570, 321, 14
Q: 2, 2, 0, 0, 0, 0
R: 588, 394, 1003, 318, 511, 46
S: 1005, 172, 442, 1055, 389, 1303
T: 881, 140, 611, 1259, 1722, 41
U: 130, 1397, 639, 341, 962, 430
V: 614, 62, 240, 192, 185, 7
W: 7, 2, 5, 2, 2, 0
X: 0, 0, 2, 0, 0, 2
Y: 117, 575, 222, 126, 380, 130
Z: 2, 0, 5, 2, 0, 0
Ä: 76, 641, 227, 284, 158, 1266
Ö: 16, 279, 96, 7, 53, 199
252. iso S3.3.2023 klo 21:00
Ristikot

Sanan pituus 4, aineistossa 2917 sanaa

A: 1155, 1748, 830, 1752
B: 147, 24, 65, 17
C: 82, 14, 48, 14
D: 137, 113, 168, 72
E: 644, 1063, 576, 881
F: 58, 17, 31, 24
G: 86, 38, 65, 31
H: 381, 257, 288, 86
I: 559, 1395, 761, 1409
J: 264, 48, 178, 7
K: 799, 223, 686, 219
L: 658, 566, 788, 278
M: 490, 213, 525, 147
N: 422, 333, 775, 511
O: 514, 987, 531, 1090
P: 501, 106, 411, 65
Q: 0, 3, 0, 0
R: 579, 497, 860, 267
S: 792, 353, 641, 631
T: 809, 322, 850, 1179
U: 333, 919, 350, 703
V: 298, 123, 305, 31
W: 41, 10, 14, 10
X: 7, 3, 7, 3
Y: 106, 226, 99, 195
Z: 17, 3, 10, 14
Å: 3, 0, 0, 0
Ä: 103, 336, 99, 291
Ö: 14, 58, 38, 72

Sanan pituus 5, aineistossa 5359 sanaa

A: 838, 2355, 593, 1140, 2185
B: 67, 15, 37, 43, 2
C: 26, 4, 17, 22, 2
D: 97, 30, 177, 110, 15
E: 388, 1051, 405, 646, 627
F: 62, 4, 13, 7, 6
G: 52, 13, 47, 43, 4
H: 481, 147, 345, 147, 32
I: 343, 1526, 931, 1142, 1452
J: 280, 24, 114, 196, 2
K: 1131, 118, 801, 761, 73
L: 786, 407, 911, 573, 138
M: 547, 136, 418, 397, 45
N: 455, 235, 756, 543, 506
O: 310, 1038, 493, 724, 782
P: 657, 97, 414, 239, 9
Q: 2, 0, 0, 0, 0
R: 670, 368, 851, 481, 157
S: 961, 261, 778, 575, 526
T: 939, 181, 939, 1002, 2299
U: 224, 1220, 455, 550, 524
V: 457, 54, 299, 332, 15
W: 22, 6, 7, 0, 0
X: 2, 2, 9, 0, 4
Y: 71, 228, 73, 118, 118
Z: 13, 4, 7, 13, 11
Å: 0, 2, 2, 2, 0
Ä: 104, 396, 91, 157, 407
Ö: 15, 80, 17, 35, 62

Sanan pituus 6, aineistossa 5578 sanaa

A: 834, 2562, 945, 1011, 1581, 2452
B: 56, 4, 23, 22, 7, 2
C: 30, 4, 7, 2, 5, 0
D: 75, 45, 34, 138, 45, 18
E: 310, 891, 549, 654, 814, 398
F: 38, 7, 14, 7, 4, 4
G: 41, 13, 27, 45, 13, 11
H: 463, 138, 246, 158, 14, 4
I: 335, 1472, 1334, 719, 1545, 966
J: 229, 52, 75, 140, 134, 0
K: 1323, 133, 532, 1081, 495, 27
L: 755, 434, 785, 662, 602, 79
M: 523, 124, 348, 380, 181, 32
N: 439, 249, 694, 670, 393, 817
O: 321, 921, 617, 412, 748, 511
P: 708, 97, 290, 328, 124, 7
Q: 2, 0, 2, 0, 0, 0
R: 583, 332, 826, 480, 360, 100
S: 999, 285, 622, 916, 246, 776
T: 1027, 246, 837, 1364, 1117, 2967
U: 233, 1255, 710, 308, 862, 274
V: 497, 90, 170, 332, 276, 13
W: 16, 2, 4, 4, 2, 0
X: 4, 2, 2, 2, 0, 0
Y: 82, 206, 102, 39, 140, 43
Z: 4, 2, 7, 2, 0, 0
Å: 0, 2, 0, 0, 0, 0
Ä: 59, 371, 160, 122, 244, 450
Ö: 14, 65, 38, 2, 48, 48
253. iso S3.3.2023 klo 21:01
Ilta-Sanomat 2022

Sanan pituus 4, aineistossa 806 sanaa

A: 906, 1551, 720, 1414
B: 174, 25, 50, 50
C: 186, 12, 149, 25
D: 136, 87, 199, 74
E: 707, 931, 670, 968
F: 161, 0, 74, 74
G: 124, 25, 62, 74
H: 347, 285, 285, 74
I: 546, 1129, 757, 1489
J: 434, 74, 211, 12
K: 633, 112, 819, 248
L: 422, 769, 558, 261
M: 608, 161, 496, 87
N: 372, 273, 645, 1514
O: 769, 1104, 620, 856
P: 583, 186, 360, 74
Q: 12, 0, 0, 0
R: 273, 459, 707, 99
S: 806, 546, 484, 496
T: 732, 236, 906, 608
U: 261, 1055, 447, 521
V: 385, 161, 323, 25
W: 99, 12, 12, 25
X: 0, 0, 0, 25
Y: 211, 298, 124, 223
Z: 37, 0, 12, 0
Å: 0, 12, 0, 0
Ä: 50, 434, 223, 645
Ö: 25, 62, 87, 37

Sanan pituus 5, aineistossa 2159 sanaa

A: 547, 2001, 380, 996, 2344
B: 176, 19, 37, 32, 9
C: 93, 0, 23, 65, 9
D: 83, 46, 259, 269, 79
E: 361, 1195, 384, 755, 611
F: 111, 5, 23, 14, 19
G: 69, 5, 28, 46, 23
H: 542, 195, 505, 102, 37
I: 287, 1376, 940, 1070, 1450
J: 491, 28, 148, 222, 5
K: 1209, 56, 755, 635, 56
L: 695, 333, 903, 496, 88
M: 644, 88, 333, 320, 23
N: 343, 167, 778, 574, 1677
O: 287, 1047, 435, 718, 662
P: 792, 60, 347, 157, 14
Q: 9, 0, 0, 0, 0
R: 440, 287, 862, 403, 120
S: 959, 296, 709, 588, 352
T: 894, 134, 820, 1135, 709
U: 176, 1366, 496, 547, 380
V: 528, 60, 371, 287, 9
W: 46, 5, 28, 9, 0
X: 5, 0, 14, 0, 5
Y: 107, 496, 176, 222, 320
Z: 5, 9, 19, 0, 14
Å: 9, 0, 0, 0, 0
Ä: 65, 616, 148, 320, 912
Ö: 28, 111, 79, 19, 74

Sanan pituus 6, aineistossa 3492 sanaa

A: 410, 2133, 599, 573, 1592, 2437
B: 132, 9, 32, 37, 6, 3
C: 54, 14, 34, 26, 20, 3
D: 80, 52, 83, 364, 37, 46
E: 203, 1091, 601, 564, 1094, 447
F: 80, 6, 23, 3, 3, 6
G: 57, 14, 43, 89, 14, 20
H: 644, 166, 467, 241, 17, 6
I: 223, 1303, 1412, 541, 1618, 1082
J: 407, 43, 83, 241, 192, 3
K: 1392, 69, 544, 1157, 315, 9
L: 676, 378, 762, 805, 430, 60
M: 687, 89, 229, 527, 117, 29
N: 387, 109, 644, 682, 326, 2672
O: 395, 1071, 604, 427, 762, 295
P: 848, 57, 261, 223, 97, 11
Q: 0, 3, 0, 0, 0, 0
R: 415, 180, 839, 435, 183, 83
S: 971, 258, 541, 922, 484, 375
T: 936, 115, 679, 1223, 1008, 1011
U: 175, 1481, 670, 252, 710, 218
V: 659, 40, 206, 432, 100, 32
W: 20, 6, 17, 0, 0, 6
X: 3, 0, 0, 6, 0, 6
Y: 103, 487, 269, 63, 306, 123
Z: 0, 3, 9, 9, 3, 6
Ä: 40, 736, 263, 160, 490, 956
Ö: 3, 89, 86, 0, 74, 57
254. Matias-Myyrä4.3.2023 klo 08:11
Sulla on jokin moka laskentamenetelmässäsi tai sitten en ymmärtänyt tilastointitapaasi oikein.
Katsoin huvikseni Kielitoimiston sanakirjan Q- ja X-sanat.

niqab
quasi
quorn
quiche
quinoa
squash
Q: 0, 0, 3, 0, 0
Q: 2, 2, 0, 0, 0, 0

roux
sioux
eximia (cum laude approbatur)
ex-mies
texmex
thorax
X: 0, 0, 0, 0, 3
X: 0, 0, 2, 0, 0, 2
255. iso S4.3.2023 klo 15:46
Saattaa olla laskennassakin virhettä, mutta noiden osalta "virhe" on pohjana olevassa sanastossa. Siinä on Kielosesta poimittuja sanoja, ei kaikki Kielosen sanat. Imuroin sanat jo vuosia sitten ja sen jälkeen on kai tullut uusia. Tarkistuksen mukaan tämä ei kuitenkaan selittänyt Matias-Myyrän havaitsemia puutteita.

Yhden noista selitin jo ennakkoon: "Suodatin joukosta pois sellaiset sanat joissa oli klassiseen suomalaiseen aakkostoon kuulumattomia merkkejä. Ei siinä kovin suurta hävikkiä tullut, mutta hatulliset ja aksentilliset kirjaimet saivat väistyä, samoin väliviivalliset ja apostrofeja sisältävät." Ex-mies lensi ulos kahdesta syystä: pituus on 7 ja "-" ei ole aakkonen. Ihan hyvin olisin voinut ottaa sen linjan että poistan viivat ja silloin exmies olisi päässyt mukaan. Tilaston suuria linjoja tämä ei olisi hetkauttanut, mutta tarkkuus on tietysti tarkempaa kuin epätarkkuus.

Selitettävää silti vielä jäi.

Olen jakanut kerääämäni sanat alustavasti karkealla kädellä vuohiin ja lampaisiin. Yhdessä tiedostossa on sellaisia joita voisin kuvitella käyttäväni jos laatisin ristikkoa ja toisessa sellaiset joita kuvittelisin jonkun vähemmän nirson käyttävän (ja sellaiset joita mielestäni kenenkään ei pitäisi käyttää ainakaan muuten kuin jonkin erikoislehden teemaristikossa).

Käyttämäni aineisto oli kotoisin tuosta parempien sanojen tiedostosta. Pahiksien puolelle päätyneitä ja siksi aineistosta puuttuvia ovat eximia, quasi, quinoa, quorn, roux ja thorax. Eximia kai lähinnä siksi että se on arvosanana virallisesti eximia cum laude approbatur, joka ei ole kelvollinen ristikkosana. Niqab, sioux, quiche, squash ja texmex ovat aineistossa mukana. Ne olin luokitellut hyviksiksi. . Hattupäisyyden takia hylättyjä sanoja olivat šiia, paaši, paštu, radža, šakki, šaria ja šokki.

Nelikirjaimisissa ei ollut kirjaimia Q ja X. Viisi- ja kuusikirjaimisista listaukseni ilmoittaa lukemat
Q: 0, 0, 3, 0, 0
X: 0, 0, 0, 0, 3
Q: 2, 2, 0, 0, 0, 0
X: 0, 0, 2, 0, 0, 2

Noista viidestä sanasta saadaan itse laskemalla
Q: 0, 0, 1, 0, 0
X: 0, 0, 0, 0, 1
Q:1, 1, 0, 0, 0, 0
X: 0, 0, 1, 0, 0, 1

Kun skaalataan kertoimilla 10000/3174 (pituus 5) ja 10000/4368 (pituus 6) saadaan
Q: 0, 0, 3,15, 0, 0
X: 0, 0, 0, 0, 3,15
Q: 2,29, 2,29, 0, 0, 0, 0
X: 0, 0, 2,29, 0, 0, 2,29

Kokonaisluvuksi vitospyöristyksellä:
Q: 0, 0, 3, 0, 0
X: 0, 0, 0, 0, 3
Q: 2, 2, 0, 0, 0, 0
X: 0, 0, 2, 0, 0, 2
eli sama kuin alkuperäinen tulos
256. iso S16.3.2023 klo 18:58
Sattuneesta syystä iskin katseeni verbeihin. Minulla oli 11134 vähintään 5 kirjaimen pituista verbiä. Kuten säikeessä Kaunis Suomemme kieli 5 kohta totean, sanaluokasta voi tehdä jossain määrin sattumaa parempia arvauksia sanan loppuosan perusteella.

Ainakin voi päätellä, että perusmuotoinen sana ei liene verbi, jos sen viimeinen kirjain on joku muu kuin A ta Ä. Aineistossa oli A-loppuisia 7968 ja Ä-loppuisia 3166, yhteensä yllättäen 11134.

Toiseksi viimeiseen kirjaimen on enemmän valinnanvaraa, mutta senkin avulla voi karsia verbiksi mahdottomilta vaikuttavia pois. Jakauma (kirjain, verbien määrä, esimerkki verbistä) oli seuraava:

A 2433 (alkaa)
T 1968 (päästä)
U 1690 (puhua)
L 1645 (tulla)
Ä 1218 (pitää)
D 916 (tehdä)
Y 634 (kysyä)
I 446 (uusia)
O 135 (sanoa)
E 39 (lähteä)
N 7 (mennä)
R 2 (purra)
Ö 1 (säilöä)

Neljän kirjaimen loppuosan perusteella sanaluokka hahmottuu kohtuullisen hyvin, tai ainakin osuvuus on parempi kuin noppaa heittämällä. Aineistosta löytyi 497 erilaista loppuosaa. Yleisin oli TTAA, 1390 verbiä, melko tarkkaan joka kahdeksas. Se onkin aika vahva merkki verbistä (ei Vehosta). Mieleen tulee vain Juuttaa, Kupittaa ja Oittaa jotka rikkovat säännön. Kupittaa on rajatapaus, se voisi tarkoittaa sitä että kattaa kupit pöytään.

25 loppua oli sellaisia jotka löytyvät vähintään sadasta verbistä:

TTAA 1390 (ottaa)
OIDA 803 (kommentoida)
ELLA 719 (ajatella)
TTÄÄ 694 (käyttää)
STAA 513 (muistaa)
UTUA 410 (joutua)
ILLA 397 (kokeilla)
ELLÄ 391 (päätellä)
STUA 344 (osallistua)
NTUA 284 (tuntua)
ITUA 248 (autioitua)
HTAA 236 (johtaa)
STÄÄ 208 (kestää)
ISTA 179 (ratkaista)
KATA 171 (leikata)
TTUA 159 (muuttua)
STYÄ 152 (pystyä)
NTAA 150 (antaa)
RATA 149 (seurata)
HTÄÄ 132 (hiihtää)
ILLÄ 132 (epäillä)
LATA 128 (pelata)
NTYÄ 120 (esiintyä)
YTYÄ 119 (löytyä)
ISTÄ 118 (väristä)

152 loppua löytyi vain yhdestä verbistä. Saatte itse pähkiä, mistä verbeistä nämä loppuosat löytyvät:

aida, akaa, akea, akia, akua, alua, amoa, anua, apoa, apua, aria, arua, asoa, asta, atoa, avia, bota, cata, deta, dita, ditä, duta, eata, ehdä, ehiä, ekua, elää, eniä, ennä, enyä, eota, epiä, epoa, etoa, fota, getä, gita, hkää, hloa, hmoa, hnia, hteä, hötä, iedä, ihiä, ihoa, iitä, ijia, ijua, ijyä, ikia, ilöä, inaa, ivua, jötä, ksää, lhia, lkaa, lkia, llia, lmia, lmiä, lmää, lpeä, lpiä, lpoa, lpyä, lsia, lsyä, lvää, mpoa, mpua, nkea, nsia, nsiä, nsoa, ntea, ntia, nytä, ohua, okua, olia, oloa, olua, omia, osua, otea, ovia, petä, ppoa, ppyä, pytä, rita, rjiä, rkaa, rkeä, rkyä, rmia, rmoa, rnia, rnua, rpiä, rsyä, rvia, rviä, svaa, sytä, teta, tetä, tita, titä, tkaa, tkea, ttoa, tviä, uata, uhaa, uida, uita, ujoa, ujua, ukia, unia, upua, uraa, usta, utea, xata, yetä, yniä, ypeä, yteä, ytiä, äetä, ähdä, äliä, älyä, ämiä, äpiä, ästä, äsyä, äteä, ätiä, äädä, öhiä, ökyä, ömiä, öniä, öryä, östä, ötyä, ötää.

Käyttämäni esimerkkisanat on poimittu taajuustilastoni kärjestä. Verbien top 20 on

siitä, pitää, tehdä, saada, alkaa, käyttää, ottaa, saattaa, sanoa, antaa, näyttää, tietää, tulla, päästä, tarkoittaa, kannattaa, mennä, kirjoittaa, uusia, nähdä.

Kahden loppukirjaimen listassa olen ohittanut sanan siitä, koska siitä näkee miten totta on tämä pahenevan harhan asteikko: valhe, emävalhe, tilasto, tilaston tulkinta. Lähes aina kun sana siitä on tullut vastaan, se ei ole ollut verbin perusmuoto. Ei esimerkiksi silloin, kun sonnin omistajan luo tuotiin lehmiä ja isäntä totesi: yhtä puuttuu puolesta tusinasta, mutta viis siitä! Tulkitsi tuon miten tahtoo niin ei se perusmuoto ole.
257. iso S17.3.2023 klo 19:03
Päivän harrjoituksen aiheena oli verbien ja niistä johdettavien VA/VÄ-loppuisten partisiippien parittaminen. Teoria oli että sitä kautta löytyy sanavarastostani aukkoja.

Koodasin yksinkertaisen makron joka käy sanalistaa läpi. Kun se löytää verbin, se etsii verbin molemmilta puolilta 50 sanan etäisyydeltä a-luokkaan merkittyjä sanoja joiden kolme ensimmäistä kirjainta täsmäävät kyseiseen verbiin ja kaksi viimeistä kirjainta ovat VA tai VÄ. Nämä kaikki makro listasi. Verbit toiseen sarakkeeseen ja a-sanat toiseen.

Kätevästi löytyi muutamia luokitteluvirheitä ja mukaan tuli tietysti joukko vääriä tarjokkaita, kun etsin tekijää kuvaaavia (mallia tutkiva) enkä enkä kohteita (ei tutkittava). Korjasin virheet, siivosin ei-toivotut pois ja yhdistin oikeat parit. Jos partisiipille ei löytynyt verbiä, kirjoitin sille parin. Pareja syntyi 7056 ja jäljelle jäi 4285 orpoa verbiä.

Ei kauheasti kiinnostanut käydä runoilemaan niille pareja käsin. Onneksi olin aikoinaan rakentanut systeemin, jolla voi muuttaa taivutettuja muotoja ja monikoita perusmuotoon kohtuullisella osumaprosentilla. Samaa systeemiä voi soveltaa tähänkin. Syötin systeemiin nuo 7056 paria malliksi ja yksi makro rakensi niistä alustavan konversiohakemiston. jSitä piti suht yksinkertaisilla manuaalitempuilla viimeistellä. Sitten tarjosin mallille pureskeltavaksi ne orvot verbit ja systeemi sylkäisi ulos näkemyksensä partisiipeista. Sen oma arvio tuloksen osuvuudesta oli 96,98 %. Silmäilin listan läpi ja korjasin virheet (tein samalla ehkä itse muutaman). Lopputulos oli se että makro oli arvannut 4205 kertaa oikein ja 61 kertaa väärin, osumaprosentti 98,57 %. Lievästi pessimistinen arvio oli hämmästyttävän lähellä todellista.

Sain vinon pinon uusia sanoja, useimmat täysin merkityksettömiä minkään käytännön tarkoituksen kannalta, mutta prosessi oli mielenkiintoinen. Samalla dementia otti toivottavasti muutamia taka-askeleita.
258. Jaska17.3.2023 klo 22:43
Voisihan jollain iso S:n uudispartisiipilla olla käyttöä laatijalle, joka muuten joutuisi purkamaan laajan alueen. Kaikkihan ovat kelvollisia ratkaisusanoja alatyylisiä lukuun ottamatta.

Niin kuin tiedämme, -va/-vä eli ensimmäinen partisiippi on ristikoissa varsin yleinen. Tänäisessä Ekin piiliksessä on yksi. Mikä on yleisin? Ehkä ajava. Löytyykö vastaus iso S:n tilastosta?
259. iso S18.3.2023 klo 13:19
Eivät useimmat nyt syntetisoiduista ole uudispartisiippeja siinä mielessä että ne eivät olisi ennestään tuttuja, eivät vain ole osuneet aiemmin haaviini. Jotkut voivat olla, en ole vielä tarkistanut. Silloin lienee kysymys sellaisista joita en tule sanastooni kelpuuttamaan ja joita ei suurehkolla varmuudella tulla missään ristikossa näkemään, vaikka laatijan tilanne olisi hyvinkin epätoivoinen.

Ristikoissa esiintyneistä sanoista poimimani tilasto on luullakseni täysi-ikäinen eikä välttämättä vastaa täydellisesti nykyistä tilannetta. Jonkinlaisen kuvan voin välittää. Seuraavat ovat mielestäni partisiippeja tai sellaiseksi tulkittavissa. Väintään viisi kertaa yksikkömuodossa esiintyneet:

anova 23, asuva 16, etova 16, ottava 16, oleva 15, istuva 12, osaava 12, antava 10, taitava 10, itävä 8, astuva 6, mahtava 6, osuva 6, palava 6, sopiva 6, uinuva 6, ivaava 5, omiva 5, ostava 5, sulava 5, tuleva 5, tuova 5, vaativa 5.

Kunniamaininta yli 6 kirjainta pitkille vähintään kolme kertaa esiintyneille:

kastuva 4, koriseva 4, loistava 4, uteleva 4, aistiva 3, aitaava 3, alistava 3, erottava 3, ihastuttava 3, inisevä 3, laskeva 3, luistava 3, makaava 3, nauttiva 3, oirehtiva 3, omistava 3, oottava 3, painava 3, saatava 3, soutava 3, taikova 3, toistava 3, vastaava 3.

Ajava (4) on on väliinputoaja. Liian vähän ensimmäiselle listalle, liian lyhyt toiselle. Tilasto todistaa vanhan väitteen poliittisista virkanimityksistä: sopiva on parempi kuin pätevä. Tulos 6-0.

Vertailun vuoksi yleisimmät sieltä sun täältä poimitusta sanatilastosta, vähintään 25 kertaa esiintyneet:

oleva 655, seuraava 318, vastaava 186, sopiva 143, loistava 138, johtava 118, yllättävä 116, tuleva 114, toimiva 109, asuva 106, kuuluva 95, mahtava 87, liittyvä 83, ajava 75, hallitseva 74, sijaitseva 71, koskeva 62, edustava 58, työskentelevä 54, jatkuva 53, pelaava 53, riittävä 53, kestävä 52, esiintyvä 45, kiinnostava 45, perustuva 45, päivystävä 43, vaativa 43, ratkaiseva 41, taitava 40, elävä 39, sisältävä 39, pätevä 38, pitävä 37, poikkeava 36, näyttävä 35, kasvava 34, vaikuttava 34, kuvaava 29, nouseva 28, alkava 27, haastava 27, hämmentävä 26, koriseva 26, osuva 26, tekevä 26, jännittävä 25, lentävä 25, miellyttävä 25, näkyvä 25.

Näin on ollut ja näin on aina oleva. Täällä ajavakin pääsi mukaan, partisiippien neljästoista sija. Sopiva (143) on myös ristikoiden ulkopuolella parempi kuin pätevä (38). On helppo todeta, että ainakin näiden listojen perusteella ristikot ovat aika kaukana todellisuudesta!
260. iso S18.3.2023 klo 13:19
Määrien osalta vertailupohjaa: ristikoiden tilastossa on kaikkiaan 29645 erilaista sanaa, jotka esiintyivät keskimäärin 3,67 kertaa. Tilasto perustuu noin tuhanteen ristikkoon, tarkka lukumäärä jäi laskematta. Muualta kerätyssä tilastossa on 202928 sanaa, jotka esiintyivät keskimäärin 5,84 kertaa. 145012 sanaa on sanalistoista (Kielonen ja vastaavat) poimittuja, taivutusmuotoisista tai monikkomuotoisista esiintymisistä perusmuotoon muunnettuja sekä vilkkaaseen mielikuvitukseen perustuvia. Sellaisia en ole laskenut esiintymiskerraksi, ne odottavat vielä "oikeaa" esiintymistä jossakin tekstissä. Todella perusmuodossa esiintyneet sanat ovat esiintyneet keskimäärin 20,47.

Ristikoissa partisiippien 20 kärjessä on esiintynyt keskimäärin 9,70 kertaa (2,64 kertaa useammin kuin sanat keskimäärin) ja muissa 135,75 kertaa (6,63 kertaa useammin kuin sanat keskimäärin). Muualla partisiippeja viljellään siis selvästi hanakammin kuin ristikoissa.

Vielä kaikista sanoista 20 yleisimmän keskiarvot: ristikot 136,25, muut 11024,50. Väitetään että ristikoissa samat sanat toistuvat hirvittävän usein. Ehkäpä, mutta "oikeassa maailmassa" ne vasta toistuvatkin! Ristikoissa 20 yleisintä sanaa kattaa 7,67 prosenttia kaikista sanojen esiintymisistä, muualla 19,10 prosenttia. Noilla tilaston esiintymistaajuuksilla on todennäköistä että sivun ristikossa, 80 sanaa, on noin kuusi näistä: taas, alas, asia, itse, atet, akat, aita, otot, otsa, osat, taus, isot, alus, siis, asut, otus, sata, osata, etana ja alat. Jos ristikoita laadittaisiin ulkopuolisen maailman sanoilla ja esiintymistaajuuksilla, ristikossa olisi noin 15 näistä: ei, että, se, mutta, kun, ole, hän, niin, kuin, myös, jos, mukaan, tai, voi, nyt, joka, jo, olla, vain ja ollut. Laatijat voisivat hoitaa hommansa paljon huonommin, jos oikein yrittäisivät! Ei yllytetä.
261. iso S2.4.2023 klo 16:39
Kaikkea ei voi laittaa ilmastonmuutoksen syyksi. Joskus on kysymys tilastoharhasta. Jos joku (esimerkiksi minä) tekee sinänsä totuuteen perustuvan tilaston ja joku (esimerkiksi minä) tulkitsee sitä vailla järjen häivää niin minkäs sille sitten voi.

Väitteen mukaan ihmisten keskimääräinen elinikä on jatkuvasti noussut enemmän tai vähemmän tasaisesti. Yksilötasolle se pitää varmasti paikkansa, tiettyyn rajaan saakka. Entäpä väestötasolla, siis keskimääräinen saavutettu elinikä? Minulla sattui olemaan tieto 6378 kuolleen ihmisen syntymävuodesta ja iästä, joten Excelin avulla syntyi näppärästi tämä tilasto (aikaväli, keskimääräinen ikä)- Ennen vuotta 1900 syntyneet jaoin 100 vuoden aikajaksoihin ja myöhemmät 10 vuoden aikajaksoihin. Tämä siksi, että vanhoista jutuista oli vähemmän tietoa. Vuotta 1300 edeltävien tietojen vähäisyyden vuoksi tilastollinen uskottavuus kärsi niin paljon että sitä ei hennonut katsoa.

1300-1399: 49,7
1400-1499: 53,9
1500-1599: 59,0
1600-1699: 65,9
1700-1799: 65,8
1800-1899: 71,1
1900-1909: 76,7
1910-1919: 76,9
1920-1929: 77,2
1930-1939: 71,8
1940-1949: 62,9
1950-1959: 54,3
1960-1969: 45,8
1970-1979: 37,3
1980-1989: 29,0
1990-1999: 20,0

Näyttää siltä että jos halusi pitkää ikää niin kannatti syntyä kultaisella 1920-luvulla. Siihen asti keski-ikä nousi ja sen jälkeen kyyti on ollut aina vain kylmempää. Tähän on olemassa niin yksinkertainen selitys että en kehtaa sitä ääneen kirjoittaa.

Hiukan voin harhaa avata. Tilaston pohjana oleva otanta ei ole satunnainen eikä näin ollen edusta maailman koko väestöä. Listalle päätyneiden on täytynyt tehdä jotain merkittävää tai olla jollakin tavalla niin huomattavia henkilöitä että tiedot päätyvät nykypäivän julkisuuteen. Ammottavina aikoina ei ollut nuorena kuolevia teini-idoleita eivätkä alle kaksikymppiset yrittäneet lentää maailman ympäri, kun ei ollut lentokoneita eikä sellainen tullut muutenkaan mieleen kun maa oli vielä pannukakku. Pääasiallinen syy tilaston näyttämään surkeaan luisuun on kuitenkin sellainen että yhtä pahalta tilanne olisi näytttanyt silloinkin jos tilasto olisi tehty silloin kun nyt näkyvä nousu oli vielä hyvässä vauhdissa.
262. Funny2.4.2023 klo 21:08
Muistan, miten joskus oli laskettu, että rock-muusikoilla oli keskimäärin alhainen elinikä. Tuumin silloin, että samalla tavalla laskien Seinäjoella valittujen tangokuninkaiden keskimääräinen elinikä on vähän päälle 20 vuotta. Nykyisin tuo on paljon korkeampi.
263. iso S8.4.2023 klo 12:38
Tässä vastaava tilasto keskimääräisestä eliniästä kuolinvuosien perusteella.

1400-1499: 40,0
1500-1599: 57,9
1600-1699: 59,5
1700-1799: 63,2
1800-1899: 62,0
1900-1909: 63,6
1910-1919: 60,6
1920-1929: 59,0
1930-1939: 58,2
1940-1949: 60,2
1950-1959: 64,4
1960-1969: 62,4
1970-1979: 66,4
1980-1989: 67,7
1990-1999: 72,1
2000-2009: 74,6
2010-2019: 77,3
2020-2023: 78,7

Pientä horjuvuutta eliniän kasvussa on havaittavissa. Joko otos on liian pieni tai harhainen (kuten onkin) tai sitten taustalla saattaa olla jotakin todellistakin syytä, kuten sodat ja pandemiat. 1400-luvulla ainakin otos on pieni ja kuolema ei aina ollut ns. luonnollinen. Toisaalta, onhan se luonnollista että henki menee jos vaikkapa roviolla poltetaan.

Jeanne d'Arc (19)
Richard III (32)
Sir Henry Percy (39)
James I (42)
Timur Lenk (68)
264. Jukkis4.7.2023 klo 16:48
Tilastopäivitys vuoden puolivälin kunniaksi:
https://drzf55.angelfire.com/listoja.html
265. iso S5.7.2023 klo 19:33
Näyttää siltä että kaikkien viestien sarjassa asemani top kympissä ei ole lähitulevaisuudessa uhattuna, samoin ketjuveisteissä top 20. Ei-ketjuviesteissä saatan jossakin vaiheessa nousta ainakin tilapäisesti kolmoseksi, koska sattuneesta syystä RA ei valitettavasti voi puolustaa asemiaan. Jukkis ei ihan pian ole uhkana vakavasti otettava, muuten kyllä.

Ääripäät saavat yleensä suurimman huomion, mutta tällä kertaa nostan kissan, ei kun tavikset pöydälle.

Ketjuviestejä on lähettänyt yhteensä 4809 nimimerkkiä. Lähetettyjä viestejä on yhteensä 737043 ja osallistuttujen säikeiden summa on 42503. Näistä voi laskea, että kuviteltu täydellisen keskinkertainen nimimerkki on lähettänyt (kahteen desimaalin pyöristettynä) 153,26 viestiä 8,74 säikeeseen. Käytännössä kukaan ei voi lähettää osittaisia viestejä, mutta ketkä kymmenen pääsevät lähimmäksi keskinkertaisuutta? Ei ainakaan Eki, jonka 86943 viestiä ja 1593 osallistuttua säiettä poikkeavat keskiarvoista yhteensä 88373,99.

Tässä on keskinkertaisuuden 10 kärjessä:

Nimimerkki, viestit/säikeet, (poikkeama)
mirene: 160/9 (6,99)
Tiina H: 150/17 (11,52)
selma: 156/20 (13,99)
Agnes: 142/13 (15,52)
Vihainen lokakuu: 140/5 (17,01)
pl: 142/18 (20,52)
Gepe: 169/14 (20,99)
platy: 139/18 (23,52)
Escord: 130/11 (25,52)
Topias: 172/16 (25,99)

Ei-ketjuissa osallistujia on 12558, lahetettyjä viestejä 345608 ja osallistuttujen säikeiden summa 115428. Keskiarvot ovat 27,52 viestiä ja 9,19 säiettä per nimimerkki.

Ei-ketjujen keskinkertaisimmat (tasapelin vuoksi 11):

Mansikki: 27/9 (0,71)
Tsusi: 27/10 (1,33)
pekkatyttö: 27/10 (1,33)
Väiski: 28/8 (1,67)
nenukko: 27/8 (1,71)
scorpio: 29/10 (2,29)
mary: 27/11 (2,33)
selma: 26/10 (2,33)
harto hakonen: 30/9 (2,67)
Urpu: 29/8 (2,67)
ensio: 29/8 (2,67)

Molempiin luokkiin osallistuneista yhteensä keskinkertaisimmat:

Gepe: 169/14 ja 32/9 (25,66)
Zepe: 143/25 ja 23/15 (36,85)
mirene: 160/9 ja 1/1 (41,7)
Escord: 130/11 ja 10/7 (45,23)
Agnes: 142/13 ja 4/3 (45,23)
Herkku: 136/24 ja 41/9 (46,19)
pl: 142/18 ja 4/4 (49,23)
Topias: 172/16 ja 49/7 (49,66)
T: 129/25 ja 22/19 (55,85)
platy: 139/18 ja 2/2 (56,23)
266. Jukkis5.7.2023 klo 19:57
iso S:mäistä datalouhintaa.
267. iso S6.7.2023 klo 13:37
Juu, on hyvä louhia kun on Jukkismaista datamalmia.

Harrastusta tietysti haittaa se että kaikki eivät ole osallistuneet molempiin osioihin, joten saman nikin tiedot eivät ole samalla rivillä vaikka ne lajittelisi. Yhdistin ketjujen ja ei-ketjujen tiedot phaku-funktiolla. Se saattaa johtaa virheellisiin yhdistämisiin, jos yhdistettävissä sarakkeissa on identtisiä avaintietoja, ja identtisiksi lasketaan sellaiset jotka kirjain kirjaimelta samoja, riippumatta siitä onko iso tai pieni kirjain. Ensimmäinen "sopiva" tulee valituksi.

Itse kullekin saattaa tapahtua shiftin kanssa lipsauksia. Esimerkiksi kun haen Kaikki viestit -sarakkeelta satunnaisesti valitun henkilön tietoja (arvonta pyörii...) Jukkis, löytyy nämä:
Jukkis 10457/1941
JUkkis 9/9
jukkis 5/5
jukkis...: 1/1
[Jukkis]: 1/1
Jukkiss: 1/1
kp-jukkis: 1/1
Asiaa Jukkis!: 1/1
Viisastelija-Jukkis: 1/1
Jukkis-34: 1/1

Aneemisen arvauksen perusteella osa näistä on pulpunnut samasta lähteestä, osa ei. Tiedonhakufunktion kannalta kolme ensimmäistä ovat ongelmallisia. Rivien järjestyksestä riippuen Jukkiksen yhden sarakkeen tiedot saattavat parittua toisessa sarakkeessa Jukkikseen itseensä, JUkkikseen tai jukkikseen. Nimimerkin pl kohdalla on päässyt käymään väärä parittuminen. Ei-ketjuista kopioitui PL:n tulos 4/4, kun oikea on 1/1. Oikea rivi on silloin
pl: 142/18 ja 1/1 (55,23)
ja pl tipahtaa Topiaksen taakse. Muitakin vastaavia virheitä varmaan on, mutta ne eivät vaikuta julkaistuihin tuloksiin. Minunkin nimimerkistäni löytyy eri versioita.
268. iso S16.8.2023 klo 18:33
https://www.is.fi/digitoday/esports/art-2000009757 047.html

"Keskivertoihminen kirjoittaa näppäimistöllä noin 50 sanaa minuutissa, kertoo Typing Pal. Sivuston mukaan 70 sanaa minuutissa kirjoittavilla on hyvin nopea tahti, mutta parhaimmat pääsevät jopa 120 sanaan."

Rohkenen epäillä että ei ole totta, varsinkaan vauvasta vaariin tutkittuna. Vaikka pantaisiin vain kaikki Suomen työikäiset ihmiset näppäimistöjen ääreen, niin keskiverto (puolet ovat nopeampia, puolet hitaampia) ei takoisi suomenkielistä tekstiä lähes sana per sekunti vauhtia.

Tuossa artikkelissa teini-ikäinen hirmu veteli tunnin testissä (monkeytype.com) 231 sanaa minuuttia kohti (69327 merkkiä), minuutin testissä 225 sanaa (69900 merkkiä/tunti) ja 15 sekunnin testissä 300 sanaa/minuutti (90000 merkkiä/tunti). Se ei minulle kirkastunut, lasketaanko välilyönti merkiksi. Kyllä kai pitäisi, ei se painamatta tule. Jos, niin sanojen keskipituus on neljä merkkiä, jos ei, niin viisi. Enimmäkseen lyhyitä joka tapauksessa.

Oma tulokseni (kolme kertaa suoritettu minuutin testi) oli keskimäärin 27 sanaa/minuutti ja karvan verran päälle 8000 merkkiä/tunti -vauhti. Vaikka olenkin kolmisormitekniikkaa käyttävä räppäkäpälä niin en usko olevani lähes 50 % keskivertosuomalaista hitaampi. 49 ehkä, mutta ei 50...

Testissä kirjoitetaan koneen arpomia englanninkielisiä sanoja ja tuloksesta vähennetään virhelyöntien määrä. kaikki vedetään pienillä kirjaimilla eikä mitään muita merrkkejä tarvita, vain välilyönti sanojen välissä. Kerralla on näkyvissä kolme riviä ja rivit rullaavat pykälän ylös siinä vaiheessa kun ollaan keskimmäisen rivin puolivälissä.

Koska en pysty kirjoittamaan sokkona, uskon että pelkkien kirjainten näpyttely omasta päästä tulevan tekstin mukaan sujuu hieman tuossa mitattua nopeammin, mutta shiftin käyttö ja erikoismerkit toisaalta hidastavat jonkin verran.

Jukkiksen tilaston mukaan olen kirjoittanut tänne 23507125 merkkiä tämän vuoden kesäkuun loppuun mennessä. Mitatun nopeuden perusteella siihen on tärvääntynyt noin 2938 tuntia. Lieventävänä asianhaarana lausun puolustuksekseni kolme pointtia:
1. Määrä on kertynyt 20 vuoden aikana, siis noin 147 tuntia per vuosi. Alle tunti päivässä.
2. Iso osa, ehkä jopa valtaosa on syntynyt leikkaa/liimaa -tekniikalla eli ei ole minun kirjoittamaani.
3. En minä ole eniten aikaa tähän käyttänyt. Juttuja lukeneet yhteensä ovat!

Yli miljoonaan merkkiin on ehtinyt 30 kirjoittajaa, yli 10 miljoonaan 3. Eki kärkkyy listan nelosena, mutta tarvitsee melkein 10 prosentin lisäyksen päästäkseen miljonääriksi.
269. iso S3.10.2023 klo 09:57
Laskeskelin vuoden 2022 viesteistä erilaisten sanojen määrää ja esiintymiskertoja. Eliminoin viestien aloitusrivit, koska olin kiinnostunut itse asiasta, en lähettäjistä.

Erilaisia sanoja oli kaikkiaan 105049 ja sanat esiintyivät yhteensä 536793 kertaa, keskimäärin 5,11 kertaa/sana.

71,78 % sanoista esiintyi vain yhden kuukauden aikana. Näistä vähintään 10 kertaa käytettyjä olivat salama (143), icao-koodi (67), lentokentän (67), vulkan (32), kot (20), ajoloka (15), häiriöksi (15), käärmeistä (15), llorar (15), pikerock (15), heinon (12), juhannusta (12), bitcoin (11), bonamassa (11), casino (11), nagy (11), oooo (11), eura (10), kenraalin (10), tietokonepeli (10) ja vou-vou-vou (10).

Salaman iskeminen noin monta kertaa samaan paikkaan selittyy kun katsoo säiettä 10083 Suomalaiset ristikkosanat maailmalla 2. Noin monta Salamaa löytyi elokuvatietokannasta. Sinänsä outoa, ettei noin normaali sana osunut muihin kuukausiin. Kertakäyttöisiä sanoja oli 68505, esimerkiksi arvokas, hyvinvointi, isku, juoksu, kauppa, keihäs, kierros, koulutus, kriittinen, myynti, nurmi, näyttö, operaatio, ralli, rauhallinen, reaktio, rikos, sopimus, talous ja tuotanto.

Joka kuukausi käytettyjä sanoja oli 1490 kappaletta, 1,42 %. Useimmin käytetyt olivat samat kuin vuoden 20 käytetyintä, mikä ei ole yllättävää, mutta ei välttämättä pakollista. Voisihan joku sana olla hetken todella "kuuma" (kuumempi kuin Salama). Vähimmillä maininnoilla joka kuukauteen venyivät is-arki (12), kissaketju (12), sielut (13), hubaa (14), rakkikoirat (14), pähkinöitä (15), selitä (15), alkukirjainketju (16), yhdyssanaketju (16), kuolleet (17), kuvitella (17), entuudestaan (18), luettua (19), risteävissä (19), ketjulaulu (20), myöhään (20), puolestani (20), tekstiä (20), koin (21), loppujen (21) ja teille (21).

Jotenkin mielenkiintoinen ilmiö on se että sanan on helpompi tulla käytetyksi joka kuukausi kuin melkein joka kuukausi. 6-11 kuukauden aikana käytettyjä oli jokaisessa luokassa vähemmän kuin 12 kuukauden aikana käytettyjä.

Vuoden sata käytetyintä sanaa olivat on (12265), ja (11048), ei (6687), että (4220), mutta (3898), oli (3847), se (3350), kun (3182), en (2583), niin (2351), ole (2351), kuin (2096), sen (1924), jos (1843), nyt (1841), klo (1649), tai (1613), olla (1609), lainaus (1552), sitten (1461), myös (1414), vielä (1387), joka (1339), kyllä (1327), voi (1316), vain (1303), olisi (1247), ihan (1244), ovat (1230), ollut (1210), jo (1196), olen (1189), säikeen (1164), otsikko (1128), siis (1084), tuo (1080), sitä (1051), oikein (1000), tämä (982), kiitos (964), vaan (962), ristikko (949), mitä (905), sana (901), siinä (892), kaikki (886), vaikka (884), saa (850), ristikon (832), tuli (820), taas (812), tässä (785), hän (773), vihje (766), siitä (756), eikä (740), yksi (734), säv (694), tulee (688), kanssa (678), esitt (672), eli (668), siihen (664), minulla (638), näin (637), kuitenkin (632), aika (630), ne (624), onko (622), mikä (618), vähän (612), ehkä (610), tämän (609), minä (606), itse (602), mitään (601), ainakin (598), saanut (598), minulle (596), aina (595), joku (595), joten (582), kaksi (563), paljon (551), löytyy (549), no (548), hyvä (547), mielestäni (544), sain (533), koska (531), mukaan (530), jälkeen (513), eivät (508), sanan (508), ennen (507), ilman (504), https (499), eri (490), suom (489) ja pitää (488).

100 yleisintä sanaa kattaa 25,06 % esiintymistä ja 200 yleisintä 31,57 %. 1166 yleisintä kattaa puolet. Vanha nyrkkisääntö 20 % tapauksista vie 80 % ajasta toimii melko tarkasti tässäkin. 17,85 & sanoista kattaa 80 % esiintymistä.
270. Jukkis4.10.2023 klo 11:56
Visual Basicillä (eli Excelin makrolla) näitä vissiin tilastoit? Sulla on koneella tiedosto, jossa on kaikki tänne kirjoitettu hölynpöly ja sieltä sitten makro poimii sanoa ja analysoi? Millä keinolla sinä ne viestit siihen isoon tiedostoon (satoja megatavuja?) olet saanut laitettua?
271. iso S4.10.2023 klo 22:25
Excelin makroilla tosiaan operoin ja menetelmä on vastaava kuin norsun syömisessä: pala kerrallaan. Paljon auttoi se kun Excelissä ollut rivimäärän rajoitus kasvoi noin 65000:sta vähän yli miljoonaa. Nykyinen koneenikin on puhdikkaampi kuin se jolla aloitin parikymmentä vuotta sitten.

Epäsäännöllisin välein (1-9 kuukautta) poimin etusiviltä edellisen imuroinnin jälkeen aktiivisina olleiden säikeiden numerot. Niiden perusteella yksi makro käy hakemassa kyseisten säikeiden sisällöt säiekohtaisiin tekstitiedostoihin. Ne eivät ole suuria, muutamasta kilotavusta noin 200 kilotavuun.

Näistä toinen makro käy hakemassa halutun aikavälin viestit esimerkiksi kuukausikohtaiseen tekstitiedostoon. Näiden koko vaihteli viime vuonna välillä 358-603 kilotavua. Kerrallaan makron mutusteltavana on vain yksi säie, eli hyvin kohtuullinen määrä.

Sitten kun sattuu inspiratio iskemään, päivitän vuoden kuukausikohtaista Excel-tiedostoa. Esimerkiksi tammikuun 2022 tiedostossa on 9591 riviä (tyhjät rivit mukaan lukien). "rivi" tarkoittaa oikeastaan kappaletta, eli netistä katsottuna Eccel-rivissä voi olla paljonkin näytön rivejä. Kopioin ne Excel-taulukkoon.makro poimii sieltä sanalistan, 63047 sanaa.Tiedoston koko on 2172 kt. Parilla yksinkertaisella tempulla lasken sanojen esiintymismäärän ja häivytän tuplat. Erilaisia sanoja on 21219.

Kopioin sanat vuositilastoon sanasarakkeelle entisten jatkoksi (tammikuussa sarakkeen alkuun) ja lukumäärät kuukauden sarakkeelle. Lajittelen sanojen mukaan ja pyöräytän makron, joka laskee kuukausien summan kullekin sanalle ja merkkaa apusarakkeelle poistettavat rivit, eli ne joissa kuukauden sana on ennenkin esiintynyt. Lajittelen apusarakkeen mukaan ja poistan merkatut rivit. Koko vuoden tilastossa on 105049 riviä ja tiedoston koko on 10524 kt.

Tieto siis tiivistyy matkan varrella eikä missään vaiheessa Excel joudu yli ylivoimaisen haasteen eteen.
272. iso S12.11.2023 klo 18:05
Köyhän ainut huvitus on vilkas mielikuvitus.
Henkisesti köyhän mielitiede ei ole kielitiede vaan tilastotiede.

Aforismit sikseen ja päivän kysymykseen: mitkä ovat yleisimmät sanat? Siihen ei ole yleispätevää vastausta. Riippuu siitä keneltä kysyy tai mistä katsoo. Minä katsoin seitsemästä lähteestä:

Vuoden 2017 Ilta-Sanomista, joista olin aikanaan imuroinut oman kiinnostukseni perusteella joukon artikkeleita, joissa oli yhteensä 260341 sanaa.

Oman kiinnostukseni eliminoimiseksi kolmen päivän (9.11.11.2023) Ilta-Sanomista lähes kaikki IS:n "omat" uutiset. Ohitin ne joissa lähteenä oli Me Naiset, Taloussanomat tai vastaava, samoin "IS seuraa" -tyyppiset jutut joissa olisi pitänyt kelailla Näytä lisää -osia. Armoitetuista kertyi 135913 sanaa.

Sopulit sikseen, kansan karttuisan käden tuotantoa sai edustaa Sanaristikot,net. Vuosien 2003-2022 varrelta Ristikot ja Muut aiheet tuottivat 22 729 094 sanaa. Kuulostaa paljolta, mutta sehän on pyöreästi vain viisi sanaa per puhekykyinen asukas ja kultakin suunnilleen sana joka neljäs vuosi. Suomalaiset ovat vähäsanaista kansaa.

Mikäpä sen uskottavampi lähde kuin Raamattu? 563046 sanaa, totta jokainen erikseen ja mimillä tavalla tahansa yhdistettynä, jos oikealta PR_henkilöltä kysytään.

Gutenberg on julkaissut Seitsemästä veljeksestä korjatun version. Entinen oli melko kelvoton. siinä oli hirveästi ylimääräisiä ta-vu-vii-vo-ja. 80404 sanaa.

Nämä kuusi saivat edustaa suorasanaista todellisuutta sanaristikot risteävien sanojen viidakkoa. Siinä käyttämäni aineisto on yli 20 vuoden takaa, noin 1000 ristikkoa ja 108856 sanaa.

Kaikista näistä pyrin poimimaan 200 yleisintä sanaa. Lajittelin sanat yleisyyden mukaan ja tasapelin sattuessa aakkosjärjestykseen. Reilun pelin hengessä päästin mukaan myös jotka jäivät noin laskettuna 200:n ulkopuolelle mutta esiintyivät yhtä usein kuin sijalla 200 ollut.

Lähteissä oli eri määrät sanoja, joten niiden keskinäisen vertailun helpottamiseksi normeerasin esiintymiskerrat niin että ilmoittavani luvut kuvaavat suhteellista esiintymismäärää miljoonaa sanaa kohti. Jos joku tykkää enemmän promilleista niin voi jakaa luvut tuhannella. Minä tykkäsin tänään enemmän kokonaisluvuista ja sellaisia lykkäsin.

Kukin lähde tulee omassa viestissään, niin ei merkkimäärän rajoitin pauku.
273. iso S12.11.2023 klo 18:08
Iltis 2017:
ja: 26173
on: 24883
että: 11381
ei: 10840
oli: 8969
hän: 6584
se: 5877
mutta: 5235
kun: 5082
myös: 4486
ole: 4175
ovat: 3776
kuin: 3422
mukaan: 3134
ollut: 3034
niin: 3027
voi: 3011
joka: 2988
jos: 2904
sen: 2885
tai: 2839
jo: 2827
jälkeen: 2677
nyt: 2270
olisi: 2209
kanssa: 2101
vain: 2047
hänen: 2040
olla: 2024
sitä: 1997
kertoo: 1894
sitten: 1786
siitä: 1767
vielä: 1717
sanoo: 1698
paljon: 1625
ennen: 1609
kuitenkin: 1563
vaikka: 1544
en: 1540
viime: 1517
vuonna: 1494
mitä: 1483
sillä: 1425
aina: 1421
tämä: 1406
suomen: 1390
hyvin: 1387
esimerkiksi: 1291
kaikki: 1279
eivät: 1268
olen: 1248
vuotta: 1248
yksi: 1245
ne: 1229
pitää: 1198
tuli: 1183
jossa: 1129
koko: 1125
koska: 1114
he: 1087
siinä: 1083
jotka: 1079
ettei: 1037
kertoi: 1010
kaksi: 987
sai: 987
tulee: 987
vuoden: 983
ihan: 979
vaan: 976
sanoi: 972
saa: 964
sekä: 956
eikä: 953
aikana: 941
jonka: 941
olivat: 930
siihen: 922
miten: 918
itse: 914
mitään: 899
eli: 872
noin: 860
näin: 860
yli: 849
silloin: 841
suomessa: 807
juuri: 803
aika: 787
tehdä: 784
tämän: 780
lisäksi: 768
kertaa: 764
enää: 753
jopa: 745
tällä: 745
muun: 741
mikä: 734
tässä: 722
hyvä: 718
räikkönen: 714
todella: 703
aikaa: 699
kyllä: 691
enemmän: 672
lisää: 672
ajan: 661
koskaan: 653
muassa: 645
vastaan: 641
siellä: 638
kuten: 634
mies: 634
eri: 622
aivan: 595
edes: 584
kauden: 584
kolme: 584
kerran: 572
pois: 572
is: 568
kilometrin: 568
niitä: 565
aiemmin: 561
mukana: 561
täysin: 561
usein: 561
vähän: 561
osa: 553
kuinka: 549
saanut: 545
välillä: 545
teki: 542
pitäisi: 538
tilanne: 534
tullut: 534
olin: 526
myöhemmin: 522
kautta: 519
helsingin: 515
lopulta: 515
vasta: 515
toinen: 511
kuitenkaan: 507
heti: 488
joten: 488
taas: 488
olevan: 484
kiinni: 476
samalla: 472
jäi: 469
kimi: 469
jotain: 465
onko: 465
tavalla: 465
alkoi: 457
ehkä: 457
maailman: 453
heidän: 449
yhtä: 449
vuoksi: 446
yhden: 446
ensi: 442
olleet: 442
räikkösen: 442
kirvesniemi: 438
silti: 438
ilman: 434
joku: 434
miksi: 434
takia: 434
hamilton: 426
saattaa: 426
ensimmäinen: 423
liian: 423
erittäin: 419
siis: 419
tätä: 419
hetkellä: 415
me: 415
aikaan: 411
alkaa: 411
asia: 411
oman: 411
nopeasti: 407
saada: 407
tästä: 407
lue: 403
hieman: 399
voitti: 399
ainakin: 396
niiden: 396
yleensä: 396
häntä: 392
lähes: 392
mahdollista: 392
ensimmäisen: 388
jota: 388
meni: 388
mäkäräinen: 388
päästä: 388
yhä: 388

200 listan ensimmäistä sanaa esiintyivät yhteensä 76439 kertaa eli ne kattoivat 29,361 % koko tekstistä. Käyrä oli melkoisen jyrkkä, yleisin sana esiintyi 67,47 kertaa useammin kuin kahdessadas.
274. iso S12.11.2023 klo 18:09
IS 9.-11,11,2023:

ja: 26164
on: 24508
että: 10095
ei: 9226
oli: 8917
hän: 6335
kuva: 6144
myös: 5040
mutta: 5011
se: 4768
mukaan: 4584
kun: 4054
ovat: 3738
ole: 3701
ollut: 2730
nyt: 2480
sen: 2443
kertoo: 2406
hänen: 2399
voi: 2377
ahtisaaren: 2354
jo: 2237
jälkeen: 2222
joka: 2193
niin: 2178
kanssa: 2148
mainos: 2075
kuin: 1913
presidentti: 1898
tai: 1861
vuonna: 1839
viime: 1803
ahtisaari: 1788
martti: 1751
sanoo: 1714
lehtikuva: 1707
jos: 1700
olla: 1670
olisi: 1597
siitä: 1575
suomen: 1545
sitä: 1494
vain: 1479
sekä: 1472
vielä: 1427
alla: 1383
vuoden: 1354
paljon: 1324
kuitenkin: 1280
noin: 1258
sitten: 1229
ennen: 1221
vaikka: 1221
sai: 1207
lisää: 1177
jatkuu: 1163
en: 1155
kertoi: 1155
tämä: 1155
hyvin: 1126
is: 1118
he: 1111
helsingin: 1111
muun: 1111
olivat: 1111
päättyy: 1111
jossa: 1104
kaikki: 1104
eikä: 1060
eivät: 1060
tämän: 1045
yli: 1045
teksti: 1037
muassa: 1030
olen: 1030
ettei: 1015
koko: 1008
lisäksi: 1008
vuotta: 1008
sillä: 1001
mitä: 979
pitää: 979
yksi: 964
poliisi: 949
sanoi: 949
tällä: 949
lue: 942
aikana: 934
jotka: 905
mies: 883
aina: 876
esimerkiksi: 861
kaksi: 853
ihan: 839
tuli: 839
jonka: 831
tulee: 831
siihen: 817
eli: 809
ne: 802
suomessa: 787
perjantaina: 750
vastaan: 750
antti: 736
euroa: 721
siinä: 721
valitettavasti: 721
miten: 714
näin: 714
koska: 706
kyllä: 699
itse: 692
kertaa: 684
tue: 684
tässä: 684
saa: 677
vaan: 677
enää: 670
eri: 670
selaimesi: 670
todella: 662
kuinka: 640
tehdä: 633
hieman: 625
aiemmin: 618
hyvä: 618
vähän: 618
mitään: 611
aikaa: 589
kello: 567
saanut: 567
venäjän: 567
takia: 559
torstaina: 552
aika: 544
kuten: 537
heidän: 530
hetkellä: 530
marko: 530
stt: 530
ajan: 522
eeva: 522
ainakin: 515
ensi: 515
heti: 515
suuri: 515
taas: 515
asti: 508
jäi: 508
kolme: 508
ruuna: 508
enemmän: 500
joten: 500
toinen: 500
jopa: 493
pois: 493
ilman: 486
isä: 486
ssä: 486
tullut: 486
piti: 478
vasta: 478
viimeksi: 478
kerran: 471
myöhemmin: 471
lähes: 464
hänet: 456
kauden: 456
lopulta: 456
mikä: 456
osa: 456
silloin: 456
ihmiset: 449
juuri: 449
nainen: 449
tehnyt: 449
kuitenkaan: 441
teki: 441
the: 441
hänellä: 434
pieni: 434
poliisin: 434
siellä: 434
helsingissä: 427
olevan: 427
thl: 427
timo: 427
vuoksi: 427
asia: 419
ihmisiä: 419
kautta: 419
kiinni: 419
suomi: 419
välillä: 419
pari: 412
ruotsin: 412
täysin: 412
usein: 412
hietaniemen: 405
marraskuuta: 405
mukana: 405
neljä: 405
perheen: 405

Kuudessa vuodessa ei ole paljon muutosta tapahtunut, lukemat olivat hämmästyttävän yhteneviä. 200 listan ensimmäistä sanaa esiintyivät yhteensä 39898 kertaa eli ne kattoivat 29,356 % koko tekstistä. Piti mennä kolmeen desimaaliin että ero näkyisi. Yleisin sana esiintyi 64,65 kertaa useammin kuin kahdessadas.
275. iso S12.11.2023 klo 18:11
Keskustelut:

on: 16001
ja: 14912
ei: 8888
että: 5699
se: 5174
mutta: 4767
kun: 4128
oli: 3724
niin: 3638
en: 3490
ole: 3302
jos: 2931
nyt: 2735
the: 2733
sen: 2519
tai: 2519
kuin: 2471
olla: 2208
vain: 2043
jo: 2014
ihan: 1914
voi: 1843
sitten: 1790
vielä: 1779
kyllä: 1749
siis: 1664
sitä: 1611
myös: 1605
olisi: 1586
ovat: 1577
olen: 1552
joka: 1495
vaan: 1397
ollut: 1383
tuo: 1350
yksi: 1313
oikein: 1304
mitä: 1295
tämä: 1293
toinen: 1237
vaikka: 1230
of: 1186
saa: 1132
siitä: 1119
tässä: 1073
kaikki: 1059
siinä: 1055
taas: 1052
sana: 1040
and: 1036
tulee: 1033
no: 1027
ne: 1016
kiitos: 1007
aina: 986
minä: 984
aika: 943
joku: 931
eikä: 928
eli: 922
ainakin: 919
tuli: 918
osa: 913
itse: 902
säv: 883
mikä: 873
mitään: 866
siihen: 864
onko: 863
ehkä: 826
hän: 824
ristikko: 822
näin: 819
hyvä: 800
vähän: 799
kanssa: 791
vai: 786
vihje: 757
paljon: 733
koska: 716
ristikon: 715
aivan: 713
kai: 707
kuitenkin: 698
ilman: 693
täällä: 693
joskus: 681
klo: 663
pitää: 660
tämän: 659
in: 657
kaksi: 641
mä: 637
sanat: 627
niitä: 627
eivät: 623
sanan: 619
esim: 618
ennen: 616
san: 599
muuten: 594
voisi: 582
löytyy: 581
joten: 580
miten: 573
jotain: 561
john: 560
nimi: 553
mielestäni: 547
mm: 540
eri: 537
silloin: 535
mukaan: 533
juuri: 525
jälkeen: 521
minulla: 521
enää: 518
minun: 511
koko: 510
kuten: 508
hyvin: 508
minulle: 506
säie: 504
kerran: 492
sillä: 491
jossa: 487
edes: 485
pois: 484
sama: 480
to: 480
ettei: 480
varmaan: 477
suom: 473
sanaa: 473
esitt: 473
de: 473
tuon: 472
me: 468
sain: 467
siellä: 466
pitäisi: 465
jonka: 460
tänään: 458
matti: 457
usein: 455
olevan: 454
tek: 442
jotka: 438
tähän: 433
noin: 431
tätä: 430
anna: 428
sanoja: 420
oikea: 413
tästä: 409
suomen: 405
david: 402
miksi: 390
tullut: 389
robert: 387
juha: 387
tällä: 386
minusta: 383
kari: 383
liian: 383
saanut: 381
muuta: 380
vihjeen: 379
aikaa: 379
sekä: 373
väärin: 371
mieleen: 370
eki: 369
olin: 369
mies: 368
kertaa: 364
pekka: 359
samaa: 358
tuota: 356
antti: 355
iso: 354
enemmän: 353
olet: 352
et: 348
kuva: 348
lienee: 345
kuinka: 345
jäi: 344
mistä: 344
missä: 341
ristikossa: 337
vasta: 336
tosin: 335
ilmeisesti: 332
tietysti: 331
uusi: 330
heti: 330
yhtä: 327
mieltä: 327
tiedä: 326

200 listan ensimmäistä sanaa esiintyivät yhteensä 5012859 kertaa eli ne kattoivat 22,05 % koko tekstistä. Selvästi vähemmän kuin Iltiksessä. Kansan kieli on monipuolisempaa kuin sopulin! Yleisin sana esiintyi 49,05 kertaa useammin kuin kahdessadas. Siinäkin näkyy että sanoja käytetään tasapuolisemmin.
276. iso S12.11.2023 klo 18:13
Raamattu:

ja: 47895
on: 17375
hän: 13907
minä: 10566
herra: 8594
hänen: 8458
oli: 8083
he: 7475
kuin: 6747
ei: 6602
mutta: 6374
sen: 6108
niin: 6106
joka: 5934
kun: 5852
että: 5275
sinä: 4998
se: 4504
sanoi: 4396
sinun: 4378
minun: 4145
kaikki: 4133
jotka: 3991
herran: 3959
heidän: 3765
ovat: 3746
te: 3405
jumala: 3200
ne: 3195
ole: 3192
sillä: 3137
olen: 3009
mitä: 2936
jos: 2842
teidän: 2799
näin: 2664
olivat: 2534
silloin: 2469
hänet: 2391
jumalan: 2332
vastaan: 2312
israelin: 2298
hänelle: 2295
kuningas: 2234
minua: 2204
häntä: 2160
jonka: 2145
olet: 2076
nyt: 2071
tuli: 2057
myös: 2025
tämän: 2019
tulee: 2016
sitten: 2000
tämä: 1995
sitä: 1966
eikä: 1877
minulle: 1874
maan: 1817
sanoo: 1806
koko: 1760
eivät: 1733
heille: 1733
jeesus: 1733
me: 1723
minut: 1723
heidät: 1698
poika: 1677
sinua: 1666
matt: 1609
pois: 1591
vielä: 1536
teille: 1520
mukaan: 1449
tai: 1449
vaan: 1444
en: 1440
joh: 1437
siitä: 1417
luo: 1401
kuninkaan: 1346
meidän: 1341
juudan: 1339
saa: 1334
kor: 1297
heitä: 1289
sinulle: 1289
älä: 1286
päivänä: 1243
sekä: 1224
enää: 1220
voi: 1199
luuk: 1197
mies: 1190
kanssa: 1186
siellä: 1176
tähden: 1172
moos: 1130
kaiken: 1115
niiden: 1106
herraa: 1096
nämä: 1073
vastasi: 1071
maahan: 1051
herralle: 1041
teitä: 1034
antoi: 1018
sinut: 1012
daavidin: 984
koska: 984
vain: 984
ollut: 970
tehnyt: 964
ap: 943
daavid: 927
aina: 918
olette: 918
mikä: 906
room: 906
älkää: 893
antaa: 879
mitään: 879
niitä: 877
vaikka: 874
jeesuksen: 867
jo: 861
kansa: 856
siis: 845
israelilaiset: 844
kukaan: 838
pojan: 826
miehet: 819
lähti: 817
itse: 812
psalmi: 805
sanoivat: 801
kuinka: 796
antanut: 787
edessä: 783
siihen: 783
miksi: 780
kuka: 776
kansan: 753
ette: 751
anna: 749
mark: 741
teidät: 732
mooses: 721
sinne: 703
ennen: 696
annan: 693
ettei: 693
meni: 687
olemme: 684
tullut: 684
jes: 666
ps: 666
teki: 662
maa: 654
ilm: 652
jumalaa: 639
jälkeen: 636
takaisin: 636
jota: 634
kaikkien: 632
paljon: 629
meille: 627
meitä: 625
kaksi: 622
toinen: 604
temppelin: 600
kaupungin: 599
joku: 595
kautta: 595
saakka: 591
olisi: 590
otti: 588
asti: 579
et: 579
piet: 577
suuri: 575
lähetti: 572
miestä: 561
miten: 561
sana: 549
siksi: 549
tekee: 549
ihminen: 545
missä: 545
tee: 545
jotta: 529
luokseen: 529
eteen: 527
kansat: 527
tulivat: 526
ef: 524
eivätkä: 522
maassa: 522
kysyi: 517
sanon: 517

200 listan ensimmäistä sanaa esiintyivät yhteensä 239064 kertaa eli ne kattoivat 42,46 % koko tekstistä. Kuulostaa hiukan toisteiselta? Yleisin sana esiintyi 92,67 kertaa useammin kuin kahdessadas eli sitä todella hoettiin. Sama j-sana oli kärjessä ja kakkosena edellisissäkin. Ei oikeastaan ole yllätys että iso J ei mahtunut 200:n listalle, koska kirjassa nimenomaan kielletään turhaan lausumasta H:n sinun J:si nimeä.
277. iso S12.11.2023 klo 18:15
7 veljestä:

ja: 52684
mutta: 15596
hän: 13047
juhani: 12512
on: 10161
niin: 9216
kuin: 7699
oli: 6579
nyt: 6542
ei: 5883
he: 5833
hänen: 5348
aapo: 5037
minä: 4826
timo: 4577
se: 4515
että: 4017
joka: 3980
sen: 3893
vaan: 3806
tuomas: 3694
koska: 3619
simeoni: 3569
vielä: 3495
eero: 3358
mitä: 3134
heidän: 3010
tämä: 2885
aina: 2662
sinä: 2649
jo: 2512
tässä: 2463
viimein: 2239
siinä: 2152
lauri: 2139
veljekset: 2114
kaikki: 2102
myös: 2102
niinkuin: 2052
mies: 2027
kerran: 1978
jos: 1965
kohden: 1928
taasen: 1890
silloin: 1841
häntä: 1803
juuri: 1766
sillä: 1754
meitä: 1691
siitä: 1691
alas: 1679
kuitenkin: 1679
ylös: 1679
jukolan: 1592
sitä: 1567
oikein: 1542
ole: 1468
kun: 1455
täällä: 1430
miehen: 1418
kuinka: 1381
mikä: 1368
pian: 1368
sitten: 1368
jonka: 1356
siellä: 1356
taas: 1356
heitä: 1343
ulos: 1331
en: 1293
kaksi: 1293
vaikka: 1293
ennen: 1281
tämän: 1281
pois: 1256
tuossa: 1231
tuolla: 1169
vastaan: 1169
me: 1144
itse: 1119
olkoon: 1107
kas: 1070
kovin: 1057
poika: 1045
ukko: 1045
kanssa: 1032
ilman: 1020
voi: 1007
meille: 995
seitsemän: 995
näin: 983
olen: 983
tai: 983
tuo: 983
kyllä: 908
impivaaran: 883
kohta: 883
tuli: 883
veljet: 883
miksi: 871
minun: 858
toinen: 858
minua: 846
pojat: 833
te: 833
yksi: 833
no: 821
taivaan: 821
aika: 808
alla: 808
jossa: 808
seisoi: 808
sinun: 808
hänelle: 796
päivä: 796
sekä: 796
jotka: 784
meidän: 784
ympäri: 784
eikä: 771
tuota: 771
herran: 759
takaisin: 759
veljesten: 759
olivat: 746
vähän: 734
ah: 721
ovat: 721
istui: 709
pitkin: 709
siis: 709
tuon: 709
jumalan: 696
kauan: 696
tästä: 696
vasten: 696
älä: 696
sinua: 684
yhtään: 672
noin: 659
eihän: 647
heille: 647
hieman: 647
niinpä: 647
sentähden: 647
koreasti: 634
josta: 622
milloin: 622
tänne: 622
äkisti: 622
hetken: 609
jota: 609
seisoivat: 609
jumala: 597
lausui: 597
enään: 585
lukkari: 585
muut: 585
ollut: 585
suuri: 585
talon: 585
vallan: 585
enemmin: 572
juhanin: 572
maailman: 572
meillä: 572
yli: 572
asti: 560
herra: 560
hyvä: 560
koko: 560
usein: 560
äänellä: 560
läksivät: 547
miestä: 547
mikko: 547
mäkelä: 547
onpa: 547
silmät: 547
tuosta: 547
heistä: 535
tällä: 535
astui: 522
kohtaan: 522
lopulta: 522
olemme: 510
rupesi: 510
silmänsä: 510
tahdon: 510
tähden: 510
yhä: 510
emäntä: 497
ettei: 497
kiinni: 497
läksi: 497
siihen: 497
itsensä: 485
käy: 485
ne: 485
paljon: 485
teitä: 485

200 listan ensimmäistä sanaa esiintyivät yhteensä 30804 kertaa eli ne kattoivat 38,31 % koko tekstistä. Lähes raamatullinen lukema. Yleisin sana esiintyi peräti 108,62 kertaa useammin kuin kahdessadas. Ja, ja ja vielä kerran ja! Tämän kirjan iso J ei ole kielletty ja Juhani pääsikin neljänneksi.
278. iso S12.11.2023 klo 18:16
Ristikot:

taas: 1801
alas: 1727
asia: 1516
itse: 1396
atet: 1323
akat: 1249
aita: 1240
otot: 1231
otsa: 1231
osat: 1176
taus: 1176
alus: 1167
isot: 1167
siis: 1139
asut: 1130
otus: 1112
sata: 1084
osata: 1075
etana: 1056
alat: 1038
itara: 1038
arat: 1001
anita: 992
itku: 955
otin: 955
siat: 919
utti: 919
asat: 909
tiet: 909
anis: 891
asua: 882
esat: 882
atso: 873
tuta: 873
aate: 864
asti: 864
taso: 864
aasi: 854
ajaa: 854
tain: 854
ulos: 845
alin: 836
etoa: 836
nata: 836
taata: 836
alati: 827
anoa: 827
asta: 827
täti: 827
atos: 808
irti: 808
isit: 808
ivat: 808
ansa: 799
alta: 790
opas: 790
taos: 790
otos: 781
viat: 781
inat: 772
osua: 772
anut: 762
atte: 762
atik: 753
tila: 753
asiat: 744
ihan: 744
ilot: 744
tiit: 744
lait: 735
maat: 735
toti: 735
akut: 726
aste: 726
avata: 726
ilta: 726
ovet: 726
rata: 726
tiut: 726
unet: 726
urat: 726
teot: 717
atomi: 707
aatu: 698
akka: 698
alias: 698
isota: 689
isät: 689
sataa: 689
äiti: 689
aisa: 680
iita: 680
tali: 680
oras: 671
tana: 671
aika: 661
ajat: 661
inari: 661
kait: 661
otava: 661
tina: 661
imut: 652
niin: 652
omat: 652
enin: 643
raot: 643
atlas: 634
avut: 634
enot: 634
tatu: 634
vain: 625
avio: 615
osin: 615
otsat: 615
otto: 615
pian: 615
teos: 615
liat: 606
oksa: 606
ottaa: 606
tosi: 606
toto: 606
aava: 597
aski: 597
kala: 597
suat: 597
tasan: 597
akti: 588
alut: 588
auto: 588
elin: 588
laet: 588
seis: 588
sota: 588
tati: 588
tuet: 588
alla: 579
apet: 579
loat: 579
mies: 579
noin: 579
tapa: 579
ukit: 579
vaan: 579
antaa: 570
arit: 570
ekat: 570
kita: 570
luut: 570
tase: 570
aasa: 560
aina: 560
anelu: 560
lasi: 560
aari: 551
avain: 551
usea: 551
into: 542
kuin: 542
otso: 542
ukot: 542
sato: 533
täit: 533
akku: 524
haat: 524
olav: 524
tatar: 524
ural: 524
useat: 524
anti: 514
astia: 514
ei: 514
irak: 514
stop: 514
tatit: 514
aleta: 505
alue: 505
iili: 505
utelu: 505
aito: 496
alit: 496
avara: 496
inte: 496
kasa: 496
tate: 496
vati: 496
akana: 487
alava: 487
aral: 487
etna: 487
isku: 487
olio: 487
oraat: 487
tasa: 487
tott: 487
uros: 487
anni: 478
aton: 478
olat: 478
opit: 478
pois: 478
sana: 478
star: 478
teat: 478

200 listan ensimmäistä sanaa esiintyivät yhteensä 15636 kertaa eli ne kattoivat vaivaiset 14,36 % kaikista sanoista. Tekstistähän ei voi varsinaisesti puhua. Yleisin sana esiintyi vain 3,77 kertaa useammin kuin kahdessadas. Ihan turha urputtaa että ristikoissa toistuvat aina ne samat sanat. Kyllä semmoinen keskittyminen löytyy ihan muualta.

Kärkipään sanasto on melko erilainen kuin Iltiksessä: 204 yleisimmästä vain 15 löytyy Iltiksen vuoden 2017 kärkipään listalta: aika, aina, asia, ei, ihan, itse, kuin, mies, niin, noin, pois, siis, taas, vaan ja vain.
279. iso S13.11.2023 klo 15:01
Shakespearea ulkomuistista siteeraten: on vanhan muisti huono, vaan jos kaikki hän unhottaa niin muistaa lisäämällä: sanatilastossani sanat on värkätty ristikkomuotoon, tosin pienillä kirjaimilla kirjoitettuna. Tavu- ja väliviivat sekä apostrofit on poistettu ((ala-aste => alaaste ja O'Hara => ohara). Ulkomaalaisilla härpäkkeillä varustetut kirjaimet (á ja vastaavat) on korvattu kotimaisilla aakkosilla. Noihin 200 kärjessä -listoihin tällä ei sinänsä ole ainakaan merkittävää vaikutusta, koska kärjessä keikkuvat tutut ja turvalliset lyhyet sanat.

Sanaksi poimintasysteemini tunnistaa kirjaimista muodostuvan merkkijonon, jossa on vähintään kaksi kirjainta ja kirjainten välissä voi olla yksittäinen tavuviiva tai apostrofi. Molemmilla puolilla pitää olla "laillinen" erotinmerkki tai tekstin ääripää. Perusmuoto, monikko ja taivutusmuoto ovat eri sanoja, jos ne siltä näyttävät, ja samoja sanoja jos ne siltä näyttävät. Tuli on tuli olipa se lauseessa substantiivin perusmuoto tai verbin imperfekti. Tuli, tulet ja tulessa ovat tilastossa eri sanoja.

Keskusteluista on siivottu pois säikeiden otsikkorivit, viestien lähettäjä-rivit ja lainaus-rivit (pelkkä lainatun paljastava rivi, ei itse lainausta. Lisäksi tekstistä on häivytetty mm. http://- ja https://-alkuiset merkkijonot. Siis varsinaiseen asiaan sisältyvät sanat on pyritty löytämään. Joku muu joillakin muilla kriteerelillä saa erilaisia tuloksia, samoin jos tekee vastaavan tilaston sivuston nykyisestä sisällöstä, Muutama vuosi sitten tapahtuneess katastrofissa muutama kuukausi katosi bittiavaruuteen, mutta minulla sattui oleman osa hävikistä jemmassa.

Vielä luvut tiskiin: löysin ryhmistä Ristikot ja Muut aiheet kaikkiaan 1414295 erilaista "sanaa" (joukossa kaikenlaisia näppihäiriöitä, älähdyksiä ja ölähdyksiä), yhteensä 22729094 sanaa. Yli puolet sanoista (743772) esiintyi vain kerran. Erittäin karkean arvion mukaan noista 1,4 miljoonasta sanasta noin 300000 - 400000 voisi olla perusmuotoisia ja "järjellisiä". Kuinkahan monta sanaa Lönnrot aikanaan keräsi? Luultavasti vähemmän, mutta suuremmalla työllä!
280. Matias-Myyrä13.11.2023 klo 16:05
Jännää miten erilainen sanasto on kryptoissa ja kuvaristikoissa. Sanaris-kryptojen yleisin sana "idoli" ei esiinny ollenkaan noissa ison ässän yleisimmissä sanoissa. Eikä noissa taida olla juuri ollenkaan yhteisiä sanoja.
Tässä listassa on tilastoimissani kryptoissa vähintään 100 kertaa esiintyneet sanat. Tilastossa on 42716 erilaista sanaa 2732 kryptosta.

199: idoli
184: ibiza
175: arabi
173: oscar
168: alibi
164: origo
163: itiöt
161: tosca
157: nizza
157: alice
154: irwin
141: igor
136: epeli
132: ämyri
131: twain
130: ylös
129: ufot
127: twist
127: irene
126: pizza
126: nyöri
125: nixon
124: yrtti
124: wifi
124: osake
123: info
123: emali
121: täti
121: islam
119: ääliö
117: intro
116: tweed
116: edwin
115: oboe
115: ikävä
114: itse
113: itiö
112: lewis
111: rötös
111: espoo
110: texas
110: skåne
110: exit
109: tiede
109: leffa
108: swing
107: jaffa
106: tower
105: taco
105: libya
105: extra
105: atlas
104: naali
104: etana
103: okapi
103: nobel
103: inari
103: bowie
102: scifi
102: iglut
101: tofu
100: öljyt
100: omega
100: kebab
100: glögi
281. Jaska13.11.2023 klo 17:58
Jännyyteen syyllisiä ovat tietysti kunnianhimoiset laatijat pyrkimyksineen tällätä kryptoonsa mahdollisimman monta eri aakkostomme 29:stä kirjaimesta.
282. iso S14.11.2023 klo 11:29
Alastomien selviytyjien ja muiden luonto-ohjelmien termein todettunatäällä kuhisee tilastohulluja. Nyt meitä on kärynnyt jo kaksi.

Matias-Myyrän 66 sanan listasta neljä oli 200 yleisimmän joukossa minun ristikkkosanojen listassani, jossa on 29645 erilaista sanaa. Peräti 19 eli lähes 29 prosenttia ei osunut noin tuhannen ristikon aineistooni. Tämä kertoo lähinnä siitä että aineistoni oli liian suppea, mutta ei mitenkään kumoa sitä havaintoa että kryptojen ja kuvaristikoiden sanastot ovat vahvasti eri suuntaan kallellaan.

Tässä Matias-Myyrän lista päivitettynä (suluissa) tiedolla siitä, miten monentena sana on minun listallani. Sijaluku on etenkin häntäpäässä hyvin suuntaa-antava, koska tasapelin sattuessa sanat on aakkostettu ja kukin on saanut oman sijansa. Esimerkiksi kaksi kertaa esiintynyt omega sai sijaluvun 10934. Aineiston pitäisi olla paljon, paljon isompi että loppupäähän saataisiin todellisia eroja. Kahdesti esiintyneitä oli kaikkiaan 4183. Omegaa ei voi näillä tiedoilla todistaa sen harvinaisemmaksi kuin sijan 8002 Aakenus tai yleisemmäksi kuin sijan 12184 Östring, vaikka sijaluku antaa niin ymmärtää.

199: idoli (2080.)
184: ibiza (-)
175: arabi (1049.)
173: oscar (10451.)
168: alibi (2507.)
164: origo (3651.)
163: itiöt (999.)
161: tosca (-)
157: nizza (-)
157: alice (3322.)
154: irwin (5121.)
141: igor (2575.)
136: epeli (988.)
132: ämyri (3297.)
131: twain (7808.)
130: ylös (841.)
129: ufot (7826.)
127: twist (27780.)
127: irene (1148.)
126: pizza (-)
126: nyöri (-)
125: nixon (21536.)
124: yrtti (3294.)
124: wifi (-)
124: osake (321.)
123: info (15930.)
123: emali (416.)
121: täti (49.)
121: islam (538.)
119: ääliö (29617.)
117: intro (1874.)
116: tweed (-)
116: edwin (-)
115: oboe (3637.)
115: ikävä (1422.)
114: itse (4.)
113: itiö (998.)
112: lewis (19486.)
111: rötös (-)
111: espoo (2916.)
110: texas (7680.)
110: skåne (11220.)
110: exit (-)
109: tiede (2800.)
109: leffa (-)
108: swing (-)
107: jaffa (-)
106: tower (11673.)
105: taco (26361.)
105: libya (-)
105: extra (-)
105: atlas (107.)
104: naali (699.)
104: etana (19.)
103: okapi (879.)
103: nobel (10266.)
103: inari (98.)
103: bowie (-)
102: scifi (-)
102: iglut (8853.)
101: tofu (-)
100: öljyt (7997.)
100: omega (10394.)
100: kebab (-)
100: glögi (8670.)

Listalla oli kärkipäässä sana itiöt ja juuri äskettäin tuli ristikossa vastaan vihje levillä jonka ratkaisu oli itiöt. Ilmainen vinkki laatijoille: pääkuvaan voisi sijoittaa kasvitieteilijän Leville etsimään itiöitä. Ratkaisulauseet jätän itse keksittäväksi. Saa suorittaa.
283. iso S26.11.2023 klo 11:53
Sivutoimisen harrastuslaatijan urallani 1996-2020 väsäsin vähän yli 1000 kuvaristikkoa. Tilastoin kaksi satsia, ristikot 1-500 ja ja 501-1000 (tykkään tasaluvuista). Niitä vertailemalla voi ehkä nähdä, onko mikään muuttunut ja mihin suuntaan. Tässä ltilastoa periaatteella
Mitä: 1-500 - 501-1000 - Yhteensä

Vaakasanoja: 23275 - 22891 - 46166
Niiden keskipituus: 5,34 - 5,30 - 5,32
Pystysanoja: 22623 - 22851 - 45474
Niiden keskipituus: 5,51 - 5,35 - 5,43
Sanoja yhteensä: 45898 - 45742 - 91640
Erilaisia sanoja: 14724 - 13397 - 21464
Niiden keskipituus: 5,42 - 5,35 - 5,37
Kirjainruutuja: 132518 - 130763 - 263281
Vaakasanoissa piilokirjaimia: 7760 - 8513 - 16273
Pystysanoissa piilokirjaimia: 8291 - 9479 - 17770
Piilokirjaimia yhteensä: 16051 - 17992 - 34043
Kirjaimista piilokirjaimia %: 12,11 - 13,76 - 12,93

Sanojen keskipituus vaihteli ristikoittain välillä 4,85 (aika noloa) - 6,12.
Kokonaan piilokirjaimettomia oli 3. Muissa piilokirjainprosentti (piilokirjaimia kaikista kirjaimista) vaihteli välillä 2,17 - (kehtaisiko tunnustaa) 20,44. Kaikkiaan 111 ristikossa piilokirjainprosentti oli enintään 10.

Voisi kuvitella että harjoittelu auttaa ja kehitystä tapahtuu, mutta mekaanisesti laskettavien tunnuslukujen (sanojen keskipituus ja piilokirjainprosentti) valossa tuli pikemminkin taantumista. Mutu neuvoi lopettamaan kohtuullisen hyvän sään aikana ja nyt tuli todistetuksi että aihetta olikin.

Erityisesti panostin sanaston laatuun ainakin siinä mielessä, että yritin välttää monia mielestäni huonoja sanoja. Tässä onnistuin ainakin osittain, kun vertaa vanhasta tilastostani löytyvään listaan muiden laatimista ristikoista. Valtaosa Hesarista, joten kaikkien laatijoiden ei tarvitse tuntea pistoa sydämessään ja Hesarin laatijan sydämestä ei tarvinne olla huolissaan. Minun ristikoissani oli yhteensä 91640 sanaa ja vertailuristikoissa 72942, joten muiden määrät pitäisi periaatteessa kertoa noin 0,8:lla. Menköön todellisilla luvuilla. Niistäkin saa riittävän selvän kuvan kriteerien erilaisuudesta:

Aton (52-3), Atair (47-0), IATA (46-3), etat (36-1), Itil (34-1), skat (32-0), Anas (31-1), Atar (30-0), aval (28-2), Apis (26-0), Atta (26-0), itte (26-3), Atiu (25-0), Nain (25-2).

Kuka muka Suomessa pelaa skatia? Jos pelaa niin ei ainakaan täydellä pakalla. Hauska sattuma: skat esiintyi 32 kertaa ja sitä pelataan 32 kortin pakalla!

Tuo välttely saattoi osittain vaikuttaa siihen että minulla yleisimmät sanat olivat useammin toistuvia kuin muilla. Yleisin sana TAAS kattoi minulla 0,2946 % kaikista sanoista, muilla ALAS 0,1330 %. Minulla peräti 42 yleisintä sanaa kahmaisi noin suuren osuuden. Muilla sijalla 42 olevan osuus oli 0.0699 %. Sanojen tasapuolisessa kohtelussa minulle jäi runsaasti parantamisen varaa. Seuraavassa elämässä sitten.

Muiden ristikoissa 100 yleisintä sanaa olivat alas, taas, asia, atet, atik, osat, utti, itara, otot, otsa, alus, itse, aita, akat, anis, tati, asat, täti, anita, taus, isot, siis, sata, otus, etana, aasi, anoa, asut, arat, esat, aate, irti, inat, nata, aika, ansa, teos, etna, alat, alati, atte, osata, itku, alta, tiit, ural, ei, tuta, isät, aral, atso, ilta, irak, aton, tain, ivat, etoa, tila, maat, isota, atlas, tasan, aasa, utah, atair, atos, kait, iata, siat, tiet, alias, äiti, akti, tott, star, saar, ulos, opas, akka, tate, teat, akaa, ajaa, alin, lait, urat, tali, inari, kala, olav, teak, otin, taso, osua, ilot, ihan, tiut, unet, isis ja asua.

Omasta sanastostani kahdessa seuraavassa viestissä.
284. iso S26.11.2023 klo 11:54
Tässä tuhannen ristikkoni 50 yleisintä tyyliin
sana: ristikot 1-500 - ristikot 501-1000 - ristikot 1-1000
Kussakin osiossa sijoitus (esiintymiskerrat/sanan osuus kaikista %)

TAAS: 1. (144/0,3137 %) - 2. (126/0,2755 %) - 1. (270/0,2946 %)
ALAS: 2. (126/0,2745 %) - 1. (137/0,2995 %) - 2. (263/0,2870 %)
ITSE: 3. (112/0,2440 %) - 3. (119/0,2602 %) - 3. (231/0,2521 %)
ASIA: 4. (98/0,2135 %) - 4. (111/0,2427 %) - 4. (209/0,2281 %)
AITA: 9. (85/0,1852 %) - 6. (106/0,2317 %) - 5. (191/0,2084 %)
OTUS: 16. (79/0,1721 %) - 5. (108/0,2361 %) - 6. (187/0,2041 %)
ASUT: 11. (85/0,1852 %) - 7. (100/0,2186 %) - 7. (185/0,2019 %)
OTSA: 7. (86/0,1874 %) - 8. (99/0,2164 %) - 8. (185/0,2019 %)
OSATA: 6. (86/0,1874 %) - 9. (97/0,2121 %) - 9. (183/0,1997 %)
TAUS: 15. (80/0,1743 %) - 10. (97/0,2121 %) - 10. (177/0,1931 %)
OTIN: 5. (87/0,1896 %) - 16. (86/0,1880 %) - 11. (173/0,1888 %)
SATA: 8. (86/0,1874 %) - 15. (87/0,1902 %) - 12. (173/0,1888 %)
SIAT: 17. (77/0,1678 %) - 11. (96/0,2099 %) - 13. (173/0,1888 %)
AKAT: 10. (85/0,1852 %) - 20. (81/0,1771 %) - 14. (166/0,1811 %)
ALUS: 21. (73/0,1590 %) - 13. (92/0,2011 %) - 15. (165/0,1801 %)
ISOT: 13. (82/0,1787 %) - 22. (81/0,1771 %) - 16. (163/0,1779 %)
ITKU: 30. (68/0,1482 %) - 12. (95/0,2077 %) - 17. (163/0,1779 %)
ASTI: 19. (74/0,1612 %) - 19. (83/0,1815 %) - 18. (157/0,1713 %)
OSAT: 18. (75/0,1634 %) - 23. (81/0,1771 %) - 19. (156/0,1702 %)
ATET: 12. (85/0,1852 %) - 30. (70/0,1530 %) - 20. (155/0,1691 %)
ASUA: 25. (71/0,1547 %) - 21. (81/0,1771 %) - 21. (152/0,1659 %)
ALAT: 14. (80/0,1743 %) - 31. (69/0,1508 %) - 22. (149/0,1626 %)
ANITA: 22. (73/0,1590 %) - 26. (74/0,1618 %) - 23. (147/0,1604 %)
IHAN: 43. (57/0,1242 %) - 14. (90/0,1968 %) - 24. (147/0,1604 %)
ISIT: 37. (62/0,1351 %) - 17. (85/0,1858 %) - 25. (147/0,1604 %)
ETANA: 23. (73/0,1590 %) - 27. (73/0,1596 %) - 26. (146/0,1593 %)
AJAA: 27. (70/0,1525 %) - 35. (67/0,1465 %) - 27. (137/0,1495 %)
TAIN: 40. (59/0,1285 %) - 25. (78/0,1705 %) - 28. (137/0,1495 %)
TAATA: 28. (69/0,1503 %) - 37. (67/0,1465 %) - 29. (136/0,1484 %)
TIET: 31. (68/0,1482 %) - 33. (68/0,1487 %) - 30. (136/0,1484 %)
SIIS: 20. (74/0,1612 %) - 52. (60/0,1312 %) - 31. (134/0,1462 %)
ALATI: 64. (50/0,1089 %) - 18. (83/0,1815 %) - 32. (133/0,1451 %)
TAOS: 34. (65/0,1416 %) - 32. (68/0,1487 %) - 33. (133/0,1451 %)
TASO: 26. (71/0,1547 %) - 49. (61/0,1334 %) - 34. (132/0,1440 %)
ULOS: 39. (62/0,1351 %) - 34. (68/0,1487 %) - 35. (130/0,1419 %)
OTOT: 24. (73/0,1590 %) - 66. (56/0,1224 %) - 36. (129/0,1408 %)
ALIN: 35. (62/0,1351 %) - 39. (66/0,1443 %) - 37. (128/0,1397 %)
ARAT: 29. (68/0,1482 %) - 50. (60/0,1312 %) - 38. (128/0,1397 %)
ITARA: 67. (50/0,1089 %) - 24. (78/0,1705 %) - 39. (128/0,1397 %)
ETOA: 36. (62/0,1351 %) - 45. (63/0,1377 %) - 40. (125/0,1364 %)
ENOT: 54. (53/0,1155 %) - 28. (71/0,1552 %) - 41. (124/0,1353 %)
OVET: 45. (57/0,1242 %) - 36. (67/0,1465 %) - 42. (124/0,1353 %)
OTOS: 32. (67/0,1460 %) - 76. (54/0,1181 %) - 43. (121/0,1320 %)
ANSA: 65. (50/0,1089 %) - 29. (70/0,1530 %) - 44. (120/0,1309 %)
AATE: 52. (53/0,1155 %) - 38. (66/0,1443 %) - 45. (119/0,1299 %)
ATSO: 47. (56/0,1220 %) - 43. (63/0,1377 %) - 46. (119/0,1299 %)
ATOS: 50. (54/0,1177 %) - 47. (61/0,1334 %) - 47. (115/0,1255 %)
TUTA: 41. (59/0,1285 %) - 72. (55/0,1202 %) - 48. (114/0,1244 %)
AKUT: 42. (58/0,1264 %) - 68. (55/0,1202 %) - 49. (113/0,1233 %)
OPAS: 76. (47/0,1024 %) - 40. (66/0,1443 %) - 50. (113/0,1233 %)
285. iso S26.11.2023 klo 11:56
Tässä Top-100:n loput:
TINA: 61. (52/0,1133 %) - 53. (60/0,1312 %) - 51. (112/0,1222 %)
OSUA: 44. (57/0,1242 %) - 75. (54/0,1181 %) - 52. (111/0,1211 %)
IVAT: 58. (52/0,1133 %) - 58. (58/0,1268 %) - 53. (110/0,1200 %)
TANA: 60. (52/0,1133 %) - 59. (58/0,1268 %) - 54. (110/0,1200 %)
UNET: 84. (46/0,1002 %) - 42. (64/0,1399 %) - 55. (110/0,1200 %)
ASTA: 33. (65/0,1416 %) - 116. (44/0,0962 %) - 56. (109/0,1189 %)
TAPA: 71. (49/0,1068 %) - 60. (58/0,1268 %) - 57. (107/0,1168 %)
ANUT: 56. (52/0,1133 %) - 77. (53/0,1159 %) - 58. (105/0,1146 %)
ASIAT: 46. (56/0,1220 %) - 92. (49/0,1071 %) - 59. (105/0,1146 %)
UKIT: 123. (40/0,0871 %) - 41. (65/0,1421 %) - 60. (105/0,1146 %)
AASI: 85. (45/0,0980 %) - 54. (59/0,1290 %) - 61. (104/0,1135 %)
ENIN: 104. (41/0,0893 %) - 44. (63/0,1377 %) - 62. (104/0,1135 %)
TASE: 110. (41/0,0893 %) - 46. (63/0,1377 %) - 63. (104/0,1135 %)
ANOA: 87. (45/0,0980 %) - 55. (58/0,1268 %) - 64. (103/0,1124 %)
APET: 88. (45/0,0980 %) - 56. (58/0,1268 %) - 65. (103/0,1124 %)
AISA: 73. (48/0,1046 %) - 73. (54/0,1181 %) - 66. (102/0,1113 %)
INTO: 70. (49/0,1068 %) - 78. (53/0,1159 %) - 67. (102/0,1113 %)
OSIN: 90. (45/0,0980 %) - 63. (57/0,1246 %) - 68. (102/0,1113 %)
VIAT: 55. (53/0,1155 %) - 95. (49/0,1071 %) - 69. (102/0,1113 %)
TOTI: 38. (62/0,1351 %) - 150. (39/0,0853 %) - 70. (101/0,1102 %)
OMAT: 59. (52/0,1133 %) - 99. (48/0,1049 %) - 71. (100/0,1091 %)
OTAVA: 91. (45/0,0980 %) - 70. (55/0,1202 %) - 72. (100/0,1091 %)
ILTA: 134. (38/0,0828 %) - 48. (61/0,1334 %) - 73. (99/0,1080 %)
AVUT: 49. (55/0,1198 %) - 125. (43/0,0940 %) - 74. (98/0,1069 %)
ESAT: 66. (50/0,1089 %) - 97. (48/0,1049 %) - 75. (98/0,1069 %)
LAIT: 74. (48/0,1046 %) - 87. (50/0,1093 %) - 76. (98/0,1069 %)
NOIN: 107. (41/0,0893 %) - 62. (57/0,1246 %) - 77. (98/0,1069 %)
RAOT: 77. (47/0,1024 %) - 86. (51/0,1115 %) - 78. (98/0,1069 %)
ASTE: 53. (53/0,1155 %) - 117. (44/0,0962 %) - 79. (97/0,1058 %)
NIIN: 94. (44/0,0959 %) - 79. (53/0,1159 %) - 80. (97/0,1058 %)
URAT: 78. (47/0,1024 %) - 90. (50/0,1093 %) - 81. (97/0,1058 %)
VAIN: 111. (41/0,0893 %) - 67. (56/0,1224 %) - 82. (97/0,1058 %)
ALIAS: 125. (39/0,0850 %) - 61. (57/0,1246 %) - 83. (96/0,1048 %)
EKAT: 89. (45/0,0980 %) - 85. (51/0,1115 %) - 84. (96/0,1048 %)
KUIN: 100. (42/0,0915 %) - 74. (54/0,1181 %) - 85. (96/0,1048 %)
AKANA: 124. (39/0,0850 %) - 64. (56/0,1224 %) - 86. (95/0,1037 %)
ELIN: 144. (37/0,0806 %) - 57. (58/0,1268 %) - 87. (95/0,1037 %)
VAAN: 51. (54/0,1177 %) - 141. (41/0,0896 %) - 88. (95/0,1037 %)
ILOT: 62. (51/0,1111 %) - 126. (43/0,0940 %) - 89. (94/0,1026 %)
RATA: 68. (50/0,1089 %) - 120. (44/0,0962 %) - 90. (94/0,1026 %)
SATAA: 75. (48/0,1046 %) - 105. (46/0,1006 %) - 91. (94/0,1026 %)
AVATA: 48. (55/0,1198 %) - 151. (38/0,0831 %) - 92. (93/0,1015 %)
OKSA: 178. (33/0,0719 %) - 51. (60/0,1312 %) - 93. (93/0,1015 %)
OLAT: 148. (37/0,0806 %) - 65. (56/0,1224 %) - 94. (93/0,1015 %)
ATOMI: 79. (46/0,1002 %) - 103. (46/0,1006 %) - 95. (92/0,1004 %)
IRTI: 96. (43/0,0937 %) - 93. (49/0,1071 %) - 96. (92/0,1004 %)
ALTA: 113. (40/0,0871 %) - 82. (51/0,1115 %) - 97. (91/0,0993 %)
APEA: 115. (40/0,0871 %) - 84. (51/0,1115 %) - 98. (91/0,0993 %)
IMUT: 80. (46/0,1002 %) - 109. (45/0,0984 %) - 99. (91/0,0993 %)
TOSI: 138. (38/0,0828 %) - 80. (53/0,1159 %) - 100. (91/0,0993 %)
286. iso S29.11.2023 klo 18:29
Tässä edellisiin liittyen tilastoa eripituisista sanoista.
Pituus Kpl % sanoista Kertaa % kerroista Keskim. Eka sij. Kertaa Yleisin

Rivin tulkinta:
1. Sanan pituus
2. Erilaisten sanojen lukumäärä
3. Lukumäärän prosenttiosuus kaikista sanoista
4. Sanojen esiintymiskertojen määrä
5. Esiintymiskertojen prosenttiosuus kaikista sanoista
6. Esiintymiskertoja per sana keskimäärin
7. Yleisimmän sanan sijoitus esiintymiskertojen mukaan
8. Yleisimmän sanan esiintymiskertojen määrä
9. Yleisin sana

2: 11, 0,05, 97, 0,11, 8,82, 352., 41, ON
3: 44, 0,21, 71, 0,08, 1,61, 3346., 5, SAA
4: 1787, 8,34, 37566, 40,99, 21,02, 1., 270, TAAS
5: 3659, 17,09, 24777, 27,04, 6,77, 9., 183, OSATA
6: 3705, 17,30, 11133, 12,15, 3,00, 257., 52, TASATA
7: 3390, 15,83, 6645, 7,25, 1,96, 759., 22, TITAANI
8: 3121, 14,57, 4648, 5,07, 1,49, 1150., 14, ATSALEAT
9: 2471, 11,54, 3120, 3,40, 1,26, 1641., 10, INTIAANIT
10: 1847, 8,62, 2130, 2,32, 1,15, 3410., 5, TALITINTIT
11: 632, 2,95, 679, 0,74, 1,07, 3597., 4, ASSOSIAATIO
12: 229, 1,07, 234, 0,26, 1,02, 6100., 2, ARKISTOINNIT
13: 201, 0,94, 211, 0,23, 1,05, 4875., 3, KOHTELIAISUUS
14: 124, 0,58, 130, 0,14, 1,05, 6481., 2, HOLLANTILAINEN
15: 96, 0,45, 101, 0,11, 1,05, 5950., 2, AJATUKSENAIHEET
16: 59, 0,28, 59, 0,06, 1,00, 9096., 1, ADVENTTIKYNTTILÄ

Kaksi- ja kolmikirjaimiset voivat esiintyä vain lauseissa, joten ne eivät ole vertailukelpoisia muiden pituuksien kanssa. Otin ne mukaan koska se ei aiheuttanut lisävaivaa ja oma mielenkiintonsa niilläkin. Yli 16 kirjaimen mittaiset ovat niin harvinaisia että niistä ei pysty vetämään tilastollisesti merkittäviä johtopäätöksiä.

Ehkä tärkeimmät huomiot voi tehdä pituuksista 4-6. Eniten erilaisia sanoja oli 6-kirjaimisissa. Pituus 5 pääsi melkein tasoihin ja pituus 4 jäi alle puoleen. Sanojen esiintymiskerroissa kuitenkin pituus 4 on kunkku, pituus 5 jää noin kolmasosan verran jälkeen ja pituus kuusi saa "ruutuaikaa" vähän alle 30 % siitä mitä neloset saavat. Dramaattinen ero näkyy myös siinä, miten monta kertaa tietyn pituiset sanat esiintyvät keskimäärin.

Kukin vetäköön omat johtopäätöksensä, minä vedän tämän: ristikon sanojen keskipituus ei välttämättä ole paras mittari kuvaamaan ristikon hyvyyttä ratkojan kannalta. Hyvään keskipituuteen voi päästä muutamalla tosi pitkällä sanalla ja suurella määrällä lyhehköjä huonoja sanoja. Nuo huonot voivat olla absoluuttisesti huonoja (pakkosanoja, jotka tulevat väkisin että saisi ne pitkät onnistumaan) tai huonoja siksi, että ne ovat usein toistuvia ja sitä kautta ratkojia kyllästyttäviä. Tärkeämpi on nelikirjaimisten vähyys. Siihen pyrkiminen toki tuppaa nostamaan keskipituutta, hyvä, mutta vielä parempi että se vähentää tehokkaasti sanojen toistuvuutta. Tämä tarkoittaa sitä että ratkoja törmää harvemmin samaan sanaan ja samaan vihjeeseen. Jatkuva Ismail => Atik -ilmiö alkaa helposti riipiä. Se ei kyllä ole Atikin itsensä vika, mutta sattuneesta syystä helposti mieleen tuleva esimerkkitapaus.

Kukapa se kissan hännän nostaa? Jos en minä niin kissa itse. Noissa tuhannessa ristikossani Atik on viisi kertaa. Pidän määrää kohtuullisena. Jos ratkoo viisi ristikkoa päivässä, Atik tulee vastaan kerran 40 päivässä. Noin monta päivää ja yötä Raamatun mukaan taisi sataa putkeen, joten ainakaan minun ristikkkoni eivät olleet syynä jos Ukko Nooa hermostui Atikiin ennen Araratiin törmäämistä. Siihen arkki törmäsi vain kerran ja saman verran Araratiin törmää ristikoissani, jotka ovat näin ollen lähes uskonnollinen kokemus. Numerot eivät valehtele!
287. iso S1.12.2023 klo 18:34
Opiskeluaikana tein ohjelman, joka ennusti kirjainkolmikoiden esiintymistiheyden perusteella, onko sana tai lause suomea, ruotsia vai englantia. Yllättävän pienen aineiston pohjalta se osui kohtuullisen usein oikeaan.

Sovelsin ajatusta edellä olevaan aineistoon. Ohjelma laski sanojen alussa, keskellä ja lopussa olevien kirjainkolmikoiden esiintymistiheyden. Kuten on oletettavaa, eroja syntyy sijainnin perusteella. Erilaisia tuloksia saadaan myös kun verrataan kolmikoita erilaisista sanoista laskettuna ja esiintyneistä sanoista laskettuna. Tässä yleisimpiä kolmikoita, lukemat promilleina sarakkeen kaikista kolmikoista. Siis

Kolmikko: erilaisten alussa, esiintyneiden alussa, erilaisten keskellä, esiintyneiden keskellä, erilaisten lopussa ja esiintyneiden lopussa.

Esimerkiksi kolmikko TAA on huomattavasti yleisempi esiintyneiden sanojen alussa kuin erilaisten sanojen alussa, koska TAAS on ristikoiden yleisimpiä sanoja.

AVA: 2,290, 4,850, 4,982, 5,086, 15,684, 11,796
IST: 1,542, 2,294, 9,499, 9,149, 0,094, 0,033
STA: 1,402, 1,005, 5,926, 6,416, 7,725, 5,390
TTA: 0,000, 0,000, 7,611, 8,135, 3,090, 2,831
TAA: 2,430, 8,094, 2,033, 2,424, 18,400, 13,578
VAT: 1,121, 1,508, 1,220, 2,978, 20,928, 10,812
SET: 0,561, 0,972, 0,596, 1,347, 23,035, 8,789
ATA: 0,421, 0,382, 2,978, 6,139, 14,373, 23,241
INE: 0,140, 0,546, 7,175, 5,965, 1,124, 1,684
ALA: 6,355, 11,251, 4,125, 4,412, 4,541, 4,209
NEN: 0,280, 0,328, 0,116, 0,071, 22,848, 7,969
AST: 2,523, 7,974, 6,420, 7,288, 0,094, 0,055
KAT: 5,841, 6,052, 2,222, 2,424, 9,972, 9,861
MAT: 3,177, 2,949, 2,498, 2,598, 9,130, 6,122
ISE: 0,000, 0,000, 5,912, 4,808, 0,187, 0,241
TEL: 1,215, 1,890, 5,563, 6,329, 0,047, 0,022
ARI: 0,794, 2,556, 3,254, 3,668, 7,163, 7,652
AIS: 0,888, 2,272, 5,418, 4,539, 0,047, 0,011
TUS: 1,028, 0,776, 1,060, 0,966, 13,718, 9,478
TUT: 1,962, 3,976, 0,915, 1,006, 12,501, 6,734
AAT: 1,262, 4,959, 2,774, 7,406, 7,070, 7,412
TAV: 1,635, 2,130, 4,822, 4,769, 0,000, 0,000
AJA: 2,009, 3,845, 2,077, 1,671, 8,053, 3,542
TON: 0,981, 1,092, 0,668, 0,515, 12,782, 6,352
IKA: 0,093, 0,044, 4,009, 3,937, 2,716, 3,192
ATT: 0,374, 1,202, 4,735, 6,749, 0,047, 0,066
LAT: 2,383, 3,201, 1,656, 2,788, 7,772, 7,915
STI: 0,421, 0,361, 2,571, 3,351, 6,086, 5,805
AIN: 1,028, 3,026, 3,486, 3,446, 2,435, 5,641
STE: 0,607, 0,404, 3,602, 3,002, 2,435, 2,952
KAS: 4,439, 3,135, 1,816, 1,347, 3,980, 3,312
STU: 0,140, 0,044, 4,198, 4,880, 0,421, 0,208
AKA: 1,121, 4,501, 3,878, 5,196, 0,421, 0,678
ITT: 0,047, 0,033, 4,299, 5,276, 0,047, 0,088
TTU: 0,000, 0,000, 1,133, 1,164, 10,300, 4,919
EET: 0,187, 0,393, 0,450, 0,317, 12,220, 7,467
ELI: 1,308, 2,742, 2,716, 2,670, 3,746, 3,739
ARA: 1,215, 2,392, 2,919, 3,390, 3,137, 5,827
RIT: 0,654, 0,830, 1,031, 0,903, 9,785, 5,258
TIT: 0,748, 1,562, 0,770, 0,562, 10,394, 8,603
INA: 0,234, 1,431, 2,324, 3,184, 5,618, 10,320
ILA: 0,561, 0,634, 2,992, 3,010, 2,996, 4,985
TTI: 0,000, 0,000, 1,511, 1,339, 8,334, 6,275
NAT: 1,168, 2,556, 1,031, 1,339, 8,662, 7,521
OTT: 1,262, 2,676, 3,588, 3,699, 0,094, 0,142
ALI: 2,196, 5,342, 2,644, 2,907, 2,154, 3,389
IVA: 1,215, 3,834, 2,542, 2,606, 3,465, 2,886
KKA: 0,000, 0,000, 1,990, 1,323, 6,414, 4,373
ITA: 0,701, 2,381, 2,789, 4,705, 3,090, 9,259
SAT: 3,458, 7,253, 1,278, 3,771, 5,197, 9,216
NTA: 0,000, 0,000, 2,382, 2,598, 5,056, 2,820
ATO: 0,654, 2,742, 3,312, 5,204, 1,311, 3,925
UUS: 0,888, 1,103, 0,813, 0,689, 9,083, 5,411
KAA: 5,140, 3,517, 1,932, 2,052, 1,124, 1,257
LLA: 0,000, 0,000, 1,511, 1,996, 7,631, 4,799
AUS: 0,093, 0,044, 0,973, 1,006, 9,177, 6,800
UVA: 0,000, 0,000, 2,019, 1,830, 5,806, 3,356
ANA: 1,635, 1,540, 2,208, 3,446, 3,511, 10,014
UTU: 0,374, 0,142, 3,471, 3,652, 0,515, 0,612
RAT: 2,663, 3,692, 1,467, 1,513, 4,541, 6,198
288. iso S2.12.2023 klo 12:31
Että meninkin tuon tekemään! Vanhoja virheitä putkahtaa esiin kuin Hydran päitä. Mielessä kävi ajatus ehdottaa kotona kokeiltavaksi sellaista, että yrittää löytää noille jokaiselle kolmikolle kolme esimerkkisanaa, joista yhdessä kolmikko alkaa sanan, toisessa on muualla kuin alussa tai lopussa ja kolmannessa sanan lopussa. En ehdota, on kai ihmisoletetuilla parempaakin tekemistä.

Ajatus poiki kuitenkin sen havainnon, että IST on esiintynyt sanan lopussa ja ihmettelin, olenko mennyt käyttämään jotakin englanninkielistä sanaa, esimerkiksi scientist. No en, lähteenä olleessa tekstitiedostossa oli sana RIST, mutta tekstitiedosto oli keskeneräinen versio ja Excelissä eli tuotantoversiossa alakulma oli ihan erilainen. Oli vain unohtunut tallentaa korjattu versio teksitiedostoon.

Ristin lisäksi olin käyttänyt kahdesti sanaa, joka tuli tunnetuksi vuoden 1960 paikkeilla. Sanan kuvaama toiminta on Chubby Checkerin määritelmän mukaan kuin kuivaisi selkäänsä pyyhkeellä ja samalla tumppaisi savuketta maahan molemmilla jaloillaan hieroen.

Turhaan olen ristikkoa korjannut. Googlen apu taisi vielä vuonna 2000 olla niukempaa kuin nykyisin? Hakukoneen perustaminen alkoi Stanfordin yliopiston tietojenkäsittelytieteen opiskelijoiden Larry Pagen ja Sergei Brinin projektina vuonna 1996. Tällöin hakukoneen nimi oli BackRub, ja se toimi yliopiston palvelimilla. Page ja Brin kehittivät PageRank-algoritmin tuottaakseen parempia hakutuloksia. Google-nimen hakukone sai vuonna 1997. Googlen hakukone avattiin syyskuussa 1997, ja samanniminen yhtiö perustettiin syyskuussa 1998.

Nyt löytyy helposti nimelle ansiokas kantaja: Johann Rist (8.7.1607-31.8.1667) oli saksalainen runoilija ja evankelisluterilainen pappi. Lennart Torstensonin ruotsalaiset sotajoukot ryöstivät 1643 hänen pappilansa. Hän oli tuottelias runoilija, hän julkaisi kaksitoista runokokoelmaa ja 30 näytelmää, joista vain neljä on säilynyt. Hän oli yksi barokkikauden tuottavimmista runoilijoista. Maallisen runouden lisäksi kirjoitti yli 650 hengellistä laulua. Keisari Ferdinand III antoi hänelle ”seppelöidyn runoilijan” (poeta laureatus) arvon 1644 ja aateloi hänet 1653. Minä sivistymätön moukka olin yhtä kunnioittamaton kuin nuo sotahullut ruotsalaiset! Kylmästi siivosin hänet pois ristikostani. Hyi minä.
289. Jaska2.12.2023 klo 13:27
Mikä mahtaa olla ristikoissasi Istan prosentti kaikista IST-alkuisista.
290. TJV2.12.2023 klo 13:28
Ei hätää, olethan sinä ihan kelpo novelist.
291. iso S2.12.2023 klo 15:09
IST-alkuisia 210 kertaa, ISTA 14 kertaa. Prosenttiosuus kuutosia niin paljon että riittää, ensimmäisen jälkeen desimaalipilkku. Tasapeli sanan ISTOT kanssa.
292. iso S2.12.2023 klo 16:44
Piti välillä tuhlata aikaa toisarvoisiin asioihin, mutta tässä on varmuuden välttämiseksi tilasto kaikista käyttämistäni ist-alkuisista. Saksankielisille lukijoille: Hier ist die IST Statistik.

43: istua
40: Isto
15: istuin
14; Ista, Istot
11: istuva
8: istunto, istuttaa, istutus
6: istahtaa, istuvat
4: istua, istuutua
3: Istat, istukas
2: istuimet, istunta, istutetut, istuttava
1: istahtanut, Istala, istui (lauseessa), istujat, istukat, istunnat, istunnot, istunut, istuskelija, istuskellut, istuttanut, istutusvalmiit, istuutuvat

Lieneekö rikollisia taipumuksia, mutta istuminen eri muodoissa näyttää olevan sydäntä lähellä. Ei ole sukuvika, esimerkiksi siskoni ei ole lusijaneito.
293. Jukkis2.1.2024 klo 16:32
Tilastopäivitys vuodenvaihteen tilanteen mukaisesti:
https://drzf55.angelfire.com/listoja.html
294. iso S4.3.2024 klo 17:15
Sorruin taas tilastoinnin syntiin. Tutkin 100 ristikkoa, enemmistö (60) Iltiksestä. Tässä tulokset.

Ristikoiden keskikoko 494,34 ruutua (vihje- ja sanaruudut).
Pienin ristikko oli 14*7=98 ruutua, suurin 40*33=1320.
Sarakemäärien ja rivimäärien keskiarvot (21,84 ja 22,39) olivat lähellä toisiaan, koska osa ristikoista oli vaaka- ja osa pystymallisia.
Yhteensä 10838 sanaa, 6683 erilaista sanaa.
Sanojen keskipituus 5,40, vaihteluväli ristikoittain 4,43-6,39.

Toistaiseksi ei ole ollut lähelläkään se, että ristikossa olisi vain aiemmissa ristikoissa käytettyjä sanoja. Viidessä viimeisessä ristikossa uusien sanojen osuus vaihteli välillä 35,23-62,11 %.

Yleisimmät sanat:
14 kertaa: taas
12 kertaa: asia, Irak, Iran
11 kertaa: ansa, Esat
10 kertaa: anis, aste, Isar, tain, tiit, Utti
9 kertaa: arat, asut, etoa, itara, itse, nata, otot, pian, unet

Vain kerran esiintyneitä sanoja oli 5121.

Pisimmät sanat:
seksisymbolinäyttelijätär (25)
turvapaikkajärjestelmät (23)
ulkomaankirjeenvaihtaja (23)
sytytysjärjestyksensä (21)
karviaismarjapensaat (20)
kaksoiskansalaisuus (19)
rakennusmateriaalia (19, esiintyi lauseessa)
kristallinkirkkaat (18)
tutkimusmatkailija (18)

Yleisimmät vihjeet:
8 kertaa: pääkaupunki
7 kertaa: puu
6 kertaa: jumala, lintu, lintuja
5 kertaa: Japanista, petolintu, Raamatun mies, saari
4 kertaa: Afrikassa, auto, kieli, -kirja, liikenteelle, lumi-, maalaji, mauste, pukine, pyydys, soitin, teillä, vuoristo
295. POH4.4.2024 klo 12:32
Lainaus: 293. Jukkis 2.1.2024 klo 16:32
Tilastopäivitys vuodenvaihteen tilanteen mukaisesti:
https://drzf55.angelfire.com/listoja.html
https://drzf55.angelfire.com/listoja.html

Vieläkös listat on jostakin löydettävissä? Ei heitä kuin 404.
296. Jukkis4.4.2024 klo 15:31
Oho. Tutkin asiaa kun pääsen kotiin asti.
297. Jukkis5.4.2024 klo 11:36
Näköjään olen jotenkin sekoillut helmikuussa, ilmeisesti sivusto on ollut toimimatta melkein kaksi kuukautta. En asiaa ole huomannut, koska siitä on tässä omalla kotikoneella paikallinen toteutus.

Nyt pitäis toimia:

https://drzf55.angelfire.com/listoja.html
298. POH5.4.2024 klo 16:34
Listat toimii kiitettävästi.
299. iso S30.6.2024 klo 10:34
Niin toimiikin. Vertailin hiukan kahta listaa:

Osallistuneet nimimerkit mukaantulojärjestyksessä
Osallistuneet nimimerkit mukaantulojärjestyksessä ottaen mukaan vain ne, jotka ovat osallistuneet vuonna 2023

Vuoden 2023 loppuun mennessä nimimerkkejä oli kertynyt 16173. Osallistujia ei ole yhtä monta. Nimimerkeissä on kirjoitusvirheitä ja tilasto erittelee isot ja pienet kirjaimet. Esimerkiksi minä olen joskus kirjoittanut vahingossa nimimerkkini muodossa Iso S ja se on tilaston mielestä eri asia kuin iso S, ja niinhän se tietysti onkin. Varsinaisia virheitäkin olen tehnyt, esimerkiksi joskus on tullut pelkkä i.

Kato on käynyt. Vuonna 2023 kirjoittaneita on 903. Satunnaisia kävijöitä on varmaan ollu paljon ja luullakseni sen muinaisen pitkän käyttökatkoksen jälkeen moni ei tullut takaisin. Sadasta ensin mukaan ehtineestä on jäljellä 19: Eki, Jukkis, Jouni, Ihmettelijä, Seppo, Tuomas L., Alf Simberg, aulis, Repa, tero, Leena, Ritva, Tupu, Juuso, Hansu, Pentti, mara, Matts ja Justiina.

En ole hidas hämäläinen, muuten vain hidas, joten ehdin mukaan vasta järjestysnumerolla 272. Jälkimmäisellä listalla olen noussut sijalle 33. Jaksaa, jaksaa, top 20 on tavoitteena...

Jos vertailun vuoksi otetaan jälkimmäiseen sijalukuun yksi kolmonen lisää, niiin sijalta 333 löytyy nimimerkki Keltanokka, joka tuli mukaan 27.05.2015 järjestysnumerolla 13696. Nousua on siis erittäin paljon enemmän kuin minulla, joten tasaisen vauhdin taulukolla näyttäisi siltä että hän ohittaa pian minut, ellei ole jo ohittanutkin. Vastaavalla logiikalla isoisäni isä hämmästyi 50 vuotta täyttäneen poikansa ikää: sinähän olet kohta vanhempi kuin minä!
300. Jukkis1.7.2024 klo 11:10
Puolivuotispäivitys:
https://drzf55.angelfire.com/listoja.html
301. Ylläpito1.7.2024 klo 11:44
Loistavaa!
302. iso S1.7.2024 klo 13:32
Ylläpidolta erinomaisesti tiivistetty kommentti.

Eri versioita katsellessa huomasin että minulla on kaikki mitalisijat, hopeaa jopa kahdella kriteerillä.

1. kirjoitetun tekstin kokonaismäärän mukaan
2. osallistuttujen säikeiden määrän mukaan ja viestien keskimääräisen pituuden mukaan
3. kirjoitettujen Ei-ketju -viestien määrän mukaan

En tiedä pitäisikö olla ylpeä vai hävetä. Varmuuden vuoksi vastaan kyllä.
303. Sepe25.8.2024 klo 12:28
Miten nuo tilastosivujen ääkköset saisi näkymään oikein. Käytän Firefoxia ja en keksi mitä asetusta pitäisi muuttaa.

s�ikeet 1 - 11599 aakkosj�rjestyksess�
304. ++juh25.8.2024 klo 17:38
Sepe, ota uBlock Origin – tai muu mainosblokkeri – pois päältä.
305. ++juh25.8.2024 klo 17:52
... tai avaa sivu yksityisessä ikkunassa.
306. Sepe25.8.2024 klo 19:41
Paljon kiitoksia ++juh. Nuo molemmat konstit näyttävät toimivan.
307. Ari2.9.2024 klo 13:55
Kiitos Jukkikselle listoista, mutta kehitysehdotuksena jos voisit jatkossa laittaa 15 tyhjää riviä, eli rivinvaihtoa listojen alkuun, ettei mainos peittäisi ensimmäisiä rivejä. On tuskaisen hankalaa saada osumaan tihruiseen ruksiin josta se pitäisi poistua, kiitos.
308. iso S3.9.2024 klo 12:55
Jotkut eivät tykkää, jos ristikossa on paljon erisnimiä. Itse en suhtaudu niihin noin yksioikoisesti. Enemmän merkitsee se, miten yleisesti tunnettuja nimet ovat. Suorastaan kiitettäväähän nimien paljous on silloin kun ne muodostavat jonkinlaisen teeman. Esimerkiksi Histiksissä aiheena on usein jonkin alan ihmiset, ja silloin suurempi määrä on parempi kuin pienempi, sillä reunahuomautuksella että teeman korostaminen ei saa (ainakaan häiritsevässä määrin) heikentää muun sanaston laatua.

Tein pienen tutkimuksen erisnimien alalajista eli henkilöiden nimistä. Kuinka moneen henkilöön ristikoissa viitataan suhteessa sanojen kokonaismäärään? Kävin läpi 173 ristikkoa ja laskin prosentit (henkilöiden määrä per sanojen määrä).

Tulokset vaihtelivat välillä 0 - 37,68. Keskiarvo oli 14,12 ja mediaani 13,58. Jakauma oli siihen suuntaan vino että keskiarvoa pienempiä oli enemmän (94) kuin keskiarvoa suurempia (79). Tämähän on linjassa sen kanssa, että maksimi poikkeaa keskiarvosta enemmän kuin minimi, eli vähäisempi määrä suuria arvoja riittää vääntämään tulosta ylös yhtä pajon kuin suurempi määrä pieniä arvoja vääntää alas. Viidessä ristikossa tulos oli yli 30, 12 ristikossa alle 5 ja 2 ristikossa ei viitattu yhteenkään henkilöön.

Otos on liian pieni tuloksen vahvistamiseksi, mutta näyttää siltä että noin yksi prosentti ristikoista on sellaisia joissa ei viitata yhteenkään henkilöön. Niissäkin saattaa silti olla muita erisnimiä. Uskoakseni on äärimmäisen harvinaista, että syntyy vähintään ristikkolehden sivun kokoista täysin erisnimetöntä ristikkoa (noin 80 sanaa) ns. luonnostaan. Kyllä se yleensä vaatii tietoista pyrkimystä eikä silloinkaan välttämättä ihan helposti.

En muista varmuudella, olenko koskaan laatinut täysin erisnimetöntä ristikkoa. Melkein erisnimettömän olen. Vitsin vuoksi laitoin siihen yhden erisnimen. Se oli Eris, eripuraisuuden jumalatar - juuri sellainen nimi jota en muuten mielellään ristikkoon laittaisi.
309. Jukkis3.9.2024 klo 15:19
Lainaus: 307. Ari 2.9.2024 klo 13:55
Kiitos Jukkikselle listoista, mutta kehitysehdotuksena jos voisit jatkossa laittaa 15 tyhjää riviä, eli rivinvaihtoa listojen alkuun, ettei mainos peittäisi ensimmäisiä rivejä. On tuskaisen hankalaa saada osumaan tihruiseen ruksiin josta se pitäisi poistua, kiitos.
------------------------------
Uusi asia mulle, koska ei noita puhelimella jaksa katsella, mutta näköjään ainakin iPhonella tosiaan suuri osa sivuista käyttäytyy noin. Hetken piti ihmetellä, että miksi ei kaikki. Syyksi löytyi laiskuus, "miksi pitäis laittaa noin kuin näinkin voi laittaa ja säästää puoli minuuttia". Nyt pitäis toimia paremmin.
310. Jukkis3.9.2024 klo 15:20
Siis en minä sinne mitään tyhjiä rivejä laittanut, vaan oikeampaa html:ää.
311. iso S28.9.2024 klo 12:36
4.3.2024 kerroin tilastoineeni 100 ristikkoa. Nyt olen tuplannut määrän. Tässä tuloksia.

200 ristikkoa
20481 sanaa
10536 erilaista
keskimäärin 104,21 sanaa per ristikko
keskimäärin 1,94 kertaa per sana
ristikoiden koko 98-1120 ruutua, keskimäärin 477,6

36 sanaa vähintään 20 kertaa: taas (41), alas (36), anis (35), Irak (30), osua (29), tain (28), ansa (27), asia (26), taus (26), otsa (25), täti (25), Isar (24), liat (24), osat (24), tiit (24), unet (24), alus (23), arat (23), itse (23), otus (23), aste (22), etoa (22), ilot (22), isät (22), otos (22), tapa (22), aita (21), asut (21), nata (21), Ural (21), Utti (21), asti (20), isota (20), opas (20), otot (20), trap (20)

93 sanaa vähintään 15 kertaa
255 sanaa vähintään 10 kertaa
853 sanaa vähintään 5 kertaa
7222 sanaa vain kerran

Edelleenkään ei näytä siltä että vain samat sanat pyörisivät ristikoissa. Vaihtuvuus on selvästi suurempaa kuin tositeeveessä! Viidessä viimeisessä ristikossa (Pehmis, Kovis, Starttis, Julkkis ja Histis) oli uusia sanoja 26,67, 47,12, 14,29, 30,59 ja 43,57 prosenttia kaikista sanoista; siis sellaisia sanoja, jotka eivät olleet esiintyneet tilaston aiemmissa ristikoissa.

Ristikkotyypeittäin tuossa sanaston toistuvuudessa on eroja. Vertaan esimerkiksi yhtä pehmistä ja kovista.

Pehmiksen 180 sanasta 48 (26,67 %) on sellaisia, että ne eivät esiinny missään muussa noista 200 ristikosta. Sanat esiintyvät keskimäärin 5,34 kertaa. Kymmenen yleisimmin käytettyä sanaa ovat alas (36), otsa (25), liat (24), isät (22), asut (21), ilta (19), Esat (18), toti (18), Laos (17) ja ivat (17). Kymmentä yleisintä on käytetty keskimäärin 21,7 kertaa.

Koviksen 93 sanasta 40 (41,24 %) on sellaisia, että ne eivät esiinny missään muussa noista 200 ristikosta. Sanat esiintyvät keskimäärin 3,43 kertaa. Kymmenen yleisimmin käytettyä sanaa ovat alas (36), osat (24), aste (22), otos (22), uros (12), alta (9), shop (6), tauti (6), pako (6) ja itaruus (5). Kymmentä yleisintä on käytetty keskimäärin 14,8 kertaa.

Vertailu voi hiukan ontua varsinkin kymmenen yleisimmän keskiarvon osalta, koska tuo pehmis on koko sivun ristikko ja kovis on puolikas, eli pehmiksessä on suunnilleen tuplamäärä sanoja. Eikä tuloksia voi yleistää koskemaan kaikkia pehmiksiä ja koviksia. Tulos vahvistaa kuitenkin sitä tuntumaa, että pehmiksissä käytetään tutumpaa ja siksi "turvallisempaa" sanastoa kuin koviksissa. Miksipä ei? Koviksissa voi kaiken kaikkiaan asettaa ratkojalle suurempia haasteita.

Kärkikolmikon esiintyvyyttä voisi kyllä pyrkiä hillitsemään. Nyt taas on melko tarkkaan joka viidennessä ristikossa. Jos ratkoo ristikon päivässä ja yleisimpien sanojen frekvenssin saisi Irakin tasolle niin kukin sana tulisi vastaan keskimäärin enintään kerran viikossa. Tässä tilastossa joka 500. sana on taas. Muinoin tekemässäni vastaava sanoja/taas oli 848. Siinä tilastossa lristikoiden keskikoko oli luultavasti suurempi (ei ollut Starttiksia ja Julkkiksia), joten tilanne ei välttämättä ole noin paljon huonontunut. Isoon ristikkoon kun mahtuu vain yksi taas, kun kahdessa puolta pienemmässä voi olla yhteensä kaksi (kun ei oteta huomioon että lauseissa taas voi toistua, samoin säännöistä piittaamattoman tai huolimattoman laatijan ristikoissa).
312. Eki28.9.2024 klo 13:01
Kyllähän nuo sanat tunnistaa "korvaamattomiksi". Jos niiden runsautta alkaisi stressata ja yrittäisi niitä, ne vain yleensä muuttuisivat muiksi yleisiksi sanoiksi.

Olisi mukava saada vertaus vaikka johonkin helppoon ristikkolehteen. Minä voin lähettää, jos haaste on mieleen.
313. iso S29.9.2024 klo 19:25
Järjestynee, ei välttämättä salamannopealla toimitusajalla. Sitä odotellessa tuohon 200 ristikon otantaan sisältyy Suuri Ristikko 2/2022, joka saa tähän hätään kelvata kakkosvaihtoehdoksi (numeroa 2/2222 pitää vähän odotella). Tämä lehti ei ole äärihelppo, sellainen helppo + ja osittain keskis -.

Suuri Ristikko 2/2022

24 ristikkoa
2385 sanaa
1986 erilaista sanaa
sanojen keskipituus: 5,39
erilaisten sanojen keskipituus: 5,59

29 yleisintä sanaa:
7 kertaa: taas
6 kertaa: alas
5 kertaa: Anita, Iran, osua, tina, ulos
4 kertaa: aari, akka, anis, atomi, ekat, etana, etoa, Eton, ilot, ipanat, Irak, isot, isota, itse, mies, otot, tana, tapa, tiit, toti, trap, viti

3 kertaa: 55 sanaa
2 kertaa: 192 sanaa
kerran: 1709 sanaa

Pituuksien jakauma:
4: 947 kpl, (39,71 %)
5: 559 kpl, (23,44 %)
6: 394 kpl, (16,52 %)
7: 234 kpl, (9,81 %)
8: 120 kpl, (5,03 %)
9: 71 kpl, (2,98 %)
10: 27 kpl, (1,13 %)
11: 18 kpl, (0,75 %)
12: 9 kpl, (0,38 %)
13: 1 kpl, (0,04 %)
14: 2 kpl, (0,08 %)
15: 2 kpl, (0,08 %)
18: 1 kpl, (0,04 %)

Näiden ristikoiden 2385 sanasta 935 (39,20 %) on sellaisia, että ne eivät esiinny missään muussa noista 200 ristikosta. Sanat esiintyvät keskimäärin 5,14 kertaa. Kymmenen yleisimmin käytettyä sanaa ovat taas (41), alas (36), anis (35), Irak (30), osua (29), tain (28), ansa (27), asia (26), taus (26) ja otsa (25). Kymmentä yleisintä on käytetty keskimäärin 30,3 kertaa.
314. iso S29.9.2024 klo 19:35
Reiluinta on tietysti verrata ristiko ristikolta, mieluiten suunnilleen samankokoisia. Koviksen osalta tuo "mieluiten" ei toteudu, mutta tässä on vertaludataa edellä mainittujen Pehmiksen ja Koviksen sekä Suuren Ristikon ensimmäisen ristikon osalta.

Pehmis 23.3.2024

180 sanaa
Sanojen keskipituus: 5,21

Pituuksien jakauma:
4: 66 kpl (36,67 %)
5: 59 kpl (32,78 %)
6: 33 kpl (18,33 %)
7: 12 kpl (6,67 %)
8: 3 kpl (1,67 %)
9: 3 kpl (1,67 %)
10: 1 kpl (0,56 %)
11: 1 kpl (0,56 %)
12: 2 kpl (1,11 %)

Tämän ristikon 180 sanasta 935 (39,20 %) on sellaisia, että ne eivät esiinny missään muussa noista 200 ristikosta. Sanat esiintyvät keskimäärin 5,14 kertaa. Kymmenen yleisimmin käytettyä sanaa ovat alas (36), otsa (25), liat (24), isät (22), asut (21), ilta (19), Esat (18), toti (18), ivat (17) ja Laos (17). Kymmentä yleisintä on käytetty keskimäärin 21,7 kertaa.

Kovis 23.3.2024

97 sanaa (aiemmin mainittu 93 on jotenkin lipsahtanut virhe)
Sanojen keskipituus: 6,05

Pituuksien jakauma:
4: 12 kpl (12,37 %)
5: 43 kpl (44,33 %)
6: 9 kpl (9,28 %)
7: 17 kpl (17,53 %)
8: 8 kpl (8,25 %)
9: 1 kpl (1,03 %)
10: 5 kpl (5,15 %)
11: 1 kpl (1,03 %)
17: 1 kpl (1,03 %)

Tämän ristikon 97 sanasta 40 (41,24 %) on sellaisia, että ne eivät esiinny missään muussa noista 200 ristikosta. Sanat esiintyvät keskimäärin 3,43 kertaa. Kymmenen yleisimmin käytettyä sanaa ovat alas (36), osat (24), aste (22), otos (22), uros (12), alta (9), pako (6), shop (6), tauti (6) ja itaruus (5). Kymmentä yleisintä on käytetty keskimäärin 14,8 kertaa.

Suuri Ristikko 2/2022, ristikko 1

89 sanaa
Sanojen keskipituus: 5,16

Pituuksien jakauma:
4: 36 kpl (37,11 %)
5: 25 kpl (25,77 %)
6: 15 kpl (15,46 %)
7: 8 kpl (8,25 %)
8: 4 kpl (4,12 %)
12: 1 kpl (1,03 %)

Tämän ristikon 89 sanasta 32 (35,96 %) on sellaisia, että ne eivät esiinny missään muussa noista 200 ristikosta. Sanat esiintyvät keskimäärin 3,65 kertaa. Kymmenen yleisimmin käytettyä sanaa ovat anis (35), irak (30), osat (24), itse (23), aste (22), asti (20), otot (20), toti (18), toto (18) ja siat (17). Kymmentä yleisintä on käytetty keskimäärin 22,7 kertaa.

Ristikkolehden ristikon tunnusluvut ovat selvästi lähempänä pehmistä kuin kovista. Sanojen laadusta ei tietenkään voi vetää kovin kummoisia johtopäätöksiä pelkistä numeroista. Lähes puolueettoman mielipiteeni mukaan sekä Iltisksen että tuon lehden sanastoa voi pitää hyvin kelvollisena.
315. iso S15.11.2024 klo 15:10
Noiden edellisten innoittamana koodasin Excel-makron, joka laskee ristikosta vastaavia tunnuslukuja. Yhtenä niistä oli suurin aukio. Tämä johti pohtimaan, minkälainen urakka olisi vääntää ohjelma, joka laskee tunnusluvun ristikon aukioisuudelle. Ajatuksena oli selvittää kunkin kirjainruudun osalta, mikä on suurin aukio johon kirjain kuuluu, ja laskea sitten näistä keskiarvo.

Tämähän on jossakin määrin sukua hahmon tunnistamiselle. Kun asiaa tarkastelee yksittäisen ruudun näkökulmasta, ohjelmakoodista tulisi melko monimutkainen. Ruutu voi kuulua samaan aikaan kolmenlaiseen aukioon: yksi on korkea ja kapea, toinen matala mutta leveä ja kolmas kumpaankin suuntaan siltä väliltä. Lisäksi kukin aukio voi olla äärirajoitaan enemmän tai vähemmän vasemmalla, oikealla, ylhäällä ja alhaalla suhteessa tarkasteltavaan ruutuun. Saa siinä sovitella erikokoisia ja erimuotoisia aukioita joka suuntaan ruudun ympärille ja testata jokaisesta, onko pelkkiä kirjainruutuja.

Annoin ajatuksen hautua ja yhtenä yönä alitajunta teki tehtävänsä. Tajusin, että jokaisella aukiolla on vasen yläkulma. Se helpotti huomattavasti. Nyt koodi käy läpi kaikki mahdolliset yläkulmat (ruudut, joissa on kirjain ja joiden oikealla puolella ja alapuolella on kirjain.

Sitten lasketaan, kuinka leveä aukio voi tuosta kohdasta alkaa, ja aletaan tutkia rivi kerrallaan, jatkuuko kirjaimia tuohon maksimileveyteen asti. Jos ei, niin korjataan maksimileveys löytyneiden kirjainten määrän mukaiseksi. Aukion koko on tutkittujen rivien määrä kertaa tuo maksimileveys, joka voi siis kaventua matkan varrella.

Tähän asti löytyneen aukion ruudut käydään läpi ja toiseen taulukkoon merkataan aukion koko, jos se on suurempi kuin aiemmin löytynyt tuon ruudun aukiokoko (alussa nollattu).

Rivejä tutkitaan ylhäältä alas, kunnes yläkulman sarakkeessa tulee vastaan vihjeruutu tai ristikon alareuna tai maksimileveys kutistuu ykköseksi (silloin aukio ei voi enää jatkua alaspäin).

Sama ruutu tulee käsitellyksi moneen kertaan eri aukioiden jäsenenä ja myös saman aukion osajoukon jäsenenä, mutta rauta ei valita. Ristikot ovat äärellisen kokoisia ja tämä melko yksinkertainen logiikka haistaa kaikenmuotoiset aukiot ja kullekin ruudulle jää voimaan suurin johon se kuuluu.

Aukion määrittelin niin, että se on vähintään 2x2 ruudun kokoinen suorakaiteen muotoinen alue jossa on pelkästään kirjaimia, siis ei vihjeruutuja. Pitkäkään sana ei siis yksinään ole aukio. Piilokirjaimet saavat kylmästi aukio-arvon nolla, samoin kaikkii vierekkäin tai päällekkäin olevat kirjaimet joilla ei ole toiseen suuntaan kirjaimia vieruskavereinaan.

Testasin näutä kahta makroa viidellä erityyppisellä ristikolla:

23.3.2024 julkaistut Mantan valinta, Pehmis ja Kovis sekä 25.3.2024 julkaistut Histis ja Keskis. Tulokset koskevat luonnollisesti vain näitä yksittäisiä ristikoita eikä niitä voi yleistää koskemaan tehtävätyyppiä. Siihen tarvittaisiin huomattavasti laajempi otos.
316. iso S15.11.2024 klo 15:10
Mantan valinta

22 riviä
16 saraketta
352 ruutua
258 kirjainruutua
73,30 % kirjainruutuja
45 vaakasanaa
43 pystysanaa
88 sanaa yhteensä
5,51 vaakasanojen keskipituus
5,77 pystysanojen keskipituus
5,64 sanojen keskipituus
10 piilokirjainta vaakasanoissa
10 piilokirjainta pystysanoissa
20 piilokirjainta yhteensä
0 alkupiiloa
0 loppupiiloa
7,75 % piilokirjaimia

Sanojen pituusjakauma
4: 35 (39,77 %)
5: 20 (22,73 %)
6: 6 (6,82 %)
7: 14 (15,91 %)
8: 7 (7,95 %)
11: 6 (6,82 %)

Kirjainten jakauma
A: 41 (15,89 %)
D: 3 (1,16 %)
E: 19 (7,36 %)
G: 2 (0,78 %)
H: 5 (1,94 %)
I: 37 (14,34 %)
J: 2 (0,78 %)
K: 13 (5,04 %)
L: 11 (4,26 %)
M: 5 (1,94 %)
N: 10 (3,88 %)
O: 18 (6,98 %)
P: 11 (4,26 %)
R: 11 (4,26 %)
S: 19 (7,36 %)
T: 32 (12,40 %)
U: 12 (4,65 %)
V: 3 (1,16 %)
Y: 2 (0,78 %)
Ä: 2 (0,78 %)

Suurin aukio 44 ruutua (11 riviä, 4 saraketta)
Suurin vihjeaukio 20 ruutua (5 riviä, 4 saraketta)
Ristikon aukioisuus: 17,13
317. iso S15.11.2024 klo 15:11
Pehmis

33 riviä
25 saraketta
825 ruutua
494 kirjainruutua
59,88 % kirjainruutuja
89 vaakasanaa
91 pystysanaa
180 sanaa yhteensä
5,21 vaakasanojen keskipituus
5,20 pystysanojen keskipituus
5,21 sanojen keskipituus
21 piilokirjainta vaakasanoissa
30 piilokirjainta pystysanoissa
51 piilokirjainta yhteensä
0 alkupiiloa
0 loppupiiloa
10,32 % piilokirjaimia

Sanojen pituusjakauma
4: 66 (36,67 %)
5: 59 (32,78 %)
6: 33 (18,33 %)
7: 12 (6,67 %)
8: 3 (1,67 %)
9: 3 (1,67 %)
10: 1 (0,56 %)
11: 1 (0,56 %)
12: 2 (1,11 %)

Kirjainten jakauma
A: 105 (21,26 %)
D: 4 (0,81 %)
E: 22 (4,45 %)
F: 1 (0,20 %)
G: 1 (0,20 %)
H: 6 (1,21 %)
I: 45 (9,11 %)
J: 5 (1,01 %)
K: 24 (4,86 %)
L: 24 (4,86 %)
M: 13 (2,63 %)
N: 23 (4,66 %)
O: 35 (7,09 %)
P: 17 (3,44 %)
R: 15 (3,04 %)
S: 45 (9,11 %)
T: 55 (11,13 %)
U: 32 (6,48 %)
V: 14 (2,83 %)
Ä: 7 (1,42 %)
Ö: 1 (0,20 %)

Suurin aukio 16 ruutua (4 riviä, 4 saraketta)
Suurin vihjeaukio 168 ruutua (12 riviä, 14 saraketta)
Ristikon aukioisuus: 8,58
318. iso S15.11.2024 klo 15:11
Kovis

19 riviä
25 saraketta
475 ruutua
313 kirjainruutua
65,89 % kirjainruutuja
51 vaakasanaa
53 pystysanaa
104 sanaa yhteensä
5,84 vaakasanojen keskipituus
5,57 pystysanojen keskipituus
5,70 sanojen keskipituus
18 piilokirjainta vaakasanoissa
15 piilokirjainta pystysanoissa
33 piilokirjainta yhteensä
0 alkupiiloa
0 loppupiiloa
10,54 % piilokirjaimia

Sanojen pituusjakauma
4: 28 (26,92 %)
5: 27 (25,96 %)
6: 18 (17,31 %)
7: 16 (15,38 %)
8: 10 (9,62 %)
9: 4 (3,85 %)
10: 1 (0,96 %)

Kirjainten jakauma
A: 52 (16,61 %)
B: 2 (0,64 %)
C: 2 (0,64 %)
D: 4 (1,28 %)
E: 16 (5,11 %)
G: 1 (0,32 %)
H: 2 (0,64 %)
I: 32 (10,22 %)
J: 4 (1,28 %)
K: 13 (4,15 %)
L: 21 (6,71 %)
M: 10 (3,19 %)
N: 10 (3,19 %)
O: 22 (7,03 %)
P: 7 (2,24 %)
R: 11 (3,51 %)
S: 26 (8,31 %)
T: 41 (13,10 %)
U: 25 (7,99 %)
V: 5 (1,60 %)
X: 1 (0,32 %)
Y: 4 (1,28 %)
Ä: 2 (0,64 %)

Suurin aukio 25 ruutua (5 riviä, 5 saraketta)
Suurin vihjeaukio 28 ruutua (4 riviä, 7 saraketta)
Ristikon aukioisuus: 12,59
319. iso S15.11.2024 klo 15:11
Histis

27 riviä
22 saraketta
594 ruutua
398 kirjainruutua
67,00 % kirjainruutuja
72 vaakasanaa
68 pystysanaa
140 sanaa yhteensä
5,33 vaakasanojen keskipituus
5,56 pystysanojen keskipituus
5,44 sanojen keskipituus
20 piilokirjainta vaakasanoissa
14 piilokirjainta pystysanoissa
34 piilokirjainta yhteensä
0 alkupiiloa
0 loppupiiloa
8,54 % piilokirjaimia

Sanojen pituusjakauma
4: 56 (40,00 %)
5: 33 (23,57 %)
6: 16 (11,43 %)
7: 15 (10,71 %)
8: 11 (7,86 %)
9: 7 (5,00 %)
10: 1 (0,71 %)
11: 1 (0,71 %)

Kirjainten jakauma
A: 70 (17,59 %)
B: 3 (0,75 %)
C: 3 (0,75 %)
D: 9 (2,26 %)
E: 31 (7,79 %)
F: 1 (0,25 %)
G: 2 (0,50 %)
H: 12 (3,02 %)
I: 48 (12,06 %)
J: 2 (0,50 %)
K: 16 (4,02 %)
L: 15 (3,77 %)
M: 12 (3,02 %)
N: 18 (4,52 %)
O: 24 (6,03 %)
P: 2 (0,50 %)
R: 28 (7,04 %)
S: 29 (7,29 %)
T: 40 (10,05 %)
U: 21 (5,28 %)
V: 6 (1,51 %)
W: 1 (0,25 %)
Y: 3 (0,75 %)
Z: 1 (0,25 %)
Ä: 1 (0,25 %)

Suurin aukio 25 ruutua (5 riviä, 5 saraketta)
Suurin vihjeaukio 42 ruutua (7 riviä, 6 saraketta)
Ristikon aukioisuus: 12,18
320. iso S15.11.2024 klo 15:12
Keskis

22 riviä
25 saraketta
550 ruutua
340 kirjainruutua
61,82 % kirjainruutuja
51 vaakasanaa
59 pystysanaa
110 sanaa yhteensä
6,29 vaakasanojen keskipituus
5,53 pystysanojen keskipituus
5,88 sanojen keskipituus
14 piilokirjainta vaakasanoissa
19 piilokirjainta pystysanoissa
33 piilokirjainta yhteensä
0 alkupiiloa
0 loppupiiloa
9,71 % piilokirjaimia

Sanojen pituusjakauma
4: 35 (31,82 %)
5: 25 (22,73 %)
6: 20 (18,18 %)
7: 12 (10,91 %)
8: 9 (8,18 %)
9: 6 (5,45 %)
13: 1 (0,91 %)
19: 1 (0,91 %)
20: 1 (0,91 %)

Kirjainten jakauma
A: 51 (15,00 %)
D: 3 (0,88 %)
E: 22 (6,47 %)
H: 4 (1,18 %)
I: 43 (12,65 %)
J: 1 (0,29 %)
K: 19 (5,59 %)
L: 26 (7,65 %)
M: 7 (2,06 %)
N: 23 (6,76 %)
O: 19 (5,59 %)
P: 2 (0,59 %)
R: 12 (3,53 %)
S: 24 (7,06 %)
T: 39 (11,47 %)
U: 16 (4,71 %)
V: 13 (3,82 %)
Y: 5 (1,47 %)
Ä: 10 (2,94 %)
Ö: 1 (0,29 %)

Suurin aukio 30 ruutua (6 riviä, 5 saraketta)
Suurin vihjeaukio 90 ruutua (9 riviä, 10 saraketta)
Ristikon aukioisuus: 15,41
321. iso S15.11.2024 klo 15:19
Todennäköisesti aukioisuutta on yritetty määritellä ennenkin. Kaikenkarvaisista tunnusluvuista ja ristikoiden hyvyyden mittaamisesta on keskusteltu hyvässä hengessä jos aikojen alussa, mm. vuonna 2003 säikeessä
271. Arvosteluasteikko ?
eli
https://www.sanaristikot.net/keskustelut/?id=271
322. iso S6.12.2024 klo 11:07
Näyttää siltä että keskustelupalstan hidas hiipuminen jatkuu. Huippuvuosilta (ja Huippuvuorilta!) ollaan kaukana. Kun verrataan viime vuoden ja tämän vuoden tekstimääriä kilotavuina mitaten (punnittua puhetta?), tämän vuoden kokonaismäärä kuukausilta 1-11 on 96,89 prosenttia viimevuotisesta. Ero ei tosin ole kovin suuri ja saattaa ainakin osittain selittyä sillä, että ehkä tänä vuonna on onnistuttu paremmin häirikköviestien torjunnassa. Sen selvittämiseksi pitäisi haistella sisältöjä.

Kuukausittain jakauma näyttää tältä (kk, vuosi 2023, vuosi 2024, 2024 suhteessa edelliseen %):

1: 454, 503, 110,79
2: 412, 347, 84,22
3: 473, 453, 95,77
4: 368, 401, 108,97
5: 323, 370, 114,55
6: 323, 315, 97,52
7: 317, 221, 69,72
8: 401, 322, 80,30
9: 402, 380, 94,53
10: 390, 416, 106,67
11: 446, 447, 100,22

Yhteensä: 4309, 4175, 96,89

Viime vuonna meno kuukausittain oli tasaisempaa. Vaihteluväli oli 317 - 473 ja maksimi oli 49,2 prosenttia suurempi kuin minimi. Tänä vuonna vastaavt luvut olivat (siis ennen joulukuuta) 221, 503 ja 127,6. Heinäkuu oli enemmän lomakuukausi kuin viime vuonna, jäätiin selvästi eniten edellisen vuoden määrästä.

Joulukuu voi vielä kaiken muuttaa, mutta tasapeliin tarvittaisiin vuoden ennätysmäärä, 578. Tätä ei tarvitse tulkita yllytykseksi. Tampereella on tapana sanoa, että ei tehrä tästä numeroo. Jossakin on myös todettu tyynesti, että sama sen väliä/mieluummin miten vaan.
KOMMENTOI

Pakolliset kentät merkitty tähdellä *