diff options
Diffstat (limited to 'libtextcat/data/new_fingerprints/lm/finnish.lm')
-rw-r--r-- | libtextcat/data/new_fingerprints/lm/finnish.lm | 400 |
1 files changed, 400 insertions, 0 deletions
diff --git a/libtextcat/data/new_fingerprints/lm/finnish.lm b/libtextcat/data/new_fingerprints/lm/finnish.lm new file mode 100644 index 000000000000..328f88604279 --- /dev/null +++ b/libtextcat/data/new_fingerprints/lm/finnish.lm @@ -0,0 +1,400 @@ +_ 19984 +a 9133 +i 8384 +t 7797 +e 6481 +n 6431 +s 5897 +l 4504 +o 4163 +u 4106 +k 4013 +ä 3354 +n_ 2868 +m 2569 +a_ 1987 +v 1905 +r 1827 +ta 1580 +en 1553 +is 1515 +h 1508 +y 1462 +st 1390 +in 1375 +p 1342 +j 1333 +an 1139 +si 1073 +tt 1030 +te 1008 +en_ 982 +_k 980 +it 974 +ll 947 +aa 942 +ä_ 902 +va 878 +el 855 +_t 851 +ka 846 +i_ 835 +. 832 +se 818 +li 806 +tä 804 +oi 767 +ai 744 +._ 739 +tu 734 +_o 719 +mi 715 +al 703 +on 684 +d 681 +_v 662 +et 654 +_j 641 +t_ 635 +ti 632 +_m 628 +_s 620 +ja 616 +ma 596 +sa 595 +la 582 +ist 575 +_e 565 +to 565 +ks 557 +in_ 554 +es 551 +il 538 +an_ 536 +ki 527 +, 525 +ku 525 +,_ 524 +us 520 +as 514 +nt 512 +ri 495 +ke 494 +at 491 +_p 485 +le 484 +ik 483 +ss 477 +ut 469 +ö 469 +sta 460 +ee 459 +uu 458 +ol 457 +ta_ 451 +ne 445 +ää 445 +ei 443 +uo 436 +ko 433 +un 430 +lu 421 +ii 420 +e_ 418 +nn 413 +_h 412 +ar 408 +er 402 +än 396 +ja_ 386 +im 381 +on_ 365 +_va 363 +aan 354 +_a 352 +me 350 +ak 345 +ssa 331 +na 330 +ie 329 +pa 327 +_ja 326 +ia 325 +tä_ 322 +_l 319 +vi 317 +ise 316 +tta 315 +de 314 +os 312 +lli 309 +_ja_ 304 +jo 295 +vä 290 +su 289 +au 287 +lis 286 +_on 285 +sä 284 +uk 280 +am 280 +ot 280 +ty 275 +ett 271 +ttä 270 +ni 269 +lä 267 +ksi 264 +nk 264 +ht 263 +ul 261 +ell 261 +sa_ 259 +ha 257 +sen 257 +a. 254 +isi 253 +ste 253 +aan_ 252 +_on_ 252 +_ka 252 +sk 251 +kk 246 +itt 245 +ok 242 +a._ 239 +all 239 +yt 239 +mä 237 +mu 237 +av 237 +_y 236 +lla 233 +taa 231 +ais 231 +een 230 +K 230 +lt 228 +s_ 227 +ast 227 +iv 226 +ssa_ 225 +ra 225 +- 223 +kse 223 +oit 220 +om 220 +T 219 +_ku 218 +än_ 216 +aa_ 214 +at_ 214 +tel 211 +ui 210 +si_ 208 +rk 207 +sta_ 207 +_jo 203 +kä 202 +_K 201 +est 200 +em 200 +he 199 +_n 199 +vo 198 +_ta 196 +eh 196 +_ol 196 +S 196 +nta 196 +_ko 194 +je 194 +stä 194 +är 193 +ust 191 +mis 191 +ns 190 +pu 189 +nen 188 +ät 188 +toi 188 +iin 187 +ten 187 +min 186 +ista 185 +hd 184 +a, 184 +a,_ 184 +sen_ 183 +E 182 +lle 181 +vat 179 +ill 177 +no 176 +pä 176 +lm 176 +llis 175 +n. 175 +io 172 +ine 171 +n._ 170 +pi 169 +uks 168 +ava 168 +ään 166 +nen_ 165 +ah 165 +_mu 164 +tus 163 +mm 162 +_to 162 +ek 160 +int 159 +_r 159 +lin 158 +oim 158 +_T 158 +A 158 +imi 157 +tö 157 +la_ 157 +jä 157 +aj 156 +yh 155 +o_ 154 +lo 154 +oli 153 +een_ 153 +le_ 153 +_si 153 +g 152 +aik 151 +vat_ 150 +L 149 +ur 149 +ti_ 149 +sia 148 +ite 147 +inen 147 +ain 146 +sti 146 +lla_ 146 +ys 145 +_mi 145 +val 144 +stu 144 +äm 144 +alli 143 +pe 143 +utt 142 +et_ 141 +_tu 141 +eri 140 +_E 140 +: 140 +nki 139 +ir 139 +llä 138 +up 138 +äi 137 +ama 137 +_ha 135 +id 135 +_se 135 +po 134 +inen_ 134 +tte 133 +nna 133 +ten_ 132 +or 132 +ts 131 +nä 131 +yk 131 +äs 131 +_S 130 +ses 130 +ve 130 +ess 129 +äl 129 +ita 129 +lai 129 +H 129 +van 127 +äk 127 +kin 127 +N 127 +_te 126 +den 126 +tee 126 +P 126 +kaa 126 +iin_ 125 +kun 125 +ois 125 +sit 125 +oh 124 +V 124 +yö 124 +äv 124 +tav 124 +voi 124 +ia_ 123 +I 123 +oll 123 +maa 122 +ih 122 +oj 122 +rj 121 +ro 121 +ikk 120 +so 120 +oo 120 +oimi 120 +do 120 +pp 119 +M 119 +_ei 118 +toim 118 +op 118 +uut 118 +tet 118 +_i 118 +_ma 117 +vai 117 +lä_ 116 +u_ 116 +sy 116 +kau 116 +utta 116 +un_ 115 +eu 115 +ssä 115 +tti 115 +_sa 115 +mp 114 +eis 114 +ka_ 112 +että 112 +taa_ 111 +_et 111 +hu 111 +itu 111 +suu 111 +den_ 111 +ksen 110 +ap 110 +_ke 110 +uv 110 +tam 110 +yv 109 +aup 109 +stä_ 109 +asta 109 +äy 109 +kan 108 +nu 108 +ukse 108 +_toi 107 +ien 107 +hi 107 +iss 107 |