diff options
Diffstat (limited to 'libtextcat/data/new_fingerprints/lm/vietnamese.lm')
-rw-r--r-- | libtextcat/data/new_fingerprints/lm/vietnamese.lm | 400 |
1 files changed, 400 insertions, 0 deletions
diff --git a/libtextcat/data/new_fingerprints/lm/vietnamese.lm b/libtextcat/data/new_fingerprints/lm/vietnamese.lm new file mode 100644 index 000000000000..14221268dc1e --- /dev/null +++ b/libtextcat/data/new_fingerprints/lm/vietnamese.lm @@ -0,0 +1,400 @@ +_ 88044 +n 17000 +h 12823 +t 9071 +i 8490 +c 8394 +g 8035 +ng 6718 +_t 6352 +_c 5234 +a 5083 +g_ 4883 +ng_ 4882 +_n 4379 +n_ 4365 +i_ 4365 +u 4149 +m 3648 +à 3635 +nh 3480 +o 3451 +Ç 3193 +_Ç 3168 +r 3011 +l 2692 +Ü 2659 +, 2328 +,_ 2295 +c_ 2279 +_l 2263 +ch 2226 +v 2161 +th 2158 +a_ 2132 +_th 2113 +y 2111 +. 2107 +t_ 2106 +h_ 2074 +_v 2057 +_h 1888 +_m 1834 +_ch 1813 +s 1749 +nh_ 1715 +u_ 1679 +á 1668 +à_ 1649 +tr 1611 +b 1589 +_tr 1581 +_nh 1541 +_b 1530 +m_ 1505 +p 1483 +._ 1455 +k 1429 +_s 1415 +o_ 1380 +y_ 1371 +_k 1367 +_ng 1348 +© 1343 +e 1296 +ó 1208 + 1199 +ô 1181 +¶ 1139 +å 1132 +T 1126 +hi 1121 +â 1081 +ì 1058 +ê 1055 +d 1040 +_g 1039 +kh 1034 +_kh 1027 +_T 994 +©i 967 +là 943 +_là 941 +" 926 +ä 916 +Ü© 901 +an 893 +_d 888 +Ó 877 +©i_ 859 +on 853 +à 848 +N 846 + 820 +ó_ 813 + 801 +ôn 795 +ph 776 +_p 772 +_ph 752 +û 752 +§ 734 +hÜ 728 +ho 715 +và 709 +_và 703 +gÜ 702 +® 700 +_r 696 +H 693 +_là_ 691 +là_ 691 +Ü©i 684 +àn 679 +ên 677 +ông 676 +ha 672 +gi 663 +C 656 +_gi 655 +Ö 654 +gÜ©i 646 +gÜ© 646 +Ü©i_ 624 +ông_ 610 +ngÜ 610 +_ngÜ 608 +ác 606 +ú 601 +ngÜ© 600 +ngÜ©i 600 +_ngÜ© 598 +gÜ©i_ 594 +ûa 587 +cû 586 +_cû 585 +¶t 585 +cûa 585 +ên_ 585 +_cûa 584 +có 583 +ûa_ 582 +_có 581 +cûa_ 581 +ã 581 +_cûa_ 580 +¶t_ 578 +_N 574 +có_ 574 +» 573 +_có_ 572 +i 568 +À 562 + 562 +m¶ 557 +_C 553 +_m¶ 551 +p_ 540 +Æ 540 +m¶t 538 +m¶t_ 534 +_m¶t 532 +ìn 528 +_m¶t_ 528 +ti 526 +i 525 +Ù 517 +Î 512 +ình 500 +.. 500 + 497 +và_ 497 +_và_ 496 +æ 491 +q 490 +qu 490 +_H 487 +_q 484 +_qu 484 +ong 481 +ong_ 471 +há 471 +x 470 +hô 468 +¿ 466 +_" 460 +Ü® 456 +ro 453 +ình_ 445 +ì_ 434 +_x 434 +ã_ 427 +í 423 +_ti 423 +in 422 +ân 421 +"_ 418 +i 415 +Ön 413 +ron 412 +V 411 +rong 410 +§i 410 +rong_ 409 +ác_ 405 +ª 400 +n 399 +hôn 398 +åi 395 +ay 390 +_V 387 +h» 382 +hà 380 +ày 377 +Ãt 376 +uy 374 +ÇÜ 374 +_ÇÜ 373 +§i_ 372 +cá 371 +_cá 367 +nà 366 +_ 366 +hú 366 +_nà 365 +ra 363 +hông 362 +ho_ 359 +ân_ 356 +án 356 +° 355 +åi_ 354 +ai 352 +hu 352 +cho 352 +Ü®c 351 +®c 351 +Ón 351 +_cho 349 +tro 347 +t 347 +ào 347 +_tro 346 +_tron 346 +ñ 346 +tron 346 +trong 346 +M 345 +khô 340 +âu 338 +_khô 338 +cho_ 337 +_cho_ 336 +hông_ 336 +ay_ 333 +ch_ 332 +Çã 331 +Ãt_ 331 +( 331 +_( 330 +Ò 329 +_Çã 329 +ÇÜ® 328 +_ÇÜ®c 328 +) 328 +ÇÜ®c 328 +_ÇÜ® 328 +khôn 324 +_ñ 324 +_khôn 322 +Çã_ 322 +_Çã_ 320 +ò 318 +ån 318 +không 316 +ào_ 316 +Ü®c_ 316 +®c_ 316 +nhÜ 315 +Ü_ 315 +»ng 313 +»ng_ 313 +»n 313 +_nhÜ 313 +Th 312 +hì 311 +Û 310 +h»n 310 +h»ng_ 310 +h»ng 310 +iê 309 +gh 309 +u 307 +ta 307 +anh 307 +¡ 307 +ai_ 306 +àng 306 +ày_ 304 +ÇÜ®c_ 298 +ÜÖ 295 +S 295 +: 294 +t_ 294 +e_ 294 +:_ 290 +Î_ 289 +ua 288 +æn 288 +ài 286 +u_ 285 +_nh» 285 +nh» 285 +nh»ng 285 +nh»n 285 +_nh»n 285 +_Th 285 +n_ 284 +n 283 +Ø 281 +_M 281 +A 281 +úc 278 +L 277 +ø 277 +ÜÖn 276 +_ha 276 +n, 275 +Öng 275 +ÜÖng 275 +an_ 272 +ài_ 271 +iu 269 +sÓ 269 +n,_ 268 +¿_ 268 +on_ 267 +_sÓ 267 +các 265 +àng_ 265 +_các 264 +anh_ 264 +ngh 264 +_ta 263 +hi_ 262 +hàn 261 +_ 261 +âu_ 261 +Àn 260 +ù 260 +_ngh 257 +ia 255 +¢ 252 +... 252 +êu 251 +Ùc 251 +i, 249 +iu_ 248 +nhi 247 +B 246 +i,_ 245 +Óng 244 +ª_ 244 +co 244 +_nhi 244 +¥ 244 +ܧ 244 +iên 243 +D 243 +Tr 241 +_S 240 +hÜ_ 239 +òn 237 +hà 236 +hÆ 233 +K 233 +Öng_ 232 +ôi 232 +ÜÖng_ 232 +Àn_ 231 +_co 231 +n_ 229 +hå 229 +äi 229 +yê 229 +Ûn 229 +¢n 228 +Ûng 228 +_L 227 +Ûng_ 226 +inh 226 +Çi 225 +mà 225 +_Çi 225 +ng, 224 +ang 224 +P 224 +n 224 +g, 224 +g,_ 223 +_v§ 223 |