summaryrefslogtreecommitdiff
path: root/libtextcat/data/new_fingerprints/lm/vietnamese.lm
diff options
context:
space:
mode:
Diffstat (limited to 'libtextcat/data/new_fingerprints/lm/vietnamese.lm')
-rw-r--r--libtextcat/data/new_fingerprints/lm/vietnamese.lm400
1 files changed, 400 insertions, 0 deletions
diff --git a/libtextcat/data/new_fingerprints/lm/vietnamese.lm b/libtextcat/data/new_fingerprints/lm/vietnamese.lm
new file mode 100644
index 000000000000..14221268dc1e
--- /dev/null
+++ b/libtextcat/data/new_fingerprints/lm/vietnamese.lm
@@ -0,0 +1,400 @@
+_ 88044
+n 17000
+h 12823
+t 9071
+i 8490
+c 8394
+g 8035
+ng 6718
+_t 6352
+_c 5234
+a 5083
+g_ 4883
+ng_ 4882
+_n 4379
+n_ 4365
+i_ 4365
+u 4149
+m 3648
+à 3635
+nh 3480
+o 3451
+Ç 3193
+_Ç 3168
+r 3011
+l 2692
+Ü 2659
+, 2328
+,_ 2295
+c_ 2279
+_l 2263
+ch 2226
+v 2161
+th 2158
+a_ 2132
+_th 2113
+y 2111
+. 2107
+t_ 2106
+h_ 2074
+_v 2057
+_h 1888
+_m 1834
+_ch 1813
+s 1749
+nh_ 1715
+u_ 1679
+á 1668
+à_ 1649
+tr 1611
+b 1589
+_tr 1581
+_nh 1541
+_b 1530
+m_ 1505
+p 1483
+._ 1455
+k 1429
+_s 1415
+o_ 1380
+y_ 1371
+_k 1367
+_ng 1348
+© 1343
+e 1296
+ó 1208
+‰ 1199
+ô 1181
+¶ 1139
+å 1132
+T 1126
+hi 1121
+â 1081
+ì 1058
+ê 1055
+d 1040
+_g 1039
+kh 1034
+_kh 1027
+_T 994
+©i 967
+là 943
+_là 941
+" 926
+ä 916
+Ü© 901
+an 893
+_d 888
+Ó 877
+©i_ 859
+on 853
+Ã 848
+N 846
+Š 820
+ó_ 813
+Π801
+ôn 795
+ph 776
+_p 772
+_ph 752
+û 752
+§ 734
+hÜ 728
+ho 715
+và 709
+_và 703
+gÜ 702
+® 700
+_r 696
+H 693
+_là_ 691
+là_ 691
+Ü©i 684
+àn 679
+ên 677
+ông 676
+ha 672
+gi 663
+C 656
+_gi 655
+Ö 654
+gܩi 646
+gܩ 646
+Ü©i_ 624
+ông_ 610
+ngÜ 610
+_ngÜ 608
+ác 606
+ú 601
+ngܩ 600
+ngܩi 600
+_ngܩ 598
+gܩi_ 594
+ûa 587
+cû 586
+_cû 585
+¶t 585
+cûa 585
+ên_ 585
+_cûa 584
+có 583
+ûa_ 582
+_có 581
+cûa_ 581
+ã 581
+_cûa_ 580
+¶t_ 578
+_N 574
+có_ 574
+» 573
+_có_ 572
+iΠ568
+À 562
+‹ 562
+m¶ 557
+_C 553
+_m¶ 551
+p_ 540
+Æ 540
+m¶t 538
+m¶t_ 534
+_m¶t 532
+ìn 528
+_m¶t_ 528
+ti 526
+i‰ 525
+Ù 517
+Î 512
+ình 500
+.. 500
+† 497
+và_ 497
+_và_ 496
+æ 491
+q 490
+qu 490
+_H 487
+_q 484
+_qu 484
+ong 481
+ong_ 471
+há 471
+x 470
+hô 468
+¿ 466
+_" 460
+Ü® 456
+ro 453
+ình_ 445
+ì_ 434
+_x 434
+ã_ 427
+í 423
+_ti 423
+in 422
+ân 421
+"_ 418
+iŠ 415
+Ön 413
+ron 412
+V 411
+rong 410
+§i 410
+rong_ 409
+ác_ 405
+ª 400
+‰n 399
+hôn 398
+åi 395
+ay 390
+_V 387
+h» 382
+hà 380
+ày 377
+Ãt 376
+uy 374
+ÇÜ 374
+_ÇÜ 373
+§i_ 372
+cá 371
+_cá 367
+nà 366
+‹_ 366
+hú 366
+_nà 365
+ra 363
+hông 362
+ho_ 359
+ân_ 356
+án 356
+° 355
+åi_ 354
+ai 352
+hu 352
+cho 352
+ܮc 351
+®c 351
+Ón 351
+_cho 349
+tro 347
+‰t 347
+ào 347
+_tro 346
+_tron 346
+ñ 346
+tron 346
+trong 346
+M 345
+khô 340
+âu 338
+_khô 338
+cho_ 337
+_cho_ 336
+hông_ 336
+ay_ 333
+ch_ 332
+Çã 331
+Ãt_ 331
+( 331
+_( 330
+Ò 329
+_Çã 329
+ÇÜ® 328
+_ÇÜ®c 328
+) 328
+ÇÜ®c 328
+_ÇÜ® 328
+khôn 324
+_ñ 324
+_khôn 322
+Çã_ 322
+_Çã_ 320
+ò 318
+ån 318
+không 316
+ào_ 316
+ܮc_ 316
+®c_ 316
+nhÜ 315
+Ü_ 315
+»ng 313
+»ng_ 313
+»n 313
+_nhÜ 313
+Th 312
+hì 311
+Û 310
+h»n 310
+h»ng_ 310
+h»ng 310
+iê 309
+gh 309
+Šu 307
+ta 307
+anh 307
+¡ 307
+ai_ 306
+àng 306
+ày_ 304
+ÇÜ®c_ 298
+ÜÖ 295
+S 295
+: 294
+‰t_ 294
+e_ 294
+:_ 290
+Î_ 289
+ua 288
+æn 288
+ài 286
+Šu_ 285
+_nh» 285
+nh» 285
+nh»ng 285
+nh»n 285
+_nh»n 285
+_Th 285
+‰n_ 284
+Œn 283
+Ø 281
+_M 281
+A 281
+úc 278
+L 277
+ø 277
+ÜÖn 276
+_ha 276
+n, 275
+Öng 275
+ÜÖng 275
+an_ 272
+ài_ 271
+iŠu 269
+sÓ 269
+n,_ 268
+¿_ 268
+on_ 267
+_sÓ 267
+các 265
+àng_ 265
+_các 264
+anh_ 264
+ngh 264
+_ta 263
+hi_ 262
+hàn 261
+Š_ 261
+âu_ 261
+Àn 260
+ù 260
+_ngh 257
+ia 255
+¢ 252
+... 252
+êu 251
+Ùc 251
+i, 249
+iŠu_ 248
+nhi 247
+B 246
+i,_ 245
+Óng 244
+ª_ 244
+co 244
+_nhi 244
+¥ 244
+ܧ 244
+iên 243
+D 243
+Tr 241
+_S 240
+hÜ_ 239
+òn 237
+hà 236
+hÆ 233
+K 233
+Öng_ 232
+ôi 232
+ÜÖng_ 232
+Àn_ 231
+_co 231
+Œn_ 229
+hå 229
+äi 229
+yê 229
+Ûn 229
+¢n 228
+Ûng 228
+_L 227
+Ûng_ 226
+inh 226
+Çi 225
+mà 225
+_Çi 225
+ng, 224
+ang 224
+P 224
+Šn 224
+g, 224
+g,_ 223
+_v§ 223