diff options
author | Laszlo Nemeth <nemeth@numbertext.org> | 2012-08-23 18:28:15 +0200 |
---|---|---|
committer | László Németh <nemeth@numbertext.org> | 2012-08-23 18:28:15 +0200 |
commit | 70d8c24a37f6b2ef325d2ba1d69cefff1acfb18c (patch) | |
tree | 3e0655457cc156ef0deef9f7bcc1ead9cea0f844 | |
parent | d021ca49317fc607064b04437e9b2d03b97cde5c (diff) |
Rule fixes (fdo#46542, fdo#46549, etc.)
Signed-off-by: László Németh <nemeth@numbertext.org>
-rw-r--r-- | ChangeLog | 8 | ||||
-rw-r--r-- | NEWS | 6 | ||||
-rw-r--r-- | README | 2 | ||||
-rw-r--r-- | VERSION | 2 | ||||
-rw-r--r-- | src/en/en.cfg | 4 | ||||
-rw-r--r-- | src/en/en.dat | 5 | ||||
-rw-r--r-- | src/hu_HU/ChangeLog | 5 | ||||
-rw-r--r-- | src/hu_HU/hu_HU.cfg | 2 | ||||
-rw-r--r-- | src/hu_HU/hu_HU.dat | 195 | ||||
-rw-r--r-- | src/ru_RU/ChangeLog | 8 | ||||
-rw-r--r-- | src/ru_RU/README_lightproof_ru_RU.txt | 2 | ||||
-rw-r--r-- | src/ru_RU/ru_RU.cfg | 2 | ||||
-rw-r--r-- | src/ru_RU/ru_RU.dat | 54 | ||||
-rw-r--r-- | src/ru_RU/ru_RU.dlg | 28 |
14 files changed, 184 insertions, 139 deletions
@@ -1,3 +1,11 @@ +2012-08-23 László Németh <nemeth@numbertext.org>: + - fix fdo#46542 ("an usability" instead of "a usability") reported by Roman Eisele + - fix fdo#46549 (allow "an habitual", too), reported by jacobwwood at fdo + - fixes for English and Hungarian modules + +2009-08-21 Yakov Reztsov <yr at myooo dot ru> + * src/ru_RU/*: fixes and new Russian grammar rules + 2012-07-09 László Németh <nemeth@numbertext.org>: - fix positions of underlining of part of the matched pattern: (foo) (bar) -2> baz # Did you mean? @@ -1,3 +1,9 @@ +2012-08-23: Version 1.5 +- capitalization based on the underlined group (on 2012-07-09) +- fix positioning of the blue underline (on 2012-07-09) +- alternative separator (|) for suggestions and URL suggestions +- rule fixes + 2012-02-04: Version 1.5 beta 3 - bug fix in suggestion formatting @@ -4,7 +4,7 @@ source: git://anongit.freedesktop.org/libreoffice/lightproof or see cgit.freedesktop.org/libreoffice -version 1.5 beta 2 (2012-02-02) +version 1.5 (2012-08-23) 2009–2012 (c) László Németh (nemeth at numbertext dot org), license: MPL 1.1 / GPLv3+ / LGPLv3+ @@ -1 +1 @@ -1.5b3 +1.5 diff --git a/src/en/en.cfg b/src/en/en.cfg index 0844e90..0f038cb 100644 --- a/src/en/en.cfg +++ b/src/en/en.cfg @@ -2,7 +2,7 @@ lang = en locales = en_GB en_US en_PH en_ZA en_NA en_ZW en_AU en_CA en_IE en_IN en_BZ en_BS en_GH en_JM en_NZ en_TT name = Lightproof grammar checker (English) -version = 0.4.2 +version = 0.4.3 author = László Németh provider = LibreOffice implname = lightproof_en @@ -10,4 +10,4 @@ link = http://www.libreoffice.org description = English grammar checker for LibreOffice extras = README_lightproof_en.txt # logo = -# sourcefiles =
\ No newline at end of file +# sourcefiles = diff --git a/src/en/en.dat b/src/en/en.dat index dd8ec6a..3a6cd03 100644 --- a/src/en/en.dat +++ b/src/en/en.dat @@ -345,7 +345,8 @@ aA = set(["eucalypti", "eucalyptus", "Eucharist", "Eucharistic", "urethra", "urethral", "urethritis", "Urey", "Uri", "uric", "urinal", "urinalysis", "urinary", "urinated", "urinating", "urination", "urine", "urogenital", "urokinase", "urologist", "urologists", "urology", -"Uruguay", "Uruguayan", "Uruguayans", "US", "USA", "usable", "usage", +"Uruguay", "Uruguayan", "Uruguayans", "US", "USA", "usability", +"usable", "usably", "usage", "usages", "use", "used", "useful", "usefulness", "usefully", "useless", "uselessly", "uselessness", "Usenet", "user", "users", "uses", "using", "usual", "usually", "usurer", "usurers", "usuress", "usurial", "usurious", @@ -368,7 +369,7 @@ aAN = set(["f", "F", "FBI", "FDA", "heir", "heirdom", "heired", "R", "s", "S", "SMS", "sos", "SOS", "SPF", "std", "STD", "SUV", "x", "X", "XML"]) -aB = set(["H", "hallucination", "haute", "hauteur", "herb", "herbaceous", "herbal", +aB = set(["H", "habitual", "hallucination", "haute", "hauteur", "herb", "herbaceous", "herbal", "herbalist", "herbalism", "heroic", "hilarious", "historian", "historic", "historical", "homage", "homophone", "horrendous", "hospitable", "horrific", "hotel", "hypothesis", "Xmas"]) diff --git a/src/hu_HU/ChangeLog b/src/hu_HU/ChangeLog index a546f1a..a93dab9 100644 --- a/src/hu_HU/ChangeLog +++ b/src/hu_HU/ChangeLog @@ -1,3 +1,8 @@ +2012-08-23 László Németh <nemeth@numbertext.org>: +- „a 1,5” („a másfél”) nem névelőhasználati hiba. Pénzes Dávid hívta fel a + figyelmet a problémára. +- A 10%-al, 10-20%-al hibás alakok javítása, Pénzes Dávid javaslatára. + 2012-02-02 László Németh <nemeth@numbertext.org>: - rövidebb magyarázat a „több mint” esetén + URL - "-szám" alakoknál nem feltételez kötőjeles felsorolást diff --git a/src/hu_HU/hu_HU.cfg b/src/hu_HU/hu_HU.cfg index 3e8db39..b64ed39 100644 --- a/src/hu_HU/hu_HU.cfg +++ b/src/hu_HU/hu_HU.cfg @@ -2,7 +2,7 @@ lang = hu_HU locales = hu_HU name = Lightproof grammar checker (magyar) -version = 1.4.3 +version = 1.4.4 author = László Németh provider = FSF.hu implname = lightproof_hu diff --git a/src/hu_HU/hu_HU.dat b/src/hu_HU/hu_HU.dat index cbc1a8c..b0d3a46 100644 --- a/src/hu_HU/hu_HU.dat +++ b/src/hu_HU/hu_HU.dat @@ -24,8 +24,8 @@ hogy-hogy -> hogyhogy # Egybeírás. -> \1, hogy # Hiányzó vessző? # túl sok vessző -([-\w]+), (ahelyett|anélkül|aszerint), hogy -> \1, \2 hogy\n\1 \2, hogy # Kötőszószerű kapcsolat esetén nem írunk a „hogy” elé vesszőt. \n http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Az_írásjelek#243. -([-\w]+), illetve, (ha|hogy) -> \1, illetve \2 # Kötőszószerű kapcsolat esetén nem írunk az „illetve” után vesszőt. \n http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Az_írásjelek#243. +([-\w]+), (ahelyett|anélkül|aszerint), hogy -> \1, \2 hogy|\1 \2, hogy # Kötőszószerű kapcsolat esetén nem írunk a „hogy” elé vesszőt. | http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Az_írásjelek#243. +([-\w]+), illetve, (ha|hogy) -> \1, illetve \2 # Kötőszószerű kapcsolat esetén nem írunk az „illetve” után vesszőt. | http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Az_írásjelek#243. ###################### nagybetűsítés ################# [code] @@ -57,27 +57,27 @@ word [a-záéíóöőúüűA-ZÉÍÓÖŐÚÜŰ]\w* punct [?!,:;%‰‱°„”] -"^[-—] " <- option("dash") -> "– " # A gondolatjel nagykötőjel \n http://hu.wikipedia.org/wiki/Nagykötőjel -" [-—]([ ,;])" <- option("dash") -> " –\1" # A gondolatjel nagykötőjel \n http://hu.wikipedia.org/wiki/Nagykötőjel +"^[-—] " <- option("dash") -> "– " # A gondolatjel nagykötőjel | http://hu.wikipedia.org/wiki/Nagykötőjel +" [-—]([ ,;])" <- option("dash") -> " –\1" # A gondolatjel nagykötőjel | http://hu.wikipedia.org/wiki/Nagykötőjel # És - hogy is mondjam -, jó. -> És – hogy is mondjam –, jó. -^[-–]{word} <- option("dash") -> – {word} # Gondolatjel szóközzel a felsorolásnál \n http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Az_írásjelek#258. +^[-–]{word} <- option("dash") -> – {word} # Gondolatjel szóközzel a felsorolásnál | http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Az_írásjelek#258. -"[[][.][.][.]]" <- option("elli") -> […] # Három pont \n http://hu.wikipedia.org/wiki/Három_pont +"[[][.][.][.]]" <- option("elli") -> […] # Három pont | http://hu.wikipedia.org/wiki/Három_pont # [...] -> […] -[.][.][.] <- option("elli") -> … # Három pont \n http://hu.wikipedia.org/wiki/Három_pont +[.][.][.] <- option("elli") -> … # Három pont | http://hu.wikipedia.org/wiki/Három_pont # Vége... -> Vége… " +([.?!,:;)”])\b" -> "\1 " # Felcserélt szóköz és írásjel? -" +([.?!,:;)”])" -> \1 # Szóköz nélkül tapadó írásjel \n http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Az_írásjelek#239. +" +([.?!,:;)”])" -> \1 # Szóköz nélkül tapadó írásjel | http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Az_írásjelek#239. # A ( kicsit ) más. -> A (kicsit) más. E ( |$) # space or end of sentence "[:,;]([.?!,;:]){E}" -> \1{E} # Felesleges írásjel. -"\b[.][.]{E}" -> .{E}\n…{E} # Pont vagy három pont? \n http://hu.wikipedia.org/wiki/Három_pont +"\b[.][.]{E}" -> .{E}|…{E} # Pont vagy három pont? | http://hu.wikipedia.org/wiki/Három_pont #"\b[.]([?!]){E}" -> \1{E} # Felesleges írásjel. # És,, stb.? -> És, stb.? -# És.. -> És.\n… +# És.. -> És.|… (\w){punct}{Abc} -> \1{punct} {Abc} # Hiányzó szóköz? {abc}[.]{ABC} -> {abc}. {ABC} # Hiányzó szóköz? @@ -87,45 +87,45 @@ E ( |$) # space or end of sentence (^|\b|{punct}|[.]) {2,3}(\b|$) <- option("spaces") -> "\1 " # Felesleges szóköz. # dupla szóköz. Itt három. -> dupla szóköz. Itt három. -(^|\b|{punct}|[.]) {4,}(\b|$) <- option("spaces2") -> "\1 \n\1 " # Szóközök cseréje egy szóközre vagy tabulátorra: +(^|\b|{punct}|[.]) {4,}(\b|$) <- option("spaces2") -> "\1 |\1 " # Szóközök cseréje egy szóközre vagy tabulátorra: -(?i)(\d+)(x| x )(\d+(-\w+)?) -> \1×\3\n\1 · \3 # Szorzásjel. \n http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Az_írásjelek#275. +(?i)(\d+)(x| x )(\d+(-\w+)?) -> \1×\3|\1 · \3 # Szorzásjel. | http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Az_írásjelek#275. # 5 x 6 -> 5 × 6 # 800x600-as -> 800×600-as a {abc}+ b {abc}* -(?i){a}['´]{b} <- option("apost") -> {a}’{b} # Valódi aposztróf. \n http://hu.wikipedia.org/wiki/Aposztróf +(?i){a}['´]{b} <- option("apost") -> {a}’{b} # Valódi aposztróf. | http://hu.wikipedia.org/wiki/Aposztróf # biz' isten -> biz’ isten # ’79-ben -['´](\d\d(-\w+)?) <- option("apost") -> ’\1 # Valódi aposztróf. \n http://hu.wikipedia.org/wiki/Aposztróf +['´](\d\d(-\w+)?) <- option("apost") -> ’\1 # Valódi aposztróf. | http://hu.wikipedia.org/wiki/Aposztróf [)] <- option("par") and not "(" in TEXT -> # Felesleges zárójel? ######################## idézés ###################### -(?i)[\"“”‟„]({abc}[^\"“”‟„]*)[\"“‟] <- option("quot") -> „\1” # Idézőjelek. \n http://hu.wikipedia.org/wiki/Idézőjel -(?i)[\"“”‟]({abc}[^\"“”‟„]*)[\"“”‟] <- option("quot") -> „\1” # Idézőjelek. \n http://hu.wikipedia.org/wiki/Idézőjel +(?i)[\"“”‟„]({abc}[^\"“”‟„]*)[\"“‟] <- option("quot") -> „\1” # Idézőjelek. | http://hu.wikipedia.org/wiki/Idézőjel +(?i)[\"“”‟]({abc}[^\"“”‟„]*)[\"“”‟] <- option("quot") -> „\1” # Idézőjelek. | http://hu.wikipedia.org/wiki/Idézőjel # A "kicsi" macska. -> A „kicsi” macska. # ASCII idézőjelek cseréje (,,vmi'', >>vmi<<) -(?i),,({abc}[^\"“”‟„><']*)'' -> „\1” # Idézőjelek. \n http://hu.wikipedia.org/wiki/Idézőjel -(?i)>>({abc}[^\"“”‟„><']*)<< -> »\1« # Idézőjelek. \n http://hu.wikipedia.org/wiki/Idézőjel +(?i),,({abc}[^\"“”‟„><']*)'' -> „\1” # Idézőjelek. | http://hu.wikipedia.org/wiki/Idézőjel +(?i)>>({abc}[^\"“”‟„><']*)<< -> »\1« # Idézőjelek. | http://hu.wikipedia.org/wiki/Idézőjel # angolszász idézőjelek cseréje -(?i)‘+({abc}[^\"“”‟„’]*)’+ -> „\1”\n»\1« # Idézőjelek. \n http://hu.wikipedia.org/wiki/Idézőjel +(?i)‘+({abc}[^\"“”‟„’]*)’+ -> „\1”|»\1« # Idézőjelek. | http://hu.wikipedia.org/wiki/Idézőjel [Word] -"([(„»]) +" -> \1 # Szóköz nélkül tapadó írásjel. \n http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Az_írásjelek#239. +"([(„»]) +" -> \1 # Szóköz nélkül tapadó írásjel. | http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Az_írásjelek#239. -" +([«])" -> \1 # Szóköz nélkül tapadó írásjel. \n http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Az_írásjelek#239. +" +([«])" -> \1 # Szóköz nélkül tapadó írásjel. | http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Az_írásjelek#239. -(?i)«({abc}[^\"“”‟„’]*)» -> »\1« # Felcserélt belső idézőjelek. \n http://hu.wikipedia.org/wiki/Idézőjel +(?i)«({abc}[^\"“”‟„’]*)» -> »\1« # Felcserélt belső idézőjelek. | http://hu.wikipedia.org/wiki/Idézőjel ############### pénz ################################# @@ -178,30 +178,31 @@ dn \d{3}(,\w+)?[%‰‱°]?(-\w+)? # 3 számjegy, toldalékkal is ([-−]?\d[\d,]*)[ ]([%‰‱°](-\w*)?) - -> \1\2 # Szóköz nélkül tapadó írásjel. \n http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Az_írásjelek#275. + -> \1\2 # Szóköz nélkül tapadó írásjel. | http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Az_írásjelek#275. ([-−]?\d\d*)[.](\d\d*)([%‰‱°](-\w*)?) <- option("comma") - -> \1,\2\3 # Tizedesvessző a helyes írásjel. \n http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Egyéb_tudnivalók#291. + -> \1,\2\3 # Tizedesvessző a helyes írásjel. | http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Egyéb_tudnivalók#291. (\d\d*)[.](\d) # kivéve, ha tulajdonnév előzi meg (pl. Firefox 3.5 <- option("comma") and (not word(-1) or not re.match("[A-Z]", word(-1))) - -> \1,\2\n\1.\2. # Tizedestört (AkH. 291.) vagy sorszám? + -> \1,\2|\1.\2. # Tizedestört (AkH. 291.) vagy sorszám? ((\d\d*[.]){2}\d) # kivéve, ha tulajdonnév előzi meg (pl. Hunspell 1.2.8 <- option("comma") and not word(-1) or not re.match("[A-Z]", word(-1)) -> \1. # A sorszámot pont követi. (\d\d\d+)[.](\d\d) <- option("comma") - -> \1,\2\n\1.\2. # Tizedestört (AkH. 291.) vagy sorszám? + -> \1,\2|\1.\2. # Tizedestört (AkH. 291.) vagy sorszám? # 25.30˚, de 10.20-kor -> 25,30˚, de 10.20-kor -# 1.5 -> 1,5\n1.5. -# 123.5 -> 123,5\n123.5. +# 1.5 -> 1,5|1.5. +# 123.5 -> 123,5|123.5. # mínuszjel -(\d+([ ]\d\d\d){0,3}(,\d+)?[%‰‱°]?(-\w+)?) <- option("minus") -> −\1 # Mínuszjel kiskötőjel helyett. --(\d+([ ]\d\d\d){0,3})[.](\d+[%‰‱°]?(-\w+)?) <- option("minus") -> −\1,\2 # Mínuszjel és tizedesvessző. \n http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Egyéb_tudnivalók#291. +-(\d+([ ]\d\d\d){0,3})[.](\d+[%‰‱°]?(-\w+)?) <- option("minus") -> −\1,\2 # Mínuszjel és tizedesvessző. | http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Egyéb_tudnivalók#291. + +(−\d+([ ]\d\d\d){0,3})[.](\d+[%‰‱°]?(-\w+)?) -> \1,\2 # Tizedesvessző pont helyett. | http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Egyéb_tudnivalók#291. -(−\d+([ ]\d\d\d){0,3})[.](\d+[%‰‱°]?(-\w+)?) -> \1,\2 # Tizedesvessző pont helyett. \n http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Egyéb_tudnivalók#291. ######################## fok ######################### @@ -215,6 +216,12 @@ dn \d{3}(,\w+)?[%‰‱°]?(-\w+)? # 3 számjegy, toldalékkal is ([-−]?\d+(?:,\d+)?)((°C|°F|℃|℉)(-\w+)?) -> \1 \2 # Nem törő szóközzel elválasztott mértékegység. +######################## %-al ######################## + +# 10%-al, 10-20%-al + +(([-−]?\d+(,\d+)?[-–])?[-−]?\d+(,\d+)?)%-al -> \1%-kal # Hiányos toldalék. + ######################## dátumok ##################### [word] @@ -235,21 +242,21 @@ notmonthcomp [-–]{month}{notmonthposs} year2 \d\d -{year} {month}{notmonthposs} -> {year}. {month}{notmonthposs} # Az évszám után itt pontot írunk. \n \n http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Egyéb_tudnivalók#294. -{year} {month}{notmonthcomp} -> {year}. {month}{notmonthcomp} # Az évszám után itt pontot írunk. \n http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Egyéb_tudnivalók#294. -{year} évi -> {year}. évi # Az évszám után itt pontot írunk. \n http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Egyéb_tudnivalók#294. -{year}[-–]{year2} évi -> {year}–{year2}. évi # Az évszám után itt pontot írunk. \n http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Egyéb_tudnivalók#294. +{year} {month}{notmonthposs} -> {year}. {month}{notmonthposs} # Az évszám után itt pontot írunk. | http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Egyéb_tudnivalók#294. +{year} {month}{notmonthcomp} -> {year}. {month}{notmonthcomp} # Az évszám után itt pontot írunk. | http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Egyéb_tudnivalók#294. +{year} évi -> {year}. évi # Az évszám után itt pontot írunk. | http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Egyéb_tudnivalók#294. +{year}[-–]{year2} évi -> {year}–{year2}. évi # Az évszám után itt pontot írunk. | http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Egyéb_tudnivalók#294. # 2005 január -> 2005. január # 1999 augusztusban -> 1999. augusztusban # 2009-10 évi -> 2009–10. évi nu folyamán|előtti?|utáni?|közötti?|nyara|nyará\w+|tele|telé\w+|tavasza|tavaszá\w+|ősze|őszé\w+ -\b{year}[.] {nu}\b -> {year} \g<nu> # Az évszám után itt nem írunk pontot. \n http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Egyéb_tudnivalók#295. +\b{year}[.] {nu}\b -> {year} \g<nu> # Az évszám után itt nem írunk pontot. | http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Egyéb_tudnivalók#295. # 1974. előtti -> 1974 előtti monthposs ([jaáe]|é\w)\w* -\b{year}[.] {month}{monthposs}\b -> {year} {month}{monthposs} # Az évszám után itt nem írunk pontot. \n http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Egyéb_tudnivalók#295. +\b{year}[.] {month}{monthposs}\b -> {year} {month}{monthposs} # Az évszám után itt nem írunk pontot. | http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Egyéb_tudnivalók#295. # 1999. augusztusában -> 1999 augusztusában [char] @@ -259,31 +266,31 @@ text [^\s][^\s]* w \w* djel [ ,;:?!] -(?i)\b{month} {day}[.]-{w} -> {month} {day}-{w} # A nap után itt nem írunk pontot. \n http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Egyéb_tudnivalók#296. -(?i)\b{month} {day}{djel} -> {month} {day}.{djel} # Ha dátum, hiányzik a pont. \n http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Egyéb_tudnivalók#296. +(?i)\b{month} {day}[.]-{w} -> {month} {day}-{w} # A nap után itt nem írunk pontot. | http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Egyéb_tudnivalók#296. +(?i)\b{month} {day}{djel} -> {month} {day}.{djel} # Ha dátum, hiányzik a pont. | http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Egyéb_tudnivalók#296. # március 15.-én -> március 15-én # március 15 volt. -> március 15. volt. nu óta|előtti?|utáni?|közötti? -(?i)\b{month} {day} {nu} -> {month} {day}. {nu} # A nap után itt pontot írunk. \n http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Egyéb_tudnivalók#297. +(?i)\b{month} {day} {nu} -> {month} {day}. {nu} # A nap után itt pontot írunk. | http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Egyéb_tudnivalók#297. # március 15 óta -> március 15. óta -(?i)\b{month} {day}[.] és {day} {nu} -> {month} {day}. és {day}. {nu} # A nap után itt pontot írunk. \n http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Egyéb_tudnivalók#297. -(?i)\b{month} {day} és {day}[.]? {nu} -> {month} {day}. és {day}. {nu} # A nap után itt pontot írunk. \n http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Egyéb_tudnivalók#297. +(?i)\b{month} {day}[.] és {day} {nu} -> {month} {day}. és {day}. {nu} # A nap után itt pontot írunk. | http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Egyéb_tudnivalók#297. +(?i)\b{month} {day} és {day}[.]? {nu} -> {month} {day}. és {day}. {nu} # A nap után itt pontot írunk. | http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Egyéb_tudnivalók#297. # március 15. és 27 között -> március 15. és 27. között # március 15 és 27. között -> március 15. és 27. között # március 15 és 27 között -> március 15. és 27. között -(?i)\b{month} {day}[-–]{day} {nu} -> {month} {day}–{day}. {nu} # A nap után itt pontot írunk. \n http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Egyéb_tudnivalók#297. -(?i)\b{month} {day}-{day}. {nu} -> {month} {day}–{day}. {nu} # A napok közé nagykötőjelet írunk. \n http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Egyéb_tudnivalók#297. +(?i)\b{month} {day}[-–]{day} {nu} -> {month} {day}–{day}. {nu} # A nap után itt pontot írunk. | http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Egyéb_tudnivalók#297. +(?i)\b{month} {day}-{day}. {nu} -> {month} {day}–{day}. {nu} # A napok közé nagykötőjelet írunk. | http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Egyéb_tudnivalók#297. # március 15-22. között -> március 15–22. között # március 15-22 között -> március 15–22. között -\b{year}[.]{monthnum}[.]{day}{optdot}{text} -> {year}. {monthnum}. {day}{optdot}{text} # Szóköz a dátumban. \n http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Egyéb_tudnivalók#293. +\b{year}[.]{monthnum}[.]{day}{optdot}{text} -> {year}. {monthnum}. {day}{optdot}{text} # Szóköz a dátumban. | http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Egyéb_tudnivalók#293. # 2009.05.12. -> 2009. 05. 12. # 1. = elseje e e|i|ei\w*|é\w+ -(?i){month} 1[.]?-{e}\b -> {month} 1-j{e} # Elseje számjegyes írása. \n http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Egyéb_tudnivalók#296. +(?i){month} 1[.]?-{e}\b -> {month} 1-j{e} # Elseje számjegyes írása. | http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Egyéb_tudnivalók#296. # május 1-i -> május 1-ji # május 1-ei -> május 1-jei # május 1-én -> május 1-jén @@ -294,12 +301,12 @@ e e|i|ei\w*|é\w+ #W \w+ # word # tagmondatok és mondatrészek megkülönböztetéséhez mondatelemzés kell -#([(]|\w+: )(({W}, )+{W};( {W}[,;])* {W})[,]? stb. -> \1\2; stb. # Stb. előtt itt pontosvessző van. (AkH. 247/b) \n http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Az_írásjelek#247. -#([(]|\w+: )(({W}, )*{W}), stb. -> \1\2 stb. # Stb. előtt itt nincs vessző. (AkH. 247/d) \n http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Az_írásjelek#247. -\bstb[.], stb[.] -> stb. stb.\nstb.; stb. # Két stb. közé nem teszünk vesszőt. +#([(]|\w+: )(({W}, )+{W};( {W}[,;])* {W})[,]? stb. -> \1\2; stb. # Stb. előtt itt pontosvessző van. (AkH. 247/b) | http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Az_írásjelek#247. +#([(]|\w+: )(({W}, )*{W}), stb. -> \1\2 stb. # Stb. előtt itt nincs vessző. (AkH. 247/d) | http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Az_írásjelek#247. +\bstb[.], stb[.] -> stb. stb.|stb.; stb. # Két stb. közé nem teszünk vesszőt. ## Madarak: rigó, cinke, veréb, stb. -> Madarak: rigó, cinke, veréb stb. ## Állatok (rigó, cinke; nyúl, pocok stb.) -> Állatok (rigó, cinke; nyúl, pocok; stb.) -# stb., stb. -> stb. stb.\nstb.; stb. +# stb., stb. -> stb. stb.|stb.; stb. #################### rövidítések ##################### @@ -325,15 +332,15 @@ year2 (1\d\d[1-9]|1\d[1-9]\d|20\d[1-9]|20[1-9]\d) # 1998-2000 -> 1998–2000 # 1998-99 -> 1998–99 -([A-ZÖÜÓŰŐÚÉÁÍ]\w*)-(\d+(-\w+)?) -> \1–\2 # Típusnév és -szám közé nagykötőjelet teszünk. \n http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Az_írásjelek#263. +([A-ZÖÜÓŰŐÚÉÁÍ]\w*)-(\d+(-\w+)?) -> \1–\2 # Típusnév és -szám közé nagykötőjelet teszünk. | http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Az_írásjelek#263. # UTF-8 -> UTF–8 # Apolló-13-nak -> Apolló–13-nak -pp[.] (\d+)-(\d+)[.] -> pp. \1–\2. # Oldalszámok közé nagykötőjelet teszünk. \n http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Az_írásjelek#263. +pp[.] (\d+)-(\d+)[.] -> pp. \1–\2. # Oldalszámok közé nagykötőjelet teszünk. | http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Az_írásjelek#263. (\d+)-(\d+)[.] (o[.]|oldal\w*) -> \1–\2. \3 # Oldalszám # 10-12. oldalon -> 10–12. oldalon -" (u[.]|utca|út|tér) (\d\d*)-(\d\d*)[.]" -> " \1 \2–\3." # Nagykötőjel a házszámban. \n http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Egyéb_tudnivalók#298. +" (u[.]|utca|út|tér) (\d\d*)-(\d\d*)[.]" -> " \1 \2–\3." # Nagykötőjel a házszámban. | http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Egyéb_tudnivalók#298. # Széna tér 123-125. -> Széna tér 123–125. @@ -350,13 +357,13 @@ ne játs(zunk|zatok|zanak) -> ne játss\1 # Helyesírási hiba. [aá] la carte -> à la carte # Helyesen à la carte. (állta(ss\w*|t\w*)) <- not morph(\1, "pa:") -> álta\2 # Áltat, hiteget értelemben egy l-lel írjuk. önáll(tat[óá]\w*) -> önál\1 # Helyesen egy l-lel. -belsőséges -> bensőséges\nbelsőségből készült # Szótévesztés vagy szójáték? +belsőséges -> bensőséges|belsőségből készült # Szótévesztés vagy szójáték? dehogy is -> dehogyis # Egybeírás „egyáltalán nem” jelentésben. dehogy nem -> dehogynem # Egybeírás „de igen” jelentésben. dehogyis nem -> dehogyisnem # Egybeírás „de igen” jelentésben. eképpen -> ekképpen # Helyesen két k-val. egyel (több\w*|kevesebb\w*) -> eggyel \1 # 1-gyel értelemben hosszú gy-vel írjuk. -egyenlőre -> egyelőre\negyformára\ndöntetlenre\negyenlő számúra\nazonos méretűre # Helyesírási (egyelőre) vagy stílushiba (egyformára). +egyenlőre -> egyelőre|egyformára|döntetlenre|egyenlő számúra|azonos méretűre # Helyesírási (egyelőre) vagy stílushiba (egyformára). egyi(vású\w*) -> egyí\1 # Hosszú í-vel helyes. egytől-egyig -> egytől egyig # Kötőjel nélkül írjuk. előre hátra -> előre-hátra # Kötőjellel írjuk. @@ -373,16 +380,16 @@ hátba (támadás\w*) -> hátba\1 # Egybeírás. időről-időre -> időről időre # Különírás. jing és jang -> jin és jang # Helyesen jin és jang. kőr((öz|út|ut)\w*) <- morph(\0, ur"st:kőr\b") -> kör\1 # Rövid ö-vel a kör összetételeiben. -légyszíves -> légy szíves\nlegyél szíves # Legyél szíves értelemben különírjuk. +légyszíves -> légy szíves|legyél szíves # Legyél szíves értelemben különírjuk. legalább is -> legalábbis # Egybeírás. Lichten(stein\w*) -> Liechten\1 # Helyesen Liechtenstein. mellékhely(ség\w*) -> mellékhelyi\1 # Helyiség, mint szoba. mú(landó\w*) -> mu\1 # Helyesen rövid u-val. nembiztos -> nem biztos # Különírás. -originált -> originál\neredeti\nbontatlan # Ha nem tárgyesetben van, „t” nélkül írjuk. +originált -> originál|eredeti|bontatlan # Ha nem tárgyesetben van, „t” nélkül írjuk. (szén|kén|mangán|nitrogén|ón|titán|tórium)(dioxid\w*) -> \1-\2 # Kötőjeles alak. (szén|kén|nitrogén)(monoxid\w*) -> \1-\2 # Kötőjeles alak. -továbbittunk -> továbbítunk\ntovább ittunk # Helyesírási hiba. +továbbittunk -> továbbítunk|tovább ittunk # Helyesírási hiba. [char] @@ -397,14 +404,14 @@ a [aA] aword [aáeéiíoóöőuúüűAÁEÉIÍOÓÖŐUÚÜŰ]\w* ^[aA] {aword} <- not re.match(r"(?i)i(ii?|[vx])$|Unicode$|Unix\w*$", {aword}) and spell({aword}) -> az {aword} # Hibás névelő? (?<!(\d[.]|az) )\b{a} {aword} <- word(-1) and not re.match(r"(?i)i(ii?|[vx])$|Unicode$|Unix\w*$", {aword}) and - spell({aword}) -> {a}z {aword}\n{aword} # Hibás vagy felesleges névelő? -# A 4. a osztály a órán az A alaphangot -> A 4. a osztály az órán\nórán az A alaphangot + spell({aword}) -> {a}z {aword}|{aword} # Hibás vagy felesleges névelő? +# A 4. a osztály a órán az A alaphangot -> A 4. a osztály az órán|órán az A alaphangot # névelők és számok [Word] -a <- word(1) and re.match(r"(1|5\d*|[15]\d\d\d)[.]?$", word(1)) -> az # Hibás névelő. +a(?! 1,5\b) <- word(1) and re.match(r"(1|5\d*|[15]\d\d\d)[.]?$", word(1)) -> az # Hibás névelő. az <- not option("grammar") and word(2) and re.match(ur"(alfejezet|alszakasz|ábr|bekezdés|diagram|fejezet|kép|lap|oldal|paragrafus|szakasz|táblázat)\w*", word(2)) and @@ -457,7 +464,7 @@ hw [a-zA-ZöüóűőúéáíÖÜÓŰŐÚÉÁÍ][a-zA-ZöüóűőúéáíÖÜÓŰ [word] event (Advent|Húsvét|Karácsony|Mindenszentek|Pünkösd|(Anyák|Apák|Halottak|Nők) [Nn]apj){abc}* -{event} <- word(-1) and word(1) == word(1).lower() -> = {event}.lower() # Kisbetűs kifejezés, ha nem cím. \n http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/A_kis_és_a_nagy_kezdőbetűk#145. +{event} <- word(-1) and word(1) == word(1).lower() -> = {event}.lower() # Kisbetűs kifejezés, ha nem cím. | http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/A_kis_és_a_nagy_kezdőbetűk#145. # Nemsokára Anyák napja. -> Nemsokára anyák napja. [char] @@ -553,48 +560,48 @@ w {Abc}+ # Észak-Amerikai Észak-amerikai helyett -{Dir}-{cap} <- morph({cap}, r"po:noun_prs.*is:i_PLACE", False) -> = {Dir} + "-" + {cap}.lower() # Kisbetűvel írt földrajzi név. \n http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/A_tulajdonnevek_írása#179. +{Dir}-{cap} <- morph({cap}, r"po:noun_prs.*is:i_PLACE", False) -> = {Dir} + "-" + {cap}.lower() # Kisbetűvel írt földrajzi név. | http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/A_tulajdonnevek_írása#179. # észak-Amerika Észak-Amerika helyett {dir}-{cap} <- morph({cap}, r"po:noun_prs", False) and not morph({cap},"is:i_PLACE", False) -> - = {dir}.capitalize() + "-" + {cap} # Nagybetűvel írt földrajzi név. \n http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/A_tulajdonnevek_írása#179. + = {dir}.capitalize() + "-" + {cap} # Nagybetűvel írt földrajzi név. | http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/A_tulajdonnevek_írása#179. # Észak-amerikai csak akkor nagybetűs, ha mondatkezdő és nem nagybetűs az utána jövő szó {Dir}-{sc} <- word(-1) and word(1) and not word(1) == word(1).capitalize() and - morph({sc}, r"po:noun_prs.*is:i_PLACE", False) -> = {Dir}.lower() + "-" + {sc} # Kisbetűvel írt földrajzi név. \n http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/A_tulajdonnevek_írása#179. + morph({sc}, r"po:noun_prs.*is:i_PLACE", False) -> = {Dir}.lower() + "-" + {sc} # Kisbetűvel írt földrajzi név. | http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/A_tulajdonnevek_írása#179. # hiányzó kötőjel -{Dir} {w} <- morph({w}, r"po:noun_prs") -> {Dir}-{w} # Kötőjellel írt földrajzi név. \n http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/A_tulajdonnevek_írása#179. +{Dir} {w} <- morph({w}, r"po:noun_prs") -> {Dir}-{w} # Kötőjellel írt földrajzi név. | http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/A_tulajdonnevek_írása#179. # köznevek prop Tenger|Óceán|Sziget|Félsziget|Középhegység -{cap}-{prop} -> = {cap} + "-" + {prop}.lower() # Kisbetűs írt köznévi tag. \n http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/A_tulajdonnevek_írása#176. +{cap}-{prop} -> = {cap} + "-" + {prop}.lower() # Kisbetűs írt köznévi tag. | http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/A_tulajdonnevek_írása#176. # AkH. 182. -(Árpád|Erzsébet|Hajógyári|Margit|Megyeri|Petőfi|Rákóczi|Szabadság)-(híd\w*) -> \1 \2 # Különírás. \n http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/A_tulajdonnevek_írása#182. -(Szabadság)(híd\w*) -> \1 \2 # Különírás. \n http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/A_tulajdonnevek_írása#182. -(Szabadság ?)(szobo?r\w*) -> \1-\2 # Kötőjeles összetétel. \n http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/A különírás és az egybeírás#140. +(Árpád|Erzsébet|Hajógyári|Margit|Megyeri|Petőfi|Rákóczi|Szabadság)-(híd\w*) -> \1 \2 # Különírás. | http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/A_tulajdonnevek_írása#182. +(Szabadság)(híd\w*) -> \1 \2 # Különírás. | http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/A_tulajdonnevek_írása#182. +(Szabadság ?)(szobo?r\w*) -> \1-\2 # Kötőjeles összetétel. | http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/A különírás és az egybeírás#140. # AkH. 183. -(Fertő)-(([tT]ó|[tT]av)\w*) -> = \1 + " " + \2.lower() # Kötőjel nélkül írt földrajzi név. \n http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/A_tulajdonnevek_írása#183. -(Góbi|Kalahári|Szahara)-([sS]ivatag\w*) -> = \1 + " " + \2.lower() # Kötőjel nélkül írt földrajzi név. \n http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/A_tulajdonnevek_írása#183. -(Börzsöny|Bükk|Mátra|Mecsek|Pilis|Zemplén|Vértes)-([Hh]egység\w*) -> = \1 + " " + \2.lower() # Kötőjel nélkül írt földrajzi név. \n http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/A_tulajdonnevek_írása#183. -(Duna)-(folyam\w*) -> = \1 + " " + \2.lower() # Kötőjel nélkül írt földrajzi név. \n http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/A_tulajdonnevek_írása#183. -(Bodrog|Duna|Dráva|Ipoly|Körös|Maros|Rába|Sajó|Tisza|Zala)-(([Ff]olyó|[Ff]olyam)\w*) -> = \1 + " " + \2.lower() # Kötőjel nélkül írt földrajzi név. \n http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/A_tulajdonnevek_írása#183. +(Fertő)-(([tT]ó|[tT]av)\w*) -> = \1 + " " + \2.lower() # Kötőjel nélkül írt földrajzi név. | http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/A_tulajdonnevek_írása#183. +(Góbi|Kalahári|Szahara)-([sS]ivatag\w*) -> = \1 + " " + \2.lower() # Kötőjel nélkül írt földrajzi név. | http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/A_tulajdonnevek_írása#183. +(Börzsöny|Bükk|Mátra|Mecsek|Pilis|Zemplén|Vértes)-([Hh]egység\w*) -> = \1 + " " + \2.lower() # Kötőjel nélkül írt földrajzi név. | http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/A_tulajdonnevek_írása#183. +(Duna)-(folyam\w*) -> = \1 + " " + \2.lower() # Kötőjel nélkül írt földrajzi név. | http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/A_tulajdonnevek_írása#183. +(Bodrog|Duna|Dráva|Ipoly|Körös|Maros|Rába|Sajó|Tisza|Zala)-(([Ff]olyó|[Ff]olyam)\w*) -> = \1 + " " + \2.lower() # Kötőjel nélkül írt földrajzi név. | http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/A_tulajdonnevek_írása#183. Budapest (Liszt Ferenc )([Nn]emzetközi [Rr]epülőt[eé])(r\w*) -> = \1 + \2.lower() + \3 + - "\nferihegyi " + \1 + \2.lower() + \3 + "\n" + + "|ferihegyi " + \1 + \2.lower() + \3 + "|" + \3.replace("r", "Ferihegy", 1).replace("gyrel", "ggyel").replace(u"gyré", u"ggyé") + - "\nBudapest, " + \1 + \2.lower() + \3 - # A köznévi tag kisbetűs, a címet vesszővel tagoljuk. (AkH. 190., 247.; FNB 74.) \n http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Az_írásjelek#247. + "|Budapest, " + \1 + \2.lower() + \3 + # A köznévi tag kisbetűs, a címet vesszővel tagoljuk. (AkH. 190., 247.; FNB 74.) | http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Az_írásjelek#247. ########################## vesszők ########################## @@ -708,14 +715,14 @@ több, mint <- (re.match(r"\d+$", word(1)) and morph(word(2), r"po:adj_num|st:ezer\b") and morph(word(3), r"po:noun\b.*is:")) or # több mint 75%-a re.match(r"\d+%-", word(1)) -> több mint # Ha nem összehasonlítás, - hanem a mondanivaló erősítése, itt nem használunk vesszőt. \n + hanem a mondanivaló erősítése, itt nem használunk vesszőt. | http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Az_írásjelek#243. ############ avagy, illetve, ill., valamint ########## (\w+)( avagy) -> \1,\2 # Az avagy kötőszó elé vesszőt teszünk. (\w+)( illetve) -> \1,\2 # Az illetve kötőszó elé vesszőt teszünk. -(\w+)( ill[.]) -> \1,\2\n\1, illetve # Az illetve kötőszó elé vesszőt teszünk. +(\w+)( ill[.]) -> \1,\2|\1, illetve # Az illetve kötőszó elé vesszőt teszünk. (\w+)( valamint) -> \1,\2 # A valamint kötőszó elé vesszőt teszünk. ############ mellet -> mellett ################## @@ -762,12 +769,12 @@ W \w{4,} ############### Stílus ################################# [Word] -#asszem -> azt hiszem\nazt hiszem, hogy # Helyesírási hiba. +#asszem -> azt hiszem|azt hiszem, hogy # Helyesírási hiba. #h <- option("style") -> hogy # Hibás rövidítés? #szar\w* <- option("style") and morph(\0, r"st:szar\b") -> rossz # Stílushiba. -médiák <- option("style") -> médiák\nmédia\nhírek\nlapok\nhírcsatornák # Vitatott stílusértékű alak. -unszimpatikus <- option("style") -> unszimpatikus\nellenszenves\nantipatikus # Vitatott stílusértékű alak. +médiák <- option("style") -> médiák|média|hírek|lapok|hírcsatornák # Vitatott stílusértékű alak. +unszimpatikus <- option("style") -> unszimpatikus|ellenszenves|antipatikus # Vitatott stílusértékű alak. # ezresek számjegyekkel @@ -796,7 +803,7 @@ W [-\w]{3,} {W} \1 <- option("dup0") and (not word(-1) or not word(-1).lower() in ["a", "az", "minden"]) and word(1) != u"hátán" and word(1) != u"hátán." and - not morph(word(1), "po:post", False) -> {W}\n{W}-\1 # Szóismétlés vagy hiányzó kötőjel? + not morph(word(1), "po:post", False) -> {W}|{W}-\1 # Szóismétlés vagy hiányzó kötőjel? {W}(?: [-–\w„”]+)* \1 <- option("dup") -> {W} # Túlzott szóismétlés? @@ -863,7 +870,7 @@ kedvel <- word(-1).lower() == u"jó" or word(-1).lower() == "rossz" -> kedvvel # ([-−]?\d+(?:,\d+)?) (℉(-\w+)?) <- option("SI") -> = measurement(\1, "F", "C", " °C" + \2[1:]) # Váltás SI mértékegységre ([-−]?\d(?:,\d+)?) (láb\w*) <- option("SI") and stem(\2) == [u"láb"] -> = - measurement(\1, "ft", "cm", " " + generate(u"centiméter", \2)[0]) + "\n" + + measurement(\1, "ft", "cm", " " + generate(u"centiméter", \2)[0]) + "|" + measurement(\1, "ft", "m", " " + generate(u"méter", \2)[0]) # Váltás SI mértékegységre ([-−]?\d\d+(?:,\d+)?) (láb\w*) <- option("SI") and stem(\2) == [u"láb"] -> = measurement(\1, "ft", "m", @@ -885,19 +892,19 @@ kedvel <- word(-1).lower() == u"jó" or word(-1).lower() == "rossz" -> kedvvel # " " + generate("liter", \2)[0]) # Váltás SI mértékegységre ([-−]?\d+(?:,\d+)?) (pint\w*) <- option("SI") -> = - measurement(\1, "uk_pt", "dl", " " + generate("deciliter", \2)[0]) + "\n" + + measurement(\1, "uk_pt", "dl", " " + generate("deciliter", \2)[0]) + "|" + measurement(\1, "us_pt", "dl", " " + generate("deciliter", \2)[0]) # Váltás SI mértékegységre (angol és amerikai pint) # elválasztás -adatút <- option("hyphen") -> adatút\nadatút # Elválasztás: -felett(em|ed|e|ünk|ük) <- option("hyphen") -> felett\1\nfelett\1 # Elválasztás: -felettetek <- option("hyphen") -> felettetek\nfelettetek # Elválasztás: -fölül <- option("hyphen") -> fölül\nfölül # Elválasztás: -gépelem <- option("hyphen") -> gépelem\ngépelem # Elválasztás: -karóra <- option("hyphen") -> karóra\nkaróra # Elválasztás: -megás <- option("hyphen") -> megás\nmegás # Elválasztás: -megint <- option("hyphen") -> megint\nmegint # Elválasztás: +adatút <- option("hyphen") -> adatút|adatút # Elválasztás: +felett(em|ed|e|ünk|ük) <- option("hyphen") -> felett\1|felett\1 # Elválasztás: +felettetek <- option("hyphen") -> felettetek|felettetek # Elválasztás: +fölül <- option("hyphen") -> fölül|fölül # Elválasztás: +gépelem <- option("hyphen") -> gépelem|gépelem # Elválasztás: +karóra <- option("hyphen") -> karóra|karóra # Elválasztás: +megás <- option("hyphen") -> megás|megás # Elválasztás: +megint <- option("hyphen") -> megint|megint # Elválasztás: [code] @@ -905,4 +912,4 @@ def measurement(mnum, min, mout, mstr): m = calc("CONVERT_ADD", (float(mnum.replace(",", ".").replace(u"−", "-")), min, mout)) a = list(set([str(calc("ROUND", (m, 0)))[:-2], str(calc("ROUND", (m, 1))), str(calc("ROUND", (m, 2))), str(m)])) # remove duplicated rounded items a.sort(lambda x, y: len(x) - len(y)) # sort by string length - return join(a, mstr + "\n").replace(".", ",").replace("-", u"−") + mstr + return join(a, mstr + "|").replace(".", ",").replace("-", u"−") + mstr diff --git a/src/ru_RU/ChangeLog b/src/ru_RU/ChangeLog new file mode 100644 index 0000000..6d7d33b --- /dev/null +++ b/src/ru_RU/ChangeLog @@ -0,0 +1,8 @@ +2012-08-21 Yakov Reztsov <yr at myooo dot ru>: +- New grammar rules +- Fix some rules + + +2012-02-04 Yakov Reztsov <yr at myooo dot ru>: +- Update and rewrite rules +- Update settings dialog
\ No newline at end of file diff --git a/src/ru_RU/README_lightproof_ru_RU.txt b/src/ru_RU/README_lightproof_ru_RU.txt index 1744797..caa4fff 100644 --- a/src/ru_RU/README_lightproof_ru_RU.txt +++ b/src/ru_RU/README_lightproof_ru_RU.txt @@ -3,5 +3,5 @@ Russian grammar checker (developed by the Lightproof grammar checker extension generator, see http://launchpad.net/lightproof) -2009, 2011 (c) Yakov Reztsov <yr at myooo dot ru>, license: MPL 1.1 / GPL / LGPL +2009, 2011, 2012 (c) Yakov Reztsov <yr at myooo dot ru>, license: MPL 1.1 / GPL / LGPL diff --git a/src/ru_RU/ru_RU.cfg b/src/ru_RU/ru_RU.cfg index 3ba09c7..dcc494d 100644 --- a/src/ru_RU/ru_RU.cfg +++ b/src/ru_RU/ru_RU.cfg @@ -2,7 +2,7 @@ lang = ru_RU locales = ru_RU name = Lightproof grammar checker (Russian) -version = 0.3.1 +version = 0.3.2 author = Yakov Reztsov <yr at myooo dot ru> provider = LibreOffice implname = lightproof_ru_RU diff --git a/src/ru_RU/ru_RU.dat b/src/ru_RU/ru_RU.dat index 512dc25..f37f2cd 100644 --- a/src/ru_RU/ru_RU.dat +++ b/src/ru_RU/ru_RU.dat @@ -1,4 +1,4 @@ -# Sample proofreading rules for Russian (by Yakov Reztsov 2009, 2011) +# Proofreading rules for Russian (by Yakov Reztsov 2009-2012) @@ -47,13 +47,13 @@ adv1 кто|что|где|зачем|кое [ ]{abbr}[ ] <- option("abbreviation") -> " {abbr}. " # Точка после сокращений. (^|\b|{punct}|[.]) {2,3}(\b|$) <- option("space") -> "\1 " # Лишний пробел. # Extra space -> Extra space -# " мм " -> " мм. " +# " коп " -> " коп. " # quotation -\"(\w[^\"“”]*[\w.?!,])\" <- option("quotation") -> «\1»\n„\1”\n“\1” # Кавычки. -\B'(\w[^']*[\w.?!,])'\B <- option("quotation") -> ‘\1’ # Кавычки. -# "The 'old' boy" -> „The ‘old’ boy”\n«The ‘old’ boy»\n“The ‘old’ boy” +\"(\w[^\"“”]*[\w.?!,])\" <- option("quotation") -> «\1» # Кавычки. +\B'(\w[^']*[\w.?!,])'\B <- option("quotation") -> ‘\1’ # Кавычки. +# "The 'old' boy" -> «The ‘old’ boy» # apostrophe @@ -107,24 +107,33 @@ w \w* # multiword expressions -\bнорд ост\b <- option("hyphen") -> норд-ост\nнордост # Дефис? -# норд ост -> норд-ост\nнордост # Suggestions separated by new lines (\n) +\bнорд ост\b <- option("hyphen") -> норд-ост # Дефис? +# норд ост -> норд-ост # Suggestions separated by new lines (\n) -\bнорд вест\b <- option("hyphen") -> норд-вест\nнордвест # Дефис? -# норд вест -> норд-вест\nнордвест # Suggestions separated by new lines (\n) +\bнорд вест\b <- option("hyphen") -> норд-вест # Дефис? +# норд вест -> норд-вест # Suggestions separated by new lines (\n) -\bсеверо западн{abc}\b <- option("hyphen") -> северо-западн{abc}\nсеверозападн{abc} # Дефис? -# северо западный -> северо-западный\nсеверозападный # Suggestions separated by new lines (\n) +\bзюйд ост\b <- option("hyphen") -> зюйд-ост # Дефис? +# зюйд ост -> зюйд-ост # Suggestions separated by new lines (\n) +\bзюйд вест\b <- option("hyphen") -> зюйд-вест # Дефис? +# зюйд вест -> зюйд-вест # Suggestions separated by new lines (\n) -\bюго западн{abc}\b <- option("hyphen") -> юго-западн{abc}\nюгозападн{abc} # Дефис? -# юго западный -> юго-западный\nюгозападный # Suggestions separated by new lines (\n) -\bсеверо восточн{abc}\b <- option("hyphen") -> северо-восточн{abc}\nсеверовосточн{abc} # Дефис? -# северо восточный -> северо-восточный\nсеверовосточный # Suggestions separated by new lines (\n) -\bюго восточн{abc}\b <- option("hyphen") -> юго-восточн{abc}\nюговосточн{abc} # Дефис? -# юго восточный -> юго-восточный\nюговосточный # Suggestions separated by new lines (\n) + +\bсеверо западн{abc}\b <- option("hyphen") -> северо-западн{abc} # Дефис? +# северо западный -> северо-западный # Suggestions separated by new lines (\n) + + +\bюго западн{abc}\b <- option("hyphen") -> юго-западн{abc} # Дефис? +# юго западный -> юго-западный # Suggestions separated by new lines (\n) + +\bсеверо восточн{abc}\b <- option("hyphen") -> северо-восточн{abc} # Дефис? +# северо восточный -> северо-восточный # Suggestions separated by new lines (\n) + +\bюго восточн{abc}\b <- option("hyphen") -> юго-восточн{abc} # Дефис? +# юго восточный -> юго-восточный # Suggestions separated by new lines (\n) \b{adv1} нибудь\b <- option("hyphen") -> {adv1}-нибудь # Дефис? @@ -196,6 +205,12 @@ w \w* +(в) (течение) (реки|потока|воды|ручья) <- option("multiword") -> \1 течении \3 # Грамматическая ошибка +(в) (течении) (часа|минуты|промежутка|секунды|дня|времени|недели|месяца|года|столетия|тысячелетия) <- option("multiword") -> \1 течение \3 # Грамматическая ошибка +(в) (продолжении) (часа|минуты|промежутка|секунды|дня|времени|недели|месяца|года|столетия|тысячелетия|разговора|беседы) <- option("multiword") -> \1 продолжение \3 # Грамматическая ошибка + + + \bкакбудто<- option("together") -> как будто # Составная частица \bпо мимо\b <- option("together") -> помимо # Пишется слитно @@ -241,8 +256,5 @@ W [-\w]{3,} # within clauses -{W}(?: [-–\w“”]+)* \1 <- option("dup") -> {W} # Повтор слова? - -# within sentences +{W} \1 <- option("dup") -> {W} # Повтор слова? -{W}[;,:]?(?: [-–\w“”]+[;,:]?)* \1 <- option("dup2") -> {W} # Повтор слова? diff --git a/src/ru_RU/ru_RU.dlg b/src/ru_RU/ru_RU.dlg index b3b3c1b..13828aa 100644 --- a/src/ru_RU/ru_RU.dlg +++ b/src/ru_RU/ru_RU.dlg @@ -23,7 +23,7 @@ # options (starred options are checked) grammar: *hyphen *comma, *multiword *together -proofreading: *dup dup2, *common *space, *abbreviation +proofreading: *common *space, *abbreviation *dup others: numsep, *typographica, *quotation # titles @@ -40,27 +40,25 @@ together=Together/separately proofreading=Proofreading space=Space mistake typographica=Typographica -dup=Word duplication within clauses -dup2=Word duplication within sentences +dup=Word duplication others=Others numsep=Separation of large numbers (ISO) quotation=Quotation [ru_RU=Проверка грамматики (Русский язык)] -abbreviation=Аббревиатуры +abbreviation=Аббревиатуры \n Аббревиатуры, сокращения и знаки пунктуации. grammar=Грамматика -hyphen=Дефис -comma=Пунктуация -common=Общие ошибки -multiword=Словосочетания -together=Слитно/раздельно +hyphen=Дефис \n Правописание слов через дефис, слитно или раздельно. +comma=Пунктуация \n Поиск ошибок в расстановке знаков препинания. +common=Общие ошибки \n Поиск прочих ошибок +multiword=Словосочетания \n Правописание словосочетаний и устойчивых оборотов. +together=Слитно/раздельно \n Правописание слов слитно или раздельно. proofreading=Стилистика -space=Пробел -typographica=Типографика -dup=Повтор слов в словосочетаниях -dup2=Повтор слов в предложениях +space=Пробел \n Поиск ошибок с пробелом: двойной пробел, пробел перед знаками пунктуации. +typographica=Типографика \n Предлагать замену сочетаний знаков на специальные символы. +dup=Повтор слов \n Поиск повторяющихся слов others=Прочее -numsep=Разделители групп разрядов (ISO) для чисел -quotation=Кавычки +numsep=Разделители групп разрядов (ISO) для чисел \n Разделители групп разрядов (ISO) для больших чисел +quotation=Кавычки \n Предлагать замену кавычек на кавычки-«ёлочки» или парные кавычки. |