summaryrefslogtreecommitdiff
diff options
context:
space:
mode:
authorLaszlo Nemeth <nemeth@numbertext.org>2012-08-23 18:28:15 +0200
committerLászló Németh <nemeth@numbertext.org>2012-08-23 18:28:15 +0200
commit70d8c24a37f6b2ef325d2ba1d69cefff1acfb18c (patch)
tree3e0655457cc156ef0deef9f7bcc1ead9cea0f844
parentd021ca49317fc607064b04437e9b2d03b97cde5c (diff)
Rule fixes (fdo#46542, fdo#46549, etc.)
Signed-off-by: László Németh <nemeth@numbertext.org>
-rw-r--r--ChangeLog8
-rw-r--r--NEWS6
-rw-r--r--README2
-rw-r--r--VERSION2
-rw-r--r--src/en/en.cfg4
-rw-r--r--src/en/en.dat5
-rw-r--r--src/hu_HU/ChangeLog5
-rw-r--r--src/hu_HU/hu_HU.cfg2
-rw-r--r--src/hu_HU/hu_HU.dat195
-rw-r--r--src/ru_RU/ChangeLog8
-rw-r--r--src/ru_RU/README_lightproof_ru_RU.txt2
-rw-r--r--src/ru_RU/ru_RU.cfg2
-rw-r--r--src/ru_RU/ru_RU.dat54
-rw-r--r--src/ru_RU/ru_RU.dlg28
14 files changed, 184 insertions, 139 deletions
diff --git a/ChangeLog b/ChangeLog
index 106d74c..9dc46de 100644
--- a/ChangeLog
+++ b/ChangeLog
@@ -1,3 +1,11 @@
+2012-08-23 László Németh <nemeth@numbertext.org>:
+ - fix fdo#46542 ("an usability" instead of "a usability") reported by Roman Eisele
+ - fix fdo#46549 (allow "an habitual", too), reported by jacobwwood at fdo
+ - fixes for English and Hungarian modules
+
+2009-08-21 Yakov Reztsov <yr at myooo dot ru>
+ * src/ru_RU/*: fixes and new Russian grammar rules
+
2012-07-09 László Németh <nemeth@numbertext.org>:
- fix positions of underlining of part of the matched pattern:
(foo) (bar) -2> baz # Did you mean?
diff --git a/NEWS b/NEWS
index 3099ed3..ac86921 100644
--- a/NEWS
+++ b/NEWS
@@ -1,3 +1,9 @@
+2012-08-23: Version 1.5
+- capitalization based on the underlined group (on 2012-07-09)
+- fix positioning of the blue underline (on 2012-07-09)
+- alternative separator (|) for suggestions and URL suggestions
+- rule fixes
+
2012-02-04: Version 1.5 beta 3
- bug fix in suggestion formatting
diff --git a/README b/README
index 3cd6f6a..9803a6d 100644
--- a/README
+++ b/README
@@ -4,7 +4,7 @@ source: git://anongit.freedesktop.org/libreoffice/lightproof
or see cgit.freedesktop.org/libreoffice
-version 1.5 beta 2 (2012-02-02)
+version 1.5 (2012-08-23)
2009–2012 (c) László Németh (nemeth at numbertext dot org), license: MPL 1.1 / GPLv3+ / LGPLv3+
diff --git a/VERSION b/VERSION
index b62c095..c239c60 100644
--- a/VERSION
+++ b/VERSION
@@ -1 +1 @@
-1.5b3
+1.5
diff --git a/src/en/en.cfg b/src/en/en.cfg
index 0844e90..0f038cb 100644
--- a/src/en/en.cfg
+++ b/src/en/en.cfg
@@ -2,7 +2,7 @@
lang = en
locales = en_GB en_US en_PH en_ZA en_NA en_ZW en_AU en_CA en_IE en_IN en_BZ en_BS en_GH en_JM en_NZ en_TT
name = Lightproof grammar checker (English)
-version = 0.4.2
+version = 0.4.3
author = László Németh
provider = LibreOffice
implname = lightproof_en
@@ -10,4 +10,4 @@ link = http://www.libreoffice.org
description = English grammar checker for LibreOffice
extras = README_lightproof_en.txt
# logo =
-# sourcefiles = \ No newline at end of file
+# sourcefiles =
diff --git a/src/en/en.dat b/src/en/en.dat
index dd8ec6a..3a6cd03 100644
--- a/src/en/en.dat
+++ b/src/en/en.dat
@@ -345,7 +345,8 @@ aA = set(["eucalypti", "eucalyptus", "Eucharist", "Eucharistic",
"urethra", "urethral", "urethritis", "Urey", "Uri", "uric", "urinal",
"urinalysis", "urinary", "urinated", "urinating", "urination", "urine",
"urogenital", "urokinase", "urologist", "urologists", "urology",
-"Uruguay", "Uruguayan", "Uruguayans", "US", "USA", "usable", "usage",
+"Uruguay", "Uruguayan", "Uruguayans", "US", "USA", "usability",
+"usable", "usably", "usage",
"usages", "use", "used", "useful", "usefulness", "usefully", "useless",
"uselessly", "uselessness", "Usenet", "user", "users", "uses", "using",
"usual", "usually", "usurer", "usurers", "usuress", "usurial", "usurious",
@@ -368,7 +369,7 @@ aAN = set(["f", "F", "FBI", "FDA", "heir", "heirdom", "heired",
"R", "s", "S", "SMS", "sos", "SOS", "SPF", "std", "STD", "SUV", "x",
"X", "XML"])
-aB = set(["H", "hallucination", "haute", "hauteur", "herb", "herbaceous", "herbal",
+aB = set(["H", "habitual", "hallucination", "haute", "hauteur", "herb", "herbaceous", "herbal",
"herbalist", "herbalism", "heroic", "hilarious", "historian", "historic", "historical",
"homage", "homophone", "horrendous", "hospitable", "horrific", "hotel", "hypothesis", "Xmas"])
diff --git a/src/hu_HU/ChangeLog b/src/hu_HU/ChangeLog
index a546f1a..a93dab9 100644
--- a/src/hu_HU/ChangeLog
+++ b/src/hu_HU/ChangeLog
@@ -1,3 +1,8 @@
+2012-08-23 László Németh <nemeth@numbertext.org>:
+- „a 1,5” („a másfél”) nem névelőhasználati hiba. Pénzes Dávid hívta fel a
+ figyelmet a problémára.
+- A 10%-al, 10-20%-al hibás alakok javítása, Pénzes Dávid javaslatára.
+
2012-02-02 László Németh <nemeth@numbertext.org>:
- rövidebb magyarázat a „több mint” esetén + URL
- "-szám" alakoknál nem feltételez kötőjeles felsorolást
diff --git a/src/hu_HU/hu_HU.cfg b/src/hu_HU/hu_HU.cfg
index 3e8db39..b64ed39 100644
--- a/src/hu_HU/hu_HU.cfg
+++ b/src/hu_HU/hu_HU.cfg
@@ -2,7 +2,7 @@
lang = hu_HU
locales = hu_HU
name = Lightproof grammar checker (magyar)
-version = 1.4.3
+version = 1.4.4
author = László Németh
provider = FSF.hu
implname = lightproof_hu
diff --git a/src/hu_HU/hu_HU.dat b/src/hu_HU/hu_HU.dat
index cbc1a8c..b0d3a46 100644
--- a/src/hu_HU/hu_HU.dat
+++ b/src/hu_HU/hu_HU.dat
@@ -24,8 +24,8 @@ hogy-hogy -> hogyhogy # Egybeírás.
-> \1, hogy # Hiányzó vessző?
# túl sok vessző
-([-\w]+), (ahelyett|anélkül|aszerint), hogy -> \1, \2 hogy\n\1 \2, hogy # Kötőszószerű kapcsolat esetén nem írunk a „hogy” elé vesszőt. \n http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Az_írásjelek#243.
-([-\w]+), illetve, (ha|hogy) -> \1, illetve \2 # Kötőszószerű kapcsolat esetén nem írunk az „illetve” után vesszőt. \n http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Az_írásjelek#243.
+([-\w]+), (ahelyett|anélkül|aszerint), hogy -> \1, \2 hogy|\1 \2, hogy # Kötőszószerű kapcsolat esetén nem írunk a „hogy” elé vesszőt. | http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Az_írásjelek#243.
+([-\w]+), illetve, (ha|hogy) -> \1, illetve \2 # Kötőszószerű kapcsolat esetén nem írunk az „illetve” után vesszőt. | http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Az_írásjelek#243.
###################### nagybetűsítés #################
[code]
@@ -57,27 +57,27 @@ word [a-záéíóöőúüűA-ZÉÍÓÖŐÚÜŰ]\w*
punct [?!,:;%‰‱°„”]
-"^[-—] " <- option("dash") -> "– " # A gondolatjel nagykötőjel \n http://hu.wikipedia.org/wiki/Nagykötőjel
-" [-—]([ ,;])" <- option("dash") -> " –\1" # A gondolatjel nagykötőjel \n http://hu.wikipedia.org/wiki/Nagykötőjel
+"^[-—] " <- option("dash") -> "– " # A gondolatjel nagykötőjel | http://hu.wikipedia.org/wiki/Nagykötőjel
+" [-—]([ ,;])" <- option("dash") -> " –\1" # A gondolatjel nagykötőjel | http://hu.wikipedia.org/wiki/Nagykötőjel
# És - hogy is mondjam -, jó. -> És – hogy is mondjam –, jó.
-^[-–]{word} <- option("dash") -> – {word} # Gondolatjel szóközzel a felsorolásnál \n http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Az_írásjelek#258.
+^[-–]{word} <- option("dash") -> – {word} # Gondolatjel szóközzel a felsorolásnál | http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Az_írásjelek#258.
-"[[][.][.][.]]" <- option("elli") -> […] # Három pont \n http://hu.wikipedia.org/wiki/Három_pont
+"[[][.][.][.]]" <- option("elli") -> […] # Három pont | http://hu.wikipedia.org/wiki/Három_pont
# [...] -> […]
-[.][.][.] <- option("elli") -> … # Három pont \n http://hu.wikipedia.org/wiki/Három_pont
+[.][.][.] <- option("elli") -> … # Három pont | http://hu.wikipedia.org/wiki/Három_pont
# Vége... -> Vége…
" +([.?!,:;)”])\b" -> "\1 " # Felcserélt szóköz és írásjel?
-" +([.?!,:;)”])" -> \1 # Szóköz nélkül tapadó írásjel \n http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Az_írásjelek#239.
+" +([.?!,:;)”])" -> \1 # Szóköz nélkül tapadó írásjel | http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Az_írásjelek#239.
# A ( kicsit ) más. -> A (kicsit) más.
E ( |$) # space or end of sentence
"[:,;]([.?!,;:]){E}" -> \1{E} # Felesleges írásjel.
-"\b[.][.]{E}" -> .{E}\n…{E} # Pont vagy három pont? \n http://hu.wikipedia.org/wiki/Három_pont
+"\b[.][.]{E}" -> .{E}|…{E} # Pont vagy három pont? | http://hu.wikipedia.org/wiki/Három_pont
#"\b[.]([?!]){E}" -> \1{E} # Felesleges írásjel.
# És,, stb.? -> És, stb.?
-# És.. -> És.\n…
+# És.. -> És.|…
(\w){punct}{Abc} -> \1{punct} {Abc} # Hiányzó szóköz?
{abc}[.]{ABC} -> {abc}. {ABC} # Hiányzó szóköz?
@@ -87,45 +87,45 @@ E ( |$) # space or end of sentence
(^|\b|{punct}|[.]) {2,3}(\b|$) <- option("spaces") -> "\1 " # Felesleges szóköz.
# dupla szóköz. Itt három. -> dupla szóköz. Itt három.
-(^|\b|{punct}|[.]) {4,}(\b|$) <- option("spaces2") -> "\1 \n\1 " # Szóközök cseréje egy szóközre vagy tabulátorra:
+(^|\b|{punct}|[.]) {4,}(\b|$) <- option("spaces2") -> "\1 |\1 " # Szóközök cseréje egy szóközre vagy tabulátorra:
-(?i)(\d+)(x| x )(\d+(-\w+)?) -> \1×\3\n\1 · \3 # Szorzásjel. \n http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Az_írásjelek#275.
+(?i)(\d+)(x| x )(\d+(-\w+)?) -> \1×\3|\1 · \3 # Szorzásjel. | http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Az_írásjelek#275.
# 5 x 6 -> 5 × 6
# 800x600-as -> 800×600-as
a {abc}+
b {abc}*
-(?i){a}['´]{b} <- option("apost") -> {a}’{b} # Valódi aposztróf. \n http://hu.wikipedia.org/wiki/Aposztróf
+(?i){a}['´]{b} <- option("apost") -> {a}’{b} # Valódi aposztróf. | http://hu.wikipedia.org/wiki/Aposztróf
# biz' isten -> biz’ isten
# ’79-ben
-['´](\d\d(-\w+)?) <- option("apost") -> ’\1 # Valódi aposztróf. \n http://hu.wikipedia.org/wiki/Aposztróf
+['´](\d\d(-\w+)?) <- option("apost") -> ’\1 # Valódi aposztróf. | http://hu.wikipedia.org/wiki/Aposztróf
[)] <- option("par") and not "(" in TEXT -> # Felesleges zárójel?
######################## idézés ######################
-(?i)[\"“”‟„]({abc}[^\"“”‟„]*)[\"“‟] <- option("quot") -> „\1” # Idézőjelek. \n http://hu.wikipedia.org/wiki/Idézőjel
-(?i)[\"“”‟]({abc}[^\"“”‟„]*)[\"“”‟] <- option("quot") -> „\1” # Idézőjelek. \n http://hu.wikipedia.org/wiki/Idézőjel
+(?i)[\"“”‟„]({abc}[^\"“”‟„]*)[\"“‟] <- option("quot") -> „\1” # Idézőjelek. | http://hu.wikipedia.org/wiki/Idézőjel
+(?i)[\"“”‟]({abc}[^\"“”‟„]*)[\"“”‟] <- option("quot") -> „\1” # Idézőjelek. | http://hu.wikipedia.org/wiki/Idézőjel
# A "kicsi" macska. -> A „kicsi” macska.
# ASCII idézőjelek cseréje (,,vmi'', >>vmi<<)
-(?i),,({abc}[^\"“”‟„><']*)'' -> „\1” # Idézőjelek. \n http://hu.wikipedia.org/wiki/Idézőjel
-(?i)>>({abc}[^\"“”‟„><']*)<< -> »\1« # Idézőjelek. \n http://hu.wikipedia.org/wiki/Idézőjel
+(?i),,({abc}[^\"“”‟„><']*)'' -> „\1” # Idézőjelek. | http://hu.wikipedia.org/wiki/Idézőjel
+(?i)>>({abc}[^\"“”‟„><']*)<< -> »\1« # Idézőjelek. | http://hu.wikipedia.org/wiki/Idézőjel
# angolszász idézőjelek cseréje
-(?i)‘+({abc}[^\"“”‟„’]*)’+ -> „\1”\n»\1« # Idézőjelek. \n http://hu.wikipedia.org/wiki/Idézőjel
+(?i)‘+({abc}[^\"“”‟„’]*)’+ -> „\1”|»\1« # Idézőjelek. | http://hu.wikipedia.org/wiki/Idézőjel
[Word]
-"([(„»]) +" -> \1 # Szóköz nélkül tapadó írásjel. \n http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Az_írásjelek#239.
+"([(„»]) +" -> \1 # Szóköz nélkül tapadó írásjel. | http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Az_írásjelek#239.
-" +([«])" -> \1 # Szóköz nélkül tapadó írásjel. \n http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Az_írásjelek#239.
+" +([«])" -> \1 # Szóköz nélkül tapadó írásjel. | http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Az_írásjelek#239.
-(?i)«({abc}[^\"“”‟„’]*)» -> »\1« # Felcserélt belső idézőjelek. \n http://hu.wikipedia.org/wiki/Idézőjel
+(?i)«({abc}[^\"“”‟„’]*)» -> »\1« # Felcserélt belső idézőjelek. | http://hu.wikipedia.org/wiki/Idézőjel
############### pénz #################################
@@ -178,30 +178,31 @@ dn \d{3}(,\w+)?[%‰‱°]?(-\w+)? # 3 számjegy, toldalékkal is
([-−]?\d[\d,]*)[  ]([%‰‱°](-\w*)?)
- -> \1\2 # Szóköz nélkül tapadó írásjel. \n http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Az_írásjelek#275.
+ -> \1\2 # Szóköz nélkül tapadó írásjel. | http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Az_írásjelek#275.
([-−]?\d\d*)[.](\d\d*)([%‰‱°](-\w*)?) <- option("comma")
- -> \1,\2\3 # Tizedesvessző a helyes írásjel. \n http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Egyéb_tudnivalók#291.
+ -> \1,\2\3 # Tizedesvessző a helyes írásjel. | http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Egyéb_tudnivalók#291.
(\d\d*)[.](\d)
# kivéve, ha tulajdonnév előzi meg (pl. Firefox 3.5
<- option("comma") and (not word(-1) or not re.match("[A-Z]", word(-1)))
- -> \1,\2\n\1.\2. # Tizedestört (AkH. 291.) vagy sorszám?
+ -> \1,\2|\1.\2. # Tizedestört (AkH. 291.) vagy sorszám?
((\d\d*[.]){2}\d)
# kivéve, ha tulajdonnév előzi meg (pl. Hunspell 1.2.8
<- option("comma") and not word(-1) or not re.match("[A-Z]", word(-1))
-> \1. # A sorszámot pont követi.
(\d\d\d+)[.](\d\d) <- option("comma")
- -> \1,\2\n\1.\2. # Tizedestört (AkH. 291.) vagy sorszám?
+ -> \1,\2|\1.\2. # Tizedestört (AkH. 291.) vagy sorszám?
# 25.30˚, de 10.20-kor -> 25,30˚, de 10.20-kor
-# 1.5 -> 1,5\n1.5.
-# 123.5 -> 123,5\n123.5.
+# 1.5 -> 1,5|1.5.
+# 123.5 -> 123,5|123.5.
# mínuszjel
-(\d+([  ]\d\d\d){0,3}(,\d+)?[%‰‱°]?(-\w+)?) <- option("minus") -> −\1 # Mínuszjel kiskötőjel helyett.
--(\d+([  ]\d\d\d){0,3})[.](\d+[%‰‱°]?(-\w+)?) <- option("minus") -> −\1,\2 # Mínuszjel és tizedesvessző. \n http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Egyéb_tudnivalók#291.
+-(\d+([  ]\d\d\d){0,3})[.](\d+[%‰‱°]?(-\w+)?) <- option("minus") -> −\1,\2 # Mínuszjel és tizedesvessző. | http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Egyéb_tudnivalók#291.
+
+(−\d+([  ]\d\d\d){0,3})[.](\d+[%‰‱°]?(-\w+)?) -> \1,\2 # Tizedesvessző pont helyett. | http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Egyéb_tudnivalók#291.
-(−\d+([  ]\d\d\d){0,3})[.](\d+[%‰‱°]?(-\w+)?) -> \1,\2 # Tizedesvessző pont helyett. \n http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Egyéb_tudnivalók#291.
######################## fok #########################
@@ -215,6 +216,12 @@ dn \d{3}(,\w+)?[%‰‱°]?(-\w+)? # 3 számjegy, toldalékkal is
([-−]?\d+(?:,\d+)?)((°C|°F|℃|℉)(-\w+)?) -> \1 \2 # Nem törő szóközzel elválasztott mértékegység.
+######################## %-al ########################
+
+# 10%-al, 10-20%-al
+
+(([-−]?\d+(,\d+)?[-–])?[-−]?\d+(,\d+)?)%-al -> \1%-kal # Hiányos toldalék.
+
######################## dátumok #####################
[word]
@@ -235,21 +242,21 @@ notmonthcomp [-–]{month}{notmonthposs}
year2 \d\d
-{year} {month}{notmonthposs} -> {year}. {month}{notmonthposs} # Az évszám után itt pontot írunk. \n \n http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Egyéb_tudnivalók#294.
-{year} {month}{notmonthcomp} -> {year}. {month}{notmonthcomp} # Az évszám után itt pontot írunk. \n http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Egyéb_tudnivalók#294.
-{year} évi -> {year}. évi # Az évszám után itt pontot írunk. \n http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Egyéb_tudnivalók#294.
-{year}[-–]{year2} évi -> {year}–{year2}. évi # Az évszám után itt pontot írunk. \n http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Egyéb_tudnivalók#294.
+{year} {month}{notmonthposs} -> {year}. {month}{notmonthposs} # Az évszám után itt pontot írunk. | http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Egyéb_tudnivalók#294.
+{year} {month}{notmonthcomp} -> {year}. {month}{notmonthcomp} # Az évszám után itt pontot írunk. | http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Egyéb_tudnivalók#294.
+{year} évi -> {year}. évi # Az évszám után itt pontot írunk. | http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Egyéb_tudnivalók#294.
+{year}[-–]{year2} évi -> {year}–{year2}. évi # Az évszám után itt pontot írunk. | http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Egyéb_tudnivalók#294.
# 2005 január -> 2005. január
# 1999 augusztusban -> 1999. augusztusban
# 2009-10 évi -> 2009–10. évi
nu folyamán|előtti?|utáni?|közötti?|nyara|nyará\w+|tele|telé\w+|tavasza|tavaszá\w+|ősze|őszé\w+
-\b{year}[.] {nu}\b -> {year} \g<nu> # Az évszám után itt nem írunk pontot. \n http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Egyéb_tudnivalók#295.
+\b{year}[.] {nu}\b -> {year} \g<nu> # Az évszám után itt nem írunk pontot. | http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Egyéb_tudnivalók#295.
# 1974. előtti -> 1974 előtti
monthposs ([jaáe]|é\w)\w*
-\b{year}[.] {month}{monthposs}\b -> {year} {month}{monthposs} # Az évszám után itt nem írunk pontot. \n http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Egyéb_tudnivalók#295.
+\b{year}[.] {month}{monthposs}\b -> {year} {month}{monthposs} # Az évszám után itt nem írunk pontot. | http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Egyéb_tudnivalók#295.
# 1999. augusztusában -> 1999 augusztusában
[char]
@@ -259,31 +266,31 @@ text [^\s][^\s]*
w \w*
djel [ ,;:?!]
-(?i)\b{month} {day}[.]-{w} -> {month} {day}-{w} # A nap után itt nem írunk pontot. \n http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Egyéb_tudnivalók#296.
-(?i)\b{month} {day}{djel} -> {month} {day}.{djel} # Ha dátum, hiányzik a pont. \n http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Egyéb_tudnivalók#296.
+(?i)\b{month} {day}[.]-{w} -> {month} {day}-{w} # A nap után itt nem írunk pontot. | http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Egyéb_tudnivalók#296.
+(?i)\b{month} {day}{djel} -> {month} {day}.{djel} # Ha dátum, hiányzik a pont. | http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Egyéb_tudnivalók#296.
# március 15.-én -> március 15-én
# március 15 volt. -> március 15. volt.
nu óta|előtti?|utáni?|közötti?
-(?i)\b{month} {day} {nu} -> {month} {day}. {nu} # A nap után itt pontot írunk. \n http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Egyéb_tudnivalók#297.
+(?i)\b{month} {day} {nu} -> {month} {day}. {nu} # A nap után itt pontot írunk. | http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Egyéb_tudnivalók#297.
# március 15 óta -> március 15. óta
-(?i)\b{month} {day}[.] és {day} {nu} -> {month} {day}. és {day}. {nu} # A nap után itt pontot írunk. \n http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Egyéb_tudnivalók#297.
-(?i)\b{month} {day} és {day}[.]? {nu} -> {month} {day}. és {day}. {nu} # A nap után itt pontot írunk. \n http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Egyéb_tudnivalók#297.
+(?i)\b{month} {day}[.] és {day} {nu} -> {month} {day}. és {day}. {nu} # A nap után itt pontot írunk. | http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Egyéb_tudnivalók#297.
+(?i)\b{month} {day} és {day}[.]? {nu} -> {month} {day}. és {day}. {nu} # A nap után itt pontot írunk. | http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Egyéb_tudnivalók#297.
# március 15. és 27 között -> március 15. és 27. között
# március 15 és 27. között -> március 15. és 27. között
# március 15 és 27 között -> március 15. és 27. között
-(?i)\b{month} {day}[-–]{day} {nu} -> {month} {day}–{day}. {nu} # A nap után itt pontot írunk. \n http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Egyéb_tudnivalók#297.
-(?i)\b{month} {day}-{day}. {nu} -> {month} {day}–{day}. {nu} # A napok közé nagykötőjelet írunk. \n http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Egyéb_tudnivalók#297.
+(?i)\b{month} {day}[-–]{day} {nu} -> {month} {day}–{day}. {nu} # A nap után itt pontot írunk. | http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Egyéb_tudnivalók#297.
+(?i)\b{month} {day}-{day}. {nu} -> {month} {day}–{day}. {nu} # A napok közé nagykötőjelet írunk. | http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Egyéb_tudnivalók#297.
# március 15-22. között -> március 15–22. között
# március 15-22 között -> március 15–22. között
-\b{year}[.]{monthnum}[.]{day}{optdot}{text} -> {year}. {monthnum}. {day}{optdot}{text} # Szóköz a dátumban. \n http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Egyéb_tudnivalók#293.
+\b{year}[.]{monthnum}[.]{day}{optdot}{text} -> {year}. {monthnum}. {day}{optdot}{text} # Szóköz a dátumban. | http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Egyéb_tudnivalók#293.
# 2009.05.12. -> 2009. 05. 12.
# 1. = elseje
e e|i|ei\w*|é\w+
-(?i){month} 1[.]?-{e}\b -> {month} 1-j{e} # Elseje számjegyes írása. \n http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Egyéb_tudnivalók#296.
+(?i){month} 1[.]?-{e}\b -> {month} 1-j{e} # Elseje számjegyes írása. | http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Egyéb_tudnivalók#296.
# május 1-i -> május 1-ji
# május 1-ei -> május 1-jei
# május 1-én -> május 1-jén
@@ -294,12 +301,12 @@ e e|i|ei\w*|é\w+
#W \w+ # word
# tagmondatok és mondatrészek megkülönböztetéséhez mondatelemzés kell
-#([(]|\w+: )(({W}, )+{W};( {W}[,;])* {W})[,]? stb. -> \1\2; stb. # Stb. előtt itt pontosvessző van. (AkH. 247/b) \n http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Az_írásjelek#247.
-#([(]|\w+: )(({W}, )*{W}), stb. -> \1\2 stb. # Stb. előtt itt nincs vessző. (AkH. 247/d) \n http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Az_írásjelek#247.
-\bstb[.], stb[.] -> stb. stb.\nstb.; stb. # Két stb. közé nem teszünk vesszőt.
+#([(]|\w+: )(({W}, )+{W};( {W}[,;])* {W})[,]? stb. -> \1\2; stb. # Stb. előtt itt pontosvessző van. (AkH. 247/b) | http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Az_írásjelek#247.
+#([(]|\w+: )(({W}, )*{W}), stb. -> \1\2 stb. # Stb. előtt itt nincs vessző. (AkH. 247/d) | http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Az_írásjelek#247.
+\bstb[.], stb[.] -> stb. stb.|stb.; stb. # Két stb. közé nem teszünk vesszőt.
## Madarak: rigó, cinke, veréb, stb. -> Madarak: rigó, cinke, veréb stb.
## Állatok (rigó, cinke; nyúl, pocok stb.) -> Állatok (rigó, cinke; nyúl, pocok; stb.)
-# stb., stb. -> stb. stb.\nstb.; stb.
+# stb., stb. -> stb. stb.|stb.; stb.
#################### rövidítések #####################
@@ -325,15 +332,15 @@ year2 (1\d\d[1-9]|1\d[1-9]\d|20\d[1-9]|20[1-9]\d)
# 1998-2000 -> 1998–2000
# 1998-99 -> 1998–99
-([A-ZÖÜÓŰŐÚÉÁÍ]\w*)-(\d+(-\w+)?) -> \1–\2 # Típusnév és -szám közé nagykötőjelet teszünk. \n http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Az_írásjelek#263.
+([A-ZÖÜÓŰŐÚÉÁÍ]\w*)-(\d+(-\w+)?) -> \1–\2 # Típusnév és -szám közé nagykötőjelet teszünk. | http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Az_írásjelek#263.
# UTF-8 -> UTF–8
# Apolló-13-nak -> Apolló–13-nak
-pp[.] (\d+)-(\d+)[.] -> pp. \1–\2. # Oldalszámok közé nagykötőjelet teszünk. \n http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Az_írásjelek#263.
+pp[.] (\d+)-(\d+)[.] -> pp. \1–\2. # Oldalszámok közé nagykötőjelet teszünk. | http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Az_írásjelek#263.
(\d+)-(\d+)[.] (o[.]|oldal\w*) -> \1–\2. \3 # Oldalszám
# 10-12. oldalon -> 10–12. oldalon
-" (u[.]|utca|út|tér) (\d\d*)-(\d\d*)[.]" -> " \1 \2–\3." # Nagykötőjel a házszámban. \n http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Egyéb_tudnivalók#298.
+" (u[.]|utca|út|tér) (\d\d*)-(\d\d*)[.]" -> " \1 \2–\3." # Nagykötőjel a házszámban. | http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Egyéb_tudnivalók#298.
# Széna tér 123-125. -> Széna tér 123–125.
@@ -350,13 +357,13 @@ ne játs(zunk|zatok|zanak) -> ne játss\1 # Helyesírási hiba.
[aá] la carte -> à la carte # Helyesen à la carte.
(állta(ss\w*|t\w*)) <- not morph(\1, "pa:") -> álta\2 # Áltat, hiteget értelemben egy l-lel írjuk.
önáll(tat[óá]\w*) -> önál\1 # Helyesen egy l-lel.
-belsőséges -> bensőséges\nbelsőségből készült # Szótévesztés vagy szójáték?
+belsőséges -> bensőséges|belsőségből készült # Szótévesztés vagy szójáték?
dehogy is -> dehogyis # Egybeírás „egyáltalán nem” jelentésben.
dehogy nem -> dehogynem # Egybeírás „de igen” jelentésben.
dehogyis nem -> dehogyisnem # Egybeírás „de igen” jelentésben.
eképpen -> ekképpen # Helyesen két k-val.
egyel (több\w*|kevesebb\w*) -> eggyel \1 # 1-gyel értelemben hosszú gy-vel írjuk.
-egyenlőre -> egyelőre\negyformára\ndöntetlenre\negyenlő számúra\nazonos méretűre # Helyesírási (egyelőre) vagy stílushiba (egyformára).
+egyenlőre -> egyelőre|egyformára|döntetlenre|egyenlő számúra|azonos méretűre # Helyesírási (egyelőre) vagy stílushiba (egyformára).
egyi(vású\w*) -> egyí\1 # Hosszú í-vel helyes.
egytől-egyig -> egytől egyig # Kötőjel nélkül írjuk.
előre hátra -> előre-hátra # Kötőjellel írjuk.
@@ -373,16 +380,16 @@ hátba (támadás\w*) -> hátba\1 # Egybeírás.
időről-időre -> időről időre # Különírás.
jing és jang -> jin és jang # Helyesen jin és jang.
kőr((öz|út|ut)\w*) <- morph(\0, ur"st:kőr\b") -> kör\1 # Rövid ö-vel a kör összetételeiben.
-légyszíves -> légy szíves\nlegyél szíves # Legyél szíves értelemben különírjuk.
+légyszíves -> légy szíves|legyél szíves # Legyél szíves értelemben különírjuk.
legalább is -> legalábbis # Egybeírás.
Lichten(stein\w*) -> Liechten\1 # Helyesen Liechtenstein.
mellékhely(ség\w*) -> mellékhelyi\1 # Helyiség, mint szoba.
mú(landó\w*) -> mu\1 # Helyesen rövid u-val.
nembiztos -> nem biztos # Különírás.
-originált -> originál\neredeti\nbontatlan # Ha nem tárgyesetben van, „t” nélkül írjuk.
+originált -> originál|eredeti|bontatlan # Ha nem tárgyesetben van, „t” nélkül írjuk.
(szén|kén|mangán|nitrogén|ón|titán|tórium)(dioxid\w*) -> \1-\2 # Kötőjeles alak.
(szén|kén|nitrogén)(monoxid\w*) -> \1-\2 # Kötőjeles alak.
-továbbittunk -> továbbítunk\ntovább ittunk # Helyesírási hiba.
+továbbittunk -> továbbítunk|tovább ittunk # Helyesírási hiba.
[char]
@@ -397,14 +404,14 @@ a [aA]
aword [aáeéiíoóöőuúüűAÁEÉIÍOÓÖŐUÚÜŰ]\w*
^[aA] {aword} <- not re.match(r"(?i)i(ii?|[vx])$|Unicode$|Unix\w*$", {aword}) and spell({aword}) -> az {aword} # Hibás névelő?
(?<!(\d[.]|az) )\b{a} {aword} <- word(-1) and not re.match(r"(?i)i(ii?|[vx])$|Unicode$|Unix\w*$", {aword}) and
- spell({aword}) -> {a}z {aword}\n{aword} # Hibás vagy felesleges névelő?
-# A 4. a osztály a órán az A alaphangot -> A 4. a osztály az órán\nórán az A alaphangot
+ spell({aword}) -> {a}z {aword}|{aword} # Hibás vagy felesleges névelő?
+# A 4. a osztály a órán az A alaphangot -> A 4. a osztály az órán|órán az A alaphangot
# névelők és számok
[Word]
-a <- word(1) and re.match(r"(1|5\d*|[15]\d\d\d)[.]?$", word(1)) -> az # Hibás névelő.
+a(?! 1,5\b) <- word(1) and re.match(r"(1|5\d*|[15]\d\d\d)[.]?$", word(1)) -> az # Hibás névelő.
az <- not option("grammar") and word(2) and
re.match(ur"(alfejezet|alszakasz|ábr|bekezdés|diagram|fejezet|kép|lap|oldal|paragrafus|szakasz|táblázat)\w*", word(2)) and
@@ -457,7 +464,7 @@ hw [a-zA-ZöüóűőúéáíÖÜÓŰŐÚÉÁÍ][a-zA-ZöüóűőúéáíÖÜÓŰ
[word]
event (Advent|Húsvét|Karácsony|Mindenszentek|Pünkösd|(Anyák|Apák|Halottak|Nők) [Nn]apj){abc}*
-{event} <- word(-1) and word(1) == word(1).lower() -> = {event}.lower() # Kisbetűs kifejezés, ha nem cím. \n http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/A_kis_és_a_nagy_kezdőbetűk#145.
+{event} <- word(-1) and word(1) == word(1).lower() -> = {event}.lower() # Kisbetűs kifejezés, ha nem cím. | http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/A_kis_és_a_nagy_kezdőbetűk#145.
# Nemsokára Anyák napja. -> Nemsokára anyák napja.
[char]
@@ -553,48 +560,48 @@ w {Abc}+
# Észak-Amerikai Észak-amerikai helyett
-{Dir}-{cap} <- morph({cap}, r"po:noun_prs.*is:i_PLACE", False) -> = {Dir} + "-" + {cap}.lower() # Kisbetűvel írt földrajzi név. \n http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/A_tulajdonnevek_írása#179.
+{Dir}-{cap} <- morph({cap}, r"po:noun_prs.*is:i_PLACE", False) -> = {Dir} + "-" + {cap}.lower() # Kisbetűvel írt földrajzi név. | http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/A_tulajdonnevek_írása#179.
# észak-Amerika Észak-Amerika helyett
{dir}-{cap} <- morph({cap}, r"po:noun_prs", False) and not morph({cap},"is:i_PLACE", False) ->
- = {dir}.capitalize() + "-" + {cap} # Nagybetűvel írt földrajzi név. \n http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/A_tulajdonnevek_írása#179.
+ = {dir}.capitalize() + "-" + {cap} # Nagybetűvel írt földrajzi név. | http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/A_tulajdonnevek_írása#179.
# Észak-amerikai csak akkor nagybetűs, ha mondatkezdő és nem nagybetűs az utána jövő szó
{Dir}-{sc} <- word(-1) and word(1) and not word(1) == word(1).capitalize() and
- morph({sc}, r"po:noun_prs.*is:i_PLACE", False) -> = {Dir}.lower() + "-" + {sc} # Kisbetűvel írt földrajzi név. \n http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/A_tulajdonnevek_írása#179.
+ morph({sc}, r"po:noun_prs.*is:i_PLACE", False) -> = {Dir}.lower() + "-" + {sc} # Kisbetűvel írt földrajzi név. | http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/A_tulajdonnevek_írása#179.
# hiányzó kötőjel
-{Dir} {w} <- morph({w}, r"po:noun_prs") -> {Dir}-{w} # Kötőjellel írt földrajzi név. \n http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/A_tulajdonnevek_írása#179.
+{Dir} {w} <- morph({w}, r"po:noun_prs") -> {Dir}-{w} # Kötőjellel írt földrajzi név. | http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/A_tulajdonnevek_írása#179.
# köznevek
prop Tenger|Óceán|Sziget|Félsziget|Középhegység
-{cap}-{prop} -> = {cap} + "-" + {prop}.lower() # Kisbetűs írt köznévi tag. \n http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/A_tulajdonnevek_írása#176.
+{cap}-{prop} -> = {cap} + "-" + {prop}.lower() # Kisbetűs írt köznévi tag. | http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/A_tulajdonnevek_írása#176.
# AkH. 182.
-(Árpád|Erzsébet|Hajógyári|Margit|Megyeri|Petőfi|Rákóczi|Szabadság)-(híd\w*) -> \1 \2 # Különírás. \n http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/A_tulajdonnevek_írása#182.
-(Szabadság)(híd\w*) -> \1 \2 # Különírás. \n http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/A_tulajdonnevek_írása#182.
-(Szabadság ?)(szobo?r\w*) -> \1-\2 # Kötőjeles összetétel. \n http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/A különírás és az egybeírás#140.
+(Árpád|Erzsébet|Hajógyári|Margit|Megyeri|Petőfi|Rákóczi|Szabadság)-(híd\w*) -> \1 \2 # Különírás. | http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/A_tulajdonnevek_írása#182.
+(Szabadság)(híd\w*) -> \1 \2 # Különírás. | http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/A_tulajdonnevek_írása#182.
+(Szabadság ?)(szobo?r\w*) -> \1-\2 # Kötőjeles összetétel. | http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/A különírás és az egybeírás#140.
# AkH. 183.
-(Fertő)-(([tT]ó|[tT]av)\w*) -> = \1 + " " + \2.lower() # Kötőjel nélkül írt földrajzi név. \n http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/A_tulajdonnevek_írása#183.
-(Góbi|Kalahári|Szahara)-([sS]ivatag\w*) -> = \1 + " " + \2.lower() # Kötőjel nélkül írt földrajzi név. \n http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/A_tulajdonnevek_írása#183.
-(Börzsöny|Bükk|Mátra|Mecsek|Pilis|Zemplén|Vértes)-([Hh]egység\w*) -> = \1 + " " + \2.lower() # Kötőjel nélkül írt földrajzi név. \n http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/A_tulajdonnevek_írása#183.
-(Duna)-(folyam\w*) -> = \1 + " " + \2.lower() # Kötőjel nélkül írt földrajzi név. \n http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/A_tulajdonnevek_írása#183.
-(Bodrog|Duna|Dráva|Ipoly|Körös|Maros|Rába|Sajó|Tisza|Zala)-(([Ff]olyó|[Ff]olyam)\w*) -> = \1 + " " + \2.lower() # Kötőjel nélkül írt földrajzi név. \n http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/A_tulajdonnevek_írása#183.
+(Fertő)-(([tT]ó|[tT]av)\w*) -> = \1 + " " + \2.lower() # Kötőjel nélkül írt földrajzi név. | http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/A_tulajdonnevek_írása#183.
+(Góbi|Kalahári|Szahara)-([sS]ivatag\w*) -> = \1 + " " + \2.lower() # Kötőjel nélkül írt földrajzi név. | http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/A_tulajdonnevek_írása#183.
+(Börzsöny|Bükk|Mátra|Mecsek|Pilis|Zemplén|Vértes)-([Hh]egység\w*) -> = \1 + " " + \2.lower() # Kötőjel nélkül írt földrajzi név. | http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/A_tulajdonnevek_írása#183.
+(Duna)-(folyam\w*) -> = \1 + " " + \2.lower() # Kötőjel nélkül írt földrajzi név. | http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/A_tulajdonnevek_írása#183.
+(Bodrog|Duna|Dráva|Ipoly|Körös|Maros|Rába|Sajó|Tisza|Zala)-(([Ff]olyó|[Ff]olyam)\w*) -> = \1 + " " + \2.lower() # Kötőjel nélkül írt földrajzi név. | http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/A_tulajdonnevek_írása#183.
Budapest (Liszt Ferenc )([Nn]emzetközi [Rr]epülőt[eé])(r\w*) -> =
\1 + \2.lower() + \3 +
- "\nferihegyi " + \1 + \2.lower() + \3 + "\n" +
+ "|ferihegyi " + \1 + \2.lower() + \3 + "|" +
\3.replace("r", "Ferihegy", 1).replace("gyrel", "ggyel").replace(u"gyré", u"ggyé") +
- "\nBudapest, " + \1 + \2.lower() + \3
- # A köznévi tag kisbetűs, a címet vesszővel tagoljuk. (AkH. 190., 247.; FNB 74.) \n http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Az_írásjelek#247.
+ "|Budapest, " + \1 + \2.lower() + \3
+ # A köznévi tag kisbetűs, a címet vesszővel tagoljuk. (AkH. 190., 247.; FNB 74.) | http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Az_írásjelek#247.
########################## vesszők ##########################
@@ -708,14 +715,14 @@ több, mint <-
(re.match(r"\d+$", word(1)) and morph(word(2), r"po:adj_num|st:ezer\b") and morph(word(3), r"po:noun\b.*is:")) or
# több mint 75%-a
re.match(r"\d+%-", word(1)) -> több mint # Ha nem összehasonlítás,
- hanem a mondanivaló erősítése, itt nem használunk vesszőt. \n
+ hanem a mondanivaló erősítése, itt nem használunk vesszőt. |
http://hu.wikisource.org/wiki/A_magyar_helyesírás_szabályai/Az_írásjelek#243.
############ avagy, illetve, ill., valamint ##########
(\w+)( avagy) -> \1,\2 # Az avagy kötőszó elé vesszőt teszünk.
(\w+)( illetve) -> \1,\2 # Az illetve kötőszó elé vesszőt teszünk.
-(\w+)( ill[.]) -> \1,\2\n\1, illetve # Az illetve kötőszó elé vesszőt teszünk.
+(\w+)( ill[.]) -> \1,\2|\1, illetve # Az illetve kötőszó elé vesszőt teszünk.
(\w+)( valamint) -> \1,\2 # A valamint kötőszó elé vesszőt teszünk.
############ mellet -> mellett ##################
@@ -762,12 +769,12 @@ W \w{4,}
############### Stílus #################################
[Word]
-#asszem -> azt hiszem\nazt hiszem, hogy # Helyesírási hiba.
+#asszem -> azt hiszem|azt hiszem, hogy # Helyesírási hiba.
#h <- option("style") -> hogy # Hibás rövidítés?
#szar\w* <- option("style") and morph(\0, r"st:szar\b") -> rossz # Stílushiba.
-médiák <- option("style") -> médiák\nmédia\nhírek\nlapok\nhírcsatornák # Vitatott stílusértékű alak.
-unszimpatikus <- option("style") -> unszimpatikus\nellenszenves\nantipatikus # Vitatott stílusértékű alak.
+médiák <- option("style") -> médiák|média|hírek|lapok|hírcsatornák # Vitatott stílusértékű alak.
+unszimpatikus <- option("style") -> unszimpatikus|ellenszenves|antipatikus # Vitatott stílusértékű alak.
# ezresek számjegyekkel
@@ -796,7 +803,7 @@ W [-\w]{3,}
{W} \1 <- option("dup0") and (not word(-1) or
not word(-1).lower() in ["a", "az", "minden"]) and word(1) != u"hátán" and word(1) != u"hátán." and
- not morph(word(1), "po:post", False) -> {W}\n{W}-\1 # Szóismétlés vagy hiányzó kötőjel?
+ not morph(word(1), "po:post", False) -> {W}|{W}-\1 # Szóismétlés vagy hiányzó kötőjel?
{W}(?: [-–\w„”]+)* \1 <- option("dup") -> {W} # Túlzott szóismétlés?
@@ -863,7 +870,7 @@ kedvel <- word(-1).lower() == u"jó" or word(-1).lower() == "rossz" -> kedvvel #
([-−]?\d+(?:,\d+)?) (℉(-\w+)?) <- option("SI") -> = measurement(\1, "F", "C", " °C" + \2[1:]) # Váltás SI mértékegységre
([-−]?\d(?:,\d+)?) (láb\w*) <- option("SI") and stem(\2) == [u"láb"] -> =
- measurement(\1, "ft", "cm", " " + generate(u"centiméter", \2)[0]) + "\n" +
+ measurement(\1, "ft", "cm", " " + generate(u"centiméter", \2)[0]) + "|" +
measurement(\1, "ft", "m", " " + generate(u"méter", \2)[0]) # Váltás SI mértékegységre
([-−]?\d\d+(?:,\d+)?) (láb\w*) <- option("SI") and stem(\2) == [u"láb"] -> = measurement(\1, "ft", "m",
@@ -885,19 +892,19 @@ kedvel <- word(-1).lower() == u"jó" or word(-1).lower() == "rossz" -> kedvvel #
" " + generate("liter", \2)[0]) # Váltás SI mértékegységre
([-−]?\d+(?:,\d+)?) (pint\w*) <- option("SI") -> =
- measurement(\1, "uk_pt", "dl", " " + generate("deciliter", \2)[0]) + "\n" +
+ measurement(\1, "uk_pt", "dl", " " + generate("deciliter", \2)[0]) + "|" +
measurement(\1, "us_pt", "dl", " " + generate("deciliter", \2)[0]) # Váltás SI mértékegységre (angol és amerikai pint)
# elválasztás
-adatút <- option("hyphen") -> ada­tút\nadat­út # Elválasztás:
-felett(em|ed|e|ünk|ük) <- option("hyphen") -> fe­let­t\1\nfel­et­t\1 # Elválasztás:
-felettetek <- option("hyphen") -> fe­let­te­tek\nfel­et­te­tek # Elválasztás:
-fölül <- option("hyphen") -> fö­lül\nföl­ül # Elválasztás:
-gépelem <- option("hyphen") -> gé­pe­lem\ngép­elem # Elválasztás:
-karóra <- option("hyphen") -> kar­óra\nka­ró­ra # Elválasztás:
-megás <- option("hyphen") -> me­gás\nmeg­ás # Elválasztás:
-megint <- option("hyphen") -> me­gint\nmeg­int # Elválasztás:
+adatút <- option("hyphen") -> ada­tút|adat­út # Elválasztás:
+felett(em|ed|e|ünk|ük) <- option("hyphen") -> fe­let­t\1|fel­et­t\1 # Elválasztás:
+felettetek <- option("hyphen") -> fe­let­te­tek|fel­et­te­tek # Elválasztás:
+fölül <- option("hyphen") -> fö­lül|föl­ül # Elválasztás:
+gépelem <- option("hyphen") -> gé­pe­lem|gép­elem # Elválasztás:
+karóra <- option("hyphen") -> kar­óra|ka­ró­ra # Elválasztás:
+megás <- option("hyphen") -> me­gás|meg­ás # Elválasztás:
+megint <- option("hyphen") -> me­gint|meg­int # Elválasztás:
[code]
@@ -905,4 +912,4 @@ def measurement(mnum, min, mout, mstr):
m = calc("CONVERT_ADD", (float(mnum.replace(",", ".").replace(u"−", "-")), min, mout))
a = list(set([str(calc("ROUND", (m, 0)))[:-2], str(calc("ROUND", (m, 1))), str(calc("ROUND", (m, 2))), str(m)])) # remove duplicated rounded items
a.sort(lambda x, y: len(x) - len(y)) # sort by string length
- return join(a, mstr + "\n").replace(".", ",").replace("-", u"−") + mstr
+ return join(a, mstr + "|").replace(".", ",").replace("-", u"−") + mstr
diff --git a/src/ru_RU/ChangeLog b/src/ru_RU/ChangeLog
new file mode 100644
index 0000000..6d7d33b
--- /dev/null
+++ b/src/ru_RU/ChangeLog
@@ -0,0 +1,8 @@
+2012-08-21 Yakov Reztsov <yr at myooo dot ru>:
+- New grammar rules
+- Fix some rules
+
+
+2012-02-04 Yakov Reztsov <yr at myooo dot ru>:
+- Update and rewrite rules
+- Update settings dialog \ No newline at end of file
diff --git a/src/ru_RU/README_lightproof_ru_RU.txt b/src/ru_RU/README_lightproof_ru_RU.txt
index 1744797..caa4fff 100644
--- a/src/ru_RU/README_lightproof_ru_RU.txt
+++ b/src/ru_RU/README_lightproof_ru_RU.txt
@@ -3,5 +3,5 @@ Russian grammar checker
(developed by the Lightproof grammar checker extension generator,
see http://launchpad.net/lightproof)
-2009, 2011 (c) Yakov Reztsov <yr at myooo dot ru>, license: MPL 1.1 / GPL / LGPL
+2009, 2011, 2012 (c) Yakov Reztsov <yr at myooo dot ru>, license: MPL 1.1 / GPL / LGPL
diff --git a/src/ru_RU/ru_RU.cfg b/src/ru_RU/ru_RU.cfg
index 3ba09c7..dcc494d 100644
--- a/src/ru_RU/ru_RU.cfg
+++ b/src/ru_RU/ru_RU.cfg
@@ -2,7 +2,7 @@
lang = ru_RU
locales = ru_RU
name = Lightproof grammar checker (Russian)
-version = 0.3.1
+version = 0.3.2
author = Yakov Reztsov <yr at myooo dot ru>
provider = LibreOffice
implname = lightproof_ru_RU
diff --git a/src/ru_RU/ru_RU.dat b/src/ru_RU/ru_RU.dat
index 512dc25..f37f2cd 100644
--- a/src/ru_RU/ru_RU.dat
+++ b/src/ru_RU/ru_RU.dat
@@ -1,4 +1,4 @@
-# Sample proofreading rules for Russian (by Yakov Reztsov 2009, 2011)
+# Proofreading rules for Russian (by Yakov Reztsov 2009-2012)
@@ -47,13 +47,13 @@ adv1 кто|что|где|зачем|кое
[ ]{abbr}[ ] <- option("abbreviation") -> " {abbr}. " # Точка после сокращений.
(^|\b|{punct}|[.]) {2,3}(\b|$) <- option("space") -> "\1 " # Лишний пробел.
# Extra space -> Extra space
-# " мм " -> " мм. "
+# " коп " -> " коп. "
# quotation
-\"(\w[^\"“”]*[\w.?!,])\" <- option("quotation") -> «\1»\n„\1”\n“\1” # Кавычки.
-\B'(\w[^']*[\w.?!,])'\B <- option("quotation") -> ‘\1’ # Кавычки.
-# "The 'old' boy" -> „The ‘old’ boy”\n«The ‘old’ boy»\n“The ‘old’ boy”
+\"(\w[^\"“”]*[\w.?!,])\" <- option("quotation") -> «\1» # Кавычки.
+\B'(\w[^']*[\w.?!,])'\B <- option("quotation") -> ‘\1’ # Кавычки.
+# "The 'old' boy" -> «The ‘old’ boy»
# apostrophe
@@ -107,24 +107,33 @@ w \w*
# multiword expressions
-\bнорд ост\b <- option("hyphen") -> норд-ост\nнордост # Дефис?
-# норд ост -> норд-ост\nнордост # Suggestions separated by new lines (\n)
+\bнорд ост\b <- option("hyphen") -> норд-ост # Дефис?
+# норд ост -> норд-ост # Suggestions separated by new lines (\n)
-\bнорд вест\b <- option("hyphen") -> норд-вест\nнордвест # Дефис?
-# норд вест -> норд-вест\nнордвест # Suggestions separated by new lines (\n)
+\bнорд вест\b <- option("hyphen") -> норд-вест # Дефис?
+# норд вест -> норд-вест # Suggestions separated by new lines (\n)
-\bсеверо западн{abc}\b <- option("hyphen") -> северо-западн{abc}\nсеверозападн{abc} # Дефис?
-# северо западный -> северо-западный\nсеверозападный # Suggestions separated by new lines (\n)
+\bзюйд ост\b <- option("hyphen") -> зюйд-ост # Дефис?
+# зюйд ост -> зюйд-ост # Suggestions separated by new lines (\n)
+\bзюйд вест\b <- option("hyphen") -> зюйд-вест # Дефис?
+# зюйд вест -> зюйд-вест # Suggestions separated by new lines (\n)
-\bюго западн{abc}\b <- option("hyphen") -> юго-западн{abc}\nюгозападн{abc} # Дефис?
-# юго западный -> юго-западный\nюгозападный # Suggestions separated by new lines (\n)
-\bсеверо восточн{abc}\b <- option("hyphen") -> северо-восточн{abc}\nсеверовосточн{abc} # Дефис?
-# северо восточный -> северо-восточный\nсеверовосточный # Suggestions separated by new lines (\n)
-\bюго восточн{abc}\b <- option("hyphen") -> юго-восточн{abc}\nюговосточн{abc} # Дефис?
-# юго восточный -> юго-восточный\nюговосточный # Suggestions separated by new lines (\n)
+
+\bсеверо западн{abc}\b <- option("hyphen") -> северо-западн{abc} # Дефис?
+# северо западный -> северо-западный # Suggestions separated by new lines (\n)
+
+
+\bюго западн{abc}\b <- option("hyphen") -> юго-западн{abc} # Дефис?
+# юго западный -> юго-западный # Suggestions separated by new lines (\n)
+
+\bсеверо восточн{abc}\b <- option("hyphen") -> северо-восточн{abc} # Дефис?
+# северо восточный -> северо-восточный # Suggestions separated by new lines (\n)
+
+\bюго восточн{abc}\b <- option("hyphen") -> юго-восточн{abc} # Дефис?
+# юго восточный -> юго-восточный # Suggestions separated by new lines (\n)
\b{adv1} нибудь\b <- option("hyphen") -> {adv1}-нибудь # Дефис?
@@ -196,6 +205,12 @@ w \w*
+(в) (течение) (реки|потока|воды|ручья) <- option("multiword") -> \1 течении \3 # Грамматическая ошибка
+(в) (течении) (часа|минуты|промежутка|секунды|дня|времени|недели|месяца|года|столетия|тысячелетия) <- option("multiword") -> \1 течение \3 # Грамматическая ошибка
+(в) (продолжении) (часа|минуты|промежутка|секунды|дня|времени|недели|месяца|года|столетия|тысячелетия|разговора|беседы) <- option("multiword") -> \1 продолжение \3 # Грамматическая ошибка
+
+
+
\bкакбудто<- option("together") -> как будто # Составная частица
\bпо мимо\b <- option("together") -> помимо # Пишется слитно
@@ -241,8 +256,5 @@ W [-\w]{3,}
# within clauses
-{W}(?: [-–\w“”]+)* \1 <- option("dup") -> {W} # Повтор слова?
-
-# within sentences
+{W} \1 <- option("dup") -> {W} # Повтор слова?
-{W}[;,:]?(?: [-–\w“”]+[;,:]?)* \1 <- option("dup2") -> {W} # Повтор слова?
diff --git a/src/ru_RU/ru_RU.dlg b/src/ru_RU/ru_RU.dlg
index b3b3c1b..13828aa 100644
--- a/src/ru_RU/ru_RU.dlg
+++ b/src/ru_RU/ru_RU.dlg
@@ -23,7 +23,7 @@
# options (starred options are checked)
grammar: *hyphen *comma, *multiword *together
-proofreading: *dup dup2, *common *space, *abbreviation
+proofreading: *common *space, *abbreviation *dup
others: numsep, *typographica, *quotation
# titles
@@ -40,27 +40,25 @@ together=Together/separately
proofreading=Proofreading
space=Space mistake
typographica=Typographica
-dup=Word duplication within clauses
-dup2=Word duplication within sentences
+dup=Word duplication
others=Others
numsep=Separation of large numbers (ISO)
quotation=Quotation
[ru_RU=Проверка грамматики (Русский язык)]
-abbreviation=Аббревиатуры
+abbreviation=Аббревиатуры \n Аббревиатуры, сокращения и знаки пунктуации.
grammar=Грамматика
-hyphen=Дефис
-comma=Пунктуация
-common=Общие ошибки
-multiword=Словосочетания
-together=Слитно/раздельно
+hyphen=Дефис \n Правописание слов через дефис, слитно или раздельно.
+comma=Пунктуация \n Поиск ошибок в расстановке знаков препинания.
+common=Общие ошибки \n Поиск прочих ошибок
+multiword=Словосочетания \n Правописание словосочетаний и устойчивых оборотов.
+together=Слитно/раздельно \n Правописание слов слитно или раздельно.
proofreading=Стилистика
-space=Пробел
-typographica=Типографика
-dup=Повтор слов в словосочетаниях
-dup2=Повтор слов в предложениях
+space=Пробел \n Поиск ошибок с пробелом: двойной пробел, пробел перед знаками пунктуации.
+typographica=Типографика \n Предлагать замену сочетаний знаков на специальные символы.
+dup=Повтор слов \n Поиск повторяющихся слов
others=Прочее
-numsep=Разделители групп разрядов (ISO) для чисел
-quotation=Кавычки
+numsep=Разделители групп разрядов (ISO) для чисел \n Разделители групп разрядов (ISO) для больших чисел
+quotation=Кавычки \n Предлагать замену кавычек на кавычки-«ёлочки» или парные кавычки.