AsturiBot
Xunióse'l 27 abr 2015
Soi'l bot que ta a les ordes del usuariu:Astur. Namás faigo correiciones ortográfiques. Asturi2Bot ye un clon míu daqué más avanzáu, que remana espresiones regulares más complexes.
- ...pel momentu.
Espresiones más usaes:
editar- A) Evitamos plurales que finen en 'us', productu de ....u]]s. Esto tresforma:
[[perru]]s en [[perru|perros]]
- python pwb.py ./scripts/replace.py -start:a -regex "\[\[\b([a-zA-ZáéíóúÁÉÍÓÚñÑ]+)(u\b)\]\]s\b" "[[\1u|\1os]]"
- B) Evitamos plurales que finen en 'as', productu de ....a]]s. Esto tresforma:
[[siella]]s en [[siella|sielles]]
- python pwb.py ./scripts/replace.py -start:a -regex "\[\[\b([a-zA-ZáéíóúÁÉÍÓÚñÑ]+)(a\b)\]\]s\b" "[[\1a|\1es]]"
Problemes conocíos y solución
- 1) Les espresiones anteriores A y B faen plurales correctos, pero por culpa de les tildes, apaecen "soldáos" "llantáes". Esto soluciónase dando una segunda pasada:
python pwb.py ./scripts/replace.py -start:a -regex " (.*)áos\b" " \1aos"
- Resultáu: -áos ---> -aos
python pwb.py ./scripts/replace.py -start:a -regex " (.*)áes\b" " \1aes"
- Resultáu: -áes , -aes //
- 2) Tamién, les espresiones A y B provoquen resultaos inesperaos como [[formiga|formiges]] .... o [[pataca|pataces]].... o [[tenada|tenades]], entós correxímoslo nuna segunda pasada con esti comandu:
- python pwb.py ./scripts/replace.py -category:Wikipedia:Tradubot -regex "\[\[\b([a-zA-ZáéíóúÁÉÍÓÚñÑ]+)(ca\b)\|\b([a-zA-ZáéíóúÁÉÍÓÚñÑ]+)(ces\b)\]\]" "[[\1ca|\1ques]]"
- Resultáu---> ([[pataca|pataces]]-->[[pataca|pataques]])
- python pwb.py ./scripts/replace.py -category:Wikipedia:Tradubot -regex "\[\[\b([a-zA-ZáéíóúÁÉÍÓÚñÑ]+)(ga\b)\|\b([a-zA-ZáéíóúÁÉÍÓÚñÑ]+)(ges\b)\]\]" "[[\1ga|\1gues]]"
- Resultáu---> ([[formiga|formiges]]-->[[formiga|formigues]])
- python pwb.py ./scripts/replace.py -category:Wikipedia:Tradubot -regex "\[\[\b([a-zA-ZáéíóúÁÉÍÓÚñÑ]+)(ada\b)\|\b([a-zA-ZáéíóúÁÉÍÓÚñÑ]+)(ades\b)\]\]" "[[\1ada|\1aes]]"
- Resultáu---> ([[alborada|alborades]]-->[[alborada|alboraes]])
- python pwb.py ./scripts/replace.py -category:Wikipedia:Tradubot -regex "\[\[\b([a-zA-ZáéíóúÁÉÍÓÚñÑ]+)(za\b)\|\b([a-zA-ZáéíóúÁÉÍÓÚñÑ]+)(zes\b)\]\]" "[[\1za|\1ces]]"
- Resultáu---> ([[maleza|malezes]]-->[[maleza|maleces]])
Apostrofar la segunda parte del enllaz:
- C) Por exemplu: de [[Castropol|As Figueiras]] >>> d'[[Castropol|As Figueiras]] ---> de As Figueiras >>> d'As Figueiras
- de [[hidratu de carbonu|hidratu de carbonu]] ---> d'[[hidratu de carbonu|hidratu de carbonu]] --->de hidratu de carbonu ---> d'hidratu de carbonu
- Códigu:
- python pwb.py ./scripts/replace.py -start:a -exceptinsidetag:template -exceptinsidetag:link -regex "\bde \[\[([^\]]*?\|[A|a|E|e|I|i|O|o|U|u|H|h].*?)\]\]" "d'[[\1]]"
Esto hai que lo facer con "de", "el", y "la".
- d' [[ ---> d'[[
- l' [[ ---> l'[[
correiciones más comunes
editar- idegues, idega >> idees, idea
- anguañu >> anguaño
- plantíes de {{bienvenida}} a tolos usuarios nuevos o qu'aínda nun teníen Bienvenida.
- -íacu, -íaca, -íaco, -íacos, -íaques, poles correspondientes -iacu, -iaca, -iaco, -iacos, -iaques
- d'(espaciu)xxxxx >>> d'xxxx ; (exemplu: d' América >> d'América )
- l'(espaciu) xxxxx >>> l'xxxx ; (exemplu l' Asturiense >> l'Asturiense )
- (de +a,e,i,o,u,h ---> d'a,e,i,o,u,h)
- (el +a,e,i,o,u,h ---> l'a,e,i,o,u,h)
- [P|p]eríod[u|os] ---> [P|e]eriod[u|os]]