[画像]
翻訳の校閲をする際に、原文と訳文の数字の照合作業がある。往々にして原文と訳文で数字の現れる順序が入れ替わるので、機械的に照合するのは難しい。それでも、原文と訳文中の数字を強調表示すれば、格段に照合しやすくなる。
数字には、次のように種々の表記がある。
半角(7)、全角(7)、漢字(七)、ローマ数字(VII)、機種依存丸数字(⑦)、機種依存ローマ数字(ⅶ)、スペルアウト(seven)、序数(seventh)、月名(July)、回数(twice)
こうした数字がらみを一括ハイライトするサクラエディタマクロを書いた。
S_SearchNext ('[\d0-9.,/-]*[\d0-9]+|[〇一二三四五六七八九十百千万億兆①-⑳Ⅰ-Ⅹ]|\bone\b|\btwo\b|\bthree\b|\bfour\b|\bfive\b|\bsix\b|\bseven\b|\beight\b|\bnine\b|\bten\b|\beleven\b|\btwelve\b|\bthirteen\b|\bfourteen\b|\bfifteen\b|\bsixteen\b|\bseventeen\b|\beighteen\b|\bnineteen\b|\btwenty\b|\bthirty\b|\bforty\b|\bfifty\b|\bsixty\b|\bseventy\b|\beighty\b|\bninety\b|\bhundred\b|\bthousand\b|\bmillion\b|\bbillion\b|\btrillion\b|\bJanuary\b|\bFebruary\b|\bMarch\b|\bApril\b|\bMay\b|\bJune\b|\bJuly\b|\bAugust\b|\bSeptember\b|\bOctober\b|\bNovember\b|\bDecember\b|\bJan\.|\bFeb\.|\bMar\.|\bApr\.|\bJun\.|\bJul\.|\bAug\.|\bSept?\.|\bOct\.|\bNov\.|\bDec\.|\bfirst\b|\bsecond\b|\bthird\b|\bfourth\b|\bfifth\b|\bsixth\b|\bseventh\b|\beighth\b|\bnineth\b|\btenth\b|\bonce\b|\btwice\b',4);
正規表現の部分は、Perl型の正規表現を使う他のプログラム言語にも応用できるだろう。アラビア数字以外は網羅が不完全で、多少ノイズも生じるが、実用にはなっている。
冒頭の図はマクロ使用結果の一例。
コメントをする