PDFからコピペした文字列を、Google Translateへの貼り付け時に一文ごとの改行になおす。
// ==UserScript== // @name Google Translate PDF Formatter // @namespace example // @include https://translate.google.co.jp* // @description // @grant none // ==/UserScript== (function () { var $ta = document.getElementById('source'); $ta.addEventListener('change', function () { var text = $ta.value; text = text.replace(/-\n/g, '').replace(/\n/g, ' ').replace(/\. /g, '.\n'); $ta.value = text; }); }) ();
例えば以下のPDF文章があったとする。
Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna ...
これが(PDFでなく)メモ帳やWebブラウザ上の文書であったなら、普通はコピーするとすべてつながった文字列になる。
Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna ...
しかし、PDFではその構造上、見たままの折り返し位置で改行されてしまう。
Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna ...
特に英語の論文を翻訳しつつ読みたい時など、翻訳サイトでは改行が挟まっては上手く翻訳してくれない。かといって、そのたびに改行を消していては非常な労力を要する。
クリップボードにコピーされる文字列に改行が入ってしまうのは仕方ないとして、それを貼り付けて利用する際に、自動的に整形してくれれば少しはましになる。
Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna ...
/-\n/
」→「''
」/\n/
」→「' '
」/\. /
」→「'.\n'
」