目次

Google Translate PDF Formatter

何をするか

PDFからコピペした文字列を、Google Translateへの貼り付け時に一文ごとの改行になおす。

スクリプト

// ==UserScript==
// @name          Google Translate PDF Formatter
// @namespace     example
// @include       https://translate.google.co.jp*
// @description	  
// @grant         none
// ==/UserScript==
(function () {
  var $ta = document.getElementById('source');
  $ta.addEventListener('change', function () {
    var text = $ta.value;
    text = text.replace(/-\n/g, '').replace(/\n/g, ' ').replace(/\. /g, '.\n');
    $ta.value = text;
  });
}) ();

例えば以下のPDF文章があったとする。

sample.pdf
Lorem ipsum dolor sit amet, consectetur
adipiscing elit, sed do eiusmod tempor
incididunt ut labore et dolore magna
...

これが(PDFでなく)メモ帳やWebブラウザ上の文書であったなら、普通はコピーするとすべてつながった文字列になる。

メモ帳やWebブラウザ上のコピー
Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna ...

しかし、PDFではその構造上、見たままの折り返し位置で改行されてしまう。

PDF上のコピー
Lorem ipsum dolor sit amet, consectetur
adipiscing elit, sed do eiusmod tempor
incididunt ut labore et dolore magna
...

特に英語の論文を翻訳しつつ読みたい時など、翻訳サイトでは改行が挟まっては上手く翻訳してくれない。かといって、そのたびに改行を消していては非常な労力を要する。

クリップボードにコピーされる文字列に改行が入ってしまうのは仕方ないとして、それを貼り付けて利用する際に、自動的に整形してくれれば少しはましになる。

PDFからコピーしてGoogle翻訳に貼り付け後、本スクリプトによって整形された文字列
Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna ...

もう少し詳しく