日本語入力用の配列案 -2013/03/29
Dvorakローマ字を基礎として、日本語をより快適に入力するための紆余曲折。
こんなこと長々と書く前に実際変えて試した方が早いと自分に突っ込み。
こういったその場凌ぎの改変を繰り返して元来のDvorakと離れていくのなら、いっそ独自の計算式でバシッと効率的な配置をきめてみるべきではないか。という考えも沸いてくる。まぁ、その計算式を作る知識がまだまだ未熟なんだが。
GとBの入れ替え
検討中の改変案。
要旨
かなの使用頻度表はソースによって結果が大幅に変わってくることもあるためこれといった決定版はないが、それでも共通しているのは、「“が”の頻度は上位20位に入ってくるほどに高い」ということである。また、“がぎぐげご”の合計と“ばびぶべぼ”の合計でも、ほぼ前者の方が圧倒して高い。(ただし“ぐ”の頻度は低い傾向にある)
小 | 薬 | 中 | 人 | 伸 | 伸 | 人 | 中 | 薬 | 小 |
---|---|---|---|---|---|---|---|---|---|
p | y | f | g | k | r | l | |||
a | o | e | u | i | d | h | t | n | s |
q | j | c | x | b | m | w | v | z |
gとbの位置は上表の通り。ホームポジションの手の置き方にも依るだろうが、自分の場合はbの方が入力しやすい。gは指先だけでなく、手のひら全体を動かして押す形になっている。gとbを入れ替えれば、ホームポジションから指先だけを動かして入力できる頻度がさらに高まると予想される。
考慮すべき点
拗音との関連
gとb、どちらも続けてnを押すと拗音(ゃゅょ)になる。「gn」という運指は、gで人差し指を伸ばしている分、nで薬指を曲げる度合いが増し、若干ではあるが負担を強いる。ただし「ゅう」「ょう」は、2打で入力できるキーを別に用意してあるので、nを押す必要はない。そのため、「ぎゅう、ぎょう」「びゅう、びょう」を除いた「ぎゃぎゅぎょ」「びゃびゅびょ」の頻度を比べたい。
そんなソースはなかなか無いわけだが、せめて「g+拗音」「b+拗音」のどちらが多いか、と探すと、http://mobitan.org/kb/romaji/kanafreq.shtml に、調査者が書いたメールを対象とした頻度調査がある。「やゆよ」を母音と見なしているので、これを見ると「g+拗音」の方が「b+拗音」よりかなり多いことが分かる。
また、http://yellow.ribbon.to/~ujiro/hindo.htm にも調査者のブログとメールを対象とした2連接の調査結果があるが、「ぎょ」「びょ」のみだがこれもgの方が多い。
拡張母音との関連
tを子音に続けて押すと“つ”、“き”を一度に入力できる拡張母音を使っているが、「gt」という組み合わせは結構不自然な指の形を強いる。ガ行でよく使うのは「がつ」「げつ」くらいしかないが、バ行は「ばつ」「ぼつ」「べつ」「ぶつ」と多い。種類は多いが、頻度はどうか、ということが知りたいが、これにはあまり有効な調査結果が見あたらなかったので、自分で調べるしかない。kakashiとmonogramというものを使えば調査は出来るようだが、さて。
直接入力との競合
直接入力時、gとbをそのまま使うとすると、混乱も予想される。
混乱も結局は慣れの問題だが、直接入力でも入れ替えてしまった方が習得コストは低いと思っている。入れ替えてしまうと、標準のDvorakしか使えない状況に弱くなるが、そもそも「Dvorakは使えるが、自分好みにカスタマイズしたDvorakは使えない」状況がまれだと思われるので気にしないことにする。Windowsを使う限りはDvorakJがあるし。
http://www7.plala.or.jp/dvorakjp/hinshutu.htm を見ると、アルファベットでもgの方が使用頻度は高いようだ。(ソースはニュース原稿)
また、運指も考慮すると、「g」と「mwvz(tn)」、「b」と「f(l)」は相当入力しにくい。入れ替えた時にこの組み合わせの頻度が増すならば、直接入力では多少の混乱を覚悟してでも入れ替えない方がよいということになる。
http://d.hatena.ne.jp/maple_magician/20060102/1136213606 に、Wikipediaの1記事を解析した結果が載っているが、「b」と「mwvztn」、「g」と「fl」の組み合わせは以下の通り。「mb」「gl」が入力しにくくなる。「ng」が入力しやすくなる。
m | w | v | z | t | n | f | l | |||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
b | 0 | 36 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 11 | 0 | 2 | 0 | 0 | 40 | 2 |
g | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 5 | 0 | 15 | 284 | 0 | 2 | 71 | 3 |
左がb,g前置、右が後置 |
ただし上の考察は、非常に入力しにくい運指が生じないことの確認にはなったが、「gr」などの、「非常に入力しやすい運指」が「普通の運指」に低下する面もあることは一応留意すべき。上の調査では「gr:46」「br:67」だったが、これはUnited Kingdomの記事なので「Britain」が多用されていたためと思われる。
しばらくは日本語、直接入力とも入れ替えて使ってみることにする。
Jを使用しない
配列を変えたての頃は、ザ行の入力にDvorakのままzを使用していて、それが入力しにくいのでせめてジャ行は入力しやすくなるjを使おう、ということだったのだが、ザ行の入力にcを使うようになってからは入力しやすくなり、今度はザ行だけ例外的にjを使用することによる拡張母音の一貫性の崩れが気になるようになってきた。
例えばb,mの位置に拡張母音「you」「yuu」を配置しているが、c(z)だけは上段の拡張母音を補う「ui」「uu」であり、「じょう」「じゅう」はjb,jmで入力するようになっている。慣れと言ってしまえばそれまでだが、入力していてちょっと引っかかる。
jは、zに比べれば入力しやすいが、それでも全体的に見れば入力しやすいとは言えない。jはcn(=zy)で代用でき、次に左手の母音に続くことを考えれば、打鍵数が増えようとも入力のしやすさという面で見れば大差はない。
問題は、ザ行の補助母音のスペースが減ること。左手子音には、同じ指が続かないように右手に補助母音を用意しているが、jを使う事で間に合っていたy,you,yuuの拡張を使うので、i,ui,uuが入力しにくくなってしまう。ui,uuはいいとして、iは結構痛い。
c(z)の2打鍵目(現在) | |||||||||
---|---|---|---|---|---|---|---|---|---|
aい | oう | eい | uう | uい | uく | eき | oく | ||
a | o | e | u | i | iく | u | i | aく | |
aん | oん | eん | iん | uい | uう |
c(z)の2打鍵目(改変) | |||||||||
---|---|---|---|---|---|---|---|---|---|
aい | oう | eい | uう | uい | iく | uく | eき | oく | |
a | o | e | u | i | i | u | y | aく | |
aん | oん | eん | iん | you | yuu |
応急処置として、ikuの拡張母音を一段上にし、その位置にiを用意する。応急処置感がぬぐえないが、本来の母音の左右対称位置ということで覚えやすくはある。
左手子音のpも同じ問題を抱えており、同様のルールを適用してしまえば、多少は「規則ある例外」になるか。
oi,ii拡張
二重母音として、ai,ou,ei,uu,uiを左手上段に配置しているが、新たにoi,iiも用意する。
http://www7.plala.or.jp/dvorakjp/diphthong.htm の調査によると、二重母音はou,ai,eiが圧倒的に多く、次いでuu,oi,ii,uiが来るようだ。ソースは『朝日新聞・読売新聞の一面及び社説、アメリカ歴代大統領の就任演説(フィッツジェラルド~ジョージ・ブッシュ)の和訳、20代男性のE-mail及び刑法から11万7433字を解析したデータ』となっている。
回数 | % | |
---|---|---|
ou | 3836 | 1.88053965 |
ai | 2863 | 1.403541454 |
ei | 2036 | 0.998117499 |
uu | 806 | 0.39512903 |
oi | 650 | 0.318652443 |
ii | 498 | 0.244136795 |
ui | 404 | 0.198054749 |
実際、日本語を打っていて、「oiの拡張母音があればいいなあ」と思うことはあった。
母音の配置を変更し、以下のようにする。uiの位置にiiを持ってきて、oi,uiを最上段に配置。
追記:規則性を重視してiiの位置を決定したが、uiは漢語に多く登場し次に撥音に繋がりやすい一方(随伴、追伸、推薦など)、iiは漢語に多くなく、撥音との組み合わせは低いと考えられる。最上段にuiを持って行くと、次の撥音拡張(再下段)が打ちにくくなってしまった。よって、uiの位置は人差し指上段のまま、iiを最上段に持っていくことにする。
2打鍵目 | |||||||||
---|---|---|---|---|---|---|---|---|---|
oい | iい | ||||||||
aい | oう | eい | uう | uい | uく | eき | oく | ||
a | o | e | u | i | iく | aく | |||
aん | oん | eん | uん | iん | you | yuu |
最上段は基本的に押しにくく、タッチタイプに支障が出るため使わないが、「2」「3」の位置はまだ押しやすい。使いにくいと思えば使わなくなるだろうし、しばらく試してみる。