nCr mod m の求め方

競技プログラミングでは、答えの非常に大きくなる解に対しては、オーバーフローを防ぐため「○○で割った剰余で答えよ」という指定が入ることがある。○○は素数であることが多い。($10^9+7$など。以下$m$とする)

また、解法に組み合わせ数${}_n\mathrm{C}_r$を用いる計算も、出てくることがある。

これらが組み合わさったとき、計算量を減らすため、mod演算の定理を用いたテクニックがある。

組み合わせ数

まず、組み合わせ数の公式は、以下になる。

$$\binom{n}{r} = {}_n\mathrm{C}_r = \dfrac{n!}{r!(n-r)!}$$

なので、上限 $n$ が決まっている場合は、$1!~n!$ をあらかじめ求めておくと(当然その中に$r!$や$(n-r)!$も含まれる)同じ計算を繰り返さずに済む。

この時、$n!$ も相当に大きな数になるためmodを取りながら計算しないとオーバーフローする。 しかし、残念ながらmodの世界では加減乗($+-\times$)はいいが割り算は正常に機能しない。

オーバーフローせず、かつ正しい値になるように、事前計算できないか。

モジュラ逆数

$x$のモジュラ逆数とは、「modの世界で $x$ にかけたら1になる数」である。$x^{-1}$ で表記し、これをかけることで割り算を表現する。

普通の算数では、$x$ の逆数は $1/x$ である。$x \times \dfrac{1}{x} = 1$となる。

だが、modは整数論の世界なので、分数は扱えない。しかし、逆数に相当する数なら条件付きだが存在する。

$$3 \times x^{-1} \equiv 1 \pmod{11}$$

$$3 \times 4 = 12 \equiv 1 \pmod{11}$$

試しに $x^{-1}$ に4を入れてみると成立する。4は、mod11における3のモジュラ逆数の1つということになる。

逆数が存在する条件は、$x$ と $m$ が互いに素である場合に限られる。$m$ が素数の場合には、$1 \le x \lt m$ の範囲では必ず満たすので、必ず存在する。

で、逆数を事前計算しておけば、組み合わせ数は以下の式で求められる。

$${}_n\mathrm{C}_r \equiv n! \times r!^{-1} \times (n-r)!^{-1} \pmod{m}$$

フェルマーの定理

では逆数を求めるにはどうしたらよいのか。$m$ が素数の場合、フェルマーの小定理が利用できる。

$$a^{m-1} \equiv 1 \pmod{m}$$

$$a^{-1} \equiv a^{m-2} \pmod{m} \ \ (m \ge 3)$$

$m$ が素数の場合、$a^{m-2}$ が $a$ の逆数となる。これを事前計算しておくことで、modでの組み合わせ数の算出を高速化できる。

この計算も、$m-2$ が大きいと時間がかかるが、バイナリ法やモンゴメリ乗算などを使うことで高速に求められる。

1!~n!の逆数

いくら $a^{-1}$ が高速に求められるとしても、$1!^{-1}~n!^{-1}$ の全てをこの方法で求めていてはやはり時間がかかる。そこで、

\begin{align} n!^{-1} &= \frac{1}{1 \times 2 \times \ldots \times (n-1) \times n} \\ (n-1)!^{-1} &= \frac{1}{1 \times 2 \times \ldots \times (n-1)} = n!^{-1} \times n \\ (n-2)!^{-1} &= \frac{1}{1 \times 2 \times \ldots \times (n-2)} = (n-1)!^{-1} \times (n-1) \end{align}

であることを利用すれば、$n!^{-1}$ さえ求めれば、かけ算の繰り返しで全ての階乗の逆数を求められる。

まとめると、($\mod{m}$ は省略)

  • 1から順にかけ算して、$1!~n!$ を計算・保持
  • $n!^{-1} \equiv n!^{m-2}$ を計算
  • $n!^{-1}$ に $n~1$ を逆順にかけ算して、$(n-1)!^{-1}~1!^{-1}$ を計算・保持
  • $1!~n!$ と $1!^{-1}~n!^{-1}$ より、${}_n\mathrm{C}_r$ を計算

def prepare(n, MOD):

    # 1! - n! の計算
    f = 1
    factorials = [1]  # 0!の分
    for m in range(1, n + 1):
        f *= m
        f %= MOD
        factorials.append(f)
    # n!^-1 の計算
    inv = pow(f, MOD - 2, MOD)
    # n!^-1 - 1!^-1 の計算
    invs = [1] * (n + 1)
    invs[n] = inv
    for m in range(n, 1, -1):
        inv *= m
        inv %= MOD
        invs[m - 1] = inv
    
    return factorials, invs
    

${}_n\mathrm{C}_r$ の左項には $n$ しか来ない場合、1!~(n-1)!は保持しなくてよいバージョン

def prepare(n, MOD):

    # n! の計算
    f = 1
    for m in range(1, n + 1):
        f *= m
        f %= MOD
    fn = f
    
    # n!^-1 の計算
    inv = pow(f, MOD - 2, MOD)
    # n!^-1 - 1!^-1 の計算
    invs = [1] * (n + 1)
    invs[n] = inv
    for m in range(n, 1, -1):
        inv *= m
        inv %= MOD
        invs[m - 1] = inv
    
    return fn, invs

さらなる高速化

階乗の計算は、NumPyを用いて $\sqrt{N} \times \sqrt{N}$ 行列の縦横1列をまとめて計算することで高速化が可能になる。 (ただし上記サイトにもあるが、ややトリッキーな方法であり、競プロを外れた文脈ではCython, Numbaなどで高速化した方が素直)

modを取りながらの累積積を高速化できるので、$N=10^6$ で、だいたいNumPyを使わないコードと比較して2.5倍(332ms→125ms)くらいの速度になる。 200msの差が生きるときもあるかも知れない。

import numpy as np

def prepare(n, MOD):
    nrt = int(n ** 0.5) + 1
    nsq = nrt * nrt
    facts = np.arange(nsq, dtype=np.int64).reshape(nrt, nrt)
    facts[0, 0] = 1
    for i in range(1, nrt):
        facts[:, i] = facts[:, i] * facts[:, i - 1] % MOD
    for i in range(1, nrt):
        facts[i] = facts[i] * facts[i - 1, -1] % MOD
    facts = facts.ravel().tolist()

    invs = np.arange(1, nsq + 1, dtype=np.int64).reshape(nrt, nrt)
    invs[-1, -1] = pow(facts[-1], MOD - 2, MOD)
    for i in range(nrt - 2, -1, -1):
        invs[:, i] = invs[:, i] * invs[:, i + 1] % MOD
    for i in range(nrt - 2, -1, -1):
        invs[i] = invs[i] * invs[i + 1, 0] % MOD
    invs = invs.ravel().tolist()

    return facts, invs

本WebサイトはcookieをPHPのセッション識別および左欄目次の開閉状況記憶のために使用しています。同意できる方のみご覧ください。More information about cookies
programming_algorithm/number_theory/mod_combination.txt · 最終更新: 2020/02/13 by ikatakos
CC Attribution 4.0 International
Driven by DokuWiki Recent changes RSS feed Valid CSS Valid XHTML 1.0