nCr mod m の求め方

競技プログラミングでは、答えの非常に大きくなる解に対しては、オーバーフローを防ぐため「○○で割った剰余で答えよ」という指定が入ることがある。○○は素数であることが多い。（$10^9+7$など。以下$m$とする）

また、解法に組み合わせ数${}_n\mathrm{C}_r$を用いる計算も、出てくることがある。

これらが組み合わさったとき、計算量を減らすため、mod演算の定理を用いたテクニックがある。

nCr mod mの求め方 - uwicoder - アットウィキ

組み合わせ数

まず、組み合わせ数の公式は、以下になる。

$$\binom{n}{r} = {}_n\mathrm{C}_r = \dfrac{n!}{r!(n-r)!}$$

なので、上限 $n$ が決まっている場合は、$1!～n!$ をあらかじめ求めておくと（当然その中に$r!$や$(n-r)!$も含まれる）同じ計算を繰り返さずに済む。

この時、$n!$ も相当に大きな数になるためmodを取りながら計算しないとオーバーフローする。しかし、残念ながらmodの世界では加減乗（$+-\times$）はいいが割り算は正常に機能しない。

オーバーフローせず、かつ正しい値になるように、事前計算できないか。

モジュラ逆数

$x$のモジュラ逆数とは、「modの世界で $x$ にかけたら1になる数」である。$x^{-1}$ で表記し、これをかけることで割り算を表現する。

普通の算数では、$x$ の逆数は $1/x$ である。$x \times \dfrac{1}{x} = 1$となる。

だが、modは整数論の世界なので、分数は扱えない。しかし、逆数に相当する数なら条件付きだが存在する。

$$3 \times x^{-1} \equiv 1 \pmod{11}$$

$$3 \times 4 = 12 \equiv 1 \pmod{11}$$

試しに $x^{-1}$ に4を入れてみると成立する。4は、mod11における3のモジュラ逆数の1つということになる。

逆数が存在する条件は、$x$ と $m$ が互いに素である場合に限られる。$m$ が素数の場合には、$1 \le x \lt m$ の範囲では必ず満たすので、必ず存在する。

で、逆数を事前計算しておけば、組み合わせ数は以下の式で求められる。

$${}_n\mathrm{C}_r \equiv n! \times r!^{-1} \times (n-r)!^{-1} \pmod{m}$$

フェルマーの定理

では逆数を求めるにはどうしたらよいのか。$m$ が素数の場合、フェルマーの小定理が利用できる。

$$a^{m-1} \equiv 1 \pmod{m}$$

$$a^{-1} \equiv a^{m-2} \pmod{m} \ \ (m \ge 3)$$

$m$ が素数の場合、$a^{m-2}$ が $a$ の逆数となる。これを事前計算しておくことで、modでの組み合わせ数の算出を高速化できる。

この計算も、$m-2$ が大きいと時間がかかるが、バイナリ法やモンゴメリ乗算などを使うことで高速に求められる。

1!～n!の逆数

いくら $a^{-1}$ が高速に求められるとしても、$1!^{-1}～n!^{-1}$ の全てをこの方法で求めていてはやはり時間がかかる。そこで、

\begin{align} n!^{-1} &= \frac{1}{1 \times 2 \times ... \times (n-1) \times n} \\ (n-1)!^{-1} &= \frac{1}{1 \times 2 \times ... \times (n-1)} = n!^{-1} \times n \\ (n-2)!^{-1} &= \frac{1}{1 \times 2 \times ... \times (n-2)} = (n-1)!^{-1} \times (n-1) \end{align}

であることを利用すれば、$n!^{-1}$ さえ求めれば、かけ算の繰り返しで全ての階乗の逆数を求められる。

まとめると、（$\mod{m}$ は省略）

1から順にかけ算して、$1!～n!$ を計算・保持
$n!^{-1} \equiv n!^{m-2}$ を計算
$n!^{-1}$ に $n～1$ を逆順にかけ算して、$(n-1)!^{-1}～1!^{-1}$ を計算・保持
$1!～n!$ と $1!^{-1}～n!^{-1}$ より、${}_n\mathrm{C}_r$ を計算

def prepare(n, MOD):

    # 1! - n! の計算
    f = 1
    factorials = [1]  # 0!の分
    for m in range(1, n + 1):
        f *= m
        f %= MOD
        factorials.append(f)
    # n!^-1 の計算
    inv = pow(f, MOD - 2, MOD)
    # n!^-1 - 1!^-1 の計算
    invs = [1] * (n + 1)
    invs[n] = inv
    for m in range(n, 1, -1):
        inv *= m
        inv %= MOD
        invs[m - 1] = inv
    
    return factorials, invs

${}_n\mathrm{C}_r$ の左項には $n$ しか来ない場合、1!～(n-1)!は保持しなくてよいバージョン

def prepare(n, MOD):

    # n! の計算
    f = 1
    for m in range(1, n + 1):
        f *= m
        f %= MOD
    fn = f
    
    # n!^-1 の計算
    inv = pow(f, MOD - 2, MOD)
    # n!^-1 - 1!^-1 の計算
    invs = [1] * (n + 1)
    invs[n] = inv
    for m in range(n, 1, -1):
        inv *= m
        inv %= MOD
        invs[m - 1] = inv
    
    return fn, invs

さらなる高速化

[numpy]n! mod pの計算 | maspyのHP

階乗の計算は、NumPyを用いて $\sqrt{N} \times \sqrt{N}$ 行列の縦横1列をまとめて計算することで高速化が可能になる。（ただし上記サイトにもあるが、ややトリッキーな方法であり、競プロを外れた文脈ではCython, Numbaなどで高速化した方が素直）

modを取りながらの累積積を高速化できるので、$N=10^6$ で、だいたいNumPyを使わないコードと比較して2.5倍（332ms→125ms）くらいの速度になる。 200msの差が生きるときもあるかも知れない。

import numpy as np

def prepare(n, MOD):
    nrt = int(n ** 0.5) + 1
    nsq = nrt * nrt
    facts = np.arange(nsq, dtype=np.int64).reshape(nrt, nrt)
    facts[0, 0] = 1
    for i in range(1, nrt):
        facts[:, i] = facts[:, i] * facts[:, i - 1] % MOD
    for i in range(1, nrt):
        facts[i] = facts[i] * facts[i - 1, -1] % MOD
    facts = facts.ravel().tolist()

    invs = np.arange(1, nsq + 1, dtype=np.int64).reshape(nrt, nrt)
    invs[-1, -1] = pow(facts[-1], MOD - 2, MOD)
    for i in range(nrt - 2, -1, -1):
        invs[:, i] = invs[:, i] * invs[:, i + 1] % MOD
    for i in range(nrt - 2, -1, -1):
        invs[i] = invs[i] * invs[i + 1, 0] % MOD
    invs = invs.ravel().tolist()

    return facts, invs

目次