もとの A の並び順は意味ないので、0 は抜き出して個数だけ数え、それ以外は昇順に並べておく。
x=1~M のそれぞれについて、AK=x になる確率を求める。
x=7 K=10 ※ 0は除いた上で昇順ソート済 i 1 2 3 4 5 6 7 8 9 10 ... 他に 0 が5個 A = ( _ _ _ 7 7 7 7 _ _ _ ... ) '_'は7以外の数字
7 が K=10 番目に来るには、0から変換される数字について、以下の2つが両方成り立つ必要がある。
この3個、7個というのは、ソートされた A 上で 7 がどこからどこまで現れるかを [L,R) として、 それぞれ max で求められる。
元の A には現れない数字でも、もし現れていればそこに来るだろう位置で L=R として、同様に求められる。
で、この場合の数を求めたいが、直接、二項係数で計算するには 7以下の数字の個数と7未満の数字の個数、両方を固定せねばならず、O(N^2) となってしまう。
ところが、逆に成り立たない条件を考えると、
この2つというのは、絶対に重複しない。(範囲の広いのが a 個未満、範囲の狭いのが b 個以上で、必ず a \le b のため)
なので、独立に求められる。独立に求めるならそれぞれ O(N) で可能。
それぞれ(7以下の数字の個数、7未満の数字の個数)を固定して求め、
全体 M^{0の個数} から引いてやれば、x=7 の時の答えが求まる。
\displaystyle \sum_{x} \frac{x \times (xの時の場合の数)}{M^{0の個数}} が答え。
計算量は O(N(\log{N}+M))
公式Editorialの方法。あまり見たことは無かったが、期待値を求める一つのテクニックっぽい。
期待値は、確率変数を X として次のように言い換えられる。
この変換をする場合は、仮に X が偶数など特定の値しか取らないよ、とかいう場合でも、x は 1~上限 まで全ての値を合計する必要がある。
まぁ今回はそんなことは無く、x=1~M まで x \le X になる確率を求めればよい。
「ちょうど X=x」を求める場合には「x-1 以下の個数」と「x 以下の個数」を両方固定する必要があったが、 変換後なら「x-1 以下の個数」さえ固定すれば求められるので、O(N) でできる。
よくある言い換えとして、整数値(などの離散値)を取る確率変数の場合は、
などのように、次に小さい値との差分とすることで「ちょうど」を「以下」に変換できるので、 この方法でも x を固定した1回毎の計算を O(N) にできる。
公式解説は上手く言い換えて二分探索の問題に落とし込んでいるが、桁DPでも解ける。
ただ、きっちりと定義してやらないと遷移で混乱するし、公式の方が賢い。
\sum_{k=L}^{R} f(k)=\sum_{k=1}^{R} f(k)-\sum_{k=1}^{L-1} f(k) なので、[1,R] の範囲の問題が解ければよい。
「S の j 文字目までと一致していて」の部分は、ちゃんというと、その数の i-j+1,...,i-1, i 桁目の数字の並びと、S の 1,2,...,j 文字目が一致しているということ。
R の i 桁目の数字を c、S の j 文字目を d として、
これは、DP配列の j=0 に、上 i 桁が R より小さい/と一致 している数の個数を入れておくと、上記と一緒に考えられる。
k=0 の時は、R を文字列としてみて先頭 i-1 桁分より、1小さい数となる。
たとえば R=12345,i=3 なら、
i>0 の場合、R より小さいことは確定している。
S[0]=0 なら、そこからの一致はできない。それ以外の場合は、1通りだけ存在する。
i=0 の場合、既に何文字かの一致が見られる場合と似ているが、S[0]=0 の場合だけ注意して、
DP[i][|S|] までたどり着いたら、出現したものが見つかったので、答えに加算する。
このとき、残り桁の自由度分だけ倍加して、
をかけてから答えに加算する。
高速ゼータ変換の応用。
高速ゼータ変換というと、ある集合ごとに決められた値 f(S) があって、 各集合 S について、それを部分集合として含む全て集合についての f(T) の和を求めるやつ。
この実装は、各bitについて順番に「現在着目中のbitが立っている集合 S の値を、そのbitを倒した集合 S \ XOR \ bit に足し込む」という操作を繰り返して、O(N2^N) でできる。
以下のDPを考える。
盤面の状態と S の対応の例示が公式Editorialにある。解説 - AtCoder Beginner Contest 295
bitフラグを2進数として率直に表記すると右の方が小さい添字を示すのに対し、配列では左の方が小さい添字になるのでややこしい。ここでは以降、配列に合わせ、2進数っぽい表記でも左の方が小さい添字を表すものとする。
i-1 から i についての遷移を考える。
ある S に対し、左から k-1 列目まで'1'を伸ばし、k 列目には'0'を埋める遷移を考える。
S[j] を、bitフラグ S で j 列目を示す箇所のbit値(0/1)とする。
j 0123456789.. S 110101110111 i行目row ?1?????1??0? (入力に与えられたi行目) k=5 の時 111110______ という状態を固定しての遷移となる
この時、
それ以外なら遷移可能で、可能なときは
j 0123456789.. S 110101110111 i行目row ?1?????1??0? k=5 の時 遷移先 S 110100_10_0_ (_ はそれぞれ独立に0/1両方に遷移)
要は、「S から、k 列目および以降のrowで'0'になっている列のbitを倒した S'」が最大であり('_'に全て'1'を置いた状態を示す)、 そこから'_'、つまり「k+1 列目以降で、S'[j]=1 かつ row[j]=? になっている列」はそのbitを個別に1→0にした状態に遷移できる。
v v v DP[i][110100010000] ← DP[i-1][S] DP[i][110100010001] ← DP[i-1][S] DP[i][110100010100] ← DP[i-1][S] DP[i][110100010101] ← DP[i-1][S] DP[i][110100110000] ← DP[i-1][S] DP[i][110100110001] ← DP[i-1][S] DP[i][110100110100] ← DP[i-1][S] DP[i][110100110101] ← DP[i-1][S] (この遷移先が S')
しかし、愚直に全遷移先に足し込もうとすると、そのような列の数は最大 M、つまり遷移先は 2^M になり得る。
これは (k,S) を固定した場合での遷移なので、i ごとに O(M 2^{2M}) かかり、TLEである。
ここで、「部分集合に足し込む」ことを効率化する高速ゼータ変換が使える。
各 (k,S) に対して S' を求めてまとめて、 最後に高速ゼータ変換をおこなえば、部分集合に上手いこと足し込まれた結果が求まりそうである。
しかしここで問題となるのが、k ごとに遷移可能な部分集合が変わってくる点。
「k+1 列目以降で」S'[j]=1 かつ row[j]=? の列の部分集合に遷移するので、
k 列目までにそのような列があっても遷移してはいけない。
j 0123456789.. S 110101110111 i行目row ?1?????1??0? k=5 110100_10_0_ '_'の部分集合に遷移させたい しかし、全(k,S)をまとめて最後に1回の高速ゼータ変換をおこなうと _10_00_10_0_ k以下の列の部分集合にも遷移しちゃう
よって、高速ゼータ変換を段階的に行う。
k=5 のときの S' を DP[i] に反映するのは、「k 以下のbitについて、1→0 の足し込みを完了した後」にする。
こうすると、もはや S' の k 以下の列については遷移が完了しているので行われず、k+1 以降の箇所のみ、ゼータ変換が適用される。
計算量は O(NM2^M) となる。