競プロインタラクティブ問題のローカルテスト

インタラクティブ形式の問題とは、入力が最初の1回きりではなく、こちらの質問（クエリ出力）に従ってジャッジが回答となる新たな入力を与えるのを繰り返し、その情報を元に隠された何かを突き止めるタイプの問題。

例: L - Interactive Sorting

こういう形式は、提出前に正しく動作するかテストがしにくい。
また最大ケースに対してクエリ数がどれくらいになるかも、ちゃんと調べたい。

ジャッジ側のプログラムは自分で書くしかないが、それが比較的簡単に書けるなら、ジャッジ側も自動化させれば、複雑なケースのテストも行いやすい。

ジャッジ側プログラムの流れ

最初に隠された答えを決める（手作りなり、ランダム生成なり）
提出用スクリプトを新規プロセスで起動
最初の入力を与える
クエリ出力が来たら返答する
答え出力が来たら、答え合わせして終了

もちろん、上記の流れに沿わない問題（最初の入力が不要など）は、適宜コードを変更する。

クエリが来た回数をカウントできる。

補足・諸注意

プロセスを開始する subprocess.Popen() の引数を stdin=PIPE, stdout=PIPE とすることにより、プロセス同士の対話が可能になる。入出力のやりとりはstring型でなくbytes型なので、ジャッジ側が送ったり受け取ったりする文字列には decode(), encode() が必要となる。競プロではまずascii文字しか使わないので、デコードに用いる文字コードは utf8 や ascii でよい。

末尾の改行は、明示的に付与しないと提出コード側が入力待ちのまま動かなくなる。忘れないよう注意。

ジャッジ側・提出側のデバッグ出力を、ジャッジ側の任意のタイミングでできる。
提出側のデバッグ出力は、提出側でprint()→ジャッジ側で受け取りprint() という過程を踏む。
下記の実装例では、ジャッジ側は何でもとりあえず提出側の出力は全てprint()した上で、所定の形式に該当しない場合は何も処理せずスルーしている。
（実際のジャッジプログラムでは、余計な出力はWAとなるため、その点は全く同じ挙動では無いことに注意）

実装例

提出用スクリプト aaa/bbb/ccc.py に対し、ジャッジ用スクリプトは aaa/bbb/ccc_judge.py というファイル名での作成を前提としている。（異なる場合は script_path の生成方法を変更）

先頭文字が ? がクエリ、! が回答の合図であることを前提としている。
他の出力（ジャッジ側にとっての入力）は、print() だけしてスルーする。

        
          
          
              
              import random
import sys
import subprocess
 
 
def judge():
    """
    インタラクティブ問題のローカルテスト
    """
 
    # [Edit] 最初にジャッジ側で最初の入力や隠された答えなどを決定 ----
    n = 2000
    ans = list(range(1, n + 1))
    random.shuffle(ans)
    # ----------------------------------------------------------------
 
    # 設定
    encoding = 'utf-8'
    query_count = 0  # クエリ回数カウント
    #   提出用ファイルパス（ジャッジ用ファイル名 = 提出用ファイル名 + '_judge.py' の場合）
    script_path = __file__[:-9] + '.py'
 
    with subprocess.Popen([sys.executable, script_path],
                          stdin=subprocess.PIPE,
                          stdout=subprocess.PIPE,
                          stderr=subprocess.PIPE) as p:
 
        # [Edit] はじめにジャッジ側から入力を与える処理 ----
        p.stdin.write(f'{n}\n'.encode(encoding))
        p.stdin.flush()
        # --------------------------------------------------
 
        while True:
            query = p.stdout.readline().decode(encoding).strip()
            print('>', query)
 
            if query[0] == '?':
                # [Edit] クエリへの返答処理 ----
                i, j, k = map(int, query[2:].split())
                if ans[i - 1] + ans[j - 1] > ans[k - 1]:
                    response = 'Yes'
                else:
                    response = 'No'
                p.stdin.write(f'{response}\n'.encode(encoding))
                p.stdin.flush()
                # ------------------------------
                query_count += 1
                print('<', response)
 
            elif query[0] == '!':
                # [Edit] 解答があっているかチェックする処理 ----
                exec_ans = list(map(int, query[2:].split()))
                print('TrueAns:', ans)
                print('ExecAns:', exec_ans)
                print('Judge:', ans == exec_ans)
                print('QueryCount:', query_count)
                # ----------------------------------------------
                break
            else:
                pass
 
 
if __name__ == '__main__':
    judge()