Xây dựng một cặp QA từ tập hợp dữ liệu mà tối đa hóa độ biến thiên của độ chính xác của người suy luận, và để người suy luận giải quyết nó. Đây chính xác là một trò chơi nhắm đến 50% độ chính xác mà Noam Brown đã đề cập ().