Construye un par de preguntas y respuestas a partir del corpus que maximice la varianza de corrección del razonador, y deja que el razonador lo resuelva. Este es exactamente un juego que apunta al 50% de corrección que mencionó Noam Brown ().