Nhưng p-token *chỉ* là một tối ưu hóa khác. Không có sự đánh đổi kiến trúc ở đây. Tăng quy mô bằng cách tối ưu hóa. Đây là cách.