OpenAI vydala gpt-oss-safeguard (náhled výzkumu), modely bezpečnostního uvažování s otevřenou hmotností ve dvou velikostech: 120B a 20B TL; DR Bezpečnostní nástroj založený na uvažování: model přebírá zásady poskytnuté vývojářem při odvozování a používá řetězec myšlenek ke klasifikaci obsahu a vysvětlení svého rozhodnutí. - Přineste si vlastní zásady: aplikujte jakoukoli psanou politiku za běhu; Není třeba znovu trénovat klasifikátor pro každou změnu pravidla. - Vysvětlitelné štítky: model vrací řetězec myšlenek, které si můžete prohlédnout, abyste pochopili, proč označil obsah určitým způsobem. - Nejlepší případy použití: vznikající nebo vyvíjející se škody, vysoce nuancované domény a situace s několika označenými příklady. - Kompromisy: vyšší výpočetní výkon a latence než tradiční klasifikátory; Může být překonán klasifikátory specifickými pro úlohu vyškolenými na mnoha označených příkladech pro komplexní rizika. Licence a stažení: - Apache 2.0 (tolerantní). - Modely jsou k dispozici ke stažení na Hugging Face.