Los modelos gpt-oss aprovechan nuestros enfoques de vanguardia para la capacitación en seguridad. Utilizamos la alineación deliberativa y una jerarquía de instrucciones durante el post-entrenamiento para ayudar a los modelos a rechazar indicaciones inseguras y defenderse contra inyecciones de indicaciones, así como intervenciones en el pre-entrenamiento.
Ver originales