Huawei представила новую версию модели DeepSeek с усиленной системой фильтрации контента
Разработка велась в партнёрстве с Чжэцзянским университетом. Для обучения модели Huawei задействовала тысячу собственных чипов Ascend. В основе проекта лежит открытая версия DeepSeek-R1, однако в неё внесли значительные изменения для повышения уровня цензурирования.
По результатам тестов, DeepSeek-R1-Safe показала около 100% эффективности при фильтрации токсичного, политического и незаконного контента. Однако при попытках обхода системы с помощью ролевых сценариев или скрытых кодов результативность снижалась примерно до 40%.
В то же время, в целом новая версия продемонстрировала более высокий уровень защиты, чем сопоставимые модели, включая Qwen-235B и DeepSeek-R1-671B от Alibaba. При этом снижение производительности по сравнению с оригинальным DeepSeek-R1 оказалось минимальным — менее 1%.
Презентация проекта состоялась в рамках конференции Huawei Connect в Шанхае, где компания также впервые за долгое время раскрыла планы по развитию собственных чипов и вычислительных мощностей.