Китайская Zhipu AI выпустила языковую модель GLM-5.2 - и уже в первые дни после релиза она переиграла Claude от Anthropic в одной из ключевых задач кибербезопасности. Не в маркетинговом бенчмарке. В реальном поиске уязвимостей.
Цифры, которые сложно проигнорировать
Независимое тестирование компании Semgrep зафиксировало: при обнаружении уязвимостей класса IDOR GLM-5.2 набрала F1-score 39% против 32-37% у Claude Code. Разрыв небольшой, но показательный - открытая модель опередила закрытого конкурента в специализированной задаче.
Второй удар - экономический. Обнаружение одной уязвимости с помощью GLM-5.2 обходится примерно в $0,17. Аналогичный сценарий на базе Claude стоит около $1. Разница почти шестикратная.
| Метрика | GLM-5.2 | Claude Mythos |
|---|---|---|
| F1 при поиске IDOR | 39% | 32-37% |
| Стоимость обнаружения одной уязвимости | ~$0,17 | ~$1+ |
| Доступность | Open-weight, MIT | Закрытая, API |
Что такое IDOR и почему это важно
IDOR - уязвимости контроля доступа, при которых один пользователь получает данные другого. Звучит просто. На практике это одна из самых распространённых угроз для веб-приложений: в рейтинге OWASP Top 10 2025 эта категория занимает первое место среди серьёзных проблем безопасности.
Автоматически находить такие дыры раньше умели только опытные команды пентестеров. Теперь - модель, которую можно скачать бесплатно и запустить на собственном сервере.
Открытые веса против экспортных ограничений
GLM-5.2 распространяется под лицензией MIT с открытыми весами. Её можно развернуть локально, встроить в CI/CD, использовать в коммерческих продуктах - без привязки к чьему-либо API и без риска, что завтра доступ закроют.
Контекст здесь принципиален. В июне Министерство торговли США вводило временные экспортные ограничения на модели Anthropic - именно из-за опасений по поводу их применения в кибератаках. Ограничения сняли, но сама история обнажила очевидное: закрытые модели можно притормозить административно. Открытые - уже нет.
Что это меняет для рынка ИБ
Несколько практических следствий, которые уже актуальны:
- AppSec-автоматизацию теперь можно строить на моделях внутри собственного контура - без передачи кода внешним сервисам.
- Порог входа для атакующих снижается: инструменты уровня профессионального пентестера становятся массовыми.
- Рынок движется от универсальных LLM к специализированным - оптимизированным под конкретные инженерные задачи.
GLM-5.2 - не «лучшая модель в мире» и не универсальный детектор всех уязвимостей. Но она наглядно показывает, куда движется индустрия. Открытые решения догоняют закрытые быстрее, чем кто-либо рассчитывал. И этот разрыв будет только сокращаться.