GLM-5.2 обошла Claude. Открытый ИИ меняет правила

Китайская Zhipu AI выпустила языковую модель GLM-5.2 - и уже в первые дни после релиза она переиграла Claude от Anthropic в одной из ключевых задач кибербезопасности. Не в маркетинговом бенчмарке. В реальном поиске уязвимостей.

Цифры, которые сложно проигнорировать

Независимое тестирование компании Semgrep зафиксировало: при обнаружении уязвимостей класса IDOR GLM-5.2 набрала F1-score 39% против 32-37% у Claude Code. Разрыв небольшой, но показательный - открытая модель опередила закрытого конкурента в специализированной задаче.

Второй удар - экономический. Обнаружение одной уязвимости с помощью GLM-5.2 обходится примерно в $0,17. Аналогичный сценарий на базе Claude стоит около $1. Разница почти шестикратная.

Метрика	GLM-5.2	Claude Mythos
F1 при поиске IDOR	39%	32-37%
Стоимость обнаружения одной уязвимости	~$0,17	~$1+
Доступность	Open-weight, MIT	Закрытая, API

Что такое IDOR и почему это важно

IDOR - уязвимости контроля доступа, при которых один пользователь получает данные другого. Звучит просто. На практике это одна из самых распространённых угроз для веб-приложений: в рейтинге OWASP Top 10 2025 эта категория занимает первое место среди серьёзных проблем безопасности.

Автоматически находить такие дыры раньше умели только опытные команды пентестеров. Теперь - модель, которую можно скачать бесплатно и запустить на собственном сервере.

Открытые веса против экспортных ограничений

GLM-5.2 распространяется под лицензией MIT с открытыми весами. Её можно развернуть локально, встроить в CI/CD, использовать в коммерческих продуктах - без привязки к чьему-либо API и без риска, что завтра доступ закроют.

Контекст здесь принципиален. В июне Министерство торговли США вводило временные экспортные ограничения на модели Anthropic - именно из-за опасений по поводу их применения в кибератаках. Ограничения сняли, но сама история обнажила очевидное: закрытые модели можно притормозить административно. Открытые - уже нет.

Что это меняет для рынка ИБ

Несколько практических следствий, которые уже актуальны:

AppSec-автоматизацию теперь можно строить на моделях внутри собственного контура - без передачи кода внешним сервисам.
Порог входа для атакующих снижается: инструменты уровня профессионального пентестера становятся массовыми.
Рынок движется от универсальных LLM к специализированным - оптимизированным под конкретные инженерные задачи.

GLM-5.2 - не «лучшая модель в мире» и не универсальный детектор всех уязвимостей. Но она наглядно показывает, куда движется индустрия. Открытые решения догоняют закрытые быстрее, чем кто-либо рассчитывал. И этот разрыв будет только сокращаться.

techtownweb.com

Обновлено 02 июл 2026