Kling 3.0: 15-секундное видео с нативным аудио и режиссёрский контроль
Kuaishou выпустила Kling 3.0 с генерацией видео до 15 секунд, нативным аудио на 6 языках и multi-shot storyboarding. Обзор нового релиза.

Kuaishou выпустила Kling 3.0 — крупнейшее обновление своего AI-генератора видео с момента запуска в июне 2024. Ключевые нововведения: видео до 15 секунд (было 5), нативная генерация аудио на нескольких языках, и multi-shot storyboarding для создания полноценных сцен с контролем каждого кадра.
Что нового
Увеличенная длительность и качество
Video 3.0 генерирует видео до 15 секунд за один запрос. Это принципиально меняет возможности — теперь можно создавать полноценные сцены с завязкой, развитием и кульминацией в одном клипе. Раньше приходилось склеивать несколько коротких фрагментов.
Качество вывода улучшено до фотореалистичного уровня. Персонажи получили более выразительную мимику и естественную динамику движений. Модель лучше справляется с физикой — ткани, волосы, жидкости выглядят убедительнее.
Нативное аудио на 6 языках
Главная инновация — генерация речи прямо в видео. Поддерживаются английский, китайский, японский, корейский, испанский, а также региональные акценты и диалекты. Можно создавать сцены с несколькими персонажами, где каждый говорит на своём языке.
Контроль над аудио детальный: можно задать содержание реплик, интонацию, порядок высказываний. Модель синхронизирует движение губ с речью.
Multi-shot storyboarding
Video 3.0 Omni добавляет режиссёрский контроль через storyboard. Для каждого шота можно указать:
- Длительность
- Размер плана (крупный, средний, общий)
- Ракурс камеры
- Движение камеры
- Нарративное содержание
Модель понимает классические кинематографические приёмы: shot-reverse-shot для диалогов, cross-cutting, voice-over. Фактически это переход от генерации "одного кадра" к созданию структурированного видеоконтента.
Улучшенная консистентность
При загрузке референсного видео или нескольких изображений модель извлекает визуальные и голосовые характеристики персонажа и воспроизводит их в новых сценах. Это решает главную проблему AI-видео — непоследовательность внешнего вида персонажей между кадрами.
Производительность
| Параметр | Kling 2.0 | Kling 3.0 |
|---|---|---|
| Макс. длительность | 5 сек | 15 сек |
| Нативное аудио | Нет | Да, 6 языков |
| Multi-shot | Нет | Да |
| Консистентность персонажей | Базовая | Продвинутая |
| Разрешение изображений | До 2K | До 4K |
Image 3.0 и Image 3.0 Omni теперь поддерживают 4K разрешение для профессионального использования — визуализация сцен, создание production assets.
Как попробовать
Kling 3.0 доступен для подписчиков Ultra на klingai.com. В ближайшее время откроется доступ для всех пользователей.
Для коммерческого использования доступен API через партнёрские платформы включая Higgsfield и Atlas Cloud.
Цены
Модель работает на кредитной системе. Точные цены зависят от платформы, но генерация 15-секундного видео обходится примерно в 3-5 раз дороже 5-секундного из-за увеличенной вычислительной нагрузки.
Ultra подписка стоит $30/месяц и включает расширенный пул кредитов плюс приоритетный доступ к новым моделям.
Сравнение с конкурентами
Kling 3.0 позиционируется как ответ на Sora v2 и Veo 2. Главное отличие — нативная генерация аудио и multi-shot storyboarding. У Sora пока нет встроенной генерации речи, а Veo 2 ограничен более короткими клипами.
С момента запуска в 2024 году Kling обработал более 600 миллионов видео и обслуживает свыше 60 миллионов создателей. Компания сотрудничает с 30,000+ корпоративных клиентов в кино, рекламе и e-commerce.
Итог
Kling 3.0 — не инкрементальное обновление, а смена парадигмы. Переход от генерации коротких клипов к созданию структурированных сцен с аудио меняет область применения: от социальных сетей к предпроизводству в кино и полноценным рекламным роликам.
Ранний доступ уже открыт для Ultra подписчиков. Публичный релиз ожидается в ближайшие недели.

