Kling представил VIDEO 2.6 — ИИ-модель, которая генерирует видео и звук за один прогон

Сохраняется 0 В закладки 0 В закладках 0
Kling запустил модель VIDEO 2.6 — свой первый генератор, который создаёт картинку и звук одновременно. Один запрос превращается в готовый ролик с диалогами, живыми звуками и эффектами, без монтажа и сторонних сервисов.
Модель уже доступна пользователям на сайте Kling, на партнёрских платформах и плейграундах. Подробнее в материале Postium.


Нейросеть Kling VIDEO 2.6 — что умеет и как работает
VIDEO 2.6 генерирует визуал и звук внутри одной модели. Она одновременно считает, что происходит в кадре, кто говорит, какие эмоции и какие звуки должны сопровождать сцену. На выходе — уже собранный клип, где совпадают движение губ, ритм и звук.
https://postium.ru/wp-content/uploads/2025/12/TWMate.com-a3a575ee9058ca67d8ca4e52dd8ca8b5.mp4
Что нового:
- Видео и звук теперь генерятся вместе и синхронно.
- Голоса звучат естественно, а движение губ совпадает с речью.
- В промте можно задавать эмоции, тембр, шумы и отдельные SFX.
- Диалоги, монологи и музыкальные вставки создаются за один прогон.
Ключевая фишка в том, что звук не приклеивается сверху. Он создаётся вместе с видео и синхронизируется автоматически.
Как пользоваться Kling VIDEO 2.6?
Функция доступна в интерфейсах Kling, на различных агрегаторах (Higgsfield) и плейграундах (Fal Ai, Wavespeed).
На сайте Kling VIDEO 2.6 работает в двух режимах: text-to-video и image-to-video.
В text-to-video вы вводите подробный промт для генерации видео. В нём описываете сцену, персонажей, их реплики, эмоции, звук окружения, музыку и любые эффекты. Затем обязательно включаете опцию «Native audio» — именно она активирует встроенную озвучку. После генерации появляется ролик, где визуал и звук уже собраны в один файл.


В image-to-video логика та же, только вы добавляете один стартовый кадр или несколько фреймов, которые служат основой сцены. Далее прописываете промпт со звуками, диалогами и атмосферой. Опцию «Native audio» также нужно включить обязательно. Модель на основе кадров и текста выдаёт короткий озвученный эпизод.
Цена. На самом Kling подписка Standard, в которую входит VIDEO 2.6, начинается от 7 долларов в месяц. Бесплатного режима нет, потестировать без оплаты не получится.
На WaveSpeed один прогон text-to-video стоит $1,4 — для сравнения, у Veo 3.1 такой же запрос обходится примерно в $3,2.
Почему это важно? Это третий релиз Kling за три дня. Сначала вышла Kling O1, рассуждающая модель для создания и правки видео. Затем — IMAGE O1 новая модель для генерации и редактирования изображений. VIDEO 2.6 продолжают серию обновлений и мы ждём ещё как минимум два релиза.
Итог: один текстовый запрос теперь превращается в короткий ролик со звуком — без ручной озвучки и монтажа.
⭐ Тестим нейросети каждый день, а то, что реально работает — сливаем в Telegram-канал: .
Тэги Kling AI Нейросети
