Вышла новая китайская модель для генерации видео по тексту 可灵 (или просто Kling)! Выпустила её Kuaishou Technology — китайская
Вышла новая китайская модель для генерации видео по тексту 可灵 (или просто Kling)!
Выпустила её Kuaishou Technology — китайская компания, которая разрабатывает одноимённую платформу для коротких видео (и довольно популярна в Китае).
Как заявляют авторы:
модель представляет собой Diffusion Transformer (DiT), работающий в латентном пространстве закодированных видео (при этом при обучении DiT берутся видео разного разрешения и соотношения сторон);
в качестве автоэнкодера видео используется специально обученный 3D VAE;
модель может генерировать Full HD видео (разрешение 1920 х 1080) длинной до 2 минут с частотой 30 кадров в секунду (время, за которое модель генерирует такое видео, авторы не уточняют); при этом Sora за один проход умеет генерировать только минутное видео.
Как водится в последнее время, авторы Kling утверждают, что модель способна отлично имитировать физические характеристики реального мира и создавать видеоролики, соответствующие законам физики (что сейчас так или иначе является целью каждой команды, которая создает собственные text-to-video модели). Хотя всё ещё видны артефакты генерации (даже на представленных черри-пиках).
Концептуально в этом подходе к генерации видео нет ничего нового по сравнению с последними сравнимыми по качеству моделями такими как Sora (OpenAI), Vidu (Tsinghua University and ShengShu Technology), Veo (DeepMind). Очень большую роль играют и значимо влияют на финальное качество:
данные, на которых обучалась модель, их количество и, самое главное, качество (в случае Kling эта информация неизвестна - как и в случае большинства других моделей генерации видео);
количество compute, затраченного на обучение (то есть фактически спецификация и размер кластера и время обучения); в частности, авторы Kling специально подчёркивают большую отдачу (с точки зрения финального качества модели) от масшабирования архитектуры и процесса оптимизации её обучения.
Модель Kling закрытая, есть только статья с примерами в блоге и ссылка на бета-тестирование (правда чтобы в нём поучаствовать, нужен китайский номер )
35 views
81
18
2 weeks ago 01:17:27 1
Евгения Добровольская: «Вытаскивали меня из ада только дети» // «Скажи Гордеевой»
2 weeks ago 01:34:51 1
⚡️Протесты на Урале! Схватка в ГосДуме! Обращение к Кадырову и Особняк магната
2 weeks ago 00:07:04 1
ЧТО МОЖНО ВЫБИТЬ ЗА 90 КРУТОК??!! ОТКРЫТИЕ МОЛИТВ Мавуики и Ситлали | Genshin Impact 5.3
2 weeks ago 00:06:30 1
Крис Пратт показывает карточный фокус [s20e09] | Шоу Грэма Нортона
2 weeks ago 00:22:04 1
новый 2025 год | vlogmas
2 weeks ago 00:16:34 1
Следователь громит мифы про Сталина
2 weeks ago 00:33:20 1
КОММУНИСТЫ И БОРЬБА ЗА ВЛАСТЬ. Чем занимаются левые сегодня? Новый сюжет Элмара Рустамова
2 weeks ago 00:49:36 1
Вакарчук, Макаревич, Арбенина. Как музыканты пытались остановить войну, но из этого ничего не вышло
3 weeks ago 00:16:37 1
[Хроники StarCraft] Как проходит РЕСОЦИАЛИЗАЦИЯ МОРПЕХОВ?
3 weeks ago 00:13:56 1
Евгений Пригожин рассказывает о лжи мо рф.
3 weeks ago 00:05:34 1
Зомби-апокалипсис в Minecraft (Сборка)
3 weeks ago 00:48:28 3
Это роковое интервью с прогнозами на 2025 год стало для Скотта Беннета последним!
3 weeks ago 02:40:06 1
НОВОГОДНИЙ СТРИМ ПО БЛЕК РАШЕ! ОБНОВА ВЫШЛА НА BLACK RUSSIA! ПУТЬ БОМЖА НА БЛЕК РАША
4 weeks ago 00:19:52 14
Падал прошлогодний снег. Советский пластилиновый мультфильм (1983)
4 weeks ago 00:05:56 1
Прогноз от lee на январь 2025
4 weeks ago 01:47:20 1
СУБСТАНЦИЯ - СОЦИАЛЬНАЯ КОМЕДИЯ С ДЕМИ МУР. НЕПОПУЛЯРНОЕ МНЕНИЕ О НАШУМЕВШЕМ ФИЛЬМЕ
4 weeks ago 00:42:30 1
35 НОВЫХ ВЫЖИВАЛОК которые УЖЕ ВЫШЛИ в 2024
4 weeks ago 00:13:40 1
Вкратце про AWARIA | ГАЙД НА ГАРЕМ ИЗ ДУХОДЕВОК
1 month ago 00:30:24 1
Когда Электричество Выходит Из-под Контроля
1 month ago 00:39:50 1
мои американские одногруппники пробуют РУССКИЙ ШКОЛЬНЫЙ ОБЕД...
1 month ago 00:04:51 1
Жид Медведь забивает битой фашиста “Бесславные ублюдки“ отрывок из фильма
1 month ago 00:12:02 1
Обращение краснодарцев на прямую линию президента!