Netflix выложила первую AI-модель в открытый доступ — и она стирает объекты из видео
Netflix опубликовала VOID на HuggingFace — модель для удаления объектов из видео с учётом физики. Первый публичный AI-релиз стримингового гиганта.
Когда Netflix появляется на HuggingFace — это замечают. Стриминговый гигант, который годами держал свои AI-разработки за закрытыми дверями, впервые опубликовал модель в открытый доступ. И она делает кое-что необычное: стирает объекты из видео так, будто их никогда не было.
Что умеет VOID
VOID расшифровывается как Video Object and Interaction Deletion — удаление объектов и их взаимодействий из видеоряда. Модель построена на базе CogVideoX-Fun-V1.5-5b-InP и дообучена для видеоинпейнтинга с так называемым quadmask conditioning — системой четырёхзначных масок.
Ключевое отличие от существующих решений — VOID учитывает физику. Традиционные методы вроде Omnimatte или ProPainter справляются с «фотометрическими» эффектами: тенями, отражениями. Но если человек сидит на стуле и вы удаляете стул, предыдущие модели оставляли человека висящим в воздухе. VOID понимает физические взаимодействия между объектами и корректно перестраивает сцену.
Для Netflix это не академический эксперимент. Студия ежегодно работает с тысячами часов видеоконтента, и возможность чисто удалять нежелательные объекты — от случайных логотипов до элементов, требующих лицензирования — имеет прямую практическую ценность.
Почему это неожиданно
Netflix — одна из немногих крупных технологических компаний, которые до сих пор не выходили на рынок open-source AI. Google открывает Gemma, Meta — Llama, Microsoft поддерживает десятки открытых проектов. Netflix же традиционно использовала AI внутри — для рекомендательных алгоритмов, оптимизации стриминга, персонализации превью.
Публикация VOID на HuggingFace — сигнал о том, что компания готова делиться наработками с сообществом. Пост на Reddit собрал более 1500 голосов, а комментарии варьируются от восторга до обсуждения того, как модель можно применить в инди-кинопроизводстве.
Кому это нужно
Прежде всего — видеопродакшену. Удаление нежелательных объектов из отснятого материала — рутинная задача, которая сейчас решается либо вручную в After Effects, либо через дорогие специализированные сервисы. Открытая модель от Netflix снижает порог входа до уровня «скачал и запустил».
Для исследовательского сообщества VOID интересна подходом к физическому моделированию. Quadmask conditioning — это относительно новая техника, и открытый доступ к обученной модели позволит другим командам развивать это направление.