Sony запатентовала систему автоматического липсинка для локализаций в играх

Максим Многословный 25 марта 2025 21:49 24

Sony, как оказалось, зарегистрировала патент на систему синхронизации губ для NPC в видеоиграх. Как обратили внимание СМИ, технология под названием Translation Language Evaluation Device обещает автоматизировать процесс адаптации анимации рта под разные языки. Сама Sony отмечает в патенте: «Когда звук переведённого текста не соответствует движению губ персонажа, игрок или зритель видеопроизведения может испытывать дискомфорт».

Система анализирует движения губ NPC и вычисляет «индекс схожести» с переводом, автоматически корректируя анимацию, чтобы она соответствовала диалогам на любом языке. Например, если перевод затягивает или укорачивает фразу, движок сам подстраивает тайминги и движение губ, сохраняя естественность. Это решает давнюю проблему несоответствия звука и визуала, чем сильно грешила в своё время The Witcher 3: Wild Hunt.

Компания, судя по всему, любит всё патентовать. Достаточно вбить в поиске «Sony запатентовала» и вам попадётся ворох ссылок, включая:

Поэтому неизвестно, будет ли использоваться эта система где-либо. Однако ближайший релиз Sony — ПК-порт The Last of Us Part II Remastered — увидит свет в Steam и EGS третьего апреля с полной русской локализацией.

Другие новости

Комментарии

Потому что они гении оригинальности идей. А завистникам остаётся только кусать локти.
Неужели мы дожили до таких технологий? Неужели теперь не придется подгонять перевод (сокращать его, искажать, портить умышленно) ради дурацкого липсинка и таймсинка?
Играл в Хорайзен, и для меня там было всё стандартно. Но я и революционную систему повреждений в Dead Island 2 не видел, и бой с паркуром от шефповара в Dying Light 2. Оно немного другое и всё.
Возможно это мои галлюцинации, но разве не во всех играх рот открывается именно под слова, чтобы форма рта подходила под каждое слово? Потому, что мимика рта разных персонажей в разной озвучке разная. И если все же это не так, то смысл их пантента нулевой, потому, что всё равно есть ощущение что они говорят слова открывая рот, а не просто открывают для имитации звуков.
А как ты катсцены удлинишь, если постановка кадра и её пролёты под конкретный момент и соответсивенно в этот момент и текст вписан, а у тебя всё еще болтовня до этого идёт?
Все комментарии