Голос Геральта надеется, что индустрия решит проблемы использования ИИ-озвучки
Озвучивание при помощи нейросетей — горячая тема как в России, так и за рубежом. Сайт IGN обсудил её с американским актёром Дагом Коклом (Doug Cockle), который исполнил роль Геральта в трилогии «Ведьмак» и грядущем мультфильме The Witcher: Sirens of the Deep.
По мнению Кокла, искусственный интеллект станет значимой частью игровой индустрии, однако с ним связаны этические вопросы:
Внедрение ИИ неизбежно, и разработчики будут его использовать. Мы не знаем точно, к чему это приведёт. ИИ уже применяется в разных ситуациях — с его помощью озвучивают массовку, NPC и всё такое. Очень жаль, ведь когда-то всё это озвучивали люди, а голоса ИИ смоделированы на основе человеческих. То есть кто-то взял чей-то голос, внёс его в свою базу данных, оцифровал и с его помощью говорит то, что сам человек никогда не говорил. В этом есть что-то неэтичное, поэтому тема активно обсуждается.
Кокл также отметил, что всякий раз, когда кто-то применяет синтезированные голоса, актёры лишаются дохода. Кроме того, нейросети становятся инструментом в руках злоумышленников:
Кто-нибудь может использовать ИИ, чтобы сказать голосом Геральта — моим голосом — что-то расистское или противоречащее общепринятым нормам. Вот тут ИИ становится опасным. Фейковые новости, ложные новости, ложные мнения… Мы уже с этим сталкиваемся в политике. Это выкладывают люди, так что проблема не в ИИ, а в людях, которые им пользуются.
К тому же со временем многое изменилось. Когда вышла The Witcher 3, вряд ли те, кто играл в игры… Не то чтобы им было неинтересно, но они не особо задумывались о людях, которые озвучивают персонажей. Эта тема не привлекала большого внимания. Но с тех пор я замечаю, что игроки и фанаты всё чаще интересуются теми, кому принадлежат эти голоса. Это прекрасно, но в результате голоса стали куда сильнее ассоциироваться с людьми. Это не просто голос Геральта — это мой голос.
Даг Кокл рассчитывает, что компании, которые занимаются нейросетями, будут сотрудничать с актёрами и защищать их интересы. В частности, артисты имеют право знать, как их голоса применяются в модах, полагает Кокл.
…Мы должны позволить актёрам контролировать использование их голосов. Я общался с несколькими разработчиками ИИ, которые заинтересованы в чём-то подобном. То есть люди знают о возможной проблеме и работают над решением, которое всех устроит.
Потому что, на мой взгляд, моддеры — молодцы. Дело не в том, что я хочу их наказать. Обычно они делают интересные, классные фанатские вещи, которые отдают дань уважения их любимым мирам, и это достойно похвалы. Но надо провести черту, и дискуссии вокруг ИИ вынуждают индустрию крепко задуматься над тем, где же проходит эта черта.
Нейросетевая озвучка в играх — уже не фантазия и не прогноз, а реальность. Так, синтезированными голосами говорят комментаторы в онлайн-шутере THE FINALS. А команда CD Projekt RED прибегла к помощи нейросети, чтобы записать реплики одного из NPC для Cyberpunk 2077: Phantom Liberty, — актёр, озвучивший персонажа в основной кампании, ушёл из жизни.
Лучшие комментарии
Человек обеспокоен проблемами и готов к дискуссии об их решении = Противник прогресса
Логика — моё почтение. /s
Пародисты голосов, заполонившие снгшное тв в 200х годах, смотрят на ситуацию с непониманием.
В целом согласен с Коклом.
Вообще, считаю внедрение ИИ в геймдев позитивным ключом. Важная задача сейчас, постараться максимально грамотно узаконить использование нейросетей, таким образом, что бы ничьи права не нарушались.
Выглядит интересно, также с той точки зрения, что можно воскрешать голоса уже ушедших актёров. Допустим, если разработчики хотели расширить чью- то сюжетную арку или сделать реткон. Разумеется с согласия семьи погибшего.
P.S Я понимаю некоторый хейт в сторону нейросетей. Работы отбирают, зарплаты актерам меняют. Такогово будущее, мир на месте не стоит. Человечество уже десяток лет боится, что их роботами заменят.
А в эпоху индустриализации сколько фермеров боялись что потеряют работу?
Однако, она создала много рабочих мест. Может и нейросети расширят текущие вакансии, понадобятся новые специалисты, инженеры.
Время покажет. Поживём, увидим.
На западе тоже можно будет спамить так — поскольку удачи это адекватно зарегулировать. Давно уже показано, что как только рисуют черту, сразу же начинается поиск конкретного атома, где эта черта заканчивается.
Как пример — возьмут пародиста, запишут с него образцы, натренируют нейронку и начнут озвучивать. Запретить схожий голос иметь нельзя же. Бонусные поинты за подмешивание образцов из фраз оригинала и последующим удалением всего обучающего датасета.
А читать новость от жалких мешков с костями принципы не позволяют?
имхо можете минусить сколько угодно но как по мне лучше ИИ озвучка чем слышать одни и те же голоса каждый озвучивающий по 33 персонажа в большой рпг
В целом согласен. В конце-концов для визуальных образов сейчас действует такое же правило — не получил согласия актёра, не можешь использовать. Другой вопрос, что таки да — надо определить ту черту, где начинается просто похожий голос, а не копия. С нейросетями это будет не так просто.
Тяжело жить в мире, где все слова употребляются и воспринимаются в прямом значении
Энтузиасты уже пытаются интегрировать возможности нейросетей в игры.
Одной из таких попыток является компаньон для Skyrim под именем Herika. Даже в своей текущей форме она уже способна вести осмысленные диалоги с игроком, реагировать на окружение вокруг себя и пытаться проявлять некую самостоятельность.
Хочется чтобы в эту сторону развивались игры. Чтобы они не просто бесконтрольно расли в масштабе продолжая быть заселенными всё теми же безмозглыми болванчиками.
А и правда. Подумаешь, найти работу по специальности будет в 100 раз сложнее. Но ведь всё ещё теоретически возможно! Чего волноваться?
Так у нас пытаются уже это зарегулировать, актёрам за образцы голоса хотят платить отчисления с использования.
Думаю в этом вопросе все довольно однозначно: копировать голоса людей без их согласия путем тренировки нейронки на их записях — нельзя. Создавать обезличеный голос на основе сотен записей от людей давших на это согласие — можно.
Все компании которые твердят что ваш голос не уникален и отличие в 100 герц по частотам уже будет новым голосом просто пытаются нажиться на вашем труде(знаем мы одну такую контору). По сути голос это тоже биометрические данные и их подделка наказуема. С отпечатками нельзя просто так взять, скопировать чей-то скан и передвинуть загазулинку на один пиксель и говорить что это чужой отпечаток, который все же будет открывать доступ.
Это сейчас они добавляют существующие, а потом на основе существующих будут делать новые, или озвучивать голосами тех кто умер, к этому претензий то у них не будет? А дальше то ещё хуже будет, ИИ будет настолько быстро и хорошо озвучивать, что будь у живых актёров хоть трижды крутой талант, они попросту будут не нужны.
Врятли они исчезнут из профессии. Так и про радио, и про газеты, и про театр говорили, что то всё пропадёт. Но нет)
В СНГ, конечно, бесспорно можно спамить ИКСДИДИДИ, но на Западе при юридической регулировке подобной деятельности — задрочат исками.
Для Arma 3 есть мод в разработке, где NPC способны распознавать голосовые команды и отвечать.
Ну да, конечно, рей трейсинг это развод. И попиксельное затенение это буржуастская технология, и ембиентная оклюзия чисто чтобы углы затенять, подповерхстное рассеивание вообще нужно чисто чтобы пре рендеры делать, а не в игрульках ваших этих. О, и ПБР тоже зря разрабатывали, нормально же раньше освещение запекали и жили же как- то люди.
Короче айда лет на 25 по технологиям назад откатимся, вот тогда и игры лагать не будут и ведро с гайками свое каждые 3-4 года обновлять не надо будет.
Касаемо использования чужих голосов — программист может взять собственный голос и на его основе сделать несколько разных голосов для озвучивания NPC. Сэкономив денег на второстепенных актёрах озвучки, можно направить их на более полезное направление, например отдел тестирования.
Нейросети и ИИ озвучка в целом могут помочь сделать миры в играх более живыми. Чтобы NPC статисты могли сказать игроку нечто большее чем пару стандартных реплик.