25 декабря 2023 25.12.23 45 6784

Голос Геральта надеется, что индустрия решит проблемы использования ИИ-озвучки

Озвучивание при помощи нейросетей — горячая тема как в России, так и за рубежом. Сайт IGN обсудил её с американским актёром Дагом Коклом (Doug Cockle), который исполнил роль Геральта в трилогии «Ведьмак» и грядущем мультфильме The Witcher: Sirens of the Deep.

По мнению Кокла, искусственный интеллект станет значимой частью игровой индустрии, однако с ним связаны этические вопросы:

Внедрение ИИ неизбежно, и разработчики будут его использовать. Мы не знаем точно, к чему это приведёт. ИИ уже применяется в разных ситуациях — с его помощью озвучивают массовку, NPC и всё такое. Очень жаль, ведь когда-то всё это озвучивали люди, а голоса ИИ смоделированы на основе человеческих. То есть кто-то взял чей-то голос, внёс его в свою базу данных, оцифровал и с его помощью говорит то, что сам человек никогда не говорил. В этом есть что-то неэтичное, поэтому тема активно обсуждается.
 

Тизер The Witcher: Sirens of the Deep. Релиз картины намечен на конец 2024-го.

Кокл также отметил, что всякий раз, когда кто-то применяет синтезированные голоса, актёры лишаются дохода. Кроме того, нейросети становятся инструментом в руках злоумышленников:

Кто-нибудь может использовать ИИ, чтобы сказать голосом Геральта — моим голосом — что-то расистское или противоречащее общепринятым нормам. Вот тут ИИ становится опасным. Фейковые новости, ложные новости, ложные мнения… Мы уже с этим сталкиваемся в политике. Это выкладывают люди, так что проблема не в ИИ, а в людях, которые им пользуются.

К тому же со временем многое изменилось. Когда вышла  The Witcher 3, вряд ли те, кто играл в игры… Не то чтобы им было неинтересно, но они не особо задумывались о людях, которые озвучивают персонажей. Эта тема не привлекала большого внимания. Но с тех пор я замечаю, что игроки и фанаты всё чаще интересуются теми, кому принадлежат эти голоса. Это прекрасно, но в результате голоса стали куда сильнее ассоциироваться с людьми. Это не просто голос Геральта — это мой голос.
 

Шедевральный трейлер «Ведьмака 3».

Даг Кокл рассчитывает, что компании, которые занимаются нейросетями, будут сотрудничать с актёрами и защищать их интересы. В частности, артисты имеют право знать, как их голоса применяются в модах, полагает Кокл.

…Мы должны позволить актёрам контролировать использование их голосов. Я общался с несколькими разработчиками ИИ, которые заинтересованы в чём-то подобном. То есть люди знают о возможной проблеме и работают над решением, которое всех устроит.

Потому что, на мой взгляд, моддеры — молодцы. Дело не в том, что я хочу их наказать. Обычно они делают интересные, классные фанатские вещи, которые отдают дань уважения их любимым мирам, и это достойно похвалы. Но надо провести черту, и дискуссии вокруг ИИ вынуждают индустрию крепко задуматься над тем, где же проходит эта черта.

Нейросетевая озвучка в играх — уже не фантазия и не прогноз, а реальность. Так, синтезированными голосами говорят комментаторы в онлайн-шутере  THE FINALS. А команда CD Projekt RED прибегла к помощи нейросети, чтобы записать реплики одного из NPC для  Cyberpunk 2077: Phantom Liberty, — актёр, озвучивший персонажа в основной кампании, ушёл из жизни.


Поддержи Стопгейм!

Лучшие комментарии

Человек обеспокоен проблемами и готов к дискуссии об их решении = Противник прогресса

Логика — моё почтение. /s

Пародисты голосов, заполонившие снгшное тв в 200х годах, смотрят на ситуацию с непониманием.

В целом согласен с Коклом.

Вообще, считаю внедрение ИИ в геймдев позитивным ключом. Важная задача сейчас, постараться максимально грамотно узаконить использование нейросетей, таким образом, что бы ничьи права не нарушались.

Выглядит интересно, также с той точки зрения, что можно воскрешать голоса уже ушедших актёров. Допустим, если разработчики хотели расширить чью- то сюжетную арку или сделать реткон. Разумеется с согласия семьи погибшего.

P.S Я понимаю некоторый хейт в сторону нейросетей. Работы отбирают, зарплаты актерам меняют. Такогово будущее, мир на месте не стоит. Человечество уже десяток лет боится, что их роботами заменят.

А в эпоху индустриализации сколько фермеров боялись что потеряют работу?

Однако, она создала много рабочих мест. Может и нейросети расширят текущие вакансии, понадобятся новые специалисты, инженеры.

Время покажет. Поживём, увидим.

На западе тоже можно будет спамить так — поскольку удачи это адекватно зарегулировать. Давно уже показано, что как только рисуют черту, сразу же начинается поиск конкретного атома, где эта черта заканчивается.

Как пример — возьмут пародиста, запишут с него образцы, натренируют нейронку и начнут озвучивать. Запретить схожий голос иметь нельзя же. Бонусные поинты за подмешивание образцов из фраз оригинала и последующим удалением всего обучающего датасета.

А читать новость от жалких мешков с костями принципы не позволяют?

имхо можете минусить сколько угодно но как по мне лучше ИИ озвучка чем слышать одни и те же голоса каждый озвучивающий по 33 персонажа в большой рпг

…Мы должны позволить актёрам контролировать использование их голоса.

В целом согласен. В конце-концов для визуальных образов сейчас действует такое же правило — не получил согласия актёра, не можешь использовать. Другой вопрос, что таки да — надо определить ту черту, где начинается просто похожий голос, а не копия. С нейросетями это будет не так просто.

Тяжело жить в мире, где все слова употребляются и воспринимаются в прямом значении

Энтузиасты уже пытаются интегрировать возможности нейросетей в игры.

Одной из таких попыток является компаньон для Skyrim под именем Herika. Даже в своей текущей форме она уже способна вести осмысленные диалоги с игроком, реагировать на окружение вокруг себя и пытаться проявлять некую самостоятельность.

Хочется чтобы в эту сторону развивались игры. Чтобы они не просто бесконтрольно расли в масштабе продолжая быть заселенными всё теми же безмозглыми болванчиками.

А и правда. Подумаешь, найти работу по специальности будет в 100 раз сложнее. Но ведь всё ещё теоретически возможно! Чего волноваться?

Так у нас пытаются уже это зарегулировать, актёрам за образцы голоса хотят платить отчисления с использования.

Думаю в этом вопросе все довольно однозначно: копировать голоса людей без их согласия путем тренировки нейронки на их записях — нельзя. Создавать обезличеный голос на основе сотен записей от людей давших на это согласие — можно.

Все компании которые твердят что ваш голос не уникален и отличие в 100 герц по частотам уже будет новым голосом просто пытаются нажиться на вашем труде(знаем мы одну такую контору). По сути голос это тоже биометрические данные и их подделка наказуема. С отпечатками нельзя просто так взять, скопировать чей-то скан и передвинуть загазулинку на один пиксель и говорить что это чужой отпечаток, который все же будет открывать доступ.

Это сейчас они добавляют существующие, а потом на основе существующих будут делать новые, или озвучивать голосами тех кто умер, к этому претензий то у них не будет? А дальше то ещё хуже будет, ИИ будет настолько быстро и хорошо озвучивать, что будь у живых актёров хоть трижды крутой талант, они попросту будут не нужны.

Врятли они исчезнут из профессии. Так и про радио, и про газеты, и про театр говорили, что то всё пропадёт. Но нет)

В СНГ, конечно, бесспорно можно спамить ИКСДИДИДИ, но на Западе при юридической регулировке подобной деятельности — задрочат исками.

Для Arma 3 есть мод в разработке, где NPC способны распознавать голосовые команды и отвечать.

Ну да, конечно, рей трейсинг это развод. И попиксельное затенение это буржуастская технология, и ембиентная оклюзия чисто чтобы углы затенять, подповерхстное рассеивание вообще нужно чисто чтобы пре рендеры делать, а не в игрульках ваших этих. О, и ПБР тоже зря разрабатывали, нормально же раньше освещение запекали и жили же как- то люди.

Короче айда лет на 25 по технологиям назад откатимся, вот тогда и игры лагать не будут и ведро с гайками свое каждые 3-4 года обновлять не надо будет.

Касаемо использования чужих голосов — программист может взять собственный голос и на его основе сделать несколько разных голосов для озвучивания NPC. Сэкономив денег на второстепенных актёрах озвучки, можно направить их на более полезное направление, например отдел тестирования.

Нейросети и ИИ озвучка в целом могут помочь сделать миры в играх более живыми. Чтобы NPC статисты могли сказать игроку нечто большее чем пару стандартных реплик.

Читай также