29 февраля 2016 29.02.16 1 3112

История «частоты кадров»

+1

Всем привет. Сегодня Джон Хесс, один из создателей сайта FilmmakerIQ.com, расскажет Вам историю «частоты кадров» в кино от ранних немых фильмов до современного телевидения. Перевод выполнен субтитрами.

 

Все что в примечаниях — это дополнительная информация, не присутствующая в оригинальном видео. Гифки под спойлерами присутствуют в оригинальном видео.

Добро пожаловать на Filmmaker IQ.com. Я Джон Хесс StopGame.ru. Я sanek_gl, и сегодня мы окунемся в историю «частоты кадров» (англ. frame rate).

Частота кадров (также кадровая частота, частота кадросмен) – количество сменяемых кадров за единицу времени в телевидении и кинематографе. Единица измерения – кадры в секунду или Гц.
Кадр (также в данном значении кадрик) – одно отдельное неподвижное изображение на киноплёнке.

Иллюзия движения
Давайте проясним основную истину о кино. Все в кино не настоящее. Декорации фальшивые, актеры притворяются и говорят заученные строки, написанные для них, даже само определение «фильм» (англ. motion picture) – ложь.

Фильм (также кинофильм, кино, телефильм, кинокартина) – в техническом плане представляет собой совокупность движущихся изображений (монтажных кадров), связанных единым сюжетом.

В нем ничего не движется, это все оптическая иллюзия.

Возьмем для примера это вращающееся кольцо из кругов – кажется, что оно вращается по часовой стрелке, но если мы сравним каждый кадр этой анимации, мы увидим, что на самом деле ничего не двигается. Мы просто последовательно выключаем круги, но когда мы быстро переключаем эти изображения одно за другим, наш мозг создает ощущение движения. Это называется «фи-феноменом» (англ. phi phenomenon), впервые описанным Максом Вертгеймером в «гештальт-психологии» в 1912 году.

Фи-феномен – это оптическая иллюзия, заключающаяся в восприятии серии быстро сменяющихся изображений, как движущиеся.
Гештальт-психология – школа психологии начала XX века, основанная Максом Вертгеймером в 1912 году.

Человеческий мозг может воспринять около 10-12 разных кадров в секунду. Быстрее чем это и наш мозг объединит изображения в движение. Итак, мы нашли нашу первую частоту кадров – что-нибудь выше, чем 12 кадров в секунду. Просто, да? Что ж не спешите…

Из-за пленки нам необходимо останавливать проецирование, выключать свет, пока меняется кадр, иначе получиться размытое изображение.

Проецирование без выключения света

Но воспроизведение при 12 кадрах в секунду, с 12 черными кадрами между ними, как требовалось для пленки, создавало недопустимое число мерцаний (англ. flicker).

Как быстро надо переключать изображения на экране, чтобы мерцание пропало? По словам Томаса Эдисона – волшебное число – 46 раз в секунду. На 46 кадрах в секунду появляется «инерция зрения» и мы не заметим, как темнеет экран между каждым кадром.

Инерция зрения – это способность глаза соединять быстро сменяющиеся изображения в одно — неподвижное.

Но 46 кадров в секунду означает то, что Вам необходимо использовать много пленки, а она не дешевая. Киномеханики пришли к уникальному решению – давайте покажем один и тот же кадр на экране больше одного раза.

Используя двух- или трехлопастные «обтюраторы» (англ. shutter), Вы можете поднять частоту кадров без использования большего количества пленки.

Обтюратор — механическое устройство для периодического перекрывания светового потока. Представляет собой вращающийся секционированный диск, конус, цилиндр либо двигающуюся возвратно-поступательно шторку.

Воспроизведя кино при 16 кадрах в секунду, используя трехлопастной «обтюратор», мы покажем каждый кадр три раза, получив в общем 48 кадров в секунду – чуть выше рекомендации Эдисона. И вот он наш первая широко используемая частота кадров для немого кино – 16 кадров в секунду. Или около того. Несогласованность частот кадров немого кино сводит с ума кино-историков и сотрудников архивов кинопленки. В камерах и проекторах начала 20го века пленка проматывалась в ручную, и кинематографисты могли ускорять или замедлять камеру для эффекта.

Undercrank (или замедленная киносъёмка) — киносъёмка с частотой, меньшей стандартной частоты съёмки и проекции. Когда полученное изображение проецируется с нормальной частотой, движение объектов съёмки на экране выглядит ускоренным.
Overcrank (или ускоренная съемка) — киносъёмка с частотой, большей стандартной частоты съёмки и проекции. Когда полученное изображение проецируется с нормальной частотой, движение объектов съёмки на экране выглядит замедленным.

Д. У. Гриффит получил дурную славу из-за того, что замедлял пленку когда снимал, снимая медленнее 12 кадров в секунду. Даже Эдисон игнорировал свои рекомендации. Киномеханики также воспроизводили кино быстро и теряли частоту кадров, иногда воспроизводя быстрее, чтобы они могли впихнуть еще один показ в конце дня.

Во времена немого кинематографа кинопроекторы оснащались примитивными стабилизаторами скорости, и проекция фильма часто происходила с частотой, превышающей частоту съёмки. Эта частота выбиралась киномехаником самостоятельно, исходя из «темперамента» публики. Роль человека, вращавшего ручку кинопроектора на заре кинематографа считалась не менее важной, чем роль создателей фильма: подбор темпа проекции также считался искусством. Для более спокойных зрителей выбиралась скорость 18—24 кадров в секунду, а для «живой» публики фильм ускорялся до 20—30 кадров в секунду. После окончания Первой Мировой войны в европейских кинотеатрах наметилась тенденция показа фильмов с увеличенной частотой. Это объяснялось коммерческими соображениями кинопрокатчиков, стремившихся укоротить киносеансы и увеличить их количество. В некоторых случаях демонстрация происходила со скоростью более 50 кадров в секунду, совершенно искажая движение на экране. В Германии даже было выпущено специальное постановление полиции о недопустимости повышения частоты проекции выше стандартной.

На самом деле, частота кадров немого кино варьировалась от 14 до 26 кадров в секунду, но это было нормально, так как, на самом деле, это не разрушало эффект движения в кино. Так было до тех пор, пока в кино не появился звук.

Звук стандартизировал «частоту кадров»
Введение звука стало одним из самых решительных, технологических и художественных изменений в истории кино.

Из-за того что звук записывался на оптической дорожке, расположенной на пленке, запись и воспроизведение фильмов должно быть на строгой и определенной частоте кадров – и эта частота кадров была международно установлена в 1929 году, как 24 кадра в секунду. Почему 24? Ну они поняли, что аудио дорожка не обладает достаточной точностью на системе 16 кадров в секунду. Используя 48 проецируемых кадров как цель, они перешли к следующему коэффициенту – 24 кадров в секунду, при проецировании используя двухлопастной «обтюратор», чтобы оставить желаемые 48 проецируемых кадров в секунду. Почему 24, а не 23 или 25? Ну, это сводиться к основам математики. 24 это число, которое можно легко разделить на 2, 3, 4, 6 и 8. Так что монтажер мог быстро узнать, что полсекунды — это 12 кадров. Треть – 8 кадров, четверть – 6 кадров и так далее. Почему не выше, например 30 или 32, которые обладают такими же коэффициентами? Как я сказал раньше, пленка не дешевая. 24 кадра было самое маленькое легко делимое число, которое работало со звуком. По иронии, необходимость в точных 24 кадрах в секунду создало проблем в звуковом отделе. Первые звуковые камеры из-за их вращающихся моторов были очень шумными – заставляли операторов снимать из звуконепроницаемых будок через окно. Технологии и дизайн в итоге развились, но частота 24 кадра в секунду до сих пор используется – почти культурно укоренившись в то, что мы ожидаем от «кинематографичности».

Электронные «частоты кадров»
У телевизоров тоже была проблема с мерцанием, которая досаждала пленочные фильмы – но показ одного и тог же кадра на экране не был способом, который можно было технически осуществить. Инженеры больше беспокоились о «полосе пропускания» (англ. bandwidth).

Полоса пропускания (прозрачности) — диапазон частот, в пределах которого амплитудно-частотная характеристика (АЧХ) акустического, радиотехнического, оптического или механического устройства достаточно равномерна для того, чтобы обеспечить передачу сигнала без существенного искажения его формы.

Решение было найдено независимо в Германии инженером Telefunken Фрицом Шрётером в 1930 году и в США инженером RCA Ричардом Баллардом в 1932 году.

Telefunken (первое название нем. Telefunken Gesellschaft für drahtlose Telegraphie m.b.H) — немецкая промышленная компания, которая известна, прежде всего, как производитель теле- и радиооборудования, средств связи, основанная в 1903 году.
RCA (англ. Radio Corporation of America) — американская компания, существовавшая с 1919 по 1986 гг.

Чтобы сохранить «полосу пропускания» и избежать мерцания – каждый кадр необходимо подвергнуть «чересстрочной развертке» (англ. interlaced) — это когда каждый кадр разбивается на два переменяющихся поля – верхнее и нижнее поле.

Развертка (или растровая развёртка, телевизионная развёртка, телевизионный растр) — перемещение развёртывающего элемента в процессе анализа или синтеза изображения по определённому периодическому закону. В процессе передачи оптическое изображение преобразуется при помощи развёртки в видеосигнал, а в процессе приёма полученный сигнал преобразуется обратно в изображение. Главная область применения растровой развёртки — телевидение, поэтому она часто называется телевизионной, хотя используется также для отображения информации компьютеров и радиолокационных станций.
В телевизионном вещании существует два вида развертки: чересстрочная и построчная.
Чересстрочная развёртка (англ. Interlaced Video) — метод телевизионной развёртки, при котором каждый кадр разбивается на два полукадра (или поля), составленные из строк, выбранных через одну. В первом поле развёртываются и воспроизводятся нечётные строки, во втором — чётные строки, располагающиеся в промежутках между строками первого поля. После окончания развёртки второго поля луч возвращается в точку, соответствующую началу развёртки первого поля, и т. д. Обозначается буквой i. Например, 480i (480 строк (240 строк – верхнее поле, 240 – нижнее поле), чересстрочная развертка), 1080i (1080 строк (540 строк – верхнее поле, 540 – нижнее поле), чересстрочная развертка).
Построчная развертка (или прогрессивная развертка (англ. Progressive scanning или noninterlaced scanning) — метод телевизионной развёртки, при котором для отображения, передачи или хранения движущихся изображений все строки каждого кадра отображаются последовательно. Обозначается буквой p. Например, 720p (720 строк, построчная развертка), 1080p (1080 строк, построчная развертка).

 

Чересстрочная развертка-слева. Построчная развертка — справа.

Каждое поле создавалось на экране одно за другим, как решетка. Для того чтобы избежать «интермодуляции» — или искажения, вызванного помехами, созданными электрическим током, частота обновления была установлена к частоте переменного тока – в США 60 Гц, так что каждое поле создавалось на одну шестидесятую секунды, получая частоту 30 кадров в секунду.

Интермодуляция — это процесс взаимодействия нескольких различных сигналов в нелинейных каскадах радиоприёмного тракта. В результате возникают новые составляющие спектра, зашумляющие принимаемый сигнал (либо проявляющиеся в качестве зеркального сигнала).

Но история становиться сложнее с появлением цвета. В 1948 году FCC выдвинула мораторий на лицензии к новым телевизионным трансляциям, так как пыталась понять, что делать с новым доступным «дециметровыми волновым» спектром.

Федеральная комиссия по связи (Federal Communications Commission, сокращённо FCC) — агентство, учрежденное Актом Коммуникаций 1934 года как преемник Федеральной Радио комиссии и уполномочен регулировать использование всего радио-спектра, не принадлежащего федеральному правительству (включая радио и радиовещание телевидения), и всей межгосударственной телесвязи (телефон, спутник и телеграф), а также все международные коммуникации, которые происходят или заканчиваются в Соединённых Штатах.
Дециметро́вые во́лны (ДМВ, UHF) — частотный диапазон электромагнитного излучения, радиоволны с длиной волны от 10 см до 1 м, что соответствует частоте от 300 МГц до 3 ГГц (ультравысокие частоты, УВЧ).

Идея была в том, чтобы ввести новую систему цвета, использующую эту высокочастотную «полосу пропускания», и позволить «метровым волновым» каналам, которые принимались старыми телевизорами, загнуться.

Метровые волны (МВ, VHF) — частотный диапазон электромагнитного излучения, радиоволны с длиной волны от 1 до 10 м, что соответствует частоте от 30 до 300 МГц .

Пока они пытались понять, как это сделать, продажи телевизоров взлетели до небес – от 1 миллиона проданных телевизоров до чуть более 10 миллионов в течении нескольких лет. Идея дать старым МВ ТВ станциям загнуться стала непрактичной. И теперь, все пытались быстро создать цветовой стандарт, который был бы совместим со старым черно-белым телевизором.

NTSC, отделение создавшее первый телевизионный стандарт в США, объединившись с RCA, стали первыми, используя систему, впервые изложенную Жоржем Валенси в 1938 году.

NTSC (англ. National Television Standards Committee — Национальный комитет по телевизионным стандартам) — система аналогового цветного телевидения, разработанная в США, названая по названию комитета, на котором была определена.

Разбивая изображение на «сигнал яркости» (англ. luminance) и «цветоразностный сигнал» (англ. chrominance), передатчик мог вставлять цветовой сигнал как «поднесущий» (англ. subcarrier) в телевизионном сигнале.

Сигнал яркости – сигнал, соответствующий черно-белому изображению.
Цветоразностный сигнал – сигнал, несущий информацию о синем и красном цвете.
Поднесущий сигнал – сигнал, передающийся в спектре основного сигнала, несущий дополнительную информацию.

Новые цветные телевизоры могли принимать и использовать этот цветной сигнал, который просто игнорировался старыми черно-белыми телевизорами. Пока все было в порядке – но была маленькая проблема. «Полоса пропускания» используемая цветным сигналом возможно мешала аудио сигналу, создавая «интермодуляционные» помехи. Решение было в том, чтобы уменьшить частоту кадров на 0.1% (0,001), фазируя сигналы цвета и звука так, чтобы они никогда полностью не совпадали. В декабре 1953 года, FCC адоптировала систему RCA для цветного вещания, и мы получили из 60 полей в секунду – 59,94 поля в секунду – для действительных 29,97 полных кадров в секунду. В математически остроумном способе создания сигнала для двух – цветных и черно-белых – телевизоров, у нас есть эта странная частота кадров, которая до сих пор играет большую роль в современных стандартах телевещания. Но это только если Вы живете в стране, использующей стандарт NTSC. В 1963 году в Германии производитель телевизоров Telefunken выпустил PAL, для Европейского вещательного союза, с постоянными вещаниями в PAL, начиная с 1967 года. PAL был форматом, разработанным для того, чтобы решить проблемы с цветом, досаждавшие NTSC и работала бы с переменным током в 50 Гц, использующимся в Европе и в некоторых других местах в мире. PAL, наравне с похожим форматом SECAM, работал при 50i получая действительных 25 кадров в секунду.

PAL (англ. Phase Alternating Line — построчное изменение фазы) — система аналогового цветного телевидения, разработанная инженером немецкой компании «Telefunken» Вальтером Брухом и принятая в качестве стандарта телевизионного вещания в 1966 году в Германии, Великобритании и ряде других стран Западной Европы.
SECAM (от фр. Séquentiel couleur avec mémoire, позднее Séquentiel couleur à mémoire — последовательный цвет с памятью) – система аналогового цветного телевидения, разработка которой началась во Франции в конце 1950-х годов.

Преобразование видео с пленки в телевизионный стандарт
Итак, как нам поместить киношные 24 кадра в секунду в видео поток 60i, чтобы, например, посмотреть фильмы по телевидению? Давайте пройдемся по процессу – Сперва фильм с частотой 24 кадра в секунду замедляется на 0.1% давая нам 23,976 кадров в секунду. Теперь, когда мы посчитаем, мы узнаем, что нам надо поместить 4 кадра из 23,976 в 5 кадров 29,97. Мы делаем это, разделив кадры на поля, используя «преобразование 3:2» (англ. 3:2 pulldown).

Первый кадр захватывается на три поля – верхнее, нижнее и затем верхнее поле – это полтора кадра. Потом следующий кадр захватывается на следующие два поля – нижнее поле и затем верхнее. Следующий кадр захватывался на нижнее, потом следующее верхнее и нижнее, и последний кадр захватывался на верхнее и нижнее. Итак, у нас 3 поля, 2 поля, 3 поля, 2 поля. 3, 2, 3, 2 и так далее. К несчастью, этот процесс не идеален, приводящий к «гребенке» (англ. Telecine Judders) каждые 3 кадра, которые очень заметны при длинных медленных движениях камеры.

 

Видео с примером «гребенки»

«Обратный телесин» (англ. Reverse Telecine) или «обратное преобразование 3:2» (англ. Reverse 3:2 pulldown) — это технология, которая работает в обратную сторону, создавая естественный 23,976 или 24p видео поток из видео 60i «преобразованного 3:2».

Телесин – процесс преобразования видео с пленки в видео сигнал.

Большинство современных цифровых камер могут полностью избежать «процесса телесина» (англ. Telecine Process) и записывать при частоте кадров 23,976 или точных 24 сразу на жесткий диск, но есть несколько рабочих процессов, которые воспроизводят видео через HDMI кабель, у которого частота 60i, могут использовать «преобразование 3:2». Для «телесина» (англ. Telecine) пленки в 25 кадров в секунду для PAL или SECAM, процесс гораздо проще. Используя «преобразование 2:2» (англ. 2:2 pulldown), видео при 24 кадрах в секунду ускоряется на 4%, и каждый кадр переноситься на два поля – верхнее и нижнее поле.

Увеличение скорости повышает звук на незаметные 0,679 полутона, или чуть больше, чем на четверть «музыкального интервала», но он может быть скорректирован при помощи «питч-шифтера» (англ. pitch-shifter).

Интерва́л (от лат. intervallum — промежуток, расстояние; разница, несходство) в музыке — соотношение между двумя звуками определённой высоты.
Питч-шифтер – звуковой эффект или соответствующее устройство, добавляющее к сигналу его копию, отстоящую от основного тона на любой интервал в пределах двух октав вверх или вниз.

Высокая «частота кадров» для игрового кино
24 кадра являются стандартом игрового кино уже около столетия. Но предприимчивые создатели фильмов пытались увеличить временное разрешение или частоту кадров – пытаясь уменьшить «моушен блюр» для создания более плавной и реалистичной картинки. Один из самых примечательных экспериментов в повышении частоты кадров был «Шоускан» (англ. Showscan) – 70мм формат, разработанный специалистом по спецэффектам Дугласом Трамбалом – который знаменит разработкой большинства спецэффектов для «Космической одиссеи 2001 года» Стэнли Кубрика.

Шоускан — система широкоформатного кинематографа, использующая кинопленку 70-мм (65-мм для изготовления негатива) и отличающаяся от традиционных частотой киносъемки и проекции 60 кадров в секунду. Широкого распространения не получила вследствие несовместимости с оборудованием большинства кинотеатров. Единственным фильмом, в котором часть сцен была снята по такой технологии, стал «Мозговой штурм», но большинство прокатчиков не захотели тратиться на новую технологию проекции, и картина шла в кинотеатрах в обычном виде.

Воспроизведя видео при 60 кадрах в секунду, «Шоускан» создавал сильные «биометрические данные» (англ. biometric response) людей на тестовых показах, но процесс просто не нашел применение в игровом кино – он в основном использовался в аттракционах.

Биометрические данные – это измеримые физиологические или поведенческие данные живого человека.
Аттракционы XD – дополнительная технология, используемая при просмотре полнометражных фильмов. Позволяет просматривать художественные и анимационные фильмы с дополнительным набором спецэффектов, усиливающих впечатления от просмотра и более полного погружения в передачу сюжета.

В последнее время Трамбал работал над цифровым «Шоусканом» — снимая при 120 кадрах в секунду и регулируя воспроизведение от 24 до 120 кадров в зависимости от цели кадра. Но зрители еще не готовы к большой частоте кадров в игровом кино – самым последним экспериментом был «Хоббит» Питера Джексона, показанный при 48 кадрах в секунду. Многие обозреватели жаловались на то, что актеры кажутся слишком легкими и это усугублялось тем, что многие сравнивают с современными спортивными трансляциями или телевизионными программами. Один киномеханик пожаловался на то, что «оно выглядит как «телефильм» (англ. made-for-TV movie)».

Телефильм (телевизионный фильм) — игровой фильм, снятый специально для показа по телевидению. При создании телефильмов учитываются технические возможности телевидения и особенности восприятия телезрителями изображения на экране телевизора.

Но передовые кинорежиссеры, такие как Питер Джексон или Джеймс Кэмерон, до сих пор пытаются поднять частоту кадров. Оставит ли будущее игрового кино 24p позади? Технологии уже здесь – новый стандарт 4К допускает до 120 кадров в секунду. Пока эти высокие частоты кадров могут отлично передать качество спортивных трансляций или отличного 3D, или для видеоигр – для кинорежиссеров есть что-то кинематографическое в частоте 24 кадра в секунду. Все эти недостатки в четкости и «моушен блюр» — это просто то, как мы выросли на просмотрах фильмов. Может быть следующее поколение вырастет на большей частоте кадров и увидит 60p, как новую «кинематографичность» – а может быть и нет. Частота кадров — это инструмент киношной фальши – магический фокус, который позволяет нам войти в мир не очень настоящий, но вполне настоящий. Простое число сформированное психологией, экономикой и умным проектированием – все для того, чтобы рассказывать истории. Так используйте это. Используйте этот инструмент и сделайте что-нибудь великое. Я Джон Хесс и увидимся на FilmmakerIQ.com. Я sanek_gl и увидимся на StopGame.ru


Лучшие комментарии

Читай также