15 апреля 2020 15.04.20 8 1002

Анализ метакритика или какие игры НЕ надо создавать

+1

В общем, я давно хотел внести свой вклад в сообщество стопгейма и решил сделать то, что хоть как-то у меня получается. Здесь я попытаюсь провести анализ игр за последние 30 лет, параллельно создав концепт худшей игры. На протяжении долгих дней я воровал скачивал данные с сайта metacritic и чуть больше времени у меня ушло на сам анализ и подведение итогов(примерно неделя на одну лишь загрузку). Информация бралась с вкладки лучших игр за всё время, а это, на минуточку, практически 18000 игр всех сортов. Большую часть статьи займут различные графики, поскольку я посчитал, что это будет гораздо информативнее(кнопочка с правилами в правом углу говорит мне, что они должны быть в спойлерах).
Я честно пытался проверить, нет ли поста схожего характера на портале, но поиск не дал результатов. Даже если таковой и имеется, то его достаточно трудно найти, поэтому надеюсь эта статья окажется релевантной.

(для юристов отмечу, что все данные находятся в общем доступе, так что технически это не воровство)

Статистика

Начнем пожалуй с самой простой и базовой статистики.

Итого мы имеем: 17847 игр всех мастей, среднее значение в 70% для обеих оценок. Стоит отметить, что если оценка просто отсутствует, то она заменена на 0(если игру никто не оценивал, значит скорее всего игра фиговая и ставить для нее среднее значение в 70% будет нечестно). Для дальнейшей работы мы поделим все игры на две большие категории, с оценками пользователей >70% и <=70%. 10327 и 7320 игр соответственно

Разделив 10327 на 17847 получаем шанс в 57% на то, что наша игра окажется хорошей(ЭТО ТАК НЕ РАБОТАЕТ)
Далее нам потребуется топ жанров по распространенности в видеоигровой сфере с все тем же делением на положительно и отрицательно оцененные игры. Для чистоты эксперимента(топа) я не брал игры с количеством оценок входящих в первый квартиль(25% на первой таблице, <11 другими словами)

На этом моменте мы уже можем заметить первое интересное место. Хоть положительно оцененных игр и больше, самый частый жанр среди плохо оцененных(синий график) на целую тысячу вхождений обгоняет жанр на той же позиции, но на фиолетовом графике. Это говорит нам о том, что игры с положительными отзывами имеют большее разнообразие жанров. Среди всех негативно оцененных игр(7320) 3085 имеют жанр beat-'em-up, берём его за основу.
С этим же делением посмотрим на количество игр от разных компаний:

Не удивляйтесь количеству игр от Telltale, просто на метакритике КАЖДЫЙ эпизод идет как отдельная игра, было бы кстати хорошо, если они и сделают(привет Глеб) нашу игру.

Время покажет

Далее рассмотрим распределение количества игр по дате выхода(можно сразу смотреть по годам):

Конечно же с таким маленьким шагом(день) ничерта не понятно

понятней не стало, идем смотреть по годам

уже лучше

С делением на положительные и отрицательные отзывы:

на 2004, 2009, 2011, 2015 интересные точки

Похоже, что хорошие игры делали всегда, а количество плохих лишь растёт :(

Теперь то же самое, но по жанрам, жанр general был исключен, по причине того, что я не понял его значение:

согласен, больше похоже на хаос

К сожалению, в выборку не попал кризис 80-х и наглядно на него не посмотреть. С другой стороны мы можем заметить спад на 2004 год, даже не знаю с чем связанный

Другая статистика:

Но всё это как-то просто, поэтому давайте затронем статистику, которую редко можно увидеть в этих наших интернетах. Сравним средние оценки критиков и пользователей, поймем кто же все-таки злее.

Заметим, что пользователи становятся все злее и злее

На первой таблице разброс значений для критиков и пользователей составляет 10(65-75) и 15(63-78), на второй таблице 4(69-73) и 10(67-77) соответственно. Так как среднее значение для ВСЕХ игр у критиков и юзеров примерно одинаковое, можно сделать вывод: критики редко ставят не нейтральные оценки, в большинстве своем они(оценки) колеблются в районе 70 баллов. Это вроде и было логично, но теперь еще и подтверждено.

С жанрами мы определились, теперь наша игра нуждается в названии. Посмотрим на распространение слов в названиях игр.

Возьмем первые 5 слов и соберем из них тайтл к нашей игре

Так как у нашей игродельни нет названия достаём схожий график, но по словам в названиях компаний:

Найдем самый продуктивный год/месяц/неделю/день:

Значит выпускаем нашу игру в релиз исключительно 2 числа в пятницу января. Ближайший такой будет в 2032 году, как раз успеем игру собрать.

Итоги

Я попытался собрать основную информацию в одну таблицу, но максимум на что меня хватило это эксель, поэтому вот:

+ лучшие, — худшие

Для каждой консоли или жанра подсчитывалось среднее значение отдельно, затем сравнивалось с остальными.
Жанр street довольно плох в наше время, поэтому добавим и его. В результате мы получаем игру жанра street beat-'em-up для Stadia с названием Call of Duty: Dead Star The Game(даже картиночку на рукожопил фотошопил).

Критика, вопросы, идеи для визуализации приветствуются! Может это было и не заметно, но работа была проделана огромная, надеюсь вам зашло. Не ожидал, что написать хоть какой-то текст и скомпоновать всё в статью окажется НАСТОЛЬКО сложно, поэтому следующая часть будет ой как не скоро, но всё же будет(не зря же качал данные). В ней будет уже не статистика, а больше машинного обучения(ML): будем предсказывать какой жанр окажется лучшим в ближайшем будущем. Не понимаю почему Буду рад любому фидбэку по блогу, так как это мой первый опыт~
Спасибо за внимание!


Лучшие комментарии

(кнопочка с правилами в правом углу говорит мне, что они должны быть в спойлерах).

Это правило относится только к комментариям на сайте. При создании блога прятать картинки под спойлеры не стоит.
интересная идея, обдумаем)
Предлагаю к ознаКомлению!
Интересная работа, мне понравились, но плюс к благодаря «ебу**** рейтингу» к сожалению поставить не могу, но спасибо интересная статья)
Ахах, сделай разбор на систему оценивания статей на stopgame)
В точности наоборот, я использовал именно оценки пользователей. Просто делать в два раза больше графиков давало слишком большой объем повторяющихся картинок, а там статья становится уже трудночитаемой. Поэтому ограничился оценками пользователей. В следующий раз попытаемся уместить все виды оценок.
Не знал, что редактор один для постов и комментов. Моя ошибка, учту
С делением на положительные и отрицательные отзывы:
Хорошо-Плохо по времени

Вот самый главный график.
Много обсуждали, что сейчас пресса оценивает игры по 3-х бальной системе — 7, 8, 9 баллов (иногда 10). А раньше оценивала по 10 бальной (ну почти). Тогда хороших оценок сейчас должно быть больше… Но что-то такого не видно. Может и хороших игр стало меньше выходить, сроки разработки там например увеличились..?
И главное? это всё для оценок прессы? Для пользовательских оценок похожего нет?
Читай также