В общем, я давно хотел внести свой вклад в сообщество стопгейма и решил сделать то, что хоть как-то у меня получается. Здесь я попытаюсь провести анализ игр за последние 30 лет, параллельно создав концепт худшей игры. На протяжении долгих дней я воровал скачивал данные с сайта metacritic и чуть больше времени у меня ушло на сам анализ и подведение итогов(примерно неделя на одну лишь загрузку). Информация бралась с вкладки лучших игр за всё время, а это, на минуточку, практически 18000 игр всех сортов. Большую часть статьи займут различные графики, поскольку я посчитал, что это будет гораздо информативнее(кнопочка с правилами в правом углу говорит мне, что они должны быть в спойлерах).
Я честно пытался проверить, нет ли поста схожего характера на портале, но поиск не дал результатов. Даже если таковой и имеется, то его достаточно трудно найти, поэтому надеюсь эта статья окажется релевантной.
(для юристов отмечу, что все данные находятся в общем доступе, так что технически это не воровство)
Статистика
Начнем пожалуй с самой простой и базовой статистики.
Итого мы имеем: 17847 игр всех мастей, среднее значение в 70% для обеих оценок. Стоит отметить, что если оценка просто отсутствует, то она заменена на 0(если игру никто не оценивал, значит скорее всего игра фиговая и ставить для нее среднее значение в 70% будет нечестно). Для дальнейшей работы мы поделим все игры на две большие категории, с оценками пользователей >70% и <=70%. 10327 и 7320 игр соответственно
Разделив 10327 на 17847 получаем шанс в 57% на то, что наша игра окажется хорошей(ЭТО ТАК НЕ РАБОТАЕТ)
Далее нам потребуется топ жанров по распространенности в видеоигровой сфере с все тем же делением на положительно и отрицательно оцененные игры. Для чистоты эксперимента(топа) я не брал игры с количеством оценок входящих в первый квартиль(25% на первой таблице, <11 другими словами)
На этом моменте мы уже можем заметить первое интересное место. Хоть положительно оцененных игр и больше, самый частый жанр среди плохо оцененных(синий график) на целую тысячу вхождений обгоняет жанр на той же позиции, но на фиолетовом графике. Это говорит нам о том, что игры с положительными отзывами имеют большее разнообразие жанров. Среди всех негативно оцененных игр(7320) 3085 имеют жанр beat-'em-up, берём его за основу.
С этим же делением посмотрим на количество игр от разных компаний:
Не удивляйтесь количеству игр от Telltale, просто на метакритике КАЖДЫЙ эпизод идет как отдельная игра, было бы кстати хорошо, если они и сделают(привет Глеб) нашу игру.
Время покажет
Далее рассмотрим распределение количества игр по дате выхода(можно сразу смотреть по годам):
С делением на положительные и отрицательные отзывы:
Похоже, что хорошие игры делали всегда, а количество плохих лишь растёт :(
Теперь то же самое, но по жанрам, жанр general был исключен, по причине того, что я не понял его значение:
К сожалению, в выборку не попал кризис 80-х и наглядно на него не посмотреть. С другой стороны мы можем заметить спад на 2004 год, даже не знаю с чем связанный
Другая статистика:
Но всё это как-то просто, поэтому давайте затронем статистику, которую редко можно увидеть в этих наших интернетах. Сравним средние оценки критиков и пользователей, поймем кто же все-таки злее.
На первой таблице разброс значений для критиков и пользователей составляет 10(65-75) и 15(63-78), на второй таблице 4(69-73) и 10(67-77) соответственно. Так как среднее значение для ВСЕХ игр у критиков и юзеров примерно одинаковое, можно сделать вывод: критики редко ставят не нейтральные оценки, в большинстве своем они(оценки) колеблются в районе 70 баллов. Это вроде и было логично, но теперь еще и подтверждено.
С жанрами мы определились, теперь наша игра нуждается в названии. Посмотрим на распространение слов в названиях игр.
Так как у нашей игродельни нет названия достаём схожий график, но по словам в названиях компаний:
Найдем самый продуктивный год/месяц/неделю/день:
Значит выпускаем нашу игру в релиз исключительно 2 числа в пятницу января. Ближайший такой будет в 2032 году, как раз успеем игру собрать.
Итоги
Я попытался собрать основную информацию в одну таблицу, но максимум на что меня хватило это эксель, поэтому вот:
Для каждой консоли или жанра подсчитывалось среднее значение отдельно, затем сравнивалось с остальными.
Жанр street довольно плох в наше время, поэтому добавим и его. В результате мы получаем игру жанра street beat-'em-up для Stadia с названием Call of Duty: Dead Star The Game(даже картиночку на рукожопил фотошопил).
Критика, вопросы, идеи для визуализации приветствуются! Может это было и не заметно, но работа была проделана огромная, надеюсь вам зашло. Не ожидал, что написать хоть какой-то текст и скомпоновать всё в статью окажется НАСТОЛЬКО сложно, поэтому следующая часть будет ой как не скоро, но всё же будет(не зря же качал данные). В ней будет уже не статистика, а больше машинного обучения(ML): будем предсказывать какой жанр окажется лучшим в ближайшем будущем. Не понимаю почему Буду рад любому фидбэку по блогу, так как это мой первый опыт~
Спасибо за внимание!
Лучшие комментарии
Это правило относится только к комментариям на сайте. При создании блога прятать картинки под спойлеры не стоит.
Вот самый главный график.
Много обсуждали, что сейчас пресса оценивает игры по 3-х бальной системе — 7, 8, 9 баллов (иногда 10). А раньше оценивала по 10 бальной (ну почти). Тогда хороших оценок сейчас должно быть больше… Но что-то такого не видно. Может и хороших игр стало меньше выходить, сроки разработки там например увеличились..?
И главное? это всё для оценок прессы? Для пользовательских оценок похожего нет?