Содержание
- Закон Ципфа объяснил
- Основной эксперимент
- Закон Ципфа на рынках Steam
- Что мы можем узнать о Steam?
- Выводы
Некоторое время назад мой друг предложил мне посмотреть видео Vsauces о законе Ципфа, принципе Парето и их таинственных явлениях вокруг нас. Вот небольшой тизер, чтобы привлечь ваше внимание - 80% всех людей живут в 20% самых популярных городов; 80% всей земли принадлежит 20% самых богатых землевладельцев; 80% всего мусора находится на верхних 20% самых грязных улиц - как предсказывают закон Ципфа и принцип Паретоса.
Недостаточно? Ну, как я обнаружил вчера, кроличья нора на этом не останавливается ... Полный скептицизма, я решил посмотреть, сколько времени люди проводят за игрой в Steam ... Ну что ж. 80% времени людей тратится на игры в 20% самых популярных игр ... Интересно? Ну, читайте дальше, это еще не все в этой истории.
Время работы более 20 минут, Vsauces endeavour является потрясающим и объясняет многие важные вещи о Zipf, однако он очень стесняется, показывая нам основной механизм, который, как считается, способствует тому, почему Zipf работает так, как он работает. Поэтому, прежде чем мы продолжим, я хотел бы кратко объяснить это.
Закон Ципфа объяснил
Существует несколько концептуальных способов объяснить интуицию, лежащую в основе принципа 20/80. На мой взгляд, лучшим примером является кратер Луны.
Основной эксперимент
Итак, представьте, если хотите, что есть нетронутая Луна - идеально гладкая поверхность. Теперь, скажем, есть несколько астероидов произвольного размера, которые попадают на Луну так или иначе. Когда первый астероид приземляется, он оставляет кратер. Теперь другой удар, оставляя кратер в другом месте. Каждый кратер является частью общей площади поверхности, поэтому существует вероятность того, что следующий случайный астероид ударится рядом с существующим кратером и объединится с ним, образуя группу. Вероятность попадания нового астероида в данный кратер пропорциональна существующему размеру кратеров и астероидов. Это означает, что следующий случайный астероид с большей вероятностью присоединится к самой большой существующей группе, что сделает его еще больше. Это своего рода кумулятивный процесс, который затем создает механизм «богатее - становишься богаче - беднее - одиноче».
Имейте это в виду, потому что это общее объяснение «почему», закон Зипфа работает с такой загадочной универсальностью. Пример астероида довольно прост, однако вопрос в том, что произойдет во многих повторениях
Немного сбивает с толку?
Ну, я сделал подарок, чтобы довести эту начальную точку до дома. NB! График будет обсуждаться позже, просто попробуйте изобразить эксперимент.
Если мы наблюдаем фактическую Луну, оказывается, что, поскольку количество астероидов увеличивается до больших количеств, наблюдаемые диаметры кратеров растут так, что верхние 20% самых больших кратеров приближаются к 80% всей площади поверхности.
Итак, когда мы перейдем к большему числу астероидов, распределение наиболее популярных среди наименее популярных групп приближается к своего рода «идеальному распределению» с этим свойством 20/80 - распределению Парето. Если вы посчитаете, получается, что (в общем случае), если самая большая группа имеет размер N, вторая по величине группа имеет размер около N / 2, третья N / 3 и так далее, и так далее. Это называется Законом Ципфа. Странно то, что закон Зипфа и распределение Парето работают для изумительного количества элементов (астероидов) и групп (кластеров кратеров). Конечно, есть перекосы и случайные помехи, но общая тенденция не вызывает сомнений.
Я надеюсь, вы сможете увидеть, как астероиды, которые с большей вероятностью попадают на большие воронки на Луне, связаны с более привлекательными городами, если в них уже живет больше людей. Однако следует понимать, что города - это далеко не единственные «группы», которые ведут себя согласно Ципфу.
Вот несколько примеров из исследования Марка Ньюмэнса о распределениях Парето. NB! Графики представлены в логарифмическом масштабе, который сглаживает гиперболическую форму кривых, представляя почти линейную зависимость.
Начальная y = aX ^ (- б)
Журналы обеих сторон => log y = log a - b log X
Интересно, что ту же тенденцию демонстрируют и религиозные культы ... Общая черта большинства этих феноменов - это просто тенденция «большие группы становятся большими». Таким образом, закон Ципфа является постоянным в механизмах, где предпочтения элементов положительно связаны с размером группы (то есть, чем больше группа, тем больше вероятность ее роста). Вот почему мне нравится думать о группах как о кластерах, а как о элементах кластеров.
Закон Ципфа на рынках Steam
Подозрительно к этому последнему? Вот количество времени, которое люди проводят в самых популярных играх в Steam. Данные из SteamSpy.
Если вы посчитаете, получается, что 20% самых популярных игр Steam составляют 80% от общего количества игр, так что загадка Pareto 20/80 работает здесь как шарм ... Однако следует заметить, что для Зипф, чтобы быть правдой, CS: GO необходимо учитывать 37,5% / 2 = 18,8% от общего времени вместо колоссальных 30%. Но помимо этого выброса (ОСТАНОВИТЬ ИГРАТЬ CS: GO), Zipf-подобный дистрибутив явно присутствует.
Вот количество проданных копий для самых популярных игр.
Выглядит намного лучше, а? Проданные копии не имеют больших выбросов, поэтому они очень хорошо вписываются, что является примечательным отличием. Однако есть кое-что более интересное, чтобы сделать вывод из различий двух последних графиков.
Вы замечаете, как "хвост", идущий направо, является жирным на втором графике? Проще говоря, это говорит нам о том, что «относительно непопулярные» игры на самом деле намного более популярны, чем в предыдущем сюжете.
На самом деле, получается, что на 20% самых популярных игр приходится только 60% продаж против 80% игр. Интересно? Вы ставите свою задницу, это так.
Что мы можем узнать о Steam?
Ну, тот факт, что популярность игр следует за дистрибутивом Парето, говорит нам о том, что действительно существует некоторый положительный сетевой эффект, который заставляет игроков выбирать игры, в которые уже играют все больше людей. Разница в жирности хвостов говорит нам о том, что пользователи Steam гораздо более «слепы по размеру группы» при покупке игр, чем когда они в них играют.
Подумайте об этом - чем больше людей покупают игры, независимо от «текущего популярного мнения», тем более расплывчатым становится дистрибутив Pareto, так как маловероятно, что крупные игры будут развиваться дальше. Если бы никто не давал крысам совет о том, сколько людей уже играют в игру, и доступность всех игр была одинаковой, то мы ожидали бы, что 20% самых популярных игр будут составлять около 50% продаж и времени игры (например, если предположить, что индивидуальные предпочтения нормально распределен).
Выводы
Таким образом, есть два фактора, которые способствуют распределению Парето на рынках Steam: насколько инновационными являются разработчики (сколько новых кратеров Луны формируется) и насколько геймеры (астероиды) ценят текущий размер группы, когда выбирают, к какой группе присоединиться , Оказывается, при покупке игр геймеры очень слепы по размеру группы, а когда играют в них, - наоборот. Круто, да?
Если вы хотите узнать больше о распределении Zipf's Law и Power Law, вот хорошая лекция. Кроме того, обязательно взгляните на статью Ньюмена!
Если вы хотите больше узнать о подобных вещах, вскоре я попытаюсь присоединить это наблюдение к модели, которая показывает, что более популярные многопользовательские игры имеют более высокую цену (что указывает на то, что геймеры предпочитают присоединяться к группам большего размера). Смотрите статью здесь. В статье Piece De Resistance мы попытаемся объединить эти теории, объяснив, как многопользовательские игры, социальные сети и города на самом деле представляют собой все противоборствующие товары с сетевыми эффектами (чем больше людей потребляют товар, тем больше пользы получает каждый отдельный потребитель), что имеет озаглавил их с этой тайной Zipfian тайна ...
До тех пор - наслаждайтесь!
Постскриптум Добавьте комментарий с забавной идеей для отношения 20/80, которое, по вашему мнению, может быть правдой.
Мои являются:
Ностальгия 80% людей вызвана 20% их самых счастливых воспоминаний (фактически доказано тем, что люди забывают информацию)
80% массы сосредоточено в 20% крупнейших космических объектов (фактически доказано для распределения силы тяжести)
И конечно
80% беспорядка в вашем туалете происходит из 20% того, что вы едите (никаких научных исследований говорить не приходится)