[/b/] [/d/] [/tu/] [/a/] [/ph/] [/wa/] [/cg/] [/t/] [/p/]
Привет, вот я это, необразованный, но предположим, есть сайт, контент которого оценивается лайками и дизлайками. Почему не делают сортировку по некоему вероятностному параметру, который я сейчас объясню?Скажем, у контента Х 200 лайков и 1 дизлайк, а у контента Y 400 лайков и 30 дизлайков.Очевидно, что вероятность того, что случайное распределение породило 200:1 значитально выше, чем 400:30. Чем выше "невероятность" (измеряемая жесткой численной переменной), тем выше место в едином однообразном рейтинге. Так можно легко вскрыть контент, который в иной (обычной) сортировке неочевиден. Например, на pouet можно будет увидеть редкие вины с 36:0:0 или им подобные.Почему не юзается такая сортировка, раз. Кто сделает такой скрипт для поуэта, два.
> значитально вышепардон, значительно ниже, разумется. *краснеет*
> значитально выше
пардон, значительно ниже, разумется. *краснеет*
>>152893Слишком нетривиальный и ресурсоемкий алгоритм получится.
>>152896Поделить одно число на другое, ахуау, вот это алгоритм. Где там мой биг дата форест неуралнет.
>>152896Да нэээ. Простая комбинаторика. Можно с экстраполяцией, в принципе. Не восьмидесятые на дворе. Мы же не сотни тысяч лайков обрабатываем; на поуэте максимум - 787 лайков.Если кто-то сделает web ui для такого алгоритма, и еще с возможностью поиска по временным интервалам (например, dec 2016 - may 2018), я смело оплачу хвостинг и домен.
>>152896Да нэээ. Простая комбинаторика. Можно с экстраполяцией, в принципе. Не восьмидесятые на дворе. Мы же не сотни тысяч лайков обрабатываем; на поуэте максимум - 787 лайков.
Если кто-то сделает web ui для такого алгоритма, и еще с возможностью поиска по временным интервалам (например, dec 2016 - may 2018), я смело оплачу хвостинг и домен.
Насчет собственно оп-поста.> вероятность 200:1 значительно [ниже], чем 400:30Это не так. Это было бы верно для 20 000:1 и 40 000:3000.Если у чего-то 200 лайков, это может означать, что контент предназначался для узкой тематики, которую прошаренные гуглят, а незнающие даже не найдут.Но вообще такой алгоритм есть и если видео, например, на ютубе быстро набирает популярность, его показывают в популярных.
Насчет собственно оп-поста.
> вероятность 200:1 значительно [ниже], чем 400:30
Это не так. Это было бы верно для 20 000:1 и 40 000:3000.Если у чего-то 200 лайков, это может означать, что контент предназначался для узкой тематики, которую прошаренные гуглят, а незнающие даже не найдут.Но вообще такой алгоритм есть и если видео, например, на ютубе быстро набирает популярность, его показывают в популярных.
>>152899А вот и не поделить. Поделить-метрика уже есть, она не решает.
>>152901> контент предназначался для узкой тематики, которую прошаренные гуглят, а незнающие даже не найдут.Давай спишем этот аспект на "при прочих равных" для условий этой задачи.
>>152901
> контент предназначался для узкой тематики, которую прошаренные гуглят, а незнающие даже не найдут.
Давай спишем этот аспект на "при прочих равных" для условий этой задачи.
https://habr.com/company/darudar/blog/143188/ уже предлагали?
Начал что-то считать, порядочно запутался. Два возможных ответа, + и -. Возьмём ситуацию с 6 ответами, это 2^6=64 всего возможных пермутации. Теперь по формуле посчитаем количество сочетаний, формула - берем количество минусов за "х", 6!/(x!*(6-x)!).01х ++++++06х +++++-15x ++++-- 20х +++---15х ++----06х +-----01х ------То есть, ++++++ у нас появляется с частотой в 1/64, а +++--- уже 7/64 (складываем всё, что выше по рейтингу). 1/64 - это примерно 1,56%.Теперь возьмём 23 ответа. Это 2^23=8388608 всего возможных пермутаций.23л0д - 122л1д - 2321л2д - 25320л3д - 177119л4д - 8855 [еще раз, формула - 23!/(4!*(23-4)!)]18л5д - 3364917л6д - 100947Итого для 17 лайков и 6 дизлайков метрика - (1+23+253+1771+8855+33649+100947)/8388608, или 145499/8388608, то есть 1,73%.То есть 17 лайков и 6 дизлайков - примерно так же маловероятно по этим подсчётам, как 6 лайков и 0 дизлайков. Ничего не понимаю. Помогите мимо-гуманитарию (◕‿‿◕)
Начал что-то считать, порядочно запутался. Два возможных ответа, + и -. Возьмём ситуацию с 6 ответами, это 2^6=64 всего возможных пермутации. Теперь по формуле посчитаем количество сочетаний, формула - берем количество минусов за "х", 6!/(x!*(6-x)!).01х ++++++06х +++++-15x ++++-- 20х +++---15х ++----06х +-----01х ------То есть, ++++++ у нас появляется с частотой в 1/64, а +++--- уже 7/64 (складываем всё, что выше по рейтингу). 1/64 - это примерно 1,56%.
Теперь возьмём 23 ответа. Это 2^23=8388608 всего возможных пермутаций.23л0д - 122л1д - 2321л2д - 25320л3д - 177119л4д - 8855 [еще раз, формула - 23!/(4!*(23-4)!)]18л5д - 3364917л6д - 100947Итого для 17 лайков и 6 дизлайков метрика - (1+23+253+1771+8855+33649+100947)/8388608, или 145499/8388608, то есть 1,73%.
То есть 17 лайков и 6 дизлайков - примерно так же маловероятно по этим подсчётам, как 6 лайков и 0 дизлайков. Ничего не понимаю. Помогите мимо-гуманитарию (◕‿‿◕)
>>152930Долго вчитывался в параметр, который ты пытаешься посчитать, но так и не смог понять его смысл.
>>152932Ну смотри, возьмём произвольную пару значений "лайки-дизлайки". Если сравнивать её с нормальным распределением (50% к 50%), можно выявить параметр "вероятностной возможности", т.е. насколько такое соотношение лайков маловероятно. Далее из полученного значения "маловероятности" выстраивается рейндж, по которому можно сортировать всё множество контента. По идее, в топе будут в том числе и редкие вещи с высоким отношением лайков к дизлайкам.
>>152933Тогда все логично, чем больше общее количество оценок, тем менее вероятно каждое из конкретных сочитаний.
- wakaba 3.0.7 + futaba + futallaby -