Бред

[/b/] [/d/] [/tu/] [/a/] [/ph/] [/wa/] [/cg/] [/t/] [/p/]

[Burichan] [Foliant] [Futaba] [Greenhell] [Gurochan] [Photon] - [Home] [Manage] [Archive]

Бред

Posting mode: Reply

File: 1525521015001.png -(124377 B, 600x175) Thumbnail displayed, click image for full size.

anonymous 2018/05/05(Sat)14:50 No.152893

Привет, вот я это, необразованный, но предположим, есть сайт, контент которого оценивается лайками и дизлайками. Почему не делают сортировку по некоему вероятностному параметру, который я сейчас объясню?
Скажем, у контента Х 200 лайков и 1 дизлайк, а у контента Y 400 лайков и 30 дизлайков.
Очевидно, что вероятность того, что случайное распределение породило 200:1 значитально выше, чем 400:30. Чем выше "невероятность" (измеряемая жесткой численной переменной), тем выше место в едином однообразном рейтинге. Так можно легко вскрыть контент, который в иной (обычной) сортировке неочевиден. Например, на pouet можно будет увидеть редкие вины с 36:0:0 или им подобные.
Почему не юзается такая сортировка, раз. Кто сделает такой скрипт для поуэта, два.

>>	anonymous 2018/05/05(Sat)14:51 No.152894 > значитально выше пардон, значительно ниже, разумется. краснеет

>>	anonymous 2018/05/05(Sat)15:08 No.152896 >>152893 Слишком нетривиальный и ресурсоемкий алгоритм получится.

>>	anonymous 2018/05/05(Sat)15:11 No.152899 >>152896 Поделить одно число на другое, ахуау, вот это алгоритм. Где там мой биг дата форест неуралнет.

anonymous 2018/05/05(Sat)15:11 No.152900

>>152896
Да нэээ. Простая комбинаторика. Можно с экстраполяцией, в принципе. Не восьмидесятые на дворе. Мы же не сотни тысяч лайков обрабатываем; на поуэте максимум - 787 лайков.
Если кто-то сделает web ui для такого алгоритма, и еще с возможностью поиска по временным интервалам (например, dec 2016 - may 2018), я смело оплачу хвостинг и домен.

anonymous 2018/05/05(Sat)15:14 No.152901

Насчет собственно оп-поста.
> вероятность 200:1 значительно [ниже], чем 400:30
Это не так. Это было бы верно для 20 000:1 и 40 000:3000.
Если у чего-то 200 лайков, это может означать, что контент предназначался для узкой тематики, которую прошаренные гуглят, а незнающие даже не найдут.
Но вообще такой алгоритм есть и если видео, например, на ютубе быстро набирает популярность, его показывают в популярных.

>>	anonymous 2018/05/05(Sat)15:15 No.152903 >>152899 А вот и не поделить. Поделить-метрика уже есть, она не решает.

>>	anonymous 2018/05/05(Sat)15:18 No.152906 >>152901 > контент предназначался для узкой тематики, которую прошаренные гуглят, а незнающие даже не найдут. Давай спишем этот аспект на "при прочих равных" для условий этой задачи.

>>	anonymous 2018/05/05(Sat)17:06 No.152921 https://habr.com/company/darudar/blog/143188/ уже предлагали?

anonymous 2018/05/05(Sat)21:11 No.152930
File: 1525543864951.jpg -(22082 B, 400x400) Thumbnail displayed, click image for full size.

Начал что-то считать, порядочно запутался. Два возможных ответа, + и -. Возьмём ситуацию с 6 ответами, это 2^6=64 всего возможных пермутации. Теперь по формуле посчитаем количество сочетаний, формула - берем количество минусов за "х", 6!/(x!*(6-x)!).
01х ++++++
06х +++++-
15x ++++--
20х +++---
15х ++----
06х +-----
01х ------
То есть, ++++++ у нас появляется с частотой в 1/64, а +++--- уже 7/64 (складываем всё, что выше по рейтингу). 1/64 - это примерно 1,56%.
Теперь возьмём 23 ответа. Это 2^23=8388608 всего возможных пермутаций.
23л0д - 1
22л1д - 23
21л2д - 253
20л3д - 1771
19л4д - 8855 [еще раз, формула - 23!/(4!*(23-4)!)]
18л5д - 33649
17л6д - 100947
Итого для 17 лайков и 6 дизлайков метрика - (1+23+253+1771+8855+33649+100947)/8388608, или 145499/8388608, то есть 1,73%.
То есть 17 лайков и 6 дизлайков - примерно так же маловероятно по этим подсчётам, как 6 лайков и 0 дизлайков. Ничего не понимаю. Помогите мимо-гуманитарию (◕‿‿◕)

>>	anonymous 2018/05/05(Sat)21:30 No.152932 >>152930 Долго вчитывался в параметр, который ты пытаешься посчитать, но так и не смог понять его смысл.

anonymous 2018/05/05(Sat)21:40 No.152933

>>152932
Ну смотри, возьмём произвольную пару значений "лайки-дизлайки". Если сравнивать её с нормальным распределением (50% к 50%), можно выявить параметр "вероятностной возможности", т.е. насколько такое соотношение лайков маловероятно. Далее из полученного значения "маловероятности" выстраивается рейндж, по которому можно сортировать всё множество контента. По идее, в топе будут в том числе и редкие вещи с высоким отношением лайков к дизлайкам.

>>	anonymous 2018/05/05(Sat)21:47 No.152934 >>152933 Тогда все логично, чем больше общее количество оценок, тем менее вероятно каждое из конкретных сочитаний.

Delete Post [File Only]
Password

[/b/] [/d/] [/tu/] [/a/] [/ph/] [/wa/] [/cg/] [/t/] [/p/]

Name
Link
Subject
Comment
File
Verification
Password	(for post and file deletion)
Supported file types are: GIF, JPG, PDF, PNG Maximum file size allowed is 20480 KB. Images greater than 200x200 pixels will be thumbnailed.