FurAffinity Recommendations
16 years ago
http://snowlands.ru/en/tools/furaff.....-recommend.htm
_________________________________
If you watch hundreds of users you soon find out it’s getting hard to discover new artists. I’ve tried the well-known FA-rank site which takes Google-like approach to rank users. I failed. Tastes of people differ too much.
How can this problem be solved? Algorithm should take individual user’s tastes into account. That’s how a frequent feature of online shops, “People who bought this also bought that”, is implemented.
So, if you watch enough users you can try out a new tool which uses so called collaborative filtering. You can see any user’s recommendations.
http://snowlands.ru/en/tools/furaff.....-recommend.htm
If you find this tool useful please spread the word about it. This is the only thing I ask in return. :)
_________________________________
Когда наблюдаешь за сотнями пользователей, с каждым разом находить новых авторов всё сложнее и сложнее. Я попробовал использовать для поиска хорошо известный "Топ ФА", в основе которого алгоритм в духе Гугла. Безуспешно. Слишком уж сильно разнятся вкусы пользователей.
Как решить проблему? Алгоритм должен учитывать предпочтения каждого пользователя. Именно так работают советы "вы купили это, вам может быть интересно то" во многих онлайн-магазинах и других ресурсах.
Теперь, если вы следите за достаточным количеством пользователей, можете воспользоваться новой примочкой на основе так называемой совместной фильтрации. Можно посмотреть и советы другим пользователям.
http://snowlands.ru/en/tools/furaff.....-recommend.htm
Если примочка окажется для вас полезной, пожалуйста, расскажите о ней другим. Это вся благодарность, которая мне нужна. :)
_________________________________
If you watch hundreds of users you soon find out it’s getting hard to discover new artists. I’ve tried the well-known FA-rank site which takes Google-like approach to rank users. I failed. Tastes of people differ too much.
How can this problem be solved? Algorithm should take individual user’s tastes into account. That’s how a frequent feature of online shops, “People who bought this also bought that”, is implemented.
So, if you watch enough users you can try out a new tool which uses so called collaborative filtering. You can see any user’s recommendations.
http://snowlands.ru/en/tools/furaff.....-recommend.htm
If you find this tool useful please spread the word about it. This is the only thing I ask in return. :)
_________________________________
Когда наблюдаешь за сотнями пользователей, с каждым разом находить новых авторов всё сложнее и сложнее. Я попробовал использовать для поиска хорошо известный "Топ ФА", в основе которого алгоритм в духе Гугла. Безуспешно. Слишком уж сильно разнятся вкусы пользователей.
Как решить проблему? Алгоритм должен учитывать предпочтения каждого пользователя. Именно так работают советы "вы купили это, вам может быть интересно то" во многих онлайн-магазинах и других ресурсах.
Теперь, если вы следите за достаточным количеством пользователей, можете воспользоваться новой примочкой на основе так называемой совместной фильтрации. Можно посмотреть и советы другим пользователям.
http://snowlands.ru/en/tools/furaff.....-recommend.htm
Если примочка окажется для вас полезной, пожалуйста, расскажите о ней другим. Это вся благодарность, которая мне нужна. :)
Спасимба за пиар. :)
I do have a suggestion, though. The results really need to be filtered against each user's existing watch list. The first 22 recommendations it gave me were artists I'm already watching.
The tool giving you these results is an indication it works correctly. That's good. :)
To update data I need to download hundreds of thousands of pages from FA, process all collected data, run recommendation algorithm on it, export results to my server. It takes quite a bit of time. :) I'll update data once in a couple of months if there's a demand.
A nice addition would be to filter out the folks who have 0 submissions.
Generally you're right, more information would be useful. I think about adding at least numbers of watches in and watches out. It's interesting wether some generally unpopular artists, but relevant for specific users, get recommended.
I've actually done this before and k-nearest-users worked best for me...
Bet it takes a long time to run the thing though. Took me ages...
I'm going to implement user-based algorithm myself anyway, because this library is closed source and doesn't tell some intermediate results which can be interesting.
The good thing about the library is that it's heavily optimized. It took about an hour to generate all the stats. And it could have taken ten times less if I optimized it using multiple threads like I did for downloading data from FA (it seems most of the time was lost on slow SQL INSERT queries).
I'd recommend Taste if you wanted to try something else: it's really good (although Java... dunno if that's bad.) But yeah, you can't go wrong with hand-rolling something. FA data is huge and a lot of algorithms just choke on data sets that big!
It's also really interesting to put in my own name and see who comes up. c:
Now it's more interesting to put in your own name. I've just added inverted recommendations; you can see who you're recommended for. :)
If only some well known artist posted a journal... I've failed to make this thing well known. :/ Unlike global FA rank thing, it's not very drama generating, so no one spreads the word. (If the tool weren't useful I wouldn't get good comments, so this seems to be the primary problem.)
This is what I got:
Error 404: nx document
The web page you are looking cannot be found, it might have been removed from web site, or its name has been changed, or it is temporarily unavailable.
Запрошенная Вами страница сайта не найдена. Возможно, она была удалена, перемещена или переименована. Если Вам кажется, что данная страница не отображена из-за технических неполадок на узле, обратитесь к администратору домена.
Maybe I should add url parsing, so it'll be less confusing...
I will probably mention this in a journal, sooner or later. Unfortunately, the drama around 'FA Rank' really helped it to get noticed... while this tool can't really create drama... at least, I can't see a way how you can turn 'FA Recommendations' into a pissing contest.
Anyway, a job well done. Always interested about statistics and mathematical solutions to community structures. Great to see there are people willing to do something on their own time to improve the FA experience.
As for contest, I'm thinking to combine data on popularity and number of inverse recommendations. It's possible to find users who are recommended disproportionally often to the number of people currently watching them. Not sure if that will work out though.
Рейтинг по вотчерам уже изобрели, называется попуфур.
Не знаю, что подразумевается под активностью. Я, скажем, имею пять аккаунтов, вотчу на одном, комментирую на трёх, выкладываю арт на двух. Как оценить активность без доступа к хотя бы времени последнего логина? Да и чтобы последний комментарий увидеть, надо скачать 45 миллионов страниц. Разве что скачать всех юзеров и регулярно сравнивать статистику. Но так все луркеры идут лесом, а их, подозреваю, несметное количество.
Не уверен в продуктивности идеи фильтрации по вручную выбранным темам. В этом десятителии я бы скорее смотрел в сторону хитроумной кластеризации, коллаборативной фильтрации по подмножеству вотчей, всё с примесью новомодного ML, ну и прочего подобного. Ещё фавы могут стать отличным источником данных, но ещё вопрос, реально ли вытянуть эти данные. Глобальные рейтинги, как их хитроумно ни считай, ущербны по своей природе и имеют плохую предсказательную силу. Разве что удовлетворить праздное любопытство в вопросах фаллометрии и посетовать на несовпадение вкусов со средним фуррем по больнице.
Попуфур — ерунда, разумеется, потому что фурри-арт слишком обширен и разнообразен, чтобы средняя температура по больнице хотя бы на 30% отвечала интересам пусть даже среднего фурря, я уж молчу про фурря с узкими или экзотическими предпочтениями. Если вносить параметр тухлости данных в клон Попуфура, то решается две проблемы по сути:
1. топы не застревают в топе навечно (что, впрочем, и не так уж сильно проявляется, потому что рейтинг не лежит на главной странице ФА и поэтому слабо влияет на предпочтения);
2. появляется возможность початиться в комментариях на свежих постах (мне в первую очередь уже имеющийся арт интересен, но, может, для кого-то поболтать — архиважный параметр).
Дихотомия тухлости художника — липовая. Если уж делать рейтинг с учётом тухлости данных, то надо делать фильтр по нескольким временным диапазонам, как на Реддите, например. На Реддите же можно и коэффициенты для формулы рейтинга с учётом тухлости подсмотреть, они их публиковали. На неуместность дихотомии указывает хотя бы то, что Танька попала в список реликтов. Она хоть и не самая активная художница, но до сих пор регулярно рисует.
1000 художников — это капля в море. Я вотчу больше. :))
Если честно, мне это напоминает упоротую версию упоротой фильтрации на порносайтах, где "straight" означает "женщины есть" (включая гомосексуальных женщин), "gay" означает "женщин нет" (вклюая переодетых в женщин мужчин), а бисексуальные видео размазаны тонким слоем по всем категориям. Считаешь себя гетеросексуалом — изволь смотреть на лесбийский секс, считаешь гомосексуалом — изволь любоваться трапами, относишься к бисексуалам — страдай в поисках, а коль весь из себя пансексуал — вообще иди лесом.
Боль.