Алгоритм Google/Яндекс + сеть социальных рекомендаций?

Не пойму, почему бы не интегрировать в поисковые системы новомодную вебдванольную социальность и не позволить пользователям голосовать за сайты. Около каждой ссылки на сайт в результатах поиска стояли бы + и -.

Конечно, встала бы проблема накрутки, но учитывая интегрированную систему сервисов Гугла с одним аккаунтом, это вполне решаемо. Зато быстро и легко решались бы проблемы всевозможных дорвеев и прочего мусора результатах поиска. Если сайт минусуют сотни человек подряд, скорее всего на нём ничего полезного нет и наоборот.

«Вес» мнения разных пользователей, конечно, должен быть разным, алгоритм можно сделать похожим на PageRank. А пользователи голосовать будут ещё как, чтобы убедиться в этом, достаточно посмотреть на тот же Хабр, где люди довольно активно присуждают карму не то, что сайтам, а постам и даже комментариям. Разумеется решающим в выдаче будет тот алгоритм, что действует сейчас, но как дополнительное средство увеличения релевантности поиска вполне должно работать. Получается, что происходит автоматическая модерация всей многомиллиардной толпой пользователей. Получился бы такой синтез мощного алгоритма гугла/яндекса с принципами социальных сетей рекомендаций а-ля Digg .com и News2.ru.

Для консерваторов сделать возможность отключать влияние голосов других пользователей на результаты выдачи или установить свой коэффициент этого влияния от 0 до 1 в настройках и все дела.

Или я чего-то не понимаю?

14 Comments

  1. Да, идея правильная. Пока, в качестве положительной оценки я использую “Отзывы” Яндекса. Возможно, это более мягкий путь по присвоению рейтинга, т.к. он формируется попутно.

  2. Да, идея правильная. Пока, в качестве положительной оценки я использую “Отзывы” Яндекса. Возможно, это более мягкий путь по присвоению рейтинга, т.к. он формируется попутно.

  3. По этой теме сложилась интересная дисуссия с ЖЖ юзером shadtchnev:

    shadtchnev
    Гугл перехватывает сам факт открытия ссылки, т.е. если ты кликаешь по одному из результатов, это равнозначно тому, что ты ему ставишь плюсик и гугл это учитывает. Если не веришь, глянь обработчик onmousedown на каждой ссылке в результатах 🙂 Идея, которую ты описал, довольно правильная, поэтому и используется еще со времен, когда и веб2.0 не было.

    nmlss
    Стоп, но это ведь не то. Перехватывает, конечно, там даже линк, по которому ты кликаешь не прямой. Соц. сети некоторые так, конечно, тоже работают, на том же newsland.ru вроде защитываются просмотры как голоса, но это другое.

    Во-первых понятно, что чем ближе результат к началу, тем, в общем, случае, будет больше кликов (на 2 страницу вроде 2-4% заходят), исключение – те сайты, по названию и дескрипшину которых видно, что они нерелеванты, но тогда получается, что “не-клик” это не столько “минус” сайту как таковому, сколько “минус” его релевантности относительно данного конкретнго запроса.

    Во-вторых, система оценки работал бы иначе, в её рамках, мог бы теоретически подняться и сайт со, скажем, 9 страницы и опуститься хорошо оптимизированный и давно существующий, но уже не актуальный сайт с первых позиций первой страницы. Но это так, задумка только, техническая реализация – уже отдельный вопрос.

    shadtchnev
    Линк прямой, но параллельно с ним запрос гуглу уходит.

    При выдаче результатов запроса каждый сайт оценивается именно относительно текущего запроса, это самое главное и самое важное. Когда ты говоришь “подняться с 9 страницы”, ты имеешь в виду какой-то конкретный запрос, по которому сайт на 9-ой странице, а не рейтинг в целом. Собственно, именно это гугл и делает: понимает его с 9-ой страницы, если по нему кликают.

    Система, которая поднимает и опускает “сайты как таковые” – это PageRank. Он использует очень большое число параметров в разных комбинациях и, возможно, учитывает и кол-во переходов на этот сайт, но это достоверно не известно, т.к. он не документирован (конкретная версия, которая фактически используется). Может быть, эта инфа и там как-то учитывается.

    В твоем примере хорошо оптимизированный, но не актуальный сайт уйдет с первой страницы, как только по нему станут меньше кликать (раз он не актуальный).

    nmlss
    Когда как, иногда почему-то вот такого вида
    http://www.google.com/url?sa=t&ct=res&cd=1&url=собственно-линк

    Так кликнуть могут ведь и по фигне и уйти с сайта через 2 секунды, увидев там сплошные киворды для SEO, обвешанные контекстной рекламой. Или гейтвей на другие сайты. Да или просто 100лет назад написанную кем-то, но совершенно не актуальную и не интересную статью. Я, например, когда делал свой проджект, смотрел запрос “яппи”, там вечна одна дурацкая статья вылазит на первых позициях. Поэтому я и говорю именно об оценки после просмотра. Ведь до просмотра человек оценивает лишь title & description.

    PR в первую очередь учитывает ссылки с друих сайтов и их PR. Это и есть элемент социальности, но это тоже другое. Кстати, в Яндексе их тИЦ на выдачу не влияет вообще.

    Так я не о кликах, а двух ссылочках “+” и “-” возле тайтла сайта а-ля хабрахабр. Если не актуальный и подавляющее большинство пользователей, зайдя, решает, что впустую потеряли время и кликает по “-“, то он так или иначе теряет в рейтинге, не обязательно сразу с первой страницы уходит, потмоу как я не предлагаю замеить этим алгоритмом старый алгоритм полностью (что было, конечно, очень смело)), а всего лишь дополнить. Т.е. при прочих равных условиях он может быть потерят позицию – две – три. А может и не потеряет. Это уже математика, здесь думать нужно, какой вес присваивает этим оценкам, чтобы достичь максимальной релевантости результатов поиска, но это технические решения, а я просто о концепции)

    shadtchnev
    Ты слишком многого хочешь от пользователя. Обычно, если человек не знает, что ищет, он открывает сразу несколько ссылок, постоянно переформулирует запрос, перезагружая страницу и закрывая нерелевантные сайты в мгновение ока – никто не будет возвращаться назад, чтобы восстановить справедливость. Другими словами, будет очень-очень большая погрешность. Не говоря уже о том, что интуитивно совершенно не ясно что значит плюс и минус (в отличие от хабра). Не забывай, что средний пользователь гугла – это не средний пользователь хабра 🙂

    На хабре это все работает потому что там во-первых, вменяемая аудитория айтишников (и то время от времени есть сильные перекосы, которые модераторы правят вручную), во-вторых ты четко понимаешь, что значат твои действия. Средний пользователь гугла просто не поймет, что именно имеется в виду, не говоря уже о том, чтобы возвращаться обратно и что-то кликать в еще не закрытом окне.

    nmlss
    Так даже если полпроцента кликнет, то уже хорошо, учитывая цифры. А никакого глубоко понимания вроде и не нужно. Сайт хороший – плюс, сайт плохой – минус, вот и всё. Ведь в конечном счёте потребителями этого рейтинга такие же обычные пользователи и будут. Ищет человек ебук, который можно скачать бесплатно, а первые 5 ссылок предлагают сделать это за плату, шестой сайт требует регистрации, а 7й даёт прямой линк на .zip. Один из ста таких искателей заминусует первые 6 и поставит плюс 7. Если каждый сотый будет это делать, то у сайта будут шансы подняться на первое место. Вот так я себе это примено представляю. Впрочем, я и не говорю, что ребятам из Гугла нужно срочно бежать это внедрять…

    shadtchnev
    Ты исходишь из того, что остальные не будут кликать от балды или из любопытства. Один из ста это сделает, остальные покликают и не поймут зачем это вообще надо здесь (кликнул – ничего не изменилось). Это и имел в виду, когда говорил, что погрешность будет высокая: если бы только осмысленные клики были… А тот факт, что седьмая ссылка – самая лучшая будет учтен, когда один пользователей из ста в своем блоге даст на электронную книгу с прямой ссылкой на седьмой результат. Это будет учтено pagerank’ом и постепенно седьмой всплывает наверх. Другими словами, для того, что ты предлагаешь, есть более надежный и прозрачный для пользователей механизм.

    nmlss
    Отчасти верно, конечно, но это же решаемо. Сделать эту возможность, например, только для тех юзеров, кто logged-in. Т.е. пользователи Gmail и прочего, у них всё же определённый уровень есть.

    Впрочем, я не думаю, что люди будут кликать “просто так” в большинстве своём, по-крайней мере. В крайнем случае, что мешает показать попап “вы действительно хотите отдать положительный голос за этот сайт?”, отсеяв таким простым образом лишние результаты.

    А блоги всё же не у всех есть 🙂

    К тому же это надёжный и прозрачный механизм породил целый побочный бизнес с продажаей и покупкой ссылок, с каталогами сайтов и с постоянной войной оптимизаторов и работников поисковых систем)

    nmlss
    Отчасти верно, конечно, но это же решаемо. Сделать эту возможность, например, только для тех юзеров, кто logged-in. Т.е. пользователи Gmail и прочего, у них всё же определённый уровень есть.

    Впрочем, я не думаю, что люди будут кликать “просто так” в большинстве своём, по-крайней мере. В крайнем случае, что мешает показать попап “вы действительно хотите отдать положительный голос за этот сайт?”, отсеяв таким простым образом лишние результаты.

    А блоги всё же не у всех есть 🙂

    К тому же этот надёжный и прозрачный механизм породил целый побочный бизнес с продажаей и покупкой ссылок, с каталогами сайтов и с постоянной войной оптимизаторов и работников поисковых систем)

    shadtchnev
    Поверь, бизнес по кликанью на нужных сайтах появится в мгновение ока и эти спам-клики тоже надо будет отслеживать и фильтровать. Ничто не совершенно 🙂

    Я думаю, что реально революцию этот метод сделать не может, если честно – существующие методы неплохо справляются с оптимизаторами. А отягощать интерфейс элементами, которые не нужны юзеру для поиска – это довольно жестоко. Гугл сначала и выехал на своей простоте: ввел запрос – получил ответ, все 🙂

    nmlss
    Может быть, может быть 🙂

  4. По этой теме сложилась интересная дисуссия с ЖЖ юзером shadtchnev:

    shadtchnev
    Гугл перехватывает сам факт открытия ссылки, т.е. если ты кликаешь по одному из результатов, это равнозначно тому, что ты ему ставишь плюсик и гугл это учитывает. Если не веришь, глянь обработчик onmousedown на каждой ссылке в результатах 🙂 Идея, которую ты описал, довольно правильная, поэтому и используется еще со времен, когда и веб2.0 не было.

    nmlss
    Стоп, но это ведь не то. Перехватывает, конечно, там даже линк, по которому ты кликаешь не прямой. Соц. сети некоторые так, конечно, тоже работают, на том же newsland.ru вроде защитываются просмотры как голоса, но это другое.

    Во-первых понятно, что чем ближе результат к началу, тем, в общем, случае, будет больше кликов (на 2 страницу вроде 2-4% заходят), исключение – те сайты, по названию и дескрипшину которых видно, что они нерелеванты, но тогда получается, что “не-клик” это не столько “минус” сайту как таковому, сколько “минус” его релевантности относительно данного конкретнго запроса.

    Во-вторых, система оценки работал бы иначе, в её рамках, мог бы теоретически подняться и сайт со, скажем, 9 страницы и опуститься хорошо оптимизированный и давно существующий, но уже не актуальный сайт с первых позиций первой страницы. Но это так, задумка только, техническая реализация – уже отдельный вопрос.

    shadtchnev
    Линк прямой, но параллельно с ним запрос гуглу уходит.

    При выдаче результатов запроса каждый сайт оценивается именно относительно текущего запроса, это самое главное и самое важное. Когда ты говоришь “подняться с 9 страницы”, ты имеешь в виду какой-то конкретный запрос, по которому сайт на 9-ой странице, а не рейтинг в целом. Собственно, именно это гугл и делает: понимает его с 9-ой страницы, если по нему кликают.

    Система, которая поднимает и опускает “сайты как таковые” – это PageRank. Он использует очень большое число параметров в разных комбинациях и, возможно, учитывает и кол-во переходов на этот сайт, но это достоверно не известно, т.к. он не документирован (конкретная версия, которая фактически используется). Может быть, эта инфа и там как-то учитывается.

    В твоем примере хорошо оптимизированный, но не актуальный сайт уйдет с первой страницы, как только по нему станут меньше кликать (раз он не актуальный).

    nmlss
    Когда как, иногда почему-то вот такого вида
    http://www.google.com/url?sa=t&ct=res&cd=1&url=собственно-линк

    Так кликнуть могут ведь и по фигне и уйти с сайта через 2 секунды, увидев там сплошные киворды для SEO, обвешанные контекстной рекламой. Или гейтвей на другие сайты. Да или просто 100лет назад написанную кем-то, но совершенно не актуальную и не интересную статью. Я, например, когда делал свой проджект, смотрел запрос “яппи”, там вечна одна дурацкая статья вылазит на первых позициях. Поэтому я и говорю именно об оценки после просмотра. Ведь до просмотра человек оценивает лишь title & description.

    PR в первую очередь учитывает ссылки с друих сайтов и их PR. Это и есть элемент социальности, но это тоже другое. Кстати, в Яндексе их тИЦ на выдачу не влияет вообще.

    Так я не о кликах, а двух ссылочках “+” и “-” возле тайтла сайта а-ля хабрахабр. Если не актуальный и подавляющее большинство пользователей, зайдя, решает, что впустую потеряли время и кликает по “-“, то он так или иначе теряет в рейтинге, не обязательно сразу с первой страницы уходит, потмоу как я не предлагаю замеить этим алгоритмом старый алгоритм полностью (что было, конечно, очень смело)), а всего лишь дополнить. Т.е. при прочих равных условиях он может быть потерят позицию – две – три. А может и не потеряет. Это уже математика, здесь думать нужно, какой вес присваивает этим оценкам, чтобы достичь максимальной релевантости результатов поиска, но это технические решения, а я просто о концепции)

    shadtchnev
    Ты слишком многого хочешь от пользователя. Обычно, если человек не знает, что ищет, он открывает сразу несколько ссылок, постоянно переформулирует запрос, перезагружая страницу и закрывая нерелевантные сайты в мгновение ока – никто не будет возвращаться назад, чтобы восстановить справедливость. Другими словами, будет очень-очень большая погрешность. Не говоря уже о том, что интуитивно совершенно не ясно что значит плюс и минус (в отличие от хабра). Не забывай, что средний пользователь гугла – это не средний пользователь хабра 🙂

    На хабре это все работает потому что там во-первых, вменяемая аудитория айтишников (и то время от времени есть сильные перекосы, которые модераторы правят вручную), во-вторых ты четко понимаешь, что значат твои действия. Средний пользователь гугла просто не поймет, что именно имеется в виду, не говоря уже о том, чтобы возвращаться обратно и что-то кликать в еще не закрытом окне.

    nmlss
    Так даже если полпроцента кликнет, то уже хорошо, учитывая цифры. А никакого глубоко понимания вроде и не нужно. Сайт хороший – плюс, сайт плохой – минус, вот и всё. Ведь в конечном счёте потребителями этого рейтинга такие же обычные пользователи и будут. Ищет человек ебук, который можно скачать бесплатно, а первые 5 ссылок предлагают сделать это за плату, шестой сайт требует регистрации, а 7й даёт прямой линк на .zip. Один из ста таких искателей заминусует первые 6 и поставит плюс 7. Если каждый сотый будет это делать, то у сайта будут шансы подняться на первое место. Вот так я себе это примено представляю. Впрочем, я и не говорю, что ребятам из Гугла нужно срочно бежать это внедрять…

    shadtchnev
    Ты исходишь из того, что остальные не будут кликать от балды или из любопытства. Один из ста это сделает, остальные покликают и не поймут зачем это вообще надо здесь (кликнул – ничего не изменилось). Это и имел в виду, когда говорил, что погрешность будет высокая: если бы только осмысленные клики были… А тот факт, что седьмая ссылка – самая лучшая будет учтен, когда один пользователей из ста в своем блоге даст на электронную книгу с прямой ссылкой на седьмой результат. Это будет учтено pagerank’ом и постепенно седьмой всплывает наверх. Другими словами, для того, что ты предлагаешь, есть более надежный и прозрачный для пользователей механизм.

    nmlss
    Отчасти верно, конечно, но это же решаемо. Сделать эту возможность, например, только для тех юзеров, кто logged-in. Т.е. пользователи Gmail и прочего, у них всё же определённый уровень есть.

    Впрочем, я не думаю, что люди будут кликать “просто так” в большинстве своём, по-крайней мере. В крайнем случае, что мешает показать попап “вы действительно хотите отдать положительный голос за этот сайт?”, отсеяв таким простым образом лишние результаты.

    А блоги всё же не у всех есть 🙂

    К тому же это надёжный и прозрачный механизм породил целый побочный бизнес с продажаей и покупкой ссылок, с каталогами сайтов и с постоянной войной оптимизаторов и работников поисковых систем)

    nmlss
    Отчасти верно, конечно, но это же решаемо. Сделать эту возможность, например, только для тех юзеров, кто logged-in. Т.е. пользователи Gmail и прочего, у них всё же определённый уровень есть.

    Впрочем, я не думаю, что люди будут кликать “просто так” в большинстве своём, по-крайней мере. В крайнем случае, что мешает показать попап “вы действительно хотите отдать положительный голос за этот сайт?”, отсеяв таким простым образом лишние результаты.

    А блоги всё же не у всех есть 🙂

    К тому же этот надёжный и прозрачный механизм породил целый побочный бизнес с продажаей и покупкой ссылок, с каталогами сайтов и с постоянной войной оптимизаторов и работников поисковых систем)

    shadtchnev
    Поверь, бизнес по кликанью на нужных сайтах появится в мгновение ока и эти спам-клики тоже надо будет отслеживать и фильтровать. Ничто не совершенно 🙂

    Я думаю, что реально революцию этот метод сделать не может, если честно – существующие методы неплохо справляются с оптимизаторами. А отягощать интерфейс элементами, которые не нужны юзеру для поиска – это довольно жестоко. Гугл сначала и выехал на своей простоте: ввел запрос – получил ответ, все 🙂

    nmlss
    Может быть, может быть 🙂

  5. Написал длинный комент и openID все нафиг порезал(не работает). Поэтому коротко. У google’а уже такой проект разрабатывается, сам немного тестировал. Ссылку не помню. Там через drag&drop сделано, можно порядок менять и выкидывать из выдачи.

  6. Написал длинный комент и openID все нафиг порезал(не работает). Поэтому коротко. У google’а уже такой проект разрабатывается, сам немного тестировал. Ссылку не помню. Там через drag&drop сделано, можно порядок менять и выкидывать из выдачи.

  7. Да, OpenID как-то криво встало, надо бы поправить. Хотите сказать, мой футуристический прогноз сбывается? 😉

  8. Да, OpenID как-то криво встало, надо бы поправить. Хотите сказать, мой футуристический прогноз сбывается? 😉

  9. всё правильно. есть конечно и минусы, но это мелочи.

    просто для них это еще рано. вот как Ян освоится с блогами, так сразу, думаю, встроит и голосование.

  10. всё правильно. есть конечно и минусы, но это мелочи.

    просто для них это еще рано. вот как Ян освоится с блогами, так сразу, думаю, встроит и голосование.

Leave a Reply