Архів міток » АП «

Яндекс научився шукати в реальному часі

З недавнього часу Яндекс увійшов у нову епоху своєї еволюції відмінив АПдейти видачі. Фактично Апдейти тепер проходять кожної хвилини.

Інформацію можна прочитати на інфомаційному блозі Яндекса.

Легко ли быть зеркалом?

Яндекс всегда хотел быть зеркалом интернета. На 100% это невозможно, и мы хотим сделать вид, что мы — зеркало для тех, кто на нас смотрит. Мим за пустой рамкой несуществующего зеркала должен быть внимательным и иметь хорошую реакцию, чтобы создать иллюзию, что он — отражение. Мы в Яндексе работаем над технологиями «свежести», чтобы сделать отличия поискового индекса от интернета незаметными для людей.

Веб-мастера рунета знают, что последние несколько лет в Яндексе существовал так называемый «быстрый робот». В его задачу входила быстрая индексация и выкладывание на поиск наиболее ценных свежепоявившихся документов. Быстрый робот неплохо решал эту задачу, однако имел определенные ограничения.

Как и «большой робот», быстрый был построен по «пакетному» принципу: какое-то время готовил версию индекса с новыми документами, потом выкладывал ее на поиск. Это вносило задержку на время обработки, которую можно было сократить с помощью разных ухищрений для части документов до 20 минут, но нельзя было устранить полностью.

С момента запуска быстрого робота мир изменился. В интернете стало много людей, интересы которых далеки от технических проблем поиска, и у них вызывает крайнее изумление ситуация, когда страница на сайте есть, а в поиске ее нет. Именно поэтому правилом хорошего тона в ближайшие годы станет индексация нового за секунды.

Чтобы окончательно сделать из поискового индекса отражение, мы создали и запустили новые технологии — робот «Orange Crawler» и «Real-Time поиск». Основная разработка была сделана калифорнийским отделением Яндекса — Yandex Labs в сотрудничестве с программистами московского офиса.

Новый апельсиновый робот не прокачивает все страницы интернета, а извлекает из него свежий и сочный контент. Количество страниц в интернете бесконечно, поэтому важно их обходить в определенном порядке, чтобы в первую очередь были скачаны страницы с ценной информацией.

Веб — это не набор отдельных страниц, которые можно рассматривать независимо. Страницы сильно связаны друг с другом, данные о ссылках очень интенсивно используются в ранжировании и в отборе из всего бесконечного интернета страниц, интересных человеку.

Люди обычно попадают на новые урлы через первые страницы любимых сайтов или по ссылкам с других новых сообщений. Поисковый робот должен находить эти же ссылки, часто освежая старые страницы, и ходить по ссылкам из новых уже скачанных документов. Именно поэтому для получения качественных свежих данных робот просто обязан работать не только с новыми документами, а со всем вебом, зная его структуру.

Orange познает ссылочную структуру интернета. Для этого ему достаточно скачивать и переобходить только часть «старых» страниц — хоть и достаточно большую. Полученные знания позволяют Orange обнаруживать почти все новые страницы, выбирать из огромного их количества все хоть сколько-нибудь интересные и мгновенно рассчитывать для них ссылочные факторы ранжирования. Вслед за роботом Orange документы обрабатывает Real-Time поиск — он подхватывает выбранные документы, индексирует их и за секунды выкладывает на поиск.

С помощью Orange мы достигли значительного улучшения свежести базы. В будущем мы сделаем его еще более агрессивным: Orange будет использовать все доступные источники информации об изменениях в интернете и реагировать на эти изменения мгновенно.

Кластер Orange Crawler реализован как распределенная вычислительная система: на каждой машине одновременно выполняются сотни небольших задач, результаты их работы в виде маленьких асинхронных сообщений отправляются на другие машины. На всем кластере сегодня обрабатывается более 100 тысяч сообщений в секунду. Подобная архитектура позволяет исключить задержки при обработке Real-Time информации, очень надежна и дает неограниченные возможности к масштабированию кластера.

Свежесть — еще одна составляющая в поиске, где простой эффект достигается сложными средствами. Хорошо, когда смотрящий в зеркало видит не особенности зеркала, а только то, что в нем отражается.

Федор Романенко и Екатерина Вебер, операторы сетевой соковыжималки

далі…

Popularity: 2% [?]

АП тІЦ та плани на літо

Два дні тому, а сама 2 липня пройшов АПдейт Яндексовського тІЦ. Показники по моїх сайтах не мінялися уже давно, так і цього разу. Все глухо.

Тепер про плани на літо.

Так склалися обставини, що це літо, як ніколи потребує  додаткового заробітку. Тому працювати буду не тільки в онлайні, а і в оффлайні.

Щодо онлайну.

Планую поставити виробництво дорів на конвеєр. Кліпати по 1-2 в день (звичайно не кожного дня). Зробив ще один варез-сайт , у планах ще кілька.  Методи роботи стандартні. Про монетизацію варезників розповім в одній із наступних статтей. Покищо такі плани. Хочеться також попробувати себе у забугорному інтернеті, але незнаю чи щось з цього получиться. Про заробіток на дорвеях напишу пару статей, думаю буде цікаво. далі…

Popularity: 3% [?]

АП тІЦ 18.06.2010 + Знову в Яндексі

Хоча зараз у мене ні один сайт не монетизується за рахунок тІЦ, я всеодно слідкую за цим показником. І ось, як завжди, коли ніхто цього неочікує проходить АП тІЦ.

В моїй панелі сайтів у стовпчику тІЦ, все і залишилося без змін, тому особливо й розказати немає що.

Зрозуміло стає, Що багато методів підняття тІЦ уже не працює: посилання із коментарів та профілів (які не під тегом nofolow) уже не приносять майже ніякого результату. Хороший результат дають якісні, довговічні посилання, це можуть бути як сквозні, постові, так і посилання з бірж (типу SAPE) закуплені на довгий термін.

Тепер хороша новина!!! Сам не очікуючи цього, при перевірці тІЦ блога замітив, що  сторінки блогу знову потрапили в індекс Яндекса. І “їсть” їх зара на ура. Нарещі це сталося. Тепер буду старатися просувати його і в Яндексі!)

Всім удачі.
далі…

Popularity: 3% [?]

Категорія: АП, Думки
 Мітки: , , , , ,     1 коментар

Яндекс враховує Nofollow

Пару днів тому в інтернеті створилася паніка над новиною, що Яндекс крім свого nioindex почав враховувати і гугловський noffolow. Читаємо тут.

Які можна з цього зробити виводи:

- Спам в коментарях на блогах став безкорисний.

- Соц. закладки з тегом nofollow стануть нецікаві для оптимізаторів.

- Посилання з Вікіпедії не будуть враховуватися.

- Тепер і у нас будуть популярні dofollow блоги. І думаю будуть дуже сильно спамитися.

- Думаю наступного АПу, тІЦ масово знизиться, що значно підніме ціни на біржах посилань.

Popularity: 4% [?]

Категорія: SEO, Новини
 Мітки: , , , , ,     прокоментуй!

АП PR та тІЦ

АП PR 03.04.10

На двох дорах, для яких закупалися посилання ПР PR піднявся до 1.  Решта без змін. Очікував підняття  PR і на блозі, але він і залишився 1, як був.

Ап тІЦ 08.04.10

Прокачував тІЦ тільки на блозі, але він не змінився, залишився 10. Всі сайти без змін. Немає мені навіть чим порадіти.

Popularity: 3% [?]

Категорія: АП
 Мітки: , , , ,     прокоментуй!

АП тІЦ 19.02.2010

Вчора знову Яндекс обновив показник тІЦ.

Для мене щоб не радісний став цей АП. Ніодного сайту в плюсі. Один впав з 10 на 0, решта без змін.

Думав блог отримає ще одну 10. Поставив пару “жирних” посилась в сапі. Вибирав близькі тематики і присутність а ЯК. Поставлю ще пару посилань і буду чекати наступного АПу.

Popularity: 3% [?]

Категорія: АП
 Мітки: , , ,     прокоментуй!

Останній АП тІЦ цього року

тИЦ

тИЦ

24 грудня відбувся останній АП тІЦ цього року. Проведу аналіз. Нарещі блогу вернули 10 тІЦа. Варезник отримав -10, давно нічого з ним не робив. Думаю потрібно прогнати його по хороших каталогах і закупити пару посилань. Далі мій кіносайт, думав отримає +10, як мінімум, але залишився з 10, напевне це через маленький вік зворотніх посилань.

Решта сайтів без особливих змін. Чекаємо наступного АПу і Нового Року!

Popularity: 6% [?]

Категорія: АП
 Мітки: ,     прокоментуй!

АП тІЦ і PR одночасно (30.10.2009)

Вчора відбулося зразу два АПа тІЦ і PR.  Особливих змін у мене на проектах спостерігати не довелося. Хоча, різко зросли позиції одного сайту в гуглі. Сайт створив спеціально для кінопартнерки. Через місяць напишу про нього і мій метод заробітку на кіно партнерках. Наразі це все.

Popularity: 21% [?]

Категорія: АП, Мої проекти
 Мітки: , ,     прокоментуй!

АП тІЦ

16 жовтня несподівано для мене пройшов апдейт тІЦ. І тут результати зразу показалися. Сайти, які були уже з тІЦом, його не втратили (хоча і + тоже нема :( .) Блог так і залишився на 0, не знаю що то таке. Було ж раніше 10, куди вона пропала і яким чином?

Мій новий кіно сайт заточений під кінопартнерку, який я активно просуваю в маси на пузомірки та відвідуваність отримав всього десяточку, хоча я планував на 20. Але добре що є рух в  гору.

От і усе вроді.

Доречі відновив роботу із SAPE. Закинув туди два сайти з тІЦами і грошики потрохи капають. Буду розширятися ….

Popularity: 31% [?]

Категорія: АП, Мої проекти
 Мітки: , , ,     прокоментуй!

АП тІЦ 25.06.09 і АП PR 24.06.09

АП тІЦ 25.06.09 і АП PR 24.06.09

АП тІЦ 25.06.09 і АП PR 24.06.09

Пройшов таки АП PR. Мало чим він мене порадував, так як усі сайти залишаються без змін. Ось тільки блог 1+1=2. Сайти на який добре був набитий PR з допомогою каталогів помало втрачають свій приріст до мінімума.

Наступного ж дня знову АП, тепер уже АП тІЦ. Також нічого особливо радісного, окрім блогу. Нарещі блог має 10 тІЦ. На цьому не буду зупинятися, буду продовжувати накачувати свій блог пузомірками. Адже воно вернеться – сторицею :)

далі…

Popularity: 78% [?]

Категорія: АП, Мої проекти
 Мітки: , , ,     1 коментар