Вход |  Регистрация
 
 
Время электроники Воскресенье, 11 декабря
 
 


Это интересно!

Новости


Обзоры, аналитика

Итоги Форума и премии «Живая электроника России - 2016»


Интервью, презентации

Ранее

Планируется ввести регистрацию автомобиля через интернет

Правительство активно пытается перевести часть госуслуг в интернет. Главной причиной называется исключение антикоррупционной составляющей и снижение бюрократических процедур.

Мобильные операторы ставят Skype на отдельный счетчик

Российские операторы вводят новые системы учета трафика, позволяющие по разному тарифицировать интернет и IP-трафик, что приведет к удорожанию разговора с помощью таких программ, как Skype.

Стоимость 1Гб памяти для плееров снизилась на 68% за два года

Аналитики Яндекса подготовили исследование, посвященное тому, как изменились некоторые товары – сотовые телефоны, цифровые фотоаппараты, ЖК-телевизоры, цифровые плееры и GPS-навигаторы – за последние два года.

 

9 июля

Яндекс запустил в сеть нового робота

Крупнейший российски поисковик создал и запустили новые технологии — робот «Orange Crawler» и «Real-Time поиск». Это позволит ускорить индексирование поисковиком нового и обновляемого контента.

П

ринцип действия нового робота заключается в том, что он не индексирует подряд все страницы, а извлекает из него только новый и обновленный контент. Количество страниц в интернете бесконечно, поэтому важно их обходить в определенном порядке, чтобы в первую очередь были скачаны страницы с ценной информацией.

Orange познает ссылочную структуру интернета. Для этого ему достаточно скачивать и переобходить только часть «старых» страниц — хоть и достаточно большую. Полученные знания позволяют Orange обнаруживать почти все новые страницы, выбирать из огромного их количества все хоть сколько-нибудь интересные и мгновенно рассчитывать для них ссылочные факторы ранжирования. Вслед за роботом Orange документы обрабатывает Real-Time поиск — он подхватывает выбранные документы, индексирует их и за секунды выкладывает на поиск.

«С помощью Orange мы достигли значительного улучшения свежести базы. В будущем мы сделаем его еще более агрессивным: Orange будет использовать все доступные источники информации об изменениях в интернете и реагировать на эти изменения мгновенно.» — написано  в корпоративном блоге компании.

Кластер Orange Crawler реализован как распределенная вычислительная система: на каждой машине одновременно выполняются сотни небольших задач, результаты их работы в виде маленьких асинхронных сообщений отправляются на другие машины. На всем кластере сегодня обрабатывается более 100 тысяч сообщений в секунду. Подобная архитектура позволяет исключить задержки при обработке Real-Time информации, очень надежна и дает неограниченные возможности к масштабированию кластера.

Источник: Яндекс

Оцените материал:

Комментарии

0 / 0
0 / 0

Прокомментировать







 
 
 




Rambler's Top100
Руководителям  |  Разработчикам  |  Производителям  |  Снабженцам
© 2007 - 2016 Издательский дом Электроника
Использование любых бесплатных материалов разрешено, при условии наличия ссылки на сайт «Время электроники».
Создание сайтаFractalla Design | Сделано на CMS DJEM ®
Контакты