|
|
|
|
|
|
Мониторинг конкурентов, как система. |
|
Постов: 5253 Дата регистрации: 24.05.2003 |
Цитата, автор nugyandex.ru:
Привет!
Осваиваю NetCaptor и получил информации, что дальнейшая работа над этой прогой закрыта т.к.вышел Internet Explorer 7.
Что это значит? |
так как NetCaptor построен на базе ядра IE - то это значит, что когда вы установите у себя 7 версию IE - NetCaptor работать не будет... |
|
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
21.05.2008 09:54 | |
|
|
|
Жернаков Постов: 20 Дата регистрации: 20.04.2008 |
PS Боюсь вы будете поражены, но уже IE 8 beta вышел. И еще - who is mr.NetCaptor? Я конечно посмотрел про него в сети, но это реально та прога, которую стоит осваивать? У нее есть реальные преимущества перед FF и Opera?
[/quote]
Спасибо, поищу, опробую. |
|
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
23.05.2008 10:35 | |
|
|
|
Постов: 3209 Дата регистрации: 28.10.2005 |
для: nugyandex.ru©
Вы бы ник сменили, Правилами запрещено иметь ник в виде урла. |
|
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
23.05.2008 10:45 | |
|
|
|
Ride the lightning
Постов: 2245 Дата регистрации: 08.08.2006 |
Вот еще некоторые хитрости, предназначенные для тех, кто хочет читать информацию, которую так просто не увидишь.
Некоторые пользователи ЖЖ ведут дневники таким образом, что их посты висят видимыми несколько часов или дней, а затем автор их переводит в режим видимости «только для друзей» или «приватный». Тем самым они пытаются внести некоторую эксклюзивность в свой блог, а также, загонять на блог пользователей ежедневно, чтобы они «не пропустили чего-то мега интересного». Есть способ читать такие посты когда вам самим этого захочется.
Просто добавляйте RSS поток такого дневника в Google Reader, а затем, когда появится единственный видимый пост, просто нажмите «all items»:
После этого все посты появятся в единой ленте вашего ридера. Работает это потому, что, если вашего блоггера читал до вас в Google Reader хотя бы один читатель, то его записи кешируются сервисом и уже ему-то все равно, что сделал ваш блоггер, скрыл или удалил свой мега пост :)
Добавляйте RSS-фид вот в таком виде: http://zhzh-user.livejournal.com/data/rss.
Взято с Lifehacker |
|
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
31.05.2008 10:55 | |
|
|
|
Ride the lightning
Постов: 2245 Дата регистрации: 08.08.2006 |
Разработчики из подразделения краулинга и индексации (Crawling and Indexing Team) сообщили о важном эксперименте, который начался совсем недавно. Они осуществили апгрейд краулера и начали испытывать технологию интеллектуальной обработки HTML-форм. После апгрейда робот-краулер должен научиться получать скрытые URL'ы и веб-страницы, которые генерируются в ответ на обработку форм на различных сайтах и которые невозможно получить иным путем.
На практике технология работает так: при встрече с элементом обработчик форм осуществляет ряд пробных запросов. Для текстовых полей в качестве запросов автоматически выбираются слова с этого самого сайта, на котором находится форма. Значения чекбоксов и выпадающих меню берутся непосредственно из кода страницы. После этого программа пытается обработать полученный URL. Если страница действительно содержит некий контент, то ее отправляют на индексирование в общий поисковый индекс.
Несмотря на кажущуюся простоту и очевидность, обработка HTML-форм является очень важным шагом по вытаскиванию на свет так называемой "Невидимой Сети" (Deep Web) - огромных массивов информации, которые скрываются в больших базах данных, открытых миру через интерфейсы HTML-форм. Это юридические БД, разнообразные справочники (телефоны, адреса, цены) и прочие массивы данных. По некоторым оценкам, Невидимая Сеть содержит сотни миллиардов страниц и охватывает 90% всего содержимого Интернета. Нужно заметить, что именно там скрывается самый ценный контент, который до сих пор не доступен через стандартные поисковики.
Правда, в любом случае, огромный кусок Невидимой Сети по-прежнему останется за пределами досягаемости Google, потому что краулеру запрещено вводить какие бы то ни было пароли или другую персональную информацию в поля форм: таково решение разработчиков и руководства Google. А ведь очень многие сайты предоставляют открытый доступ к информации только после бесплатной регистрации на сайте. Но с юридической точки зрения робот Google не имеет права создавать фиктивную личность специально для регистрации, потому что это является мошенничеством и противоречит принципам всегда дружелюбного гуглобота.
Кстати, знающие люди уже объяснили, откуда растут ноги у новой технологии краулинга. Скорее всего, ее создала команда разработчиков из маленькой компании Transformic, которую Google приобрела в 2005 году. Последние два с половиной года они упорно трудились, совершенствуя свою разработку и помогая интегрировать ее в краулер Google.
Взято отсюда: http://ppc-seo.blogspot.com/2008/05/google_15.html |
|
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
31.05.2008 11:07 | |
|
|
|
| Только зарегистрированные пользователи могут оставлять сообщения в этом форуме |
|
|
|
|
|
© "ООО Состав.ру" 1998-2024
тел/факс: +7 495 225 1331 адрес: 109004, Москва, Пестовский пер., д. 16, стр. 2
При использовании материалов портала ссылка на Sostav.ru обязательна! Администрация Sostav.ru просит Вас сообщать о всех замеченных технических неполадках на E-mail
|
|
|