|
|
|
|
|
|
Постов: 3 Дата регистрации: 12.10.2006 |
??? Не очень понимаю, по какой системе работают поисковики. Толи они как то сами лазают по сайту, прыгая по всем ссылкам, толи просто сканируют все файлы на сервере…
Подскажите плз.
У мне на домене newuo.ru 2 сайта на пхп на 1 домене, зарегеном в нескольких поисковиках. Второй сайт не влез целиком, места много жрёт, поэтому там стоит только текстовой скелет и все ссылки с него ведут на http://81.222.235.41:81
Возможно если поисковики сами тыкаются по ссылкам то и не понимают ссылку на неизвестный АПИ, и ещё на 81 порту (
Кстати может есть какие проги которые регят сами в поисковиках ? Или где можно побольше можно почитать о регистрации в поисковиках, как эффективней это сделать.
Спасибо за внимание.
|
|
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
12.10.2006 11:23 | |
|
|
|
CMS Maker Постов: 2504 Дата регистрации: 24.11.2005 |
для: voimix© попробуйте переписать Ваш пост на общепонятном русском/английском. И разбейте по темам. |
|
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
12.10.2006 11:33 | |
|
|
|
Постов: 196 Дата регистрации: 12.01.2006 |
Цитата, автор voimix:
??? Не очень понимаю, по какой системе работают поисковики. Толи они как то сами лазают по сайту, прыгая по всем ссылкам, толи просто сканируют все файлы на сервере…
|
как вы себе представляете процедуру "сканирования всех файлов на сервере"? Это, между прочим, нарушение закона о защите информации :)
конечно роботы ходят по ссылкам. причем IP им не сильно важно - важен адрес |
|
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
12.10.2006 17:37 | |
|
|
|
Постов: 3 Дата регистрации: 12.10.2006 |
так что получается, неважно где на сервере лежат файлы с информацией. важно что бы они все были связаны между собой ссылками ? |
|
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
12.10.2006 18:15 | |
|
|
|
Постов: 1719 Дата регистрации: 04.03.2005 |
для: voimix©
Роботы Яндекса - это программки, которые ходят по сайтам от ссылки к ссылке и складывают содержание сайта в свою базу (на свои сервера, коих у Яндекса сотни, а может и тысячи). А уже ищет информацию Яндекс не по реальному сайту, а по своей базе, в которой как правило немного устаревшие версии его страниц (если вы сайт часто меняете). Поэтому если ввести на сайт некую фразу и попробовать сразу найти по ней его в Яндексе, то ничего не выйдет. А вот по старой фразе выйдет очень даже успешно, если фраза длинная или непопулярная (не представляет интереса для оптимизаторов).
Роботы Яндекса бывают нескольких видов - скажем, условно, легкие (быстрые) и тяжелые (медленные). Легкий ходит часто, но он не копирует содержание страницы сайта в базу (точнее копирует, но не все страницы и не всю инфо - его собственная база маленькая), а просто определяет, обновилась ли страница, если да, то как давно и насколько сильно и т.п. А потом дает команду "тяжелому" роботу переиндексировать страницу (видимо он еще и срочность переиндексации определяет), т.е. поменять на сервере Яндекса ее содержание на новое. Так как индексация - дело долгое, то Яндекс не все страницы индексирует быстро. Кроме того, складывая в свою базу содержание страницы (а это текст, подписи к картинкам, текст ссылок и метатеги и т.п.), Яндекс может копировать не весь текст, если он длинный, а только его часть. Также надо понимать, что Яндекс не видит (плохо видит) то, что зашито в скрипты или Flash (т.е. не видит всплывающие разделы навигации, например, или flash навигацию) и посему не заходит на страницы, на которые ведут ссылки с таких навигаций.
Переходит Яндекс от страницы к странице по ссылкам, т.е. если все страницы у вас связаны ссылками, то рано или поздно Яндекс их найдет. При этом за один сеанс Яндекс индексирует не все страницы сайта. Особенно, если страницы динамические - со знаком вопроса в адресе. Это связано с тем, что на динамических сайтах могут плодиться масса страниц без какой-либо пользы (всякие архивы корзин заказов, служебные страницы и т.п., которые нафиг никому не нужны). Поэтом Яндекс и ограничивает число проиндексированных страниц на таких сайтах, чтоб не увязнуть в дебрях одного бестолкового динамического сайта (т.е. чтоб зря время не тратить). Если Вам надо, чтобы Яндекс проиндексировал определенные страницы Вашего сайта, то лучше на них сделать ссылку с главной страницы.
Вы можете не регистрировать сайт в поисковике - он сам его найдет. Или по ссылке, или зайдя через базу доменов второго уровня, которые в Роснииросе. Другое дело, как быстро найдет. Яндекс быстро находит сайты, особенно новые. Но лучше зайти в Яндекс, Рамблер и Гугл и добавить сайт вручную. Это займет 3 мин. В тысячи поисковиков автоматом сайт не нужно добавлять - в этом нет смысла. |
|
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
12.10.2006 19:08 | |
|
|
|
Постов: 3 Дата регистрации: 12.10.2006 |
Спасибо за подробное объяснение!!! |
|
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
12.10.2006 20:37 | |
|
|
|
Просто маркетолог Постов: 5216 Дата регистрации: 17.11.2003 |
To moderator - а может, завести в разделе что-то типа FAQ и такие посты, как сейчас написал Artus туда выкладывать? Именно как пост. Тема закрытая, добавляется только модератором. Ну жалко просто будет, если это в глубины уйдет. Я за последние пару месяцев здесь с десяток такого уровня постов видел, которые для любого новичка будут просто огромной помощью! А порой и не для новичка! |
|
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
14.10.2006 00:04 | |
|
|
|
CMS Maker Постов: 2504 Дата регистрации: 24.11.2005 |
для: Artus©
Легкий ходит часто, но он не копирует содержание страницы сайта в базу (точнее копирует, но не все страницы и не всю инфо - его собственная база маленькая), а просто определяет, обновилась ли страница, если да, то как давно и насколько сильно и т.п. |
Робот не может определять изменения на странице без записи контента.
для: voimix© все происходит так:
Бот заходит на морду и скачивает весь контент. Далее он собирает ссылки, как внутренние так и внешние. Внешние он сравнивает со своей базой, и если в базе такого домена нет - "он идет к нему". После сбора ссылок с главной страницы бот скачивает контент со страниц по этим ссылкам.
И повторяет процедуру обработки.
Записанный в базу (или файлы - у всех по разному) контент подвергается разбиению на слова и хиты этих слов в контенте (кто не знает, я рекомендую статью "Растолкованный Page Rank).
И после команды админов поисковика начинается глобальный индекс, который перетряхивает всю информацию, раскладывая по полочкам. |
|
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
14.10.2006 14:29 | |
|
|
|
Arbeit macht frei
Постов: 7061 Дата регистрации: 04.03.2005 |
для: voimix©
Еще до кучи робот сравнивает контент на совпадение с уже имеющимся в его индексе. Другой робот смотрил зеркала сайтов. Еще один - индексирует картинки.
Но все (почти) роботы указаны здесь: http://webmaster.yandex.ru/faq.xml?id=502499#robot
для: Arsenij©
Я в дайджест эту тему включу - имхо, для вменяемых будет достаточно
|
|
|
1 |
|
0 |
Комментарий понравился? |
|
1 |
|
0 |
14.10.2006 15:20 | |
|
|
|
CMS Maker Постов: 2504 Дата регистрации: 24.11.2005 |
для: AAZ© это смотря чей робот.
То, что Яша клеит автоматом похожий контент - не более, чем миф.
Достаточно зайти по среднечастотным запросам. Сплошные дубли. Клеят они ручками.
|
|
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
14.10.2006 17:23 | |
|
|
|
Управляю интернет-проектами Постов: 801 Дата регистрации: 29.11.2005 |
Цитата, автор pelvis:
для: AAZ© это смотря чей робот.
То, что Яша клеит автоматом похожий контент - не более, чем миф.
Достаточно зайти по среднечастотным запросам. Сплошные дубли. Клеят они ручками.
|
К тому же, судя по их последним сообщения, у них какие-то технические вопросы и сейчас есть определённые два человека, кто занимается этим ручками. Т.е. это более-менее проверенная информация. |
|
-------- -------------------
ветка про BTL: http://www.forumsostav.ru/78/
Кампании в социальных медиа: http://www.in-man.ru (InManagement)
|
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
16.10.2006 08:55 | |
|
|
|
Постов: 196 Дата регистрации: 12.01.2006 |
для: AAZ© это смотря чей робот.
То, что Яша клеит автоматом похожий контент - не более, чем миф.
Достаточно зайти по среднечастотным запросам. Сплошные дубли. Клеят они ручками.
[/quote]
К тому же, судя по их последним сообщения, у них какие-то технические вопросы и сейчас есть определённые два человека, кто занимается этим ручками. Т.е. это более-менее проверенная информация.[/quote]
2 чела клеят ручками сотни тысяч документов??? :)
|
|
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
16.10.2006 16:18 | |
|
|
|
Arbeit macht frei
Постов: 7061 Дата регистрации: 04.03.2005 |
для: qq©
ДелИтесь инфой, как оно на самом деле со склейкой контента (про склейку одинакового теста ссылок спрашивать не буду, обещаю ) |
|
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
16.10.2006 16:38 | |
|
|
|
CMS Maker Постов: 2504 Дата регистрации: 24.11.2005 |
|
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
16.10.2006 17:35 | |
|
|
|
Постов: 1719 Дата регистрации: 04.03.2005 |
Цитата, автор AAZ:
для: qq©
Про склейку одинакового теста ссылок спрашивать не буду, обещаю |
А зря... Я бы послушал детали процесса... |
|
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
17.10.2006 16:04 | |
|
|
|
Arbeit macht frei
Постов: 7061 Дата регистрации: 04.03.2005 |
для: Artus©
Ну, так надо ж быть реалистом - зачем задавать вопросы, на которые не будет ответа? |
|
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
17.10.2006 21:41 | |
|
|
|
Постов: 19 Дата регистрации: 10.02.2007 |
Цитата, автор Artus:
Про склейку одинакового теста ссылок спрашивать не буду, обещаю |
А зря... Я бы послушал детали процесса...[/quote]
Зря не будете задавать, т.к. в гугле уже давно такая склейка идет, если вы создадите 1000 ссылок с аббревиатурой SEO, например, идущие на ваш сайт, то вы все равно не ведете в топ по этому запросу, т.к. гугл вас просто удалит, у них очень сильная антиспамовая защита, которая обращает внимание какие ссылки идут, с каким текстом, куда идут... тоже самое, если у вас 100% ссылок будет идти на главную страницу, то вас также выкинут. Всегда надо создавать структуру ссылок, которая будет казаться поисковикам естественной, а не созданной для обмана поискового робота. Например, 10% с одним ключевым словом, 20% с другим, 30% на главную, остальное на второстепенные страницы и т.п. Честно говоря, мне гугл нравится :) |
|
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
10.02.2007 21:32 | |
|
|
|
| Только зарегистрированные пользователи могут оставлять сообщения в этом форуме |
|
|
|
|
|
© "ООО Состав.ру" 1998-2024
тел/факс: +7 495 225 1331 адрес: 109004, Москва, Пестовский пер., д. 16, стр. 2
При использовании материалов портала ссылка на Sostav.ru обязательна! Администрация Sostav.ru просит Вас сообщать о всех замеченных технических неполадках на E-mail
|
|
|