|
|
||
Основы парсинга Google В этой статье я Вам расскажу, как правильно работать с Google, т.е. как собирать нужные вам ресурсы, как подготавливать запросы и еще несколько тонкостей. Основные определения, которые вы должны знать, а если не знаете, то должны запомнить. Что такое парсинг? Парсинг – это сбор нужных вам ресурсов с Поисковой системы по правильно составленным запросам, если правильно составить поисковый запрос, то можно собрать все что угодно. Что такое Поисковые запросы? Поисковые запросы, в основном состоят из поисковых операторов + уточняющего запросам ресурса, к примеру: поисковый оператор – intext:”” и уточняющий запрос ресурса, например ресурс форум – Powered by phpbb Соединим вместе поисковый оператор + запрос, и у нас выйдет: intext:” Powered by phpbb ” если ввести этот запрос в Google, то мы увидим в выдаче только форумы. Теперь рассмотрим все подробней. 1. Вам надо знать несколько основных поисковых операторов Google: intitle:”” – этот оператор отвечает за уточнение по заголовку сайта в выдаче Google, т.е. если вы введете запрос типа intitle:”Forum”, то вы увидите такую картинку: Тем самым заметите, что у всех ресурсов в заголовке есть слово “forum”. Следующий оператор, это intext:”” – этот поисковых оператор отвечает за уточнение в тексе сайта, т.е. если Вы введете в этот оператор, уточнение “Powered by phpbb”, выйдет полностью так: intext:”Powered by phpbb ”, то Вы увидиет в выдаче Google, только те сайты в которых есть фраза “Powered by phpbb” на примере: Эти два поискового оператора intitle:”” и intext:”” можно объединять, к примеру ввести в Google такой запрос: intitle:”Forum” intext:”Powered by phpbb” Тогда Вы увидите только те сайты, в которых есть слово Forum в заголовке сайта и фраза ”Powered by phpbb” в тексте сайта. Следующий основной поисковый оператор, это: site: - этот оператор показывает уточнение по доменной зоне, если ввести такой запрос: site:com – то вы увидите в выдаче Google, сайты в доменной зоне .com Также можно совмещать этот запрос и предыдущие два запроса. Не мало важный поисковый оператор – inurl:”” inurl:”” – этот поисковый оператор показывает выдачу Поисковой Системы по нужному куску ссылки, т.е. например в ссылке есть слово forum, это слово вставляем в этот поисковый оператор, выходит inurl:”forum” и видим такую картинку: Этот поисковый оператор, можно совмещать также и с другими поисковыми операторами, например: inurl:”forum” intext:”Powered by phpbb”
inurl:”forum” intitle:”Forum
inurl:”forum” intitle:”Forum” intext:”Powered by phpbb” и т.д. И еще пару совсем простых поисковых операторов, которые вы должны знать. +”” – если сделать поисковый запрос так +”car” то Вы увидите в выдаче Google, только те сайты где присутствует слово car. Можно этот оператор совмещать с другими операторами, например: inurl:”forum” +”car”
intitle:”Forum” +”car”
intext:”Powered by phpbb” +”car”
intitle:”Forum” intext:”Powered by phpbb” +”car”
intitle:”Forum” +”car” site:com
intitle:”Forum” intext:”Powered by phpbb” +”car” site:com
+”car” site:com и т.д.. Оператор, –“” – это противоположность оператору +””, т.е. если вы сделаете запрос –“car”, то вы увидите в выдаче Google сайта где нету слова car. На этом с Поисковыми Операторами мы закончили. Переходим к следующему пункту статьи. 2. Как правильно составлять уточняющие запросы. Т.е. это фразы типа “Powered by phpbb” и т.д.. Эти запросы в основном нужны чтоб подставлять их к поисковым оператором. Создавать поисковые запросы, так: Если Вам надо собрать с выдаче Google форумы, то Вы заходите к примеру на форумов 50 и смотрите какие фразы на форумах, часто встречаются. Это могут быть фразы типа: “Последнее сообщение”
“View Topic”
"Powered by phpbb"
"Powered by IPB"
"Powered by vBulletin" И т.д. Те фразы, которые повторяются в тексте сайта, эти фразы надо подставлять к операторам intext:””, либо +”” А фразы или слова, которые часто встречаются на заголовках форумов, то их надо подставлять к оператору intitle:”” Что касается поискового оператора inurl:”” Для него надо готовить куски ссылок, которые часто встречаются, к примеру, на форумах. Например: inurl: ”showthread”
inurl: ”viewtopic”
inurl: ”forumdisplay” Все самое галвнео Вы узнали. Теперь Вы знаете все чтобы начать собирать нужные ресурсы. С Уважением BABBLS. Успехов в работе.
|
Блог / Новости |
|
BABBLS SHOP © 2011 | Все права защищены
|