Поисковые движки получают новые источники контента

Как мы уже упоминали ранее, миссия Google состоит в том, чтобы "организовать мировую информацию и сделать ее полезной и доступной отовсюду". Это сильное заявление, особенно в свете того факта, что очень много информации еще не попало в Интернет.

Частью усилий компании Google по переносу данных в Интернет стала запущенная в 2004 г. инициатива по сканированию книг (чтобы их можно было включить в поисковый движок Book Search (http://books.google.com/)). Это стало объектом судебного преследования со стороны авторов и библиотек, однако в конце 2008 г. было достигнуто соглашение (http://books.google.com/googlebooks/agreement/). Это соглашение еще должно быть полностью ратифицировано сторонами. Помимо книг, стоит также сканировать и другие исторические документы. Google не единственная организация, которая занимается такими задачами (например,http://www.recaptcha.net).

Точно так же и у владельцев контента имеется большое количество собственной информации, которая обычно недоступна публике. Часть этой информации закрыта учетными записями (предоставляется по принципу подписки). Чтобы владельцам такого контента создать стимул с целью сделать его доступным для поиска, Google выдвинула свою концепцию First Click Free (уже обсуждавшуюся в главе 6), которая позволяет Google просматривать предоставляемый на условиях подписки контент.

Однако значительное количество контента в Интернете отсутствует вовсе, и именно эту информацию поисковые движки хотят проиндексировать. Для доступа к ней они могут обратиться к владельцам контента и заключить сделки на предоставление контента. Этой деятельностью занимаются все поисковые движки.