Google отсканировал 1 миллион книг

Логотип сервиса Google Book SearchЕще в 2007 году компания Google заключила соглашение с консорциумом нескольких американских университетов, называющим себя CIC, для того, чтобы пополнить коллекцию книг Google Book Search (Поиск книг Google) более чем 10 миллионами изданий. Все это время Google занималась оцифровкой книг с одной лишь благородной целью – сделать книги доступными для всех. На прошлой неделе в компании заявили о том, что им удалось отсканировать уже миллион печатных изданий из библиотек CIC. Всего же гугляне оцифровали более 15 миллионов изданий, которые может просмотреть каждый.

Конечная цель гуглян впечатляет своим размахом – сделать цифровые копии каждой книги в мире. Для этого компания заключает договора с издательствами, библиотеками и университетами. Несмотря на множество досадных промахов и задержек, прямо сейчас в Google могут похвастаться, что милионный рубикон перейден. Каждая книга была отсканирована, переведена из изображения в цифровой текстовый формат при помощи технологии оптического распознавания символов (OCR) и добавлена в индексацию Google Book Search. После оцифровки книги отправлены обратно в библиотечные фонды, а сотрудники компании отправились за новой порцией «сырья» с рюкзаками за плечами.

Страница Google Book Search

Это всего лишь первый шаг в масштабном и долгоиграющем проекте, являющимся результатом партнерских отношений между Google и CIC. Работа далека от своего завершения, хотя в целом, обе стороны заинтересованы в скорейшей реализации общей цели. К слову сказать, в компании собираются сделать доступными для широкого круга пользователей 10 из 85 миллионов изданий, которые можно найти в закромах университетских библиотек. Естественно, отсканированные книги теперь доступны через сервис Google Book Search, по крайней мере, их можно найти. А вот прочитать удастся не все. Если книга защищена авторским правом (а таких изданий, как вы понимаете, большинство), то ресурс предоставляет возможность прочитать пару абзацев, а затем  дает ссылки на покупку издания.

 

Обсуждение