Google навчився індексувати відскановані документи

Листопад 3, 2008 – 10:08 am

Компанія Google оголосила про те, що її пошуковик навчився індексувати текст на відсканованих зображеннях.
З слів представників компанії, для визначення тексту на картинці використовується спеціальна технологія оптичного роспізнавання Optical Character Recognition, яка вміє конвертувати зображення слів у файли з текстом.

На сьогоднішній день, пошукова система Google вміє розпізнавати тільки текст в документах формату PDF.