Google навчився індексувати відскановані документи
Листопад 3, 2008 – 10:08 am
Компанія Google оголосила про те, що її пошуковик навчився індексувати текст на відсканованих зображеннях.
З слів представників компанії, для визначення тексту на картинці використовується спеціальна технологія оптичного роспізнавання Optical Character Recognition, яка вміє конвертувати зображення слів у файли з текстом.
На сьогоднішній день, пошукова система Google вміє розпізнавати тільки текст в документах формату PDF.