Google OCR
Google abrió el código del sistema OCR (reconocimiento de texto) que utiliza para escanear libros.
Tesseract, desarrollado por HP entre 1985 y 1995 llevaba juntando polvo todos éstos años después que HP abandonara el negocio del reconocimiento de texto.
Con la ayuda de La Universidad de Nevada arreglaron algunos bugs que venía arrastrando y decidieron abrir el código (no se sabe bajo que licencia todavía) y lo lanzaron.
Un dato que no es menor, es que aún no hay de donde bajarlo, asi que si alguien lo quiere, lo puede bajar de acá.



