pdf PDF sense OCR preprints202410.2193.v1.pdf