pdf PDF sense OCR modelharvard_a2025.pdf