pdf PDF sense OCR biorxiv_a2021.06.09.447792iENG.pdf