vovere rašė:
tai juk aiškiai parašyta kad reikalinga atvirkštinis variantas iš pdf paversti į wordą exelį ar dar kažką
Visiškai neaiškiai - čia jūsų prielaida, kad klausėjas to klausia. Kiti, pvz.,"nuima" ir nuotraukas, tai yra nufotografuoja. Čia yra barbarizmas - tiesioginis vertalas iš rusų kalbos "снять", kaip ir kiti, pvz. datos ("vasario penkto", "kovo dešimto").
Apie word ir excel iš pdf apskritai net neužsiminta.
Taigi, greičiausiai nori "nuimti pdf", tai yra paversti pdf formatu.
Pdfcreator leidžia pasirinkti iš 13 formatų, tame tarpe ir paprasto tekstinio ir veikia kaip paprastas spausdintuvas, t.y. spausdina iš visų programų. Microsoft Office 2007 leidžia išsaugot pdf formatu be jokių priedų.
Apie PDF:
Tai yra suspaustas formatas, skirtas peržiūrai, o ne redagavimui, todėl jo redagavimas yra ribotas net ir su specialiomis programomis. Tekstą galima perkelti tokiu būdu, kaip siūlė anksčiau kolega - pažymėt ir kopijuot. Kitas variantas - naudoti teksto atpažinimo programas. Priklausomai nuo dokumento kalbos, teksto atpažinimo programos gali būti nemokamos arba mokamos, su daugiau funkcijų (išlaiko formatavimą, perkelia su paveiksliukais, t.y. paverčia redaguojamu), kartais būna pateikiamos su kitomis programomis (pvz. Tildės biuras buvo su Abbyy finereader 5.0 sprint) ar įranga - skaitytuvais ar net kopijavimo aparatais pvz. Toshiba.
Viena geriausių mokamų - Abbyy Finereader.
Dėl teksto atpažinimo nemokamų programų:
Galima bandyti
www.free-ocr.com/ - reikia nusiųsti failą į tinklalapį.
Nemokamos teksto atpažinimo programos kol kas dar atpažįsta tik tekstą, be formatavimo, bet jos yra tobulinamos ir tikėtina, kad artimiausiu metu irgi dokumento išlaikys formatavimą.
Galima parsisiųsti FreeOcr iš http://www.paperfile.net/ ir įsikelti lietuvių kalbos atpažinimą, kurį pridedu. Kadangi neatpažįsta formatavimo, tai, jei puslapyje yra keli stulpeliai, geriau pažymėti po vieną stulpelį ir atpažinti atskirai.
Atpažinimo kokybė priklauso nuo pakišamo dokumento kokybės (rekomenduojama ne mažiau 200 taškų, o geriau 300)
tesseract-ocr-lit_2.03_0.3.zip