Dokumenty PDF umożliwiają łatwe kopiowanie treści i obrazów, co pozwala na ich transfer, na przykład do pakietu biurowego Word. Niemniej jednak niektóre pliki PDF są zabezpieczone przed możliwością kopiowania.
Podczas tworzenia PDF możemy zablokować opcję kopiowania, co uniemożliwia ręczne wycięcie fragmentu tekstu. Istnieją jednak metody na ekstrakcję treści z zabezpieczonego dokumentu PDF. W tym artykule przedstawimy, jak skopiować tekst, obrazy, wykresy i inne elementy z takiego pliku. Niektóre z tych sposobów mogą wydawać się proste, ale są skuteczne! 🙂
Jak skopiować tekst z PDF?
Sposób 1. CTRL + A -> CTRL + C -> CTRL + V 🙂
Najprostszym sposobem jest próba zaznaczenia całej treści poprzez kombinację klawiszy CTRL+A
, a następnie skopiowanie jej CTRL+C
i wklejenie do programu, jak na przykład Word, za pomocą CTRL+V
.
Jeśli ten sposób nie zadziałał, zastanów się nad wypróbowaniem innej metody.
Sposób 2. Użycie online’owego konwertera PDF na TXT.
Możesz przesłać swój dokument PDF na wybranej stronie internetowej, a specjalne narzędzie automatycznie wyekstrahuje z niego cały tekst.
Oto kilka przykładowych konwerterów PDF na tekst, które polecam:
Jeżeli treść dokumentu PDF jest trudna do zaznaczenia, może to wynikać z tego, że strony przedstawiają treść w formie grafik bitmapowych. W takim przypadku ten sposób może nie przynieść satysfakcjonujących rezultatów.
Sposób 3. Używanie płatnych edytorów PDF.
Płatne edytory, takie jak Adobe Acrobat PRO czy WPS PDF, umożliwiają nie tylko kopiowanie, ale również edycję dokumentów PDF oraz ich eksport do Worda.
Sposób 4. Wykorzystanie technologii OCR (Optyczne Rozpoznawanie Znaków).
Jest to specjalne oprogramowanie zdolne do rozpoznawania tekstu na obrazach. Jeżeli posiadasz zabezpieczony dokument PDF lub tekst prezentowany jest w formie obrazu, możesz skorzystać z tej metody. W zależności od jakości pliku, używanego języka oraz czcionki, rezultaty mogą się różnić.
Poradnik konwersji PDF na TXT z użyciem technologii OCR:
Aplikacja Sharex
- Pobierasz Sharex, lub inną bezpłatna aplikacja OCR. Możesz też skorzystać z konwertera online. Wpisujesz w wyszukiwarkę
Free online OCR.
- Sharex to aplikacja do wykonywania zrzutów ekranu, jednak posiada dodatkową funkcję OCR takiego zrzutu. Po instalacji uruchamiasz program, wybierasz
Capture -> Text Capture (OCR)
.
- Kolejny krok to zaznaczenie fragmentu ekranu z stroną PDF. Następnie po chwili program połączy się z usługą OCR i wygeneruje tekst.
- Sharex umożliwia wykonanie zrzutu ekranu z automatycznym scrollowaniem, które można następnie użyć OCR-u.
W zależności od pliku treść tekstowa dokumentu może znacząco się różnić. Warto sprawdzić inne aplikacje OCR, ponieważ mogą dać o wiele lepsze wyniki.
Aplikacja WPS Office
WPS Office jest bezpłatnym pakietem biurowym o ogromnych możliwościach, jedną z nich jest możliwość edycji PDF. Edytor posiada wbudowany OCR, dzięki któremu możesz wygenerować tekst ze zdjęcia znajdującego się w PDF. Większości funkcjonalności jest płatna, jednak aplikacja umożliwia bezpłatne wyciągnięcie treści z dokumentu PDF.
- Otwierasz plik PDF w aplikacji, zaznaczasz zdjęcie oraz opcję
obraz na tekst
.
- Wybierasz opcję
wyodrębnij tylko tekst
.
- Po kilku sekundach pojawia się tekst z dokumentu PDF, którego nie mogłeś skopiować.
Jak skopiować, zapisać obrazek z PDF?
Sposób nr 1. Zrzut ekranu
Wystarczy zaznaczyć odpowiednią część ekranu i wykonać zrzut ekranu (ang. print screen) do pliku graficznego. Umożliwia to, chociaż program Sharex. Następnie taką grafikę możesz poprawić w aplikacji graficznej np. Photopea.com
Sposób nr 2. Wykorzystanie WPS PDF Office
Jak już wspomniałem w punkcie z kopiowaniem tekstu. Wystarczy otworzyć plik PDF w WPS. Następnie wybrać zdjęcie, tak by aplikacja je oznaczyła i nacisnąć prawy przycisk myszy. Funkcja ta jest bezpłatna!
Pojawi się menu kontekstowe z opcją eksportu Zapisz lokalnie jako
. Aplikacja wyeksportuje zdjęcie z PDF do formatu PNG.
Jak skopiować, zapisać tabele, wykres z PDF?
Wszystko zależy od tego jak dany wykres czy tabela została wgrana do dokumentu PDF. Jeżeli w formacie zdjęcia to można je wyeksportować za pośrednictwem narzędzia WPS Office jak na zdjęciach powyżej, jeżeli chodzi o same dane to można użyć OCR-u z pierwszej części tekstu.