Odczyt tekstu z plików PDF w Javie

pdfZałóżmy, że zlecono nam wykonanie zadania odczytu faktur od klientów. Dokumenty będziemy otrzymywać w plikach PDF, z których należy pobrać pewne dane tekstowe.
Poniżej przedstawię dwa sposoby na wykonanie takich operacji za pomocą dwóch różnych bibliotek:

  1. Z wykorzystaniem iText,
  2. Z wykorzystaniem Apache pdfbox.

iText

 

Apache pdfbox i zapis do pliku

 

Nauka Javy

To również może Cię zainteresować:

  • Permutacje, cz. 2 – algorytmyPermutacje, cz. 2 – algorytmy W poprzednim wpisie programistyczne rozwiązanie zagadki polegało na wygenerowaniu wszystkich permutacji zbioru i sprawdzeniu każdej z nich pod względem spełnienia warunku […]
  • Jest już nas 1000!Jest już nas 1000! Moi drodzy,   pół roku temu postanowiłem, że założę prostą stronę www, na której będę mógł umieszczać swoje pomysły i przemyślenia z dziedziny programowania i w pewnym stopniu […]
  • Szybsze parsowanie stron internetowych – c.d. z serwisem www.filmydokumentalne.euSzybsze parsowanie stron internetowych – c.d. z serwisem www.filmydokumentalne.eu We wczorajszym wpisie opisałem sposób pobrania bazy danych filmów ze strony www.filmydokumentalne.eu. Wszystko byłoby w porządku, gdyby nie fakt, że wykonanie kompletnego importu trwa ok. […]
  • Wykonywanie kodu JavaScript w JavieWykonywanie kodu JavaScript w Javie Wraz z pojawieniem się Javy 8 został udostępniony nowy silnik JavaScriptowy dla JVM o nazwie Nashorn. Zastąpił on starszą implementację Rhino, dostępnego od Javy 6. JavaScriptowy silnik […]
  • Raspberry PI 2 jako ekran infokioskuRaspberry PI 2 jako ekran infokiosku Zapewne nie jeden z Was widział na stacjach benzynowych ekrany LCD wyświetlające informacje o prognozowanych warunkach pogodowych, czy utrudnieniach w ruchu. W witrynach sklepowych możemy […]
  • Blog, rozwój, zmiany, ŚwiętaBlog, rozwój, zmiany, Święta Trochę ponad miesiąc temu postanowiłem założyć bloga - swego rodzaju osobisty notatnik programisty. To była szybka piłka, od momentu powstania pomysłu, stronę udostępniłem po trzech […]

One thought on “Odczyt tekstu z plików PDF w Javie

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *