Δημοσιεύτηκε: 02 Μάιος 2020, 02:10
από advocate
advocate έγραψε:
matthew έγραψε:με


Την ξέρω αυτή τη τη διαδικασία αλλά έχει δύο προβλήματα:
*Το LibreOffice δεν ανοίγει όλα τα pdf ακριβώς όπως φαίντονται στον reader τους, εννοώ όχι όλα και όχι πάντα. Τα περισσότερα τ' ανοίγει κανονικά.
*Τα συγκεκριμένα αρχεία είναι πολύ μεγάλα, γύρω στα 80 ΜΒ με 800 σελίδες και το LibreOffice μπλοκάρει. Μου βγάζει μήνυμα ότι δεν ανταποκρίνεται και το κλείνω με τον "επόπτη συστήματος"
the_eye έγραψε:Είχα κάνει κάτι παρόμοιο παλαιότερα
Τρέξε την παρακάτω εντολή στον φάκελο με τα αρχεία. ΠΡΟΣΟΧΗ να τα έχεις και κάπου αλλού ως αντίγραφο.

Κώδικας: Επιλογή όλων
for file in *.JPG; do convert $file -threshold 55% th-$file; done


Για να ρυθμίσεις το αποτέλεσμα άλλαξε το 55%


Γι' αυτή τη λύση νομίζω ότι πρέπει να μετατραπεί το pdf σε jpg, τόσα όσες και σελίδες (μιλάμε για βιβλία 800-1000 σελίδων) και επιπλέον τους αφαιρεί και το ocr. OK,μπορώ να τα περάσω ξανά ocr αλλα τέτοιου όγκου αρχεία θέλουν 3 μέρες να περαστούν. Και δεν έχει νόημα να χάσεις το ocr που το έχει ήδη το βιβλίο όταν το κατεβάζεις.

Πάντως, θα βγάλω 3-4 σελίδες από το βιβλίο και θα δοκιμάσω αυτή τη λύση. και θα σας πω τ' αποτελέσματα.