αφαίρεση γκρίζου φόντου από pdf files  Το θέμα επιλύθηκε

...office, φωτογραφία, CAD, spss, latex, κλπ

Συντονιστής: adem1

αφαίρεση γκρίζου φόντου από pdf files

Δημοσίευσηαπό advocate » 29 Απρ 2020, 21:13

Μετά από μια ολόκληρη μέρα αναζήτηση, ήρθε η ώρα να ζητήσω τη βοήθειά σας.
Θέλω να μετακινήσω το gray background από αρκετά μεγάλο pdf, π.χ. αυτό:
https://archive.org/details/athenianfam ... 7/mode/2up
Για την ακρίβεια το background δεν είναι γκρίζο αλλά κιτρινωπό. Μπορεί όμως να μετατραπεί με πολύ μεγάλη ζημιά σε όγκο σε γκρίζο με το ghostscript, μεγάλη ζημιά διότι από 9,5 ΜΒ το πρωτότυπο γίνεται 50 ΜΒ με τη μετατροπή σε ebook. Αλλά η αφαίρεση του γκρίζου, κατόπιν είναι αδύνατη.
Βρήκα σε διάφορα σάιτ εντολές που δεν λειτουργούν, π.χ. η κατωτέρω, που μου λέει να κάνω το έγγραφο σε ξεχωριστές εικόνες και να κάνω την αφαίρεση από jpg or png, επιπλέον δε αυτή η εντολή χάνει και τις γραμματοσειρές.
https://askubuntu.com/questions/396437/ ... -while-pre
ή η κατωτέρω που αφαιρεί το γκρίζο, κάνει χάλια τη γραμματοσειρά αλλά αφήνει το μπλε, οπότε πάλι τζίφος.
https://www.imagemagick.org/discourse-s ... hp?t=26656
Δοκίμασα επίσης την παράμετρο -monochrome από το ImageMagic αλλά εκτός του ότι καταργεί τις γραμματοσειρές το αποτέλεσμα είναι χάλια, λες και βλέπεις έγγραφο στα 50 dpi.
Προσπάθησα επίσης να βρω στο pdftk κάποια σχετική παράμετρο αλλά δεν τα κατάφερα· το ίδιο και στο ocrmypdf.
Είδα εμπορικά προγράμματα που δουλεύουν σε windows αλλά με έκπληξη διαπίστωσα ότι δεν μπορούσα να βρω τίποτε σε linux-ubuntu.
Το ζήτημα, λοιπόν είναι να βρούμε ένα λογισμικό που αφαιρεί το background, γρίζο ή χρωματιστό και αφήνει τη γραμματοσειρά ανέπαφη.
Τι λέτε?
Γνώσεις⇛Linux:Χαμηλό┃Προγραμματισμός:Όχι┃Αγγλικά:Καλά
laptop:Ubuntu 14.04.02 acer aspire Ε17
Προδιαγραφές⇛Intel® Celeron(R) CPU N2940 @ 1.83GHz × 4 │RAM 4.0GB DDR3│δε βρίσκω πληροφορίες GML│Wireless rtl8723be | Audio: Analog stereo duplex│Οθόνη: 1600x900
advocate
babeTUX
babeTUX
 
Δημοσιεύσεις: 142
Εγγραφή: 27 Φεβ 2010, 19:13
Εκτύπωση

Re: αφαίρεση γκρίζου φόντου από pdf files

Δημοσίευσηαπό Maras » 29 Απρ 2020, 21:26

Απ΄ ότι είδα το pdf προσφέρεται και σε ασπρόμαυρη έκδοση(B/W pdf), δεν σου κάνει αυτό?
“Long is the way, and hard, that out of hell leads up to light.”
Άβαταρ μέλους
Maras
saintTUX
saintTUX
 
Δημοσιεύσεις: 1460
Εγγραφή: 25 Ιούλ 2017, 12:49
Εκτύπωση

Re: αφαίρεση γκρίζου φόντου από pdf files

Δημοσίευσηαπό advocate » 29 Απρ 2020, 21:53

Maras έγραψε:Απ΄ ότι είδα το pdf προσφέρεται και σε ασπρόμαυρη έκδοση(B/W pdf), δεν σου κάνει αυτό?

Όχι, είναι άλλη έκδοση, το ένα 800 και σελίδες το άλλο κάτι λιγότερο από 500
Γνώσεις⇛Linux:Χαμηλό┃Προγραμματισμός:Όχι┃Αγγλικά:Καλά
laptop:Ubuntu 14.04.02 acer aspire Ε17
Προδιαγραφές⇛Intel® Celeron(R) CPU N2940 @ 1.83GHz × 4 │RAM 4.0GB DDR3│δε βρίσκω πληροφορίες GML│Wireless rtl8723be | Audio: Analog stereo duplex│Οθόνη: 1600x900
advocate
babeTUX
babeTUX
 
Δημοσιεύσεις: 142
Εγγραφή: 27 Φεβ 2010, 19:13
Εκτύπωση

Re: αφαίρεση γκρίζου φόντου από pdf files

Δημοσίευσηαπό advocate » 29 Απρ 2020, 21:54

advocate έγραψε:
Maras έγραψε:Απ΄ ότι είδα το pdf προσφέρεται και σε ασπρόμαυρη έκδοση(B/W pdf), δεν σου κάνει αυτό?

Όχι, είναι άλλη έκδοση, το ένα 800 και σελίδες το άλλο κάτι λιγότερο από 500


Δεν πρόσεξα ότι υπάρχει Α/Μ έκδοση, αλλά το πρόβλημα παραμένει, διότι έχω και άλλα έτσι παλιά που πρέπει να φύγει το background.
Γνώσεις⇛Linux:Χαμηλό┃Προγραμματισμός:Όχι┃Αγγλικά:Καλά
laptop:Ubuntu 14.04.02 acer aspire Ε17
Προδιαγραφές⇛Intel® Celeron(R) CPU N2940 @ 1.83GHz × 4 │RAM 4.0GB DDR3│δε βρίσκω πληροφορίες GML│Wireless rtl8723be | Audio: Analog stereo duplex│Οθόνη: 1600x900
advocate
babeTUX
babeTUX
 
Δημοσιεύσεις: 142
Εγγραφή: 27 Φεβ 2010, 19:13
Εκτύπωση

Re: αφαίρεση γκρίζου φόντου από pdf files

Δημοσίευσηαπό matthew » 30 Απρ 2020, 15:07

advocate έγραψε:Το ζήτημα, λοιπόν είναι να βρούμε ένα λογισμικό που αφαιρεί το background, γρίζο ή χρωματιστό και αφήνει τη γραμματοσειρά ανέπαφη.
Τι λέτε?

Μπορείς να επεξεργαστείς αρχεία pdf με το LibreOffice Draw.
Δεν ξέρω πως είναι ακριβώς η δομή του συγκεκριμένου αρχείου που παρέθεσες, πάντως το σκούρο πλαίσιο φαίνεται να είναι σαν επιπλέον στρώση από πάνω και όχι background.



Την οποία στρώση αν την αφαιρέσεις αυτό που απομένει είναι χάλια.



Γνώσεις Linux: Βασικές ┃ Προγραμματισμός: Όχι ┃ Αγγλικά: Καλά
Ubuntu Mate 20.04 64-bit σε Fujitsu Amilo Xi3670 & HP Compaq 6910p
Άβαταρ μέλους
matthew
saintTUX
saintTUX
 
Δημοσιεύσεις: 1319
Εγγραφή: 25 Αύγ 2008, 01:35
Εκτύπωση

Re: αφαίρεση γκρίζου φόντου από pdf files

Δημοσίευσηαπό the_eye » 30 Απρ 2020, 15:32

Είχα κάνει κάτι παρόμοιο παλαιότερα
Τρέξε την παρακάτω εντολή στον φάκελο με τα αρχεία. ΠΡΟΣΟΧΗ να τα έχεις και κάπου αλλού ως αντίγραφο.

Κώδικας: Επιλογή όλων
for file in *.JPG; do convert $file -threshold 55% th-$file; done


Για να ρυθμίσεις το αποτέλεσμα άλλαξε το 55%
Όσο λιγότερο κλειστό λογισμικό έχεις, τόσα λιγότερα προβλήματα.
1 Γνώσεις ⇛ Linux: Καλό ┃ Προγραμματισμός: Ναι PHP, MySQL ┃ Αγγλικά: Καλά
2 Ubuntu 22.04 Jammy Jellyfish 5.15.0-58-generic 64bit (el_GR.UTF-8, ubuntu:GNOME ubuntu)
3 Intel Core i3-6100 CPU @ 3.70GHz ‖ RAM 7836 MiB ‖ Gigabyte B150M-HD3 DDR3-CF - Gigabyte B150M-HD3 DDR3
4 Intel HD Graphics 530 [8086:1912] {i915}
5 enp1s0: Realtek RTL8111/8168/8411 PCI Express Gigabit Ethernet Controller [10ec:8168] (rev 15)
Οδηγοί Ubuntu Βίντεο Οδηγοί
Άβαταρ μέλους
the_eye
Διαχειριστής
Διαχειριστής
 
Δημοσιεύσεις: 11671
Εγγραφή: 16 Μαρ 2010, 17:19
Launchpad: ntoulasd
IRC: the_eye_
Εκτύπωση

Re: αφαίρεση γκρίζου φόντου από pdf files

Δημοσίευσηαπό advocate » 02 Μάιος 2020, 02:06

matthew έγραψε:με


Την ξέρω αυτή τη τη διαδικασία αλλά έχει δύο προβλήματα:
*Το LibreOffice δεν ανοίγει όλα τα pdf ακριβώς όπως φαίντονται στον reader τους, εννοώ όχι όλα και όχι πάντα. Τα περισσότερα τ' ανοίγει κανονικά.
*Τα συγκεκριμένα αρχεία είναι πολύ μεγάλα, γύρω στα 80 ΜΒ με 800 σελίδες και το LibreOffice μπλοκάρει. Μου βγάζει μήνυμα ότι δεν ανταποκρίνεται και το κλείνω με τον "επόπτη συστήματος"
Γνώσεις⇛Linux:Χαμηλό┃Προγραμματισμός:Όχι┃Αγγλικά:Καλά
laptop:Ubuntu 14.04.02 acer aspire Ε17
Προδιαγραφές⇛Intel® Celeron(R) CPU N2940 @ 1.83GHz × 4 │RAM 4.0GB DDR3│δε βρίσκω πληροφορίες GML│Wireless rtl8723be | Audio: Analog stereo duplex│Οθόνη: 1600x900
advocate
babeTUX
babeTUX
 
Δημοσιεύσεις: 142
Εγγραφή: 27 Φεβ 2010, 19:13
Εκτύπωση

Re: αφαίρεση γκρίζου φόντου από pdf files

Δημοσίευσηαπό advocate » 02 Μάιος 2020, 02:10

advocate έγραψε:
matthew έγραψε:με


Την ξέρω αυτή τη τη διαδικασία αλλά έχει δύο προβλήματα:
*Το LibreOffice δεν ανοίγει όλα τα pdf ακριβώς όπως φαίντονται στον reader τους, εννοώ όχι όλα και όχι πάντα. Τα περισσότερα τ' ανοίγει κανονικά.
*Τα συγκεκριμένα αρχεία είναι πολύ μεγάλα, γύρω στα 80 ΜΒ με 800 σελίδες και το LibreOffice μπλοκάρει. Μου βγάζει μήνυμα ότι δεν ανταποκρίνεται και το κλείνω με τον "επόπτη συστήματος"
the_eye έγραψε:Είχα κάνει κάτι παρόμοιο παλαιότερα
Τρέξε την παρακάτω εντολή στον φάκελο με τα αρχεία. ΠΡΟΣΟΧΗ να τα έχεις και κάπου αλλού ως αντίγραφο.

Κώδικας: Επιλογή όλων
for file in *.JPG; do convert $file -threshold 55% th-$file; done


Για να ρυθμίσεις το αποτέλεσμα άλλαξε το 55%


Γι' αυτή τη λύση νομίζω ότι πρέπει να μετατραπεί το pdf σε jpg, τόσα όσες και σελίδες (μιλάμε για βιβλία 800-1000 σελίδων) και επιπλέον τους αφαιρεί και το ocr. OK,μπορώ να τα περάσω ξανά ocr αλλα τέτοιου όγκου αρχεία θέλουν 3 μέρες να περαστούν. Και δεν έχει νόημα να χάσεις το ocr που το έχει ήδη το βιβλίο όταν το κατεβάζεις.

Πάντως, θα βγάλω 3-4 σελίδες από το βιβλίο και θα δοκιμάσω αυτή τη λύση. και θα σας πω τ' αποτελέσματα.
Γνώσεις⇛Linux:Χαμηλό┃Προγραμματισμός:Όχι┃Αγγλικά:Καλά
laptop:Ubuntu 14.04.02 acer aspire Ε17
Προδιαγραφές⇛Intel® Celeron(R) CPU N2940 @ 1.83GHz × 4 │RAM 4.0GB DDR3│δε βρίσκω πληροφορίες GML│Wireless rtl8723be | Audio: Analog stereo duplex│Οθόνη: 1600x900
advocate
babeTUX
babeTUX
 
Δημοσιεύσεις: 142
Εγγραφή: 27 Φεβ 2010, 19:13
Εκτύπωση

Re: αφαίρεση γκρίζου φόντου από pdf files

Δημοσίευσηαπό advocate » 02 Μάιος 2020, 02:19

Η εντολή
Κώδικας: Επιλογή όλων
    for file in *.JPG; do convert $file -threshold 55% th-$file; done

δουλεύει αλλά χαλάει το ocr.
ΟΚ, το να συνενώσεις μετά τα jpg σε pdf δεν είναι και τίποτα.
Έχω καιρό ν' ανεβάσω σε φόρουμ εικόνα, αλλά θα πρσπαθήσω, να σας δείξω το αποτέλεσμα.
Γνώσεις⇛Linux:Χαμηλό┃Προγραμματισμός:Όχι┃Αγγλικά:Καλά
laptop:Ubuntu 14.04.02 acer aspire Ε17
Προδιαγραφές⇛Intel® Celeron(R) CPU N2940 @ 1.83GHz × 4 │RAM 4.0GB DDR3│δε βρίσκω πληροφορίες GML│Wireless rtl8723be | Audio: Analog stereo duplex│Οθόνη: 1600x900
advocate
babeTUX
babeTUX
 
Δημοσιεύσεις: 142
Εγγραφή: 27 Φεβ 2010, 19:13
Εκτύπωση

Re: αφαίρεση γκρίζου φόντου από pdf files  Το θέμα επιλύθηκε

Δημοσίευσηαπό advocate » 02 Μάιος 2020, 02:26




Δεν υπάρχει κάποιο εργαλείο να το κάνει απευθείας στο pdf χωρίς τις μετατροπές σε jpg?
Γνώσεις⇛Linux:Χαμηλό┃Προγραμματισμός:Όχι┃Αγγλικά:Καλά
laptop:Ubuntu 14.04.02 acer aspire Ε17
Προδιαγραφές⇛Intel® Celeron(R) CPU N2940 @ 1.83GHz × 4 │RAM 4.0GB DDR3│δε βρίσκω πληροφορίες GML│Wireless rtl8723be | Audio: Analog stereo duplex│Οθόνη: 1600x900
advocate
babeTUX
babeTUX
 
Δημοσιεύσεις: 142
Εγγραφή: 27 Φεβ 2010, 19:13
Εκτύπωση

Επόμενο

Επιστροφή στο Εφαρμογές για Γραφείο / Γραφιστική / Επιστήμες