αφαίρεση γκρίζου φόντου από pdf files  Το θέμα επιλύθηκε

...office, φωτογραφία, CAD, spss, latex, κλπ

Συντονιστής: adem1

Re: αφαίρεση γκρίζου φόντου από pdf files

Δημοσίευσηαπό the_eye » 02 Μάιος 2020, 12:10

advocate έγραψε:γίνεται 50 ΜΒ με τη μετατροπή σε ebook

Αν ο σκοπός σου είναι να το κάνεις ebook και λες ότι το αρχείο έχει ήδη περαστεί από ocr, γιατί δεν κρατάς μόνο το text και να διαγράψεις το background.
Όσο λιγότερο κλειστό λογισμικό έχεις, τόσα λιγότερα προβλήματα.
1 Γνώσεις ⇛ Linux: Καλό ┃ Προγραμματισμός: Ναι PHP, MySQL ┃ Αγγλικά: Καλά
2 Ubuntu 22.04 Jammy Jellyfish 5.15.0-58-generic 64bit (el_GR.UTF-8, ubuntu:GNOME ubuntu)
3 Intel Core i3-6100 CPU @ 3.70GHz ‖ RAM 7836 MiB ‖ Gigabyte B150M-HD3 DDR3-CF - Gigabyte B150M-HD3 DDR3
4 Intel HD Graphics 530 [8086:1912] {i915}
5 enp1s0: Realtek RTL8111/8168/8411 PCI Express Gigabit Ethernet Controller [10ec:8168] (rev 15)
Οδηγοί Ubuntu Βίντεο Οδηγοί
Άβαταρ μέλους
the_eye
Διαχειριστής
Διαχειριστής
 
Δημοσιεύσεις: 11671
Εγγραφή: 16 Μαρ 2010, 17:19
Launchpad: ntoulasd
IRC: the_eye_
Εκτύπωση

Re: αφαίρεση γκρίζου φόντου από pdf files

Δημοσίευσηαπό matthew » 02 Μάιος 2020, 13:59

Σίγουρα για αρχεία με πολλές σελίδες είναι δύσκολο και χρειάζεται και δυνατό σύστημα. Δες και τα παρακάτω online εργαλεία μήπως σε βοηθήσουν.
https://tools.pdf24.org/el/
Γνώσεις Linux: Βασικές ┃ Προγραμματισμός: Όχι ┃ Αγγλικά: Καλά
Ubuntu Mate 20.04 64-bit σε Fujitsu Amilo Xi3670 & HP Compaq 6910p
Άβαταρ μέλους
matthew
saintTUX
saintTUX
 
Δημοσιεύσεις: 1319
Εγγραφή: 25 Αύγ 2008, 01:35
Εκτύπωση

Re: αφαίρεση γκρίζου φόντου από pdf files

Δημοσίευσηαπό advocate » 16 Μάιος 2020, 01:21

Υπάρχει όντως πρόβλημα αφού όλες οι εκδόσεις δεν είναι σε ασπρόμαυρο και πρέπει να γίνει μετατροπή, όπως η παρακάτω και η μετατροπή πρώτα σε jpg είναι χρονοβόρα και επιβαρύνει με επιπλέον δουλειά εφαρμογής του OCR
https://archive.org/details/dasattische ... 4/mode/2up
Γνώσεις⇛Linux:Χαμηλό┃Προγραμματισμός:Όχι┃Αγγλικά:Καλά
laptop:Ubuntu 14.04.02 acer aspire Ε17
Προδιαγραφές⇛Intel® Celeron(R) CPU N2940 @ 1.83GHz × 4 │RAM 4.0GB DDR3│δε βρίσκω πληροφορίες GML│Wireless rtl8723be | Audio: Analog stereo duplex│Οθόνη: 1600x900
advocate
babeTUX
babeTUX
 
Δημοσιεύσεις: 142
Εγγραφή: 27 Φεβ 2010, 19:13
Εκτύπωση

Re: αφαίρεση γκρίζου φόντου από pdf files

Δημοσίευσηαπό talos » 18 Μάιος 2020, 13:04

Όποιος αυτοματισμός υπάρχει θα περάσει από επεξεργασία εικόνας. Οπότε και θα χάσεις κάθε πληροφορία κειμένου, δυνατότητα επιλογής κλπ. Αν είσαι απελπισμένος μπορείς να το κάνεις με κάποιο πρόγραμμα που ανοίγει τα pdf διανυσματικά (libreoffice/inkscape). Το πρόβλημα του μεγέθους το παρακάμπτεις σπάζοντας τα πρώτα σε μικρότερα.

Αν είσαι ακόμα περισσότερο απελπισμένος μπορείς να διαβάσεις για την εσωτερική δομή ενός pdf, να διασχίσεις προγραμματιστικά κάθε σελίδα και κάθε στοιχείο κάθε σελίδας και να αφαιρέσεις η αλλάξεις κάθε στοιχείο που να ταιριάζει με μεγάλο γκρίζο παραλληλόγραμμο.
talos
babeTUX
babeTUX
 
Δημοσιεύσεις: 28
Εγγραφή: 12 Νοέμ 2013, 20:21
Εκτύπωση

Re: αφαίρεση γκρίζου φόντου από pdf files

Δημοσίευσηαπό advocate » 02 Σεπ 2020, 19:05

advocate έγραψε:
Δεν υπάρχει κάποιο εργαλείο να το κάνει απευθείας στο pdf χωρίς τις μετατροπές σε jpg?


Να κάνω μια ενημέρωση του ερωτήματος, μια και μπήκα στο φόρουμ για άλλη δουλειά?
Υπάρχει, λοιπόν, κάποιο εργαλείο που να αφαιρεί απευθείας από το pdf το γκρίζο ή έγχρωμο φόνο (συνήθως κιτρινωπό χρώμα σελίδας λόγω παλαιότητας), χωρίς να χαλά το ocr?
Γνώσεις⇛Linux:Χαμηλό┃Προγραμματισμός:Όχι┃Αγγλικά:Καλά
laptop:Ubuntu 14.04.02 acer aspire Ε17
Προδιαγραφές⇛Intel® Celeron(R) CPU N2940 @ 1.83GHz × 4 │RAM 4.0GB DDR3│δε βρίσκω πληροφορίες GML│Wireless rtl8723be | Audio: Analog stereo duplex│Οθόνη: 1600x900
advocate
babeTUX
babeTUX
 
Δημοσιεύσεις: 142
Εγγραφή: 27 Φεβ 2010, 19:13
Εκτύπωση

Re: αφαίρεση γκρίζου φόντου από pdf files

Δημοσίευσηαπό advocate » 02 Σεπ 2020, 19:06

advocate έγραψε:
Δεν υπάρχει κάποιο εργαλείο να το κάνει απευθείας στο pdf χωρίς τις μετατροπές σε jpg?


Να κάνω μια ενημέρωση του ερωτήματος, μια και μπήκα στο φόρουμ για άλλη δουλειά?
Υπάρχει, λοιπόν, κάποιο εργαλείο που να αφαιρεί απευθείας από το pdf το γκρίζο ή έγχρωμο φόνο (συνήθως κιτρινωπό χρώμα σελίδας λόγω παλαιότητας), χωρίς να χαλά το ocr?
Γνώσεις⇛Linux:Χαμηλό┃Προγραμματισμός:Όχι┃Αγγλικά:Καλά
laptop:Ubuntu 14.04.02 acer aspire Ε17
Προδιαγραφές⇛Intel® Celeron(R) CPU N2940 @ 1.83GHz × 4 │RAM 4.0GB DDR3│δε βρίσκω πληροφορίες GML│Wireless rtl8723be | Audio: Analog stereo duplex│Οθόνη: 1600x900
advocate
babeTUX
babeTUX
 
Δημοσιεύσεις: 142
Εγγραφή: 27 Φεβ 2010, 19:13
Εκτύπωση

Re: αφαίρεση γκρίζου φόντου από pdf files

Δημοσίευσηαπό advocate » 02 Σεπ 2020, 19:07

advocate έγραψε:
Δεν υπάρχει κάποιο εργαλείο να το κάνει απευθείας στο pdf χωρίς τις μετατροπές σε jpg?


Να κάνω μια ενημέρωση του ερωτήματος, μια και μπήκα στο φόρουμ για άλλη δουλειά?
Υπάρχει, λοιπόν, κάποιο εργαλείο που να αφαιρεί απευθείας από το pdf το γκρίζο ή έγχρωμο φόνο (συνήθως κιτρινωπό χρώμα σελίδας λόγω παλαιότητας), χωρίς να χαλά το ocr?
Γνώσεις⇛Linux:Χαμηλό┃Προγραμματισμός:Όχι┃Αγγλικά:Καλά
laptop:Ubuntu 14.04.02 acer aspire Ε17
Προδιαγραφές⇛Intel® Celeron(R) CPU N2940 @ 1.83GHz × 4 │RAM 4.0GB DDR3│δε βρίσκω πληροφορίες GML│Wireless rtl8723be | Audio: Analog stereo duplex│Οθόνη: 1600x900
advocate
babeTUX
babeTUX
 
Δημοσιεύσεις: 142
Εγγραφή: 27 Φεβ 2010, 19:13
Εκτύπωση

Re: αφαίρεση γκρίζου φόντου από pdf files

Δημοσίευσηαπό advocate » 12 Δεκ 2020, 22:32

Μάλλον υπήρξα πολύ ανόητος και δεν πρόσεξα ότι το ocrmypdf έχει ειδικό εργαλείο για την αφαίρεση του φόντου, το --remove-background
Κώδικας: Επιλογή όλων
ocrmypdf -l ell+eng --remove-background input.pdf output.pdf

To μειονέκτημα είναι ότι αυξάνει υπερβολικά το μέγεθος του αρχείου αντί να το μειώσει λόγω της αφαίρεσης του φόντου.
Γνώσεις⇛Linux:Χαμηλό┃Προγραμματισμός:Όχι┃Αγγλικά:Καλά
laptop:Ubuntu 14.04.02 acer aspire Ε17
Προδιαγραφές⇛Intel® Celeron(R) CPU N2940 @ 1.83GHz × 4 │RAM 4.0GB DDR3│δε βρίσκω πληροφορίες GML│Wireless rtl8723be | Audio: Analog stereo duplex│Οθόνη: 1600x900
advocate
babeTUX
babeTUX
 
Δημοσιεύσεις: 142
Εγγραφή: 27 Φεβ 2010, 19:13
Εκτύπωση

Re: αφαίρεση γκρίζου φόντου από pdf files

Δημοσίευσηαπό advocate » 12 Δεκ 2020, 22:33

Μάλλον υπήρξα πολύ ανόητος και δεν πρόσεξα ότι το ocrmypdf έχει ειδικό εργαλείο για την αφαίρεση του φόντου, το --remove-background
Κώδικας: Επιλογή όλων
ocrmypdf -l ell+eng --remove-background input.pdf output.pdf

To μειονέκτημα είναι ότι αυξάνει υπερβολικά το μέγεθος του αρχείου αντί να το μειώσει λόγω της αφαίρεσης του φόντου.
Γνώσεις⇛Linux:Χαμηλό┃Προγραμματισμός:Όχι┃Αγγλικά:Καλά
laptop:Ubuntu 14.04.02 acer aspire Ε17
Προδιαγραφές⇛Intel® Celeron(R) CPU N2940 @ 1.83GHz × 4 │RAM 4.0GB DDR3│δε βρίσκω πληροφορίες GML│Wireless rtl8723be | Audio: Analog stereo duplex│Οθόνη: 1600x900
advocate
babeTUX
babeTUX
 
Δημοσιεύσεις: 142
Εγγραφή: 27 Φεβ 2010, 19:13
Εκτύπωση

Re: αφαίρεση γκρίζου φόντου από pdf files

Δημοσίευσηαπό advocate » 12 Δεκ 2020, 22:34

Μάλλον υπήρξα πολύ ανόητος και δεν πρόσεξα ότι το ocrmypdf έχει ειδικό εργαλείο για την αφαίρεση του φόντου, το --remove-background
Κώδικας: Επιλογή όλων
ocrmypdf -l ell+eng --remove-background input.pdf output.pdf

To μειονέκτημα είναι ότι αυξάνει υπερβολικά το μέγεθος του αρχείου αντί να το μειώσει λόγω της αφαίρεσης του φόντου.
Γνώσεις⇛Linux:Χαμηλό┃Προγραμματισμός:Όχι┃Αγγλικά:Καλά
laptop:Ubuntu 14.04.02 acer aspire Ε17
Προδιαγραφές⇛Intel® Celeron(R) CPU N2940 @ 1.83GHz × 4 │RAM 4.0GB DDR3│δε βρίσκω πληροφορίες GML│Wireless rtl8723be | Audio: Analog stereo duplex│Οθόνη: 1600x900
advocate
babeTUX
babeTUX
 
Δημοσιεύσεις: 142
Εγγραφή: 27 Φεβ 2010, 19:13
Εκτύπωση

ΠροηγούμενηΕπόμενο

Επιστροφή στο Εφαρμογές για Γραφείο / Γραφιστική / Επιστήμες