πώς θα απομονώσω σελίδα από pdf  Το θέμα επιλύθηκε

...office, φωτογραφία, CAD, spss, latex, κλπ

Συντονιστής: adem1

πώς θα απομονώσω σελίδα από pdf

Δημοσίευσηαπό moritz » 28 Ιαν 2014, 16:32

Καλησπέρα,
έχω ένα αρχείο pdf και θέλω να απομονώσω κάποιες σελίδες σε ξεχωριστό αρχείο, πάλι pdf. Πώς μπορώ να το κάνω;
1 Γνώσεις Linux: Ικανοποιητικό ┃ Προγραμματισμού: Καθόλου ┃ Αγγλικών: Πολύ καλό
2 Ubuntu 16.04 xenial 4.4.0-104-generic 64bit (en_US.UTF-8, Unity ubuntu), Windows Boot Manager
3 Intel Core i5-4210U CPU @ 1.70GHz ‖ RAM 3856 MiB ‖ Dell Inc. 09V1VC - Dell Inc. Inspiron 3542
4 Intel Haswell-ULT Integrated Graphics [8086:0a16] {i915}
5 wlan0: Qualcomm Atheros QCA9565 / AR9565 Wireless Network Adapter [168c:0036] (rev 01) ⋮ eth0: Realtek RTL8101/2/6E PCI Express Fast/Gigabit Ethernet controller [10ec:8136] (rev 07)
moritz
punkTUX
punkTUX
 
Δημοσιεύσεις: 282
Εγγραφή: 09 Ιουν 2011, 20:22
Εκτύπωση

Re: πώς θα απομονώσω σελίδα από pdf

Δημοσίευσηαπό eliasps » 28 Ιαν 2014, 16:48

To pdftk είναι ένα καλό εργαλείο γραμμής εντολών για τέτοιες δουλειές:
Κώδικας: Επιλογή όλων
sudo apt-get install pdftk

Για να διασπάσεις ένα PDF σε σελίδες εκτελείς (αν υποθέσουμε ότι έχεις το PDF σε έναν φάκελο με όνομα xyz):
Κώδικας: Επιλογή όλων
cd xyz
pdftk όνομα_αρχείου.pdf burst

Όπου το όνομα_αρχείου είναι το πραγματικό όνομα του αρχείου PDF.
Aυτό θα διασπάσει το PDF σε ξεχωριστές σελίδες με ονόματα pg_0001.pdf pg_0002.pdf ... pg_000n.pdf στον ίδιο φάκελο.
Μπορείς μετά να ενώσεις όποιες σελίδες θες εκτελώντας:
Κώδικας: Επιλογή όλων
pdftk pg_000a.pdf pg_000b.pdf pg_000c.pdf ... pg_000N.pdf cat output όνομα_αρχείου_μετά_την_ένωση.pdf

Όπου τα a,b,c...N είναι οι αριθμοί των σελίδων που θες να ενώσεις. Μην βάλεις τις τρεις τελείες που έχω βάλει στο ενδιάμεσο, το έκανα για το παράδειγμα. Το όνομα_αρχείου_μετά_την_ένωση είναι το όνομα του αρχείου που θα δημιουργηθεί μετά την ένωση, το οποίο ορίζεις εσύ να είναι ό,τι θες.

Το είχα χρησιμοποιήσει για την ένωση των άρθρων του περιοδικού Ubuntistas στην σελιδοποίηση του τεύχους 16, γιατί τότε έφτιαχνα τα άρθρα σε ξεχωριστά PDF και τα ένωνα με το pdftk για την δημιουργία του τελικού (τεμπελιά!). Τώρα τα φτιάχνω σε ένα αρχείο.

Παρέχει και άλλες επιλογές, τις οποίες μπορείς να δεις με την:
Κώδικας: Επιλογή όλων
man pdftk
Άβαταρ μέλους
eliasps
antiwinTUX
antiwinTUX
 
Δημοσιεύσεις: 4017
Εγγραφή: 16 Δεκ 2011, 22:25
Τοποθεσία: Αθήνα, Αττική
Launchpad: eliasps
IRC: eliasps
Εκτύπωση

Re: πώς θα απομονώσω σελίδα από pdf

Δημοσίευσηαπό gla » 28 Ιαν 2014, 17:01

Πολύ εύκολο και με gui που χρησιμοποιώ είναι το PdfShuffler. Υπάρχει στο synaptic
Γνώσεις ⇛ Linux: Χαμηλό ┃ Προγραμματισμός: Όχι ┃ Αγγλικά: Μέτρια
pc: debian-lxde wheezy/sid 32bit
Προδιαγραφές ⇛ AMD ATHLON II X2 240 2812MHz ┃ μνήμη ram: DDR2 1,9 Gb
Μητρική: ΜSI K9N6PGM2 ┃ Κάρτα Γραφικών: nvidia GeForce 6150 SE ┃ Οθόνη: TFT 19"
gla
babeTUX
babeTUX
 
Δημοσιεύσεις: 22
Εγγραφή: 27 Μαρ 2009, 00:14
Εκτύπωση

Re: πώς θα απομονώσω σελίδα από pdf

Δημοσίευσηαπό moritz » 28 Ιαν 2014, 17:24

eliasps έγραψε:Για να διασπάσεις ένα PDF σε σελίδες εκτελείς (αν υποθέσουμε ότι έχεις το PDF σε έναν φάκελο με όνομα xyz):
Κώδικας: Επιλογή όλων
cd xyz
pdftk όνομα_αρχείου.pdf burst


μπερδεύτηκα στο πώς θα βρω τον φάκελο. Θα πάω από /home κλπ;
1 Γνώσεις Linux: Ικανοποιητικό ┃ Προγραμματισμού: Καθόλου ┃ Αγγλικών: Πολύ καλό
2 Ubuntu 16.04 xenial 4.4.0-104-generic 64bit (en_US.UTF-8, Unity ubuntu), Windows Boot Manager
3 Intel Core i5-4210U CPU @ 1.70GHz ‖ RAM 3856 MiB ‖ Dell Inc. 09V1VC - Dell Inc. Inspiron 3542
4 Intel Haswell-ULT Integrated Graphics [8086:0a16] {i915}
5 wlan0: Qualcomm Atheros QCA9565 / AR9565 Wireless Network Adapter [168c:0036] (rev 01) ⋮ eth0: Realtek RTL8101/2/6E PCI Express Fast/Gigabit Ethernet controller [10ec:8136] (rev 07)
moritz
punkTUX
punkTUX
 
Δημοσιεύσεις: 282
Εγγραφή: 09 Ιουν 2011, 20:22
Εκτύπωση

Re: πώς θα απομονώσω σελίδα από pdf

Δημοσίευσηαπό eliasps » 28 Ιαν 2014, 17:30

moritz έγραψε:μπερδεύτηκα στο πώς θα βρω τον φάκελο. Θα πάω από /home κλπ;

Όταν ανοίγεις το τερματικό βλέπεις κάτι τέτοιο:
Κώδικας: Επιλογή όλων
user@host:~$

Aυτό σημαίνει πως βρίσκεσαι στον προσωπικό σου φάκελο, δηλαδή στο /home/$USER/ που περιέχει τους φακέλους με τις εικόνες, τη μουσική, τις λήψεις κλπ.
Αν για παράδειγμα έχεις το αρχείο σε έναν φάκελο xyz μέσα στο Έγγραφα, δηλαδή εδώ /home/$USER/Έγγραφα/xyz , απλά εκτελείς όπως είσαι στο τερματικό:
Κώδικας: Επιλογή όλων
cd Έγγραφα/xyz

Ή:
Κώδικας: Επιλογή όλων
cd /home/$USER/Έγγραφα/xyz

Το ίδιο είναι.
Άβαταρ μέλους
eliasps
antiwinTUX
antiwinTUX
 
Δημοσιεύσεις: 4017
Εγγραφή: 16 Δεκ 2011, 22:25
Τοποθεσία: Αθήνα, Αττική
Launchpad: eliasps
IRC: eliasps
Εκτύπωση

Re: πώς θα απομονώσω σελίδα από pdf

Δημοσίευσηαπό moritz » 28 Ιαν 2014, 17:45

eliasps έγραψε:
moritz έγραψε:μπερδεύτηκα στο πώς θα βρω τον φάκελο. Θα πάω από /home κλπ;

Όταν ανοίγεις το τερματικό βλέπεις κάτι τέτοιο:
Κώδικας: Επιλογή όλων
user@host:~$

Aυτό σημαίνει πως βρίσκεσαι στον προσωπικό σου φάκελο, δηλαδή στο /home/$USER/ που περιέχει τους φακέλους με τις εικόνες, τη μουσική, τις λήψεις κλπ.
Αν για παράδειγμα έχεις το αρχείο σε έναν φάκελο xyz μέσα στο Έγγραφα, δηλαδή εδώ /home/$USER/Έγγραφα/xyz , απλά εκτελείς όπως είσαι στο τερματικό:
Κώδικας: Επιλογή όλων
cd Έγγραφα/xyz

Ή:
Κώδικας: Επιλογή όλων
cd /home/$USER/Έγγραφα/xyz

Το ίδιο είναι.


Αυτό κάνω αλλά μάλλον κάτι είναι λάθος. Δες:
Κώδικας: Επιλογή όλων
antyp@antyp-netbook:~$ cd Έγγραφα/Jenny/Cambridge Files
bash: cd: Έγγραφα/Jenny/Cambridge: Δεν υπάρχει τέτοιο αρχείο ή κατάλογος
antyp@antyp-netbook:~$ cd /home/antyp/Έγγραφα/Jenny/Cambridge Files
bash: cd: /home/antyp/Έγγραφα/Jenny/Cambridge: Δεν υπάρχει τέτοιο αρχείο ή κατάλογος


έκανα και print screen την τοποθεσία του αρχείου:
http://postimg.org/image/erjd2wlpx/
1 Γνώσεις Linux: Ικανοποιητικό ┃ Προγραμματισμού: Καθόλου ┃ Αγγλικών: Πολύ καλό
2 Ubuntu 16.04 xenial 4.4.0-104-generic 64bit (en_US.UTF-8, Unity ubuntu), Windows Boot Manager
3 Intel Core i5-4210U CPU @ 1.70GHz ‖ RAM 3856 MiB ‖ Dell Inc. 09V1VC - Dell Inc. Inspiron 3542
4 Intel Haswell-ULT Integrated Graphics [8086:0a16] {i915}
5 wlan0: Qualcomm Atheros QCA9565 / AR9565 Wireless Network Adapter [168c:0036] (rev 01) ⋮ eth0: Realtek RTL8101/2/6E PCI Express Fast/Gigabit Ethernet controller [10ec:8136] (rev 07)
moritz
punkTUX
punkTUX
 
Δημοσιεύσεις: 282
Εγγραφή: 09 Ιουν 2011, 20:22
Εκτύπωση

Re: πώς θα απομονώσω σελίδα από pdf

Δημοσίευσηαπό eliasps » 28 Ιαν 2014, 17:55

Nαι, επειδή ο φάκελος Cambridge Files έχει κενό στο όνομα. Δική μου παράληψη που δεν έγραψα για αυτή την περίπτωση.
Οπότε, στην περίπτωση του κενού αρκεί να βάλεις το όνομα του φακέλου μέσα σε 'Cambridge Files', δηλαδή έτσι:
Κώδικας: Επιλογή όλων
cd /home/antyp/Έγγραφα/Jenny/'Cambridge Files'

Αρχικά, καλύτερα να μεταφέρεις το αρχείο σε ξεχωριστό φάκελο γιατί στην διάσπαση θα σου δημιουργήσει πολλά αρχεία pdf με τις σελίδες και μετά θα θες να τα διαγράψεις μάλλον. Oπότε σου προτείνω το εξής:
  • Φτιάξε μέσα στο Cambridge Files έναν φάκελο με όνομα PDFTK (με δεξί κλικ και "Νέος φάκελος") και βάλε ένα αντίγραφο του αρχείου PDF που θες να διασπάσεις εκεί μέσα.
  • Μετά στο τερματικό:
    Κώδικας: Επιλογή όλων
    cd /home/antyp/Έγγραφα/Jenny/'Cambridge Files'/PDFTK
    pdftk transcript_certificate.pdf burst
  • Θα δημιουργηθούν τα αρχεία pg_0001.pdf... και στη συνέχεια ενώνεις όποια θες με:
    Κώδικας: Επιλογή όλων
    pdftk pg_0001.pdf pg_0002.pdf pg_0003.pdf ... cat output certificate_pages.pdf

    Ξανά, η παραπάνω εντολή είναι παράδειγμα. Εσύ θα βάλεις τα ονόματα των αρχείων που θες να ενώσεις με τη σειρά (χωρίς τις τρεις τελείες) και εκτελώντας την εντολή θα δημιουργηθεί ένα αρχείο με όνομα certificate_pages.pdf που θα έχει ενωμένες τις σελίδες που επέλεξες.
Άβαταρ μέλους
eliasps
antiwinTUX
antiwinTUX
 
Δημοσιεύσεις: 4017
Εγγραφή: 16 Δεκ 2011, 22:25
Τοποθεσία: Αθήνα, Αττική
Launchpad: eliasps
IRC: eliasps
Εκτύπωση

Re: πώς θα απομονώσω σελίδα από pdf  Το θέμα επιλύθηκε

Δημοσίευσηαπό Spock » 28 Ιαν 2014, 17:59

Υπάρχει και το pdfsam με gui, πολύ απλό και πρακτικό για διαχωρισμό και ένωση αρχείων pdf.
1 Γνώσεις Linux: Αρκετές ┃ Προγραμματισμού: Βασικό επίπεδο Python ┃ Αγγλικών: Άπταιστα
2 Ubuntu 19.04 5.0 64bit (en_US.UTF-8, Gnome 3.32)
3 Intel Core i5-3230M CPU @ 2.60GHz ‖ RAM 3828 MiB ‖ Dell Inc. 05GRXT - Dell Inc. Latitude E5530 non-vPro
4 Intel 3rd Gen Core processor Graphics Controller [8086:0166] {i915}
5 eth0: Broadcom NetXtreme BCM5761 Gigabit Ethernet PCIe [14e4:1681] (rev 10) ⋮ wlan0: Intel Centrino Advanced-N 6205 [Taylor Peak] [8086:0082] (rev 34)
Άβαταρ μέλους
Spock
punkTUX
punkTUX
 
Δημοσιεύσεις: 271
Εγγραφή: 27 Σεπ 2008, 13:52
Τοποθεσία: Θεσσαλονίκη
Εκτύπωση

Re: πώς θα απομονώσω σελίδα από pdf

Δημοσίευσηαπό moritz » 28 Ιαν 2014, 18:21

eliasps έγραψε:
Κώδικας: Επιλογή όλων
cd /home/antyp/Έγγραφα/Jenny/'Cambridge Files'/PDFTK
pdftk transcript_certificate.pdf burst

[*]Θα δημιουργηθούν τα αρχεία pg_0001.pdf... και στη συνέχεια ενώνεις όποια θες με:
Κώδικας: Επιλογή όλων
pdftk pg_0001.pdf pg_0002.pdf pg_0003.pdf ... cat output certificate_pages.pdf



Δεν δημιουργήθηκαν αρχεία...:
Κώδικας: Επιλογή όλων
antyp@antyp-netbook:~$ cd /home/antyp/Έγγραφα/Jenny/'Cambridge Files'/PDFTK
antyp@antyp-netbook:~/Έγγραφα/Jenny/Cambridge Files/PDFTK$
antyp@antyp-netbook:~/Έγγραφα/Jenny/Cambridge Files/PDFTK$ pdftk transcript_certificate.pdf burst
pdftk transcript_certificate.pdf burst
^C
antyp@antyp-netbook:~/Έγγραφα/Jenny/Cambridge Files/PDFTK$ pdftk transcript_certificate.pdf burst



gla έγραψε:Πολύ εύκολο και με gui που χρησιμοποιώ είναι το PdfShuffler. Υπάρχει στο synaptic

δεν κάνει εξαγωγή αρχείου

Spock έγραψε:Υπάρχει και το pdfsam με gui, πολύ απλό και πρακτικό για διαχωρισμό και ένωση αρχείων pdf.

είναι το ίδιο με το pdfshuffler?
1 Γνώσεις Linux: Ικανοποιητικό ┃ Προγραμματισμού: Καθόλου ┃ Αγγλικών: Πολύ καλό
2 Ubuntu 16.04 xenial 4.4.0-104-generic 64bit (en_US.UTF-8, Unity ubuntu), Windows Boot Manager
3 Intel Core i5-4210U CPU @ 1.70GHz ‖ RAM 3856 MiB ‖ Dell Inc. 09V1VC - Dell Inc. Inspiron 3542
4 Intel Haswell-ULT Integrated Graphics [8086:0a16] {i915}
5 wlan0: Qualcomm Atheros QCA9565 / AR9565 Wireless Network Adapter [168c:0036] (rev 01) ⋮ eth0: Realtek RTL8101/2/6E PCI Express Fast/Gigabit Ethernet controller [10ec:8136] (rev 07)
moritz
punkTUX
punkTUX
 
Δημοσιεύσεις: 282
Εγγραφή: 09 Ιουν 2011, 20:22
Εκτύπωση

Re: πώς θα απομονώσω σελίδα από pdf

Δημοσίευσηαπό eliasps » 28 Ιαν 2014, 18:31

moritz έγραψε:Δεν δημιουργήθηκαν αρχεία...:

Περίεργο είναι το ότι στα αποτελέσματα δεν έβγαλε κάποιο σφάλμα.
Για δώσε το αποτέλεσμα:
Κώδικας: Επιλογή όλων
ls /home/antyp/Έγγραφα/Jenny/'Cambridge Files'/PDFTK
Άβαταρ μέλους
eliasps
antiwinTUX
antiwinTUX
 
Δημοσιεύσεις: 4017
Εγγραφή: 16 Δεκ 2011, 22:25
Τοποθεσία: Αθήνα, Αττική
Launchpad: eliasps
IRC: eliasps
Εκτύπωση

Επόμενο

Επιστροφή στο Εφαρμογές για Γραφείο / Γραφιστική / Επιστήμες