Μετατροπή encoding αρχείων

...το μέρος για να ξεκινήσετε!

Συντονιστής: adem1

Κανόνες Δ. Συζήτησης
Παρακαλώ να επιλέξετε, με προσοχή, την άδεια που θέλετε να έχουν οι οδηγοί που συγγράφετε.
Πληροφορίες για τις άδειες μπορείτε να βρείτε εδώ.
Άμα επιθυμείτε κάποια άλλη άδεια επικοινωνήστε με κάποιο Διαχειριστή είτε Συντονιστή.

Σημαντικό είναι να χρησιμοποιήσετε την υπηρεσία http://imagebin.ubuntu-gr.org για τις εικόνες.

Μετατροπή encoding αρχείων

Δημοσίευσηαπό eirc » 14 Μάιος 2008, 02:16

αργά ή γρήγορα όλοι κάπου θα δούμε ένα αρχείο ελληνικού κειμένου γραμμένο στα win που δεν μπορούμε να διαβάσουμε με την μία μιας και ο gedit δεν αναγνωρίζει αυτόματα το encoding.. ειδικά σε υπότιτλους είναι μεγάλο πρόβλημα μιας και η συντριπτική πλειοψηφία είναι γραμμένη στα win.

εφτιαξα λοιπόν ένα scriptάκι που μπορεί να μπεί στα "open with..." αρχείων όπως txt και srt και μετατρέπει αυτόματα το αρχείο σε ένα καινούριο με utf-8 encoding

το έχω βάλει εδω: http://www.eirc.gr/utf8convert_0.1-all.deb σε deb για εύκολη εγκατάσταση

(btw για τους administrators του forum: γίνεται η κατάληξη .deb να επιτρέπεται σαν επισυναπτόμενο αρχείο μιας και είναι ιδιαίτερα σχετική με το forum?)


το παρόν νήμα μεταφέρθηκε στην παρούσα κατηγορία "Οδηγοί - How to" από την κατηγορία "Ερωτήσεις -Προβλήματα Software"
14-5-08, ilpara
eirc...
Άβαταρ μέλους
eirc
babeTUX
babeTUX
 
Δημοσιεύσεις: 2
Εγγραφή: 14 Μάιος 2008, 01:21
Τοποθεσία: Αθήνα - Τρίπολη
Εκτύπωση

Re: Μετατροπή encoding αρχείων

Δημοσίευσηαπό bullgr » 15 Μάιος 2008, 13:26

eirc έγραψε:αργά ή γρήγορα όλοι κάπου θα δούμε ένα αρχείο ελληνικού κειμένου γραμμένο στα win που δεν μπορούμε να διαβάσουμε με την μία μιας και ο gedit δεν αναγνωρίζει αυτόματα το encoding..


Και μιας και το έφερε το θέμα, υπάρχει τρόπος να μετατρέπουμε οποιοδήποτε κείμενο text (όχι με μορφοποίηση)
από μια κωδικοποίηση χαρακτήρων σε άλλη.
Για παράδειγμα για να αλλάξουμε ένα αρχείο κειμένου φτιαγμένο σε winblows iso-8859-7 σε utf8 ανοίγουμε μια
κονσόλα και δίνουμε την παρακάτω εντολή.

Κώδικας: Επιλογή όλων
iconv -f iso-8859-7 -t utf8 iso_file.txt > utf_file.txt


Αυτή η εντολή θα δημιουργήσει ένα νέο αρχείο κειμένου utf_file.txt με κωδικοποίηση χαρακτήρων utf8.
Το πηγαίο αρχείο κειμένου iso_file.txt με κωδικοποίηση χαρακτήρων iso-8859-7 παραμένει άθικτο.

Τονίζω ότι δεν παίζει ρόλο η επέκταση του αρχείου (.txt) αρκεί να είναι αρχείο κειμένου.
Άρα η παραπάνω εντολή ισχύει και για τους υπότιτλους με επέκταση .srt κλπ.
ΕΠΙΤΡΕΠΕΤΑΙ ΝΑ ΠΕΣΕΙΣ, ΕΠΙΒΑΛΛΕΤΑΙ ΝΑ ΣΗΚΩΘΕΙΣ... HASTA SIEMPRE...
Άβαταρ μέλους
bullgr
Επίτιμο μέλος
Επίτιμο μέλος
 
Δημοσιεύσεις: 1853
Εγγραφή: 10 Μάιος 2008, 21:45
Εκτύπωση

Re: Μετατροπή encoding αρχείων

Δημοσίευσηαπό eirc » 19 Μάιος 2008, 02:25

βασικά το scriptάκι που δίνω κάνει ακριβώς αυτό :D
eirc...
Άβαταρ μέλους
eirc
babeTUX
babeTUX
 
Δημοσιεύσεις: 2
Εγγραφή: 14 Μάιος 2008, 01:21
Τοποθεσία: Αθήνα - Τρίπολη
Εκτύπωση

Re: Μετατροπή encoding αρχείων

Δημοσίευσηαπό headless » 19 Μάιος 2008, 06:54

Υπάρχει κι ένας πιο "μπακαλίστικος" τρόπος,για όσους δεν είναι εξοικειωμένοι με την κονσόλα.
Μπορείτε να ανοίξετε το αρχείο με τον firefox (Ctrl+O) και να αλλάξετε το encoding από Προβολή-Κωδικοποίηση χαρακτήρων.
Γνώσεις ⇛ Linux: Καλές ┃ Προγραμματισμός: Μέτριος ┃ Αγγλικά: Καλά
Λειτουργικό: debian wheezy/sid 64-bit (en_US.utf8)
Προδιαγραφές ⇛ CPU: 2x Intel Core2 Duo CPU E8400 3.00GHz │ RAM 3965 MiB │ ASUS INC. P5QL/EPU
Κάρτα γραφικών: nVidia GF104 [GeForce GTX 460] [10de:0e22]
Δίκτυα: eth0: Realtek RTL8111/8168B PCI Express Gigabit Ethernet controller [10ec:8168]
My Blog
Άβαταρ μέλους
headless
powerTUX
powerTUX
 
Δημοσιεύσεις: 2173
Εγγραφή: 14 Μάιος 2008, 17:30
Τοποθεσία: Αθήνα
Launchpad: headl3ss
IRC: h3adl3ss
Εκτύπωση

Re: Μετατροπή encoding αρχείων

Δημοσίευσηαπό sparus » 19 Ιουν 2008, 15:16

Όταν δίνω αυτή την εντολή
Κώδικας: Επιλογή όλων
iconv -f iso-8859-7 -t utf8 iso_file.txt > utf_file.txt

Το αρχείο γίνεται 0 bytes και μέσα του έχουν εξαφανιστεί όλα. Κάνω κάτι λάθος?
Debian Squeeze (64bit)/ Ubuntu 10.10 (32bit)
AMD Athlon 64 (3200+) / Asus A8N5X / Gainward GeForce 6500 / 2GB DDR
Άβαταρ μέλους
sparus
dudeTUX
dudeTUX
 
Δημοσιεύσεις: 439
Εγγραφή: 31 Μάιος 2008, 15:41
Εκτύπωση

Re: Μετατροπή encoding αρχείων

Δημοσίευσηαπό simosx » 19 Ιουν 2008, 15:24

sparus έγραψε:Όταν δίνω αυτή την εντολή
Κώδικας: Επιλογή όλων
iconv -f iso-8859-7 -t utf8 iso_file.txt > utf_file.txt

Το αρχείο γίνεται 0 bytes και μέσα του έχουν εξαφανιστεί όλα. Κάνω κάτι λάθος?


Ξέχασες ένα <

Έτσι,

iconv -f iso-8859-7 -t utf8 < iso_file.txt > utf_file.txt
προσωπικό ιστολόγιο ϗ πλανήτης Ubuntu-gr
Συμβάλετε και εσείς στο ελληνικό βιβλίο Ubuntu!
1 Γνώσεις Linux: Πολύ καλό ┃ Προγραμματισμού: Πολύ καλό ┃ Αγγλικών: Πολύ καλό
2 Ubuntu 13.10 saucy 3.11.0-031100rc1-generic 64bit (el_GR.UTF-8, Unity ubuntu)
3 AMD E-450 APU with Radeon HD Graphics ‖ RAM 3555 MiB ‖ Sony Corporation VAIO
4 AMD nee ATI Wrestler [Radeon HD 6320] [1002:9806] {fglrx_pci}
5 eth0: Atheros Inc. AR8151 v2.0 Gigabit Ethernet [1969:1083] (rev c0) ⋮ wlan0: Atheros Inc. AR9285 [168c:002b] (rev 01)
Φτιάξτε και εσείς τη δική σας υπογραφή (παραπάνω κείμενο) αυτόματα με κλικ εδώ!
simosx
Επίτιμο μέλος
Επίτιμο μέλος
 
Δημοσιεύσεις: 10334
Εγγραφή: 11 Μάιος 2008, 18:52
Launchpad: simosx
IRC: simosx
Εκτύπωση

Re: Μετατροπή encoding αρχείων

Δημοσίευσηαπό sparus » 19 Ιουν 2008, 15:41

Α οκ ευχαριστώ! Bullgr διόρθωσε το και στον κώδικα που δίνεις.
Debian Squeeze (64bit)/ Ubuntu 10.10 (32bit)
AMD Athlon 64 (3200+) / Asus A8N5X / Gainward GeForce 6500 / 2GB DDR
Άβαταρ μέλους
sparus
dudeTUX
dudeTUX
 
Δημοσιεύσεις: 439
Εγγραφή: 31 Μάιος 2008, 15:41
Εκτύπωση

Re: Μετατροπή encoding αρχείων

Δημοσίευσηαπό simosx » 19 Ιουν 2008, 15:54

Κάπου απάντησα για τέτοια ερώτηση, ότι κάποιος μπορεί να χρησιμοποιήσει τον επεξεργαστή κειμένου (Εφαρμογές/Βοηθήματα/Επεξεργαστής κειμένου) για την ίδια δουλειά.
προσωπικό ιστολόγιο ϗ πλανήτης Ubuntu-gr
Συμβάλετε και εσείς στο ελληνικό βιβλίο Ubuntu!
1 Γνώσεις Linux: Πολύ καλό ┃ Προγραμματισμού: Πολύ καλό ┃ Αγγλικών: Πολύ καλό
2 Ubuntu 13.10 saucy 3.11.0-031100rc1-generic 64bit (el_GR.UTF-8, Unity ubuntu)
3 AMD E-450 APU with Radeon HD Graphics ‖ RAM 3555 MiB ‖ Sony Corporation VAIO
4 AMD nee ATI Wrestler [Radeon HD 6320] [1002:9806] {fglrx_pci}
5 eth0: Atheros Inc. AR8151 v2.0 Gigabit Ethernet [1969:1083] (rev c0) ⋮ wlan0: Atheros Inc. AR9285 [168c:002b] (rev 01)
Φτιάξτε και εσείς τη δική σας υπογραφή (παραπάνω κείμενο) αυτόματα με κλικ εδώ!
simosx
Επίτιμο μέλος
Επίτιμο μέλος
 
Δημοσιεύσεις: 10334
Εγγραφή: 11 Μάιος 2008, 18:52
Launchpad: simosx
IRC: simosx
Εκτύπωση

Re: Μετατροπή encoding αρχείων

Δημοσίευσηαπό sparus » 19 Ιουν 2008, 16:01

Άκυρο. Δε φταίει ο κώδικας. Απλά αν βάλεις το ίδιο όνομα αρχείου στο βγάζει 0 bytes. Και οι δύο κώδικες σωστοί είναι. Εγώ προσπαθούσα επιτόπου να αντικαταστήσω το παλιό αρχείο
Debian Squeeze (64bit)/ Ubuntu 10.10 (32bit)
AMD Athlon 64 (3200+) / Asus A8N5X / Gainward GeForce 6500 / 2GB DDR
Άβαταρ μέλους
sparus
dudeTUX
dudeTUX
 
Δημοσιεύσεις: 439
Εγγραφή: 31 Μάιος 2008, 15:41
Εκτύπωση

Re: Μετατροπή encoding αρχείων

Δημοσίευσηαπό bullgr » 20 Ιουν 2008, 02:17

sparus έγραψε:Άκυρο. Δε φταίει ο κώδικας. Απλά αν βάλεις το ίδιο όνομα αρχείου στο βγάζει 0 bytes. Και οι δύο κώδικες σωστοί είναι. Εγώ προσπαθούσα επιτόπου να αντικαταστήσω το παλιό αρχείο

Έτσι μπράβο, γιατί το έχω κάνει άπειρες φορές και μου φαινόταν παράξενο όταν είπατε ότι λείπει ένα "<".
ΕΠΙΤΡΕΠΕΤΑΙ ΝΑ ΠΕΣΕΙΣ, ΕΠΙΒΑΛΛΕΤΑΙ ΝΑ ΣΗΚΩΘΕΙΣ... HASTA SIEMPRE...
Άβαταρ μέλους
bullgr
Επίτιμο μέλος
Επίτιμο μέλος
 
Δημοσιεύσεις: 1853
Εγγραφή: 10 Μάιος 2008, 21:45
Εκτύπωση

Επόμενο

  • ΣΧΕΤΙΚΑ ΘΕΜΑΤΑ
    ΑΠΑΝΤΗΣΕΙΣ
    ΠΡΟΒΟΛΕΣ
    ΣΥΓΓΡΑΦΕΑΣ

Επιστροφή στο Οδηγοί - How to - Tutorials

cron