Δημοσιεύτηκε: 15 Μάιος 2008, 13:26
από bullgr
eirc έγραψε:αργά ή γρήγορα όλοι κάπου θα δούμε ένα αρχείο ελληνικού κειμένου γραμμένο στα win που δεν μπορούμε να διαβάσουμε με την μία μιας και ο gedit δεν αναγνωρίζει αυτόματα το encoding..


Και μιας και το έφερε το θέμα, υπάρχει τρόπος να μετατρέπουμε οποιοδήποτε κείμενο text (όχι με μορφοποίηση)
από μια κωδικοποίηση χαρακτήρων σε άλλη.
Για παράδειγμα για να αλλάξουμε ένα αρχείο κειμένου φτιαγμένο σε winblows iso-8859-7 σε utf8 ανοίγουμε μια
κονσόλα και δίνουμε την παρακάτω εντολή.

Κώδικας: Επιλογή όλων
iconv -f iso-8859-7 -t utf8 iso_file.txt > utf_file.txt


Αυτή η εντολή θα δημιουργήσει ένα νέο αρχείο κειμένου utf_file.txt με κωδικοποίηση χαρακτήρων utf8.
Το πηγαίο αρχείο κειμένου iso_file.txt με κωδικοποίηση χαρακτήρων iso-8859-7 παραμένει άθικτο.

Τονίζω ότι δεν παίζει ρόλο η επέκταση του αρχείου (.txt) αρκεί να είναι αρχείο κειμένου.
Άρα η παραπάνω εντολή ισχύει και για τους υπότιτλους με επέκταση .srt κλπ.