Δημοσιεύτηκε: 10 Σεπ 2012, 00:44
από simosx
ppong έγραψε:Κατέβασα το UTF8 Migration tool , αλλά μου λέει ότι όλα τα αρχεία μου είναι utf-8 συμβατά και δεν χρειάζεται καμία μετονομασία.
Διευκρίνηση.
Τα έγγραφα που ο τίτλος τους βγαίνει με κουτάκια και δεν διαβάζεται
τα κατεβάζω από το σάιτ της αθλητικής ομοσπονδίας(httf) έχουν τον τίτλο prokirikseis2012-13.zip
τα ανοίγω με τον διαχειριστή συμπιεσμένων αρχείων και είναι έγγραφα word.


Αυτό που χρειάζεται να δώσεις είναι ο σύνδεσμος www.httf.gr/images/anak/prokirikseis2012-13.zip (το βρήκα ύστερα από αναζήτηση από τις πληροφορίες που έδωσες).

Πράγματι το αρχείο .ZIP εμπεριέχει αρχεία όπου το όνομά τους είναι σε κωδικοποίηση windows-1253 (ή παραπλήσιο με iso-8859-7). Αυτές είναι παρωχημένες κωδικοποιήσεις 8-bit και δεν είναι συμβατές με Unicode.
Μέχρι τώρα δε διαπιστώσαμε αν το περιεχόμενο των εγγράφων είναι προβληματικό· μέχρι τώρα βλέπουμε το όνομα των αρχείων όπως το έφτιαξε το λειτουργικό σύστημα του υπολογιστή της ομοσπονδίας.

Υπάρχουν διάφοροι τρόποι για τη διόρθωση του προβλήματος. Υπάρχει τρόπος μέσω του γραφικού περιβάλλοντος που δεν το θυμάμαι, οπότε ας το αναφέρει κάποιος. Είναι απλά κάποιο πρόγραμμα όπως το file-roller όπου επιτρέπει να καθορίσεις την κωδικοποίηση των ονομάτων.

Με το δικό μου τρόπο,
1. αποσυμπιέζεις τα αρχεία με το file-roller ή με το unzip. Τα ονόματα φαίνονται με ??????, ωστόσο πίσω από κάθε ? υπάρχει ο σωστός χαρακτήρας στην παρωχημένη κωδικοποίηση.
2. Εγκαθιστάς το convmv με

Κώδικας: Επιλογή όλων
sudo apt-get install convmv


3. Μετατρέπεις τα ονόματα σε UTF-8 (κωδικοποίηση του Ubuntu) με
Κώδικας: Επιλογή όλων

convmv -f CP737 -t UTF-8 -r --notest *.doc


Κώδικας: Επιλογή όλων
Α1ΕΘΝΙΚΗ 2012-13.doc
Α2 ΕΘΝΙΚΗ 2012-13.doc
ΑΝΔΡΩΝ-ΓΥΝΑΙΚΩΝ 2012-13.DOC
ΑΤΟΜΙΚΟ ΕΦΗΒΩΝ-ΝΕΑΝΙΔΩΝ 2012-13.doc
ΑΤΟΜΙΚΟ ΝΕΩΝ ΑΝΔΡΩΝ-ΝΕΩΝ ΓΥΝΑΙΚΩΝ 2012-13.doc
ΑΤΟΜΙΚΟ ΠΑΙΔΩΝ-ΚΟΡΑΣΙΔΩΝ 2012-13.doc
ΑΤΟΜΙΚΟ ΠΑΜΠΑΙΔΩΝ-ΠΑΓΚΟΡΑΣΙΔΩΝ 2012-13.doc
Β ΕΘΝΙΚΗ 2012-13.doc
ΓΕΝΙΚΗ 2012-13.doc
ΚΥΠΕΛΛΟ 2012-13.doc
ΟΜΑΔΙΚΟ ΕΦΗΒΩΝ-ΝΕΑΝΙΔΩΝ 2012-13.doc
ΟΜΑΔΙΚΟ ΠΑΙΔΩΝ-ΚΟΡΑΣΙΔΩΝ 2012-13.doc
ΟΜΑΔΙΚΟ ΠΑΜΠΑΙΔΩΝ-ΠΑΓΚΟΡΑΣΙΔΩΝ 2012-13.doc
ΤΟΠ 8 2012-13.doc


Μετά το LibreOffice τα διαβάζει μια χαρά.

Η πηγή του προβλήματος είναι τα Windows, όπου για λόγους συμβατότητας φτιάχνουν αρχεία με ονόματα σε κωδικοποίηση από τη δεκαετία του '90.