Πρόβλημα με τα Ελληνικά στο gedit σε αρχεία .srt  Το θέμα επιλύθηκε

...εφαρμογές για οτιδήποτε άλλο

Συντονιστής: konnn

Re: Πρόβλημα με τα Ελληνικά στο gedit σε αρχεία .srt

Δημοσίευσηαπό panagiotis » 05 Ιουν 2009, 16:06

Εδώ είναι το αρχείο:
http://www.2shared.com/file/6121962/f69d1098/KNOWTS.html
Δεν νομίζω να φταίει το αρχείο γιατί και άλλους υπότιτλους που δοκίμασα δεν τα ανοίγει.
Εικόνα Εικόνα
Toshiba Sattelite A100: Intel CoreDuo (1.83GHz) / Nvidia Ge Force 7600 / 1 GB DDR2 / 15.4" Mobile High Definiton.
Επίπεδο Γνώσεων: Linux: Καλό/Υψηλό / Προγραμματισμός: Ναι / Αγγλικά: Καλά/ Λειτουργικό:Ubuntu 11.10LTS "Oneiric Ocelot"
Άβαταρ μέλους
panagiotis
punkTUX
punkTUX
 
Δημοσιεύσεις: 166
Εγγραφή: 21 Οκτ 2008, 17:10
Τοποθεσία: ΛΕΜΕΣΟΣ
Εκτύπωση

Re: Πρόβλημα με τα Ελληνικά στο gedit σε αρχεία .srt

Δημοσίευσηαπό yobo » 05 Ιουν 2009, 16:13

panagiotis έγραψε:Δοκίμασα να το ανοίξω με : UTF-8 , Central Europe (iso 8859-2) , Central European (Windows-1250) , Greek (ISO-8859-7) , Greek (Windows -1253).


Δεν ξέρω αν υπάρχει και κάποια άλλη περισσότερο εξειδικευμενη εντολή αλλά μπορείς να δεις την κωδικοποίηση με:

Κώδικας: Επιλογή όλων
file onoma.arxeiou
There is no system but GNU, and Linux is one of its kernels
--> Αγοράστε στην Ελλάδα φορητό υπολογιστή χωρίς windows
yobo
babeTUX
babeTUX
 
Δημοσιεύσεις: 85
Εγγραφή: 19 Νοέμ 2008, 21:03
IRC: yobo
Εκτύπωση

Re: Πρόβλημα με τα Ελληνικά στο gedit σε αρχεία .srt

Δημοσίευσηαπό panagiotis » 05 Ιουν 2009, 16:17

έγραψε:Δεν ξέρω αν υπάρχει και κάποια άλλη περισσότερο εξειδικευμενη εντολή αλλά μπορείς να δεις την κωδικοποίηση με:
Κώδικας: Επιλογή όλων
file onoma.arxeiou

έγραψε:
Κώδικας: Επιλογή όλων

iconv arxeio.srt -f WINDOWS-1253 -t UTF-8 -o arxeio_new.srt


Δοκίμασα και την εντολή
Κώδικας: Επιλογή όλων
iconv arxeio.srt -f WINDOWS-1253 -t UTF-8 -o arxeio_new.srt

αλλά τίποτα.
Εικόνα Εικόνα
Toshiba Sattelite A100: Intel CoreDuo (1.83GHz) / Nvidia Ge Force 7600 / 1 GB DDR2 / 15.4" Mobile High Definiton.
Επίπεδο Γνώσεων: Linux: Καλό/Υψηλό / Προγραμματισμός: Ναι / Αγγλικά: Καλά/ Λειτουργικό:Ubuntu 11.10LTS "Oneiric Ocelot"
Άβαταρ μέλους
panagiotis
punkTUX
punkTUX
 
Δημοσιεύσεις: 166
Εγγραφή: 21 Οκτ 2008, 17:10
Τοποθεσία: ΛΕΜΕΣΟΣ
Εκτύπωση

Re: Πρόβλημα με τα Ελληνικά στο gedit σε αρχεία .srt

Δημοσίευσηαπό xqtr » 05 Ιουν 2009, 17:27

το αρχειο σου δειχνει οτι εχει μετατραπει σε utf8, αλλα παρολα αυτα δεν φενονται ελληνικα, τουλαχιστον με τον gedit. Καλυτερα κατεβασε το παλι και μετα κατεβασε αυτο το προγραμμα https://sourceforge.net/projects/concom/ και κανε την μετατροπη ευκολα.
O χειμώνας έρχεται...
Γνώσεις ⇛ Linux: Μέτριο │ Προγραμματισμός: Ναι (Delphi/Lazarus) │ Αγγλικά: Καλά
Λειτουργικό : Ubuntu 14.04 σε Acer Aspire 5520
Προδιαγραφές ⇛ AMD Turion 1.8GHz │ 1GB │ ATI X700 │ Broadcom BCM4318 │LCD 15.4"
Άβαταρ μέλους
xqtr
seniorTUX
seniorTUX
 
Δημοσιεύσεις: 509
Εγγραφή: 05 Φεβ 2009, 19:00
Εκτύπωση

Re: Πρόβλημα με τα Ελληνικά στο gedit σε αρχεία .srt

Δημοσίευσηαπό simosx » 05 Ιουν 2009, 17:34

panagiotis έγραψε:Εδώ είναι το αρχείο:
http://www.2shared.com/file/6121962/f69d1098/KNOWTS.html
Δεν νομίζω να φταίει το αρχείο γιατί και άλλους υπότιτλους που δοκίμασα δεν τα ανοίγει.


Το αρχείο αυτό είναι προβληματικό.

Το αρχείο είναι κωδικοποίησης UTF-8 και δείχνει

Κώδικας: Επιλογή όλων
Ãéá íá âñïýìå ôçí êáëýôåñç éäÝá ãéá
íá ãéïñôÜóïõìå áõôÞ ôçí îå÷ùñéóôÞ ìÝñá.


που δεν είναι φυσικά κάποια γλώσσα. Κάποιος έκανε εσφαλμένη μετατροπή από iso-8859-1 (μάλλον) προς UTF-8,
οπότε φαίνονται εκτεταμένοι λατινικοί χαρακτήρες.

Ακόμα, αν και το αρχείο είναι UTF-8, υπάρχει ένας χαρακτήρας μέσα που δεν είναι UTF-8, στη γραμμή που δείχνει

Κώδικας: Επιλογή όλων
SEPTiCEMiA TEAM - [GMTeam] - S.M.P<99></b></i>


Είναι αυτό το <99> (στην πραγματικότητα είναι ένας χαρακτήρας, του copyright, σε κωδικοποίηση iso-8859-1, ενώ το υπόλοιπο κείμενο είναι ορθό σε UTF-8).
Αυτό έχει ως αποτέλεσμα να μη μπορεί να ανοίξει το κείμενο μέσα από το gedit.

Αυτό που πρέπει να γίνει είναι πρώτα αντίθετη μετατροπή, από UTF-8 σε iso-8859-1 (μάλλον), και μετά μετατροπή από iso-8859-7 προς UTF-8.

Με αυτόν το τρόπο, οι παραπάνω γραμμές στην παράξενη γλώσσα εμφανίζονται σωστά στα ελληνικά,

Κώδικας: Επιλογή όλων
Για να βρούμε την καλύτερη ιδέα για
να γιορτάσουμε αυτή την ξεχωριστή μέρα.


Οπότε, μπορείς να κάνεις τη δουλειά από γραμμή εντολής, με

Κώδικας: Επιλογή όλων
iconv -c -f utf-8 -t iso-8859-1 < /tmp/KNOWTS.srt | iconv -f iso-8859-7 -t utf-8


Θα δεις ότι χρησιμοποιώ την παράμετρο '-c', που σημαίνει, αγνόησε ό,τι σφάλματα υπάρχουν.
Συγκεκριμένα, στο παραγόμενο αρχείο δε θα δεις ελληνικούς κεφαλαίους χαρακτήρες με τόνο (Ό, Έ, κτλ) σε μερικές γραμμές.
Είναι πιθανό αν δοκιμάσεις περισσότερες κωδικοποιήσεις με την iconv (δες iconv -l) να βρεις το σωστό μείγμα.

Ελπίζω τα παραπάνω να βοηθήσουν στην αντιμετώπιση προβλημάτων στην κωδικοποίηση υποτίτλων.
προσωπικό ιστολόγιο ϗ πλανήτης Ubuntu-gr
Συμβάλετε και εσείς στο ελληνικό βιβλίο Ubuntu!
1 Γνώσεις Linux: Πολύ καλό ┃ Προγραμματισμού: Πολύ καλό ┃ Αγγλικών: Πολύ καλό
2 Ubuntu 13.10 saucy 3.11.0-031100rc1-generic 64bit (el_GR.UTF-8, Unity ubuntu)
3 AMD E-450 APU with Radeon HD Graphics ‖ RAM 3555 MiB ‖ Sony Corporation VAIO
4 AMD nee ATI Wrestler [Radeon HD 6320] [1002:9806] {fglrx_pci}
5 eth0: Atheros Inc. AR8151 v2.0 Gigabit Ethernet [1969:1083] (rev c0) ⋮ wlan0: Atheros Inc. AR9285 [168c:002b] (rev 01)
Φτιάξτε και εσείς τη δική σας υπογραφή (παραπάνω κείμενο) αυτόματα με κλικ εδώ!
simosx
Επίτιμο μέλος
Επίτιμο μέλος
 
Δημοσιεύσεις: 10334
Εγγραφή: 11 Μάιος 2008, 18:52
Launchpad: simosx
IRC: simosx
Εκτύπωση

Re: Πρόβλημα με τα Ελληνικά στο gedit σε αρχεία .srt

Δημοσίευσηαπό logari81 » 05 Ιουν 2009, 17:36

η αρχική μου υπόθεση ήταν μάλλον σωστη. Το αρχειο εχει υποστει διπλή μετατροπή κωδικοποιησης από/σε λαθος μορφη. Π.χ. παιρνωντας ενα δειγμα απο το αρχειο ο τροπος να διαπιστωσει κανεις την αναποδη φορα των μετατροπων μεσω python ειναι ο παρακατω:

Κώδικας: Επιλογή όλων
>>> a='Êáé èõìÜóôå ôïí äéáãùíéóìü ðïõ åß÷å'
>>> print a.decode('utf-8').encode('iso-8859-15').decode('windows-1253')
Και θυμάστε τον διαγωνισμό που είχε


Αυτο που εχεις να κανεις ειναι
open (encoding utf-8)
save as (encoding iso-8859-15)
κλεισιμο
open (encoding windows-1253)
save as (encoding utf-8)

από κονσολα ειναι λιγο πιο ευκολο με:
Κώδικας: Επιλογή όλων
iconv KNOWTS.srt -f UTF-8 -t ISO_8859-15 -o tmp.srt
iconv tmp.srt -f WINDOWS-1253 -t UTF-8 -o KNOWTS_new.srt


EDIT: με προλαβε ο Σιμος
http://opensourceecology.org/


Λειτουργικό: Ubuntu 10.04 lucid 64-bitΠροδιαγραφές: 4x Intel Core i5 CPU M 450 2.40GHz ‖ RAM 3696 MiB ‖ Lenovo KL3 - LENOVO IdeaPad Y560
Κάρτα γραφικών: ATI Device [1002:68c0]Ασύρματο: wlan0: Atheros Inc. AR928X Wireless Network Adapter (PCI-Express) [168c:002a] (rev 01)
logari81
Επίτιμο μέλος
Επίτιμο μέλος
 
Δημοσιεύσεις: 6074
Εγγραφή: 14 Μάιος 2008, 10:40
Εκτύπωση

Re: Πρόβλημα με τα Ελληνικά στο gedit σε αρχεία .srt

Δημοσίευσηαπό panagiotis » 05 Ιουν 2009, 21:07

Να 'στε καλά παιδιά ευχαριστώ.Εν το μεταξύ όλοι οι υπότιτλοι είναι τέτοιο μπέρδεμα και δεν ξέρω γιατί..Όπως και να 'χει σας ευχαριστώ.
Εικόνα Εικόνα
Toshiba Sattelite A100: Intel CoreDuo (1.83GHz) / Nvidia Ge Force 7600 / 1 GB DDR2 / 15.4" Mobile High Definiton.
Επίπεδο Γνώσεων: Linux: Καλό/Υψηλό / Προγραμματισμός: Ναι / Αγγλικά: Καλά/ Λειτουργικό:Ubuntu 11.10LTS "Oneiric Ocelot"
Άβαταρ μέλους
panagiotis
punkTUX
punkTUX
 
Δημοσιεύσεις: 166
Εγγραφή: 21 Οκτ 2008, 17:10
Τοποθεσία: ΛΕΜΕΣΟΣ
Εκτύπωση

Re: Πρόβλημα με τα Ελληνικά στο gedit σε αρχεία .srt

Δημοσίευσηαπό simosx » 05 Ιουν 2009, 22:21

panagiotis έγραψε:Να 'στε καλά παιδιά ευχαριστώ.Εν το μεταξύ όλοι οι υπότιτλοι είναι τέτοιο μπέρδεμα και δεν ξέρω γιατί..Όπως και να 'χει σας ευχαριστώ.


Τη σωστή απάντηση την έδωσε ο logari81, όπου διαπίστωσε την κωδικοποίηση iso-8859-15 (εγώ έγραψα για iso-8859-1).

Οπότε, είναι σημαντικό να πατήσεις το Εικόνα στην απάντηση του logari81. Όπως είναι τώρα, έβαλες το Εικόνα στην αρχική σου ερώτηση που είναι λάθος (βάζεις το Εικόνα στην απάντηση που σε καλύπτει καλύτερα και όχι στην ερώτησή σου).
προσωπικό ιστολόγιο ϗ πλανήτης Ubuntu-gr
Συμβάλετε και εσείς στο ελληνικό βιβλίο Ubuntu!
1 Γνώσεις Linux: Πολύ καλό ┃ Προγραμματισμού: Πολύ καλό ┃ Αγγλικών: Πολύ καλό
2 Ubuntu 13.10 saucy 3.11.0-031100rc1-generic 64bit (el_GR.UTF-8, Unity ubuntu)
3 AMD E-450 APU with Radeon HD Graphics ‖ RAM 3555 MiB ‖ Sony Corporation VAIO
4 AMD nee ATI Wrestler [Radeon HD 6320] [1002:9806] {fglrx_pci}
5 eth0: Atheros Inc. AR8151 v2.0 Gigabit Ethernet [1969:1083] (rev c0) ⋮ wlan0: Atheros Inc. AR9285 [168c:002b] (rev 01)
Φτιάξτε και εσείς τη δική σας υπογραφή (παραπάνω κείμενο) αυτόματα με κλικ εδώ!
simosx
Επίτιμο μέλος
Επίτιμο μέλος
 
Δημοσιεύσεις: 10334
Εγγραφή: 11 Μάιος 2008, 18:52
Launchpad: simosx
IRC: simosx
Εκτύπωση

Re: Πρόβλημα με τα Ελληνικά στο gedit σε αρχεία .srt

Δημοσίευσηαπό baker » 06 Ιουν 2009, 12:07

Να προσθέσω και εγώ τον δικό μου τρόπο που βλέπω ελλληνικά με το gedit? όντως αν ανοίξεις το gedit και μετα Άνοιγμα - κωδικοποιηση χαρακτήρων - Greek (iso-8859-7)
δουλεύει μια χαρά.. αλλά γιατί να το κάνεις έτσι κάθε φορά σε κάθε αρχείο...

Δεξι κλικ στο srt αρχείο που έχεις πρόβλημα με τα ελληνικά, Ιδιότητες - Άνοιγμα με - Προσθήκη - Χρήση μιας προσαρμοσμένης εντολής -
και γράφουμε: gedit --enconding=iso-8859-7
Από εδώ και πέρα κάθε srt αρχείο θα ανοίγει σωστά με απλό διπλό κλικ πάνω του..

Τώρα αν το srt είναι ήδη σε utf-8 το gedit θα μας πει οτι δεν μπορει να το ανοίξει με την τρέχουσα κωδικοποιηση iso-8859-7
δεν έχουμε παρά να κάνουμε ένα κλικ στο retry με κωδικοποίηση UTF-8
πιστευω είναι πιο βολικός αυτός ο τρόπος, με λιγότερες διαδικασίες
Γνώσεις ⇛ Linux: Χαμηλό │ Προγραμματισμός: Όχι │ Αγγλικά: Καλά
Λειτουργικό ⇛ Dualboot Ubuntu 9.10 & Windows XP SP3 σε Acer Aspire 5920G
Προδιαγραφές ⇛ 2x T5550 @ 1.83GHz │ 3GB DDR2 │ GeForce 8600M GS │ Intel 3945ABG │ HDA Intel │ 15,4" WXGA
Άβαταρ μέλους
baker
babeTUX
babeTUX
 
Δημοσιεύσεις: 123
Εγγραφή: 15 Μάιος 2009, 14:48
IRC: baker_GR
Εκτύπωση

Re: Πρόβλημα με τα Ελληνικά στο gedit σε αρχεία .srt

Δημοσίευσηαπό yobo » 07 Ιουν 2009, 17:53

Αυτό που λες φίλε baker δεν είναι η λύση στο πρόβλημα είναι ένας άλλος τρόπος να δεις τα αρχεία σου, αλλά το πρόβλημα παραμένει: τα αρχεία δεν είναι σε μορφή UTF-8.

Αν μετατρέψεις την κωδικοποίηση ενός αρχείου από οτιδήποτε σε UTF-8, τότε λύνεις το πρόβλημα για πάντα (για το συγκεκριμένο αρχείο). Ακόμα και στα windows αν ανοίξεις αρχείο με κωδικοποίηση UTF-8 δεν το πειράζει το αφήνει ως έχει. Το πρόβλημα ξεκινάει από την επιλογή της Microsoft να έχει προεπιλεγμένη (default) κωδικοποίηση κάποια άλλη από την standard (UTF-8).

Δες εδώ: http://en.wikipedia.org/wiki/Utf-8
Και εδώ: http://en.wikipedia.org/wiki/Comparison ... _encodings
There is no system but GNU, and Linux is one of its kernels
--> Αγοράστε στην Ελλάδα φορητό υπολογιστή χωρίς windows
yobo
babeTUX
babeTUX
 
Δημοσιεύσεις: 85
Εγγραφή: 19 Νοέμ 2008, 21:03
IRC: yobo
Εκτύπωση

ΠροηγούμενηΕπόμενο

  • ΣΧΕΤΙΚΑ ΘΕΜΑΤΑ
    ΑΠΑΝΤΗΣΕΙΣ
    ΠΡΟΒΟΛΕΣ
    ΣΥΓΓΡΑΦΕΑΣ

Επιστροφή στο Εφαρμογές Άλλες-Διάφορες