OCR ελληνικών (και όχι μόνο) χαρακτήρων στο linux

...το μέρος για να ξεκινήσετε!

Συντονιστής: adem1

Κανόνες Δ. Συζήτησης
Παρακαλώ να επιλέξετε, με προσοχή, την άδεια που θέλετε να έχουν οι οδηγοί που συγγράφετε.
Πληροφορίες για τις άδειες μπορείτε να βρείτε εδώ.
Άμα επιθυμείτε κάποια άλλη άδεια επικοινωνήστε με κάποιο Διαχειριστή είτε Συντονιστή.

Σημαντικό είναι να χρησιμοποιήσετε την υπηρεσία http://imagebin.ubuntu-gr.org για τις εικόνες.

Re: OCR ελληνικών (και όχι μόνο) χαρακτήρων στο linux

Δημοσίευσηαπό akounadis » 02 Απρ 2011, 18:24

...μου ζητάει δικαιώματα για να βάλω το αρχείο "ell.traineddata.gz" στον φάκελο "tessdata" και να το αποσυμπιέσω.
Τι πρέπει να κάνω; Με τα δικαιώματα δεν τα πάω και τόσο καλά.
Ευχαριστώ
Arch Linux i3, Slackware, Ubuntu Gnome
Intel Core i7-7700HQ CPU @ 2.80GHz ‖ RAM 7617 MiB ‖ Dell Inc. 065C71 - Dell Inc. Inspiron 15 7000 Gaming
Intel Device [8086:591b] {i915} ⋮ nVidia Device [10de:1c8c] {nouveau}
wlp3s0: Intel Wireless 3165 [8086:3165] (rev 79) ⋮ enp2s0: Realtek RTL8111/8168/8411 PCI Express Gigabit Ethernet Controller [10ec:8168] (rev 15)
Συναντήσεις φίλων του Ubuntu-gr σε πόλεις της Ελλάδας
Άβαταρ μέλους
akounadis
daemonTUX
daemonTUX
 
Δημοσιεύσεις: 1047
Εγγραφή: 23 Δεκ 2009, 17:40
Τοποθεσία: Πειραιάς
Launchpad: akounadis
Εκτύπωση

Re: OCR ελληνικών (και όχι μόνο) χαρακτήρων στο linux

Δημοσίευσηαπό medigeek » 02 Απρ 2011, 18:55

Μηπως θα ήταν καλύτερα να κατεβάσεις τα πακέτα με τον 2ο τρόπο; :)

akounadis έγραψε:Τι πρέπει να κάνω;

Αν θέλεις να συνεχίσεις με τον 1ο τρόπο, εκτέλεσε στο τερματικό:
(Αν σου ζητηθεί ο κωδικός χρήστη, πληκτρολογησε τον στο τερματικό και μετά Enter)
Κώδικας: Επιλογή όλων
sudo wget "http://tesseract-ocr.googlecode.com/files/ell.traineddata.gz" -O /usr/local/share/tessdata/ell.traineddata.gz

Αυτό αντιστοιχεί στο τελευταίο μέρος του 1ου τρόπου (εγκατάσταση του ell.traineddata.gz)
Κύπριος; Κόπιασε στο ubuntu-cy! ┃ Launchpad Debian Github
Οδηγός για νεοεισερχόμενους -- Αρχικές οδηγίες για αρχάριους χρήστες του Ubuntu

1 Γνώσεις Linux: Πολύ καλό ┃ Προγραμματισμού: Πολύ καλό ┃ Αγγλικών: Πολύ καλό
2 Ubuntu 12.10 quantal 3.5.0-21-generic 64bit (en_US.UTF-8, GNOME cinnamon2d), Ubuntu 3.5.0-19-generic, Windows 7
3 Intel Core2 Duo CPU E6550 2.33GHz ‖ RAM 5970 MiB ‖ MSI MS-7235
4 nVidia G73 [GeForce 7300 GT] [10de:0393] {nvidia}
5 eth0: Realtek RTL-8110SC/8169SC Gigabit Ethernet [10ec:8167] (rev 10)
Άβαταρ μέλους
medigeek
Freedom
Freedom
 
Δημοσιεύσεις: 5023
Εγγραφή: 24 Μάιος 2008, 14:49
Τοποθεσία: Σερβία/Κύπρος
Launchpad: medigeek
IRC: savvas
Εκτύπωση

Re: OCR ελληνικών (και όχι μόνο) χαρακτήρων στο linux

Δημοσίευσηαπό akounadis » 02 Απρ 2011, 19:43

Κώδικας: Επιλογή όλων
tesseract: error while loading shared libraries: libtesseract_api.so.3: cannot open shared object file: No such file or directory


...τι κάνω γι´ αυτή την περίπτωση;
Arch Linux i3, Slackware, Ubuntu Gnome
Intel Core i7-7700HQ CPU @ 2.80GHz ‖ RAM 7617 MiB ‖ Dell Inc. 065C71 - Dell Inc. Inspiron 15 7000 Gaming
Intel Device [8086:591b] {i915} ⋮ nVidia Device [10de:1c8c] {nouveau}
wlp3s0: Intel Wireless 3165 [8086:3165] (rev 79) ⋮ enp2s0: Realtek RTL8111/8168/8411 PCI Express Gigabit Ethernet Controller [10ec:8168] (rev 15)
Συναντήσεις φίλων του Ubuntu-gr σε πόλεις της Ελλάδας
Άβαταρ μέλους
akounadis
daemonTUX
daemonTUX
 
Δημοσιεύσεις: 1047
Εγγραφή: 23 Δεκ 2009, 17:40
Τοποθεσία: Πειραιάς
Launchpad: akounadis
Εκτύπωση

Re: OCR ελληνικών (και όχι μόνο) χαρακτήρων στο linux

Δημοσίευσηαπό akounadis » 02 Απρ 2011, 21:41

the_eye έγραψε:Για κάνε
Κώδικας: Επιλογή όλων
sudo apt-get install libleptonica

και ξαναδοκίμασε στο τερματικό


...ok, έκανα αυτό. Είναι μια χαρά.
Arch Linux i3, Slackware, Ubuntu Gnome
Intel Core i7-7700HQ CPU @ 2.80GHz ‖ RAM 7617 MiB ‖ Dell Inc. 065C71 - Dell Inc. Inspiron 15 7000 Gaming
Intel Device [8086:591b] {i915} ⋮ nVidia Device [10de:1c8c] {nouveau}
wlp3s0: Intel Wireless 3165 [8086:3165] (rev 79) ⋮ enp2s0: Realtek RTL8111/8168/8411 PCI Express Gigabit Ethernet Controller [10ec:8168] (rev 15)
Συναντήσεις φίλων του Ubuntu-gr σε πόλεις της Ελλάδας
Άβαταρ μέλους
akounadis
daemonTUX
daemonTUX
 
Δημοσιεύσεις: 1047
Εγγραφή: 23 Δεκ 2009, 17:40
Τοποθεσία: Πειραιάς
Launchpad: akounadis
Εκτύπωση

Re: OCR ελληνικών (και όχι μόνο) χαρακτήρων στο linux

Δημοσίευσηαπό akounadis » 03 Απρ 2011, 11:04

Καλημέρα σας
Σας παραθέτω το κείμενο έτσι όπως το διαβάζει το OCR. http://img818.imageshack.us/i/screenshotke.png/
Τι πρόβλημα υπάρχει;
Ευχαριστώ
Arch Linux i3, Slackware, Ubuntu Gnome
Intel Core i7-7700HQ CPU @ 2.80GHz ‖ RAM 7617 MiB ‖ Dell Inc. 065C71 - Dell Inc. Inspiron 15 7000 Gaming
Intel Device [8086:591b] {i915} ⋮ nVidia Device [10de:1c8c] {nouveau}
wlp3s0: Intel Wireless 3165 [8086:3165] (rev 79) ⋮ enp2s0: Realtek RTL8111/8168/8411 PCI Express Gigabit Ethernet Controller [10ec:8168] (rev 15)
Συναντήσεις φίλων του Ubuntu-gr σε πόλεις της Ελλάδας
Άβαταρ μέλους
akounadis
daemonTUX
daemonTUX
 
Δημοσιεύσεις: 1047
Εγγραφή: 23 Δεκ 2009, 17:40
Τοποθεσία: Πειραιάς
Launchpad: akounadis
Εκτύπωση

Re: OCR ελληνικών (και όχι μόνο) χαρακτήρων στο linux

Δημοσίευσηαπό the_eye » 03 Απρ 2011, 13:54

Δες το οδηγό στο πρώτο θέμα. Έχεις ξεχάσει κάποια πράγματα από την παραμετροποίηση.
Όσο λιγότερο κλειστό λογισμικό έχεις, τόσα λιγότερα προβλήματα.
1 Γνώσεις ⇛ Linux: Καλό ┃ Προγραμματισμός: Ναι PHP, MySQL ┃ Αγγλικά: Καλά
2 Ubuntu 18.04 bionic 4.15.0-42-generic 64bit (el_GR.UTF-8, GNOME-Flashback:Unity gnome-flashback-compiz)
3 Intel Core i3-6100 CPU @ 3.70GHz ‖ RAM 3832 MiB ‖ Gigabyte B150M-HD3 DDR3-CF
4 Intel Sky Lake Integrated Graphics [8086:1912] {i915_bpo}
5 enp1s0: Realtek RTL8111/8168/8411 PCI Express Gigabit Ethernet Controller [10ec:8168] (rev 15)
Οδηγοί Ubuntu Βίντεο Οδηγοί
Άβαταρ μέλους
the_eye
Διαχειριστής
Διαχειριστής
 
Δημοσιεύσεις: 11450
Εγγραφή: 16 Μαρ 2010, 17:19
Launchpad: ntoulasd
IRC: the_eye_
Εκτύπωση

Re: OCR ελληνικών (και όχι μόνο) χαρακτήρων στο linux

Δημοσίευσηαπό akounadis » 03 Απρ 2011, 15:59

Έβαλα το αρχείο ell.traineddata.gz όπως μου είπε ο medigeek στον φάκελο tessdata αλλά δεν μπορώ να τον αποσυμπιέσω εκεί.
Η μηχανή tesseract υπάρχει κανονικά στο OCR όπως και το argument στα Ελληνικά.
Πώς κάνω πλήρη απεγκατάσταση, αν είναι να το ξανά εγκαταστήσω πάλι με τον δεύτερο τρόπο.
Ευχαριστώ
Arch Linux i3, Slackware, Ubuntu Gnome
Intel Core i7-7700HQ CPU @ 2.80GHz ‖ RAM 7617 MiB ‖ Dell Inc. 065C71 - Dell Inc. Inspiron 15 7000 Gaming
Intel Device [8086:591b] {i915} ⋮ nVidia Device [10de:1c8c] {nouveau}
wlp3s0: Intel Wireless 3165 [8086:3165] (rev 79) ⋮ enp2s0: Realtek RTL8111/8168/8411 PCI Express Gigabit Ethernet Controller [10ec:8168] (rev 15)
Συναντήσεις φίλων του Ubuntu-gr σε πόλεις της Ελλάδας
Άβαταρ μέλους
akounadis
daemonTUX
daemonTUX
 
Δημοσιεύσεις: 1047
Εγγραφή: 23 Δεκ 2009, 17:40
Τοποθεσία: Πειραιάς
Launchpad: akounadis
Εκτύπωση

Re: OCR ελληνικών (και όχι μόνο) χαρακτήρων στο linux

Δημοσίευσηαπό the_eye » 03 Απρ 2011, 16:04

Γράψε sudo nautilus έτσι θα μπορείς να πας στην διαδρομή και να το αποσυμπιέσεις.
Όσο λιγότερο κλειστό λογισμικό έχεις, τόσα λιγότερα προβλήματα.
1 Γνώσεις ⇛ Linux: Καλό ┃ Προγραμματισμός: Ναι PHP, MySQL ┃ Αγγλικά: Καλά
2 Ubuntu 18.04 bionic 4.15.0-42-generic 64bit (el_GR.UTF-8, GNOME-Flashback:Unity gnome-flashback-compiz)
3 Intel Core i3-6100 CPU @ 3.70GHz ‖ RAM 3832 MiB ‖ Gigabyte B150M-HD3 DDR3-CF
4 Intel Sky Lake Integrated Graphics [8086:1912] {i915_bpo}
5 enp1s0: Realtek RTL8111/8168/8411 PCI Express Gigabit Ethernet Controller [10ec:8168] (rev 15)
Οδηγοί Ubuntu Βίντεο Οδηγοί
Άβαταρ μέλους
the_eye
Διαχειριστής
Διαχειριστής
 
Δημοσιεύσεις: 11450
Εγγραφή: 16 Μαρ 2010, 17:19
Launchpad: ntoulasd
IRC: the_eye_
Εκτύπωση

Re: OCR ελληνικών (και όχι μόνο) χαρακτήρων στο linux

Δημοσίευσηαπό akounadis » 03 Απρ 2011, 16:22

Το αποσυμπίεσα αλλά πάλι τα ίδια.
Είναι εύκολο να μου πεις για πλήρη απεγκατάσταση γιατί δεν σημείωσα τα αρχεία κατά την εγκατάσταση.
Αν είναι να το ξανά βάλω. Σε ζάλισα.
Ευχαριστώ
Arch Linux i3, Slackware, Ubuntu Gnome
Intel Core i7-7700HQ CPU @ 2.80GHz ‖ RAM 7617 MiB ‖ Dell Inc. 065C71 - Dell Inc. Inspiron 15 7000 Gaming
Intel Device [8086:591b] {i915} ⋮ nVidia Device [10de:1c8c] {nouveau}
wlp3s0: Intel Wireless 3165 [8086:3165] (rev 79) ⋮ enp2s0: Realtek RTL8111/8168/8411 PCI Express Gigabit Ethernet Controller [10ec:8168] (rev 15)
Συναντήσεις φίλων του Ubuntu-gr σε πόλεις της Ελλάδας
Άβαταρ μέλους
akounadis
daemonTUX
daemonTUX
 
Δημοσιεύσεις: 1047
Εγγραφή: 23 Δεκ 2009, 17:40
Τοποθεσία: Πειραιάς
Launchpad: akounadis
Εκτύπωση

Re: OCR ελληνικών (και όχι μόνο) χαρακτήρων στο linux

Δημοσίευσηαπό the_eye » 03 Απρ 2011, 16:48

Αυτό το έκανες
Εικόνα

Αν έχεις πάλι πρόβλημα δοκίμασε τον 2 τρόπο, δεν χρειάζεται να κάνεις απεγκατάσταση.
Όσο λιγότερο κλειστό λογισμικό έχεις, τόσα λιγότερα προβλήματα.
1 Γνώσεις ⇛ Linux: Καλό ┃ Προγραμματισμός: Ναι PHP, MySQL ┃ Αγγλικά: Καλά
2 Ubuntu 18.04 bionic 4.15.0-42-generic 64bit (el_GR.UTF-8, GNOME-Flashback:Unity gnome-flashback-compiz)
3 Intel Core i3-6100 CPU @ 3.70GHz ‖ RAM 3832 MiB ‖ Gigabyte B150M-HD3 DDR3-CF
4 Intel Sky Lake Integrated Graphics [8086:1912] {i915_bpo}
5 enp1s0: Realtek RTL8111/8168/8411 PCI Express Gigabit Ethernet Controller [10ec:8168] (rev 15)
Οδηγοί Ubuntu Βίντεο Οδηγοί
Άβαταρ μέλους
the_eye
Διαχειριστής
Διαχειριστής
 
Δημοσιεύσεις: 11450
Εγγραφή: 16 Μαρ 2010, 17:19
Launchpad: ntoulasd
IRC: the_eye_
Εκτύπωση

ΠροηγούμενηΕπόμενο

  • ΣΧΕΤΙΚΑ ΘΕΜΑΤΑ
    ΑΠΑΝΤΗΣΕΙΣ
    ΠΡΟΒΟΛΕΣ
    ΣΥΓΓΡΑΦΕΑΣ

Επιστροφή στο Οδηγοί - How to - Tutorials