OCR ελληνικών (και όχι μόνο) χαρακτήρων στο linux

...το μέρος για να ξεκινήσετε!

Συντονιστής: adem1

Κανόνες Δ. Συζήτησης
Παρακαλώ να επιλέξετε, με προσοχή, την άδεια που θέλετε να έχουν οι οδηγοί που συγγράφετε.
Πληροφορίες για τις άδειες μπορείτε να βρείτε εδώ.
Άμα επιθυμείτε κάποια άλλη άδεια επικοινωνήστε με κάποιο Διαχειριστή είτε Συντονιστή.

Σημαντικό είναι να χρησιμοποιήσετε την υπηρεσία http://imagebin.ubuntu-gr.org για τις εικόνες.

Re: OCR ελληνικών (και όχι μόνο) χαρακτήρων στο linux

Δημοσίευσηαπό mz412 » 09 Ιουν 2011, 00:43

Παιδιά, η αναγνώριση του εγγράφου γίνεται χωρίς πρόβλημα. Πως όμως εξάγω το κείμενο ή το αντιγράφω σε odt πχ; Δοκίμασα με την εξαγωγή σε Odt αλλά η σελίδα εμφανίζεται κενή.

Συγχαρητήρια για τον οδηγό, πολύ καλός και κατατοπιστικός.
1 Γνώσεις → Linux: Αρχάριος ┃ Προγραμματισμός: Αρχάριος ┃ Αγγλικά: Προχωρημένος
2 Λειτουργικό → Ubuntu 11.04 natty 32-bit (el_GR.UTF-8)
3 Προδιαγραφές → CPU: 4x Intel Core2 Quad CPU Q9400 2.66GHz ‖ RAM 4020 MiB ‖ MSI P45 Neo2-FR (MS-7512)
4 Κάρτες γραφικών: ATI RV770 [Radeon HD 4850] ⎨1002:9442⎬
mz412
babeTUX
babeTUX
 
Δημοσιεύσεις: 66
Εγγραφή: 22 Μαρ 2011, 19:40
Τοποθεσία: Μακεδονία
Εκτύπωση

Re: OCR ελληνικών (και όχι μόνο) χαρακτήρων στο linux

Δημοσίευσηαπό the_eye » 09 Ιουν 2011, 01:32

Πρέπει πρώτα να πατήσεις το κουμπάκι OCR και μετά να το κάνεις εξαγωγή σε odt.
Όσο λιγότερο κλειστό λογισμικό έχεις, τόσα λιγότερα προβλήματα.
1 Γνώσεις ⇛ Linux: Καλό ┃ Προγραμματισμός: Ναι PHP, MySQL ┃ Αγγλικά: Καλά
2 Ubuntu 22.04 Jammy Jellyfish 5.15.0-58-generic 64bit (el_GR.UTF-8, ubuntu:GNOME ubuntu)
3 Intel Core i3-6100 CPU @ 3.70GHz ‖ RAM 7836 MiB ‖ Gigabyte B150M-HD3 DDR3-CF - Gigabyte B150M-HD3 DDR3
4 Intel HD Graphics 530 [8086:1912] {i915}
5 enp1s0: Realtek RTL8111/8168/8411 PCI Express Gigabit Ethernet Controller [10ec:8168] (rev 15)
Οδηγοί Ubuntu Βίντεο Οδηγοί
Άβαταρ μέλους
the_eye
Διαχειριστής
Διαχειριστής
 
Δημοσιεύσεις: 11672
Εγγραφή: 16 Μαρ 2010, 17:19
Launchpad: ntoulasd
IRC: the_eye_
Εκτύπωση

Re: OCR ελληνικών (και όχι μόνο) χαρακτήρων στο linux

Δημοσίευσηαπό dimkalg » 30 Ιουν 2012, 13:21

Ενώ έχω κάνει τα πάντα κόλλησα στο τελευταίο βήμα :

"...Το make θα τρέξει αρκετή ώρα.
Κατόπιν κατεβάζουμε και αποσυμπιέζουμε το αρχείο με τα ελληνικά ή οποια άλλη γλώσσα θέλουμε
http://tesseract-ocr.googlecode.com/fil ... neddata.gz
στον φάκελο
Κώδικας: Επιλογή όλων
/usr/local/share/tessdata"

Στο παραπάνω (τελευταίο βήμα) εμφανίζει το μήνυμα ΔΕΝ ΕΧΕΤΕ ΤΑ ΣΩΣΤΑ ΔΙΚΑΙΩΜΑΤΑ ΓΙΑ ΑΠΟΣΥΜΠΙΕΣΗ ΣΤΟΝ ΦΑΚΕΛΛΟ .... κτλ (βλέπε εδώ : http://imageshack.us/content_round.php? ... 130812.png ).
Τι πρέπει να κάνω;;

Ευχαριστώ
1 Γνώσεις Linux: Καθόλου ┃ Προγραμματισμού: Καθόλου ┃ Αγγλικών: Ικανοποιητικό
2 Ubuntu 16.04 xenial 4.4.0-22-generic 32bit (el_GR.UTF-8, Unity ubuntu)
3 Intel Core2 CPU T7200 2.00GHz ‖ RAM 2004 MiB ‖ FUJITSU SIEMENS AMILO Pro V3505
4 Intel Mobile 945GM/GMS, 943/940GML Express Integrated Graphics [8086:27a2] {i915}
5 enp2s0: Marvell 88E8055 PCI-E Gigabit Ethernet Controller [11ab:4363] (rev 12) ⋮ wlp4s0: Intel PRO/Wireless 3945ABG [Golan] Network Connection [8086:4222] (rev 02)
dimkalg
babeTUX
babeTUX
 
Δημοσιεύσεις: 118
Εγγραφή: 25 Ιαν 2011, 18:33
Εκτύπωση

Re: OCR ελληνικών (και όχι μόνο) χαρακτήρων στο linux

Δημοσίευσηαπό the_eye » 30 Ιουν 2012, 14:41

Καλύτερα να το αποσυμπιέσεις στις λήψεις και μετά από το τερματικό να ανοίξεις το nautilus ως υπερχρήστης για να σου επιτραπεί η αντιγραφή με
Κώδικας: Επιλογή όλων
gksudo nautilus
Όσο λιγότερο κλειστό λογισμικό έχεις, τόσα λιγότερα προβλήματα.
1 Γνώσεις ⇛ Linux: Καλό ┃ Προγραμματισμός: Ναι PHP, MySQL ┃ Αγγλικά: Καλά
2 Ubuntu 22.04 Jammy Jellyfish 5.15.0-58-generic 64bit (el_GR.UTF-8, ubuntu:GNOME ubuntu)
3 Intel Core i3-6100 CPU @ 3.70GHz ‖ RAM 7836 MiB ‖ Gigabyte B150M-HD3 DDR3-CF - Gigabyte B150M-HD3 DDR3
4 Intel HD Graphics 530 [8086:1912] {i915}
5 enp1s0: Realtek RTL8111/8168/8411 PCI Express Gigabit Ethernet Controller [10ec:8168] (rev 15)
Οδηγοί Ubuntu Βίντεο Οδηγοί
Άβαταρ μέλους
the_eye
Διαχειριστής
Διαχειριστής
 
Δημοσιεύσεις: 11672
Εγγραφή: 16 Μαρ 2010, 17:19
Launchpad: ntoulasd
IRC: the_eye_
Εκτύπωση

Re: OCR ελληνικών (και όχι μόνο) χαρακτήρων στο linux

Δημοσίευσηαπό dimkalg » 30 Ιουν 2012, 19:31

the_eye έγραψε:Καλύτερα να το αποσυμπιέσεις στις λήψεις και μετά από το τερματικό να ανοίξεις το nautilus ως υπερχρήστης για να σου επιτραπεί η αντιγραφή με
Κώδικας: Επιλογή όλων
gksudo nautilus


Το αποσυμπίεσα στις λήψεις αλλά ανοίγοντας το nautilus όπως ανέφερες δεν μπορώ να καταλάβω πως θα κάνω την αντιγραφή. Δεν εμφανίζει στο αναδυόμενο παράθυρο όλους τους φακέλλους : http://imageshack.us/content_round.php? ... 192750.png
Τι κάνω λάθος;;
1 Γνώσεις Linux: Καθόλου ┃ Προγραμματισμού: Καθόλου ┃ Αγγλικών: Ικανοποιητικό
2 Ubuntu 16.04 xenial 4.4.0-22-generic 32bit (el_GR.UTF-8, Unity ubuntu)
3 Intel Core2 CPU T7200 2.00GHz ‖ RAM 2004 MiB ‖ FUJITSU SIEMENS AMILO Pro V3505
4 Intel Mobile 945GM/GMS, 943/940GML Express Integrated Graphics [8086:27a2] {i915}
5 enp2s0: Marvell 88E8055 PCI-E Gigabit Ethernet Controller [11ab:4363] (rev 12) ⋮ wlp4s0: Intel PRO/Wireless 3945ABG [Golan] Network Connection [8086:4222] (rev 02)
dimkalg
babeTUX
babeTUX
 
Δημοσιεύσεις: 118
Εγγραφή: 25 Ιαν 2011, 18:33
Εκτύπωση

Re: OCR ελληνικών (και όχι μόνο) χαρακτήρων στο linux

Δημοσίευσηαπό konnn » 30 Ιουν 2012, 22:11

dimkalg έγραψε:Δεν εμφανίζει στο αναδυόμενο παράθυρο όλους τους φακέλλους : http://imageshack.us/content_round.php? ... 192750.png
Τι κάνω λάθος;;

Θα βρεις τον home από το "φάκελο" Filesystem που βλέπεις αριστερά.

Μπορείς αντί του imageshack να χρησιμοποιείς την υπηρεσία του φόρουμ.


;)
1 Linux: Μέτριος ┃ Προγραμματισμός: Μέτριος ┃ Αγγλικά: Προχωρημένος
2 Desktop : Ubuntu 16.04 64bit
a Intel Core i3 CPU 530 2.93GHz ‖ RAM 3824 MiB ‖ Intel DH55HC -
b nVidia Device [10de:1040] (rev a1)
c eth0: Intel 82578DC Gigabit Network Connection
3 Notebook : Ubuntu 16.04 64 bit
a Intel Core i3-2365M CPU @ 1.40GHz ‖ RAM 3854 MiB ‖ LENOVO 20197
b Intel 2nd Generation Core Processor Family Integrated Graphics Controller
c 5 wlan0: Intel Centrino Wireless-N 2230 ⋮ eth0: Realtek RTL8101E/RTL8102E

Αυτόματη υπογραφή.
Άβαταρ μέλους
konnn
Συντονιστής
Συντονιστής
 
Δημοσιεύσεις: 3568
Εγγραφή: 12 Ιούλ 2010, 17:54
Τοποθεσία: Καλαμάτα
Launchpad: konnn
Εκτύπωση

Re: OCR ελληνικών (και όχι μόνο) χαρακτήρων στο linux

Δημοσίευσηαπό dimkalg » 01 Ιούλ 2012, 09:21

konnn έγραψε:
dimkalg έγραψε:Δεν εμφανίζει στο αναδυόμενο παράθυρο όλους τους φακέλλους : http://imageshack.us/content_round.php? ... 192750.png
Τι κάνω λάθος;;

Θα βρεις τον home από το "φάκελο" Filesystem που βλέπεις αριστερά.

Μπορείς αντί του imageshack να χρησιμοποιείς την υπηρεσία του φόρουμ.


;)


ok Ευχαριστώ, το κατάλαβα και πέτυχε. Το θέμα είναι πως εμφανίζει το κείμενο αλλά δεν μπορώ να το επεξεργαστώ. Τέλος πάντων θα ξαναπροσπαθήσω και θα επανέλθω.
Ευχαριστώ και πάλι.
1 Γνώσεις Linux: Καθόλου ┃ Προγραμματισμού: Καθόλου ┃ Αγγλικών: Ικανοποιητικό
2 Ubuntu 16.04 xenial 4.4.0-22-generic 32bit (el_GR.UTF-8, Unity ubuntu)
3 Intel Core2 CPU T7200 2.00GHz ‖ RAM 2004 MiB ‖ FUJITSU SIEMENS AMILO Pro V3505
4 Intel Mobile 945GM/GMS, 943/940GML Express Integrated Graphics [8086:27a2] {i915}
5 enp2s0: Marvell 88E8055 PCI-E Gigabit Ethernet Controller [11ab:4363] (rev 12) ⋮ wlp4s0: Intel PRO/Wireless 3945ABG [Golan] Network Connection [8086:4222] (rev 02)
dimkalg
babeTUX
babeTUX
 
Δημοσιεύσεις: 118
Εγγραφή: 25 Ιαν 2011, 18:33
Εκτύπωση

Re: OCR ελληνικών (και όχι μόνο) χαρακτήρων στο linux

Δημοσίευσηαπό dimkalg » 01 Ιούλ 2012, 09:50

οκ επιτυχία. Πολλά συγχαρητήρια στον the_eye για τον οδηγό και την άμεση ανταπόκριση στο ερώτημα, καθώς και στον konnn για την επιπλέον βοήθεια.
1 Γνώσεις Linux: Καθόλου ┃ Προγραμματισμού: Καθόλου ┃ Αγγλικών: Ικανοποιητικό
2 Ubuntu 16.04 xenial 4.4.0-22-generic 32bit (el_GR.UTF-8, Unity ubuntu)
3 Intel Core2 CPU T7200 2.00GHz ‖ RAM 2004 MiB ‖ FUJITSU SIEMENS AMILO Pro V3505
4 Intel Mobile 945GM/GMS, 943/940GML Express Integrated Graphics [8086:27a2] {i915}
5 enp2s0: Marvell 88E8055 PCI-E Gigabit Ethernet Controller [11ab:4363] (rev 12) ⋮ wlp4s0: Intel PRO/Wireless 3945ABG [Golan] Network Connection [8086:4222] (rev 02)
dimkalg
babeTUX
babeTUX
 
Δημοσιεύσεις: 118
Εγγραφή: 25 Ιαν 2011, 18:33
Εκτύπωση

Re: OCR ελληνικών (και όχι μόνο) χαρακτήρων στο linux

Δημοσίευσηαπό the_eye » 05 Αύγ 2012, 05:11

Ενημέρωση του αρχικού οδηγού για την 12.04
Όσο λιγότερο κλειστό λογισμικό έχεις, τόσα λιγότερα προβλήματα.
1 Γνώσεις ⇛ Linux: Καλό ┃ Προγραμματισμός: Ναι PHP, MySQL ┃ Αγγλικά: Καλά
2 Ubuntu 22.04 Jammy Jellyfish 5.15.0-58-generic 64bit (el_GR.UTF-8, ubuntu:GNOME ubuntu)
3 Intel Core i3-6100 CPU @ 3.70GHz ‖ RAM 7836 MiB ‖ Gigabyte B150M-HD3 DDR3-CF - Gigabyte B150M-HD3 DDR3
4 Intel HD Graphics 530 [8086:1912] {i915}
5 enp1s0: Realtek RTL8111/8168/8411 PCI Express Gigabit Ethernet Controller [10ec:8168] (rev 15)
Οδηγοί Ubuntu Βίντεο Οδηγοί
Άβαταρ μέλους
the_eye
Διαχειριστής
Διαχειριστής
 
Δημοσιεύσεις: 11672
Εγγραφή: 16 Μαρ 2010, 17:19
Launchpad: ntoulasd
IRC: the_eye_
Εκτύπωση

Re: OCR ελληνικών (και όχι μόνο) χαρακτήρων στο linux

Δημοσίευσηαπό nsiklafidis » 24 Ιουν 2013, 17:29

Εγκατέστησα το OCRfeeder από το Κέντρο λογισμικού UBUNTU
από το τερματικό μου βγάζει αυτό το μήνυμα:
Error opening data file /usr/share/tesseract-ocr/tessdata/ell.traineddata
Please make sure the TESSDATA_PREFIX environment variable is set to the parent directory of your "tessdata" directory.
Failed loading language 'ell'
Tesseract couldn't load any languages!
Could not initialize tesseract.
Από την εφαρμογή μου βγαίνει κενό. Δεν γίνεται τίποτα. Αν μπορείτε θα ήθελα να μου δώσετε αναλυτικές οδηγίες για να τρέξω μέσα από τερματικό όλη την εγκατάσταση και θα ήθελα να προσθέσω και τα Ancient Greece (κάπου είδα ότι 5 April βγήκε ένα πρόσθετο)
Ευχαριστώ για όλα!
1 Γνώσεις Linux: Ικανοποιητικό ┃ Προγραμματισμού: Ικανοποιητικό ┃ Αγγλικών: Ικανοποιητικό
2 Ubuntu 13.04 raring 3.8.0-26-generic 32bit (el_GR.UTF-8, Unity ubuntu)
3 Intel Core i5-3230M CPU @ 2.60GHz ‖ RAM 3868 MiB ‖ Acer Aspire V3-571G
4 Intel 3rd Gen Core processor Graphics Controller [8086:0166] {i915} ⋮ nVidia GF117M [GeForce 710M] [10de:1140] {}
5 eth0: Broadcom NetLink BCM57785 Gigabit Ethernet PCIe [14e4:16b5] (rev 10) ⋮ wlan0: Atheros Inc. AR9462 Wireless Network Adapter [168c:0034] (rev 01)
nsiklafidis
babeTUX
babeTUX
 
Δημοσιεύσεις: 40
Εγγραφή: 15 Φεβ 2013, 18:24
Εκτύπωση

ΠροηγούμενηΕπόμενο

  • ΣΧΕΤΙΚΑ ΘΕΜΑΤΑ
    ΑΠΑΝΤΗΣΕΙΣ
    ΠΡΟΒΟΛΕΣ
    ΣΥΓΓΡΑΦΕΑΣ

Επιστροφή στο Οδηγοί - How to - Tutorials