OCR ελληνικών (και όχι μόνο) χαρακτήρων στο linux

...το μέρος για να ξεκινήσετε!

Συντονιστής: adem1

Κανόνες Δ. Συζήτησης
Παρακαλώ να επιλέξετε, με προσοχή, την άδεια που θέλετε να έχουν οι οδηγοί που συγγράφετε.
Πληροφορίες για τις άδειες μπορείτε να βρείτε εδώ.
Άμα επιθυμείτε κάποια άλλη άδεια επικοινωνήστε με κάποιο Διαχειριστή είτε Συντονιστή.

Σημαντικό είναι να χρησιμοποιήσετε την υπηρεσία http://imagebin.ubuntu-gr.org για τις εικόνες.

Re: OCR ελληνικών (και όχι μόνο) χαρακτήρων στο linux

Δημοσίευσηαπό kzlazy » 31 Ιαν 2011, 08:33

Μπράβο. Απίθανος.
Δεν το δοκίμασα ακόμα, αλλά δεν αργώ καθόλου...
Now there sits a man with an open mind. You can feel the draft from here...
Groucho (τι θα πει ποιός Groucho) ?

Επίπεδο Γνώσεων: Linux: Μέτριο / Προγραμματισμός: Όχι / Αγγλικά: Καλά
Arch 64b με KDE
Acer Aspire 5680 laptop / Intel core 2 duo / 2 x 2048 Mb / nVidia GeForce Go 7600 / 1280x800
Άβαταρ μέλους
kzlazy
seniorTUX
seniorTUX
 
Δημοσιεύσεις: 626
Εγγραφή: 09 Ιούλ 2008, 15:02
Εκτύπωση

Re: OCR ελληνικών (και όχι μόνο) χαρακτήρων στο linux

Δημοσίευσηαπό ecatodarcus » 31 Ιαν 2011, 13:41

λειτουργεί άψογα! αν βάλεις ενα εγγραφό με καλή ανάλυση, δλδ αυτή που αναφέρει ο the_eye τότε έχεις τέλεια αποτελέσματα!!
και πάλι σε ευχαριστώ the_eye!
Γνώσεις ⇛ Linux: Μέτριο ┃ Προγραμματισμός: Λίγο (fortran, html,css) ┃ Αγγλικά: Αρκετά καλά (Advance) ┃ Γερμανικά: Λίγα (B1)
1)Ubuntu 11.10 i386
Προδιαγραφές: Laptop Acer Aspire 5742Z-4629 ⇛ Intel Pentium P6100@2.00Ghz│RAM 2.7 DDR3 SDRAM - 1066 MHz │Intel HD Graphics Dynamic Video Memory Technology 5.0
Άβαταρ μέλους
ecatodarcus
punkTUX
punkTUX
 
Δημοσιεύσεις: 198
Εγγραφή: 06 Μάιος 2009, 14:48
Εκτύπωση

Re: OCR ελληνικών (και όχι μόνο) χαρακτήρων στο linux

Δημοσίευσηαπό kriti » 31 Ιαν 2011, 14:19

Κολησε κατι κατα την εγκατασταση ?
http://pastebin.ubuntu-gr.org/m9ea238
manjaro - hp pavilion -geforce 7400 -1,73 dualcore
Άβαταρ μέλους
kriti
daemonTUX
daemonTUX
 
Δημοσιεύσεις: 938
Εγγραφή: 01 Ιουν 2008, 22:21
Τοποθεσία: ΗΡΑΚΛΕΙΟ
IRC: kriti
Εκτύπωση

Re: OCR ελληνικών (και όχι μόνο) χαρακτήρων στο linux

Δημοσίευσηαπό evolgen » 31 Ιαν 2011, 14:27

Μπράβο παιδιά! Πολύ καλή δουλειά και πολύ καλά αποτελέσματα! :clap:
Το να μειώνεις ένα έργο ελεύθερου λογισμικού, επειδή θεωρείς το δικό σου καλύτερο,
είναι απαράδεκτη συμπεριφορά και δε συμβαδίζει με τις αρχές του ελεύθερου λογισμικού.

Γνώσεις Linux: Μέτριο++ ┃ Προγραμματισμός: Perl, R, Python, SQL, C, Common Lisp, BashΑγγλικά: Άριστα

1. Ubuntu 14.04 trusty
2. Intel Core i7-3520M CPU @ 2.90GHz ‖ RAM 7892 MiB
3. Intel 3rd Gen Core processor Graphics Controller [8086:0166] {i915}
4. eth0: Broadcom NetXtreme BCM57765 Gigabit Ethernet PCIe [14e4:16b4] (rev 10) ⋮ eth1: Broadcom BCM4331 802.11a/b/g/n [14e4:4331] (rev 02)
Άβαταρ μέλους
evolgen
daemonTUX
daemonTUX
 
Δημοσιεύσεις: 1031
Εγγραφή: 28 Ιούλ 2010, 14:22
Τοποθεσία: UK
IRC: bioevolgenec
Εκτύπωση

Re: OCR ελληνικών (και όχι μόνο) χαρακτήρων στο linux

Δημοσίευσηαπό the_eye » 31 Ιαν 2011, 15:41

kriti έγραψε:Κολησε κατι κατα την εγκατασταση ?
http://pastebin.ubuntu-gr.org/m9ea238


Μη το κάνεις compile σε φάκελο στην "Επιφάνεια εργασίας" πολλές φορές τα ελληνικά στην διαδρομή των αρχείων και το κενό βγάζουν λάθη.
Όσο λιγότερο κλειστό λογισμικό έχεις, τόσα λιγότερα προβλήματα.
1 Γνώσεις ⇛ Linux: Καλό ┃ Προγραμματισμός: Ναι PHP, MySQL ┃ Αγγλικά: Καλά
2 Ubuntu 18.04 bionic 4.15.0-42-generic 64bit (el_GR.UTF-8, GNOME-Flashback:Unity gnome-flashback-compiz)
3 Intel Core i3-6100 CPU @ 3.70GHz ‖ RAM 3832 MiB ‖ Gigabyte B150M-HD3 DDR3-CF
4 Intel Sky Lake Integrated Graphics [8086:1912] {i915_bpo}
5 enp1s0: Realtek RTL8111/8168/8411 PCI Express Gigabit Ethernet Controller [10ec:8168] (rev 15)
Οδηγοί Ubuntu Βίντεο Οδηγοί
Άβαταρ μέλους
the_eye
Διαχειριστής
Διαχειριστής
 
Δημοσιεύσεις: 11451
Εγγραφή: 16 Μαρ 2010, 17:19
Launchpad: ntoulasd
IRC: the_eye_
Εκτύπωση

Re: OCR ελληνικών (και όχι μόνο) χαρακτήρων στο linux

Δημοσίευσηαπό c7p » 31 Ιαν 2011, 16:27

Μπράβο ρε the_eye ! όσο και αν είχα ψάξει για ελληνικό OCR στο linux δεν είχα βρεί τίποτα ... :thumbup:
Άβαταρ μέλους
c7p
powerTUX
powerTUX
 
Δημοσιεύσεις: 1849
Εγγραφή: 30 Μάιος 2009, 16:09
Τοποθεσία: Κατερίνη
Εκτύπωση

Re: OCR ελληνικών (και όχι μόνο) χαρακτήρων στο linux

Δημοσίευσηαπό kriti » 31 Ιαν 2011, 18:14

Λειτουργησε σωστα μονο οταν αλλαξα στο OCRFeeder Tools -> OCR Engines/tesseract το tif σε jpg
κουφο? κανει λιγα λαθη
manjaro - hp pavilion -geforce 7400 -1,73 dualcore
Άβαταρ μέλους
kriti
daemonTUX
daemonTUX
 
Δημοσιεύσεις: 938
Εγγραφή: 01 Ιουν 2008, 22:21
Τοποθεσία: ΗΡΑΚΛΕΙΟ
IRC: kriti
Εκτύπωση

Re: OCR ελληνικών (και όχι μόνο) χαρακτήρων στο linux

Δημοσίευσηαπό Th P » 31 Ιαν 2011, 19:27

@the_eye

Μπράβο!!!

το εγκατέστησα στο laptop με τήν 3η μέθοδο καί όλα καλά.

Ευχαριστώ καί εγώ

Φιλικά
Θανάσης Π.
Σταθερή είναι η διανομή που προσπαθείς ανεπιτυχώς να κρασσάρεις
Linux: Low┃Προγραμματισμός: No┃Αγγλικά: Good
Είμαι αναλφάβητος, ανιστόρητος και άξιος της μοίρας μου
Άβαταρ μέλους
Th P
powerTUX
powerTUX
 
Δημοσιεύσεις: 1888
Εγγραφή: 02 Μάιος 2009, 10:46
Τοποθεσία: Θεσσαλονίκη
IRC: ThP1
Εκτύπωση

Re: OCR ελληνικών (και όχι μόνο) χαρακτήρων στο linux

Δημοσίευσηαπό simosx » 04 Φεβ 2011, 03:52

the_eye έγραψε:
kriti έγραψε:Κολησε κατι κατα την εγκατασταση ?
http://pastebin.ubuntu-gr.org/m9ea238


Μη το κάνεις compile σε φάκελο στην "Επιφάνεια εργασίας" πολλές φορές τα ελληνικά στην διαδρομή των αρχείων και το κενό βγάζουν λάθη.


Είναι πράγματι το πρόβλημα με
Κώδικας: Επιλογή όλων
#
/bin/sed: can't read εργασίας/tesseract-3.00/wordrec/libtesseract_wordrec.la: No such file or directory
#
libtool: link: `εργασίας/tesseract-3.00/wordrec/libtesseract_wordrec.la' is not a valid libtool archive


Το πρόβλημα δεν είναι τα ελληνικά αλλά το διάστημα στο όνομα του Επιφάνεια εργασίας. Είναι σφάλμα του tesseract που δεν καταλαβαίνει το διάστημα.

Θα ήταν καλό να αλλάζαμε το «Επιφάνεια εργασίας» σε απλά «Επιφάνεια»;
προσωπικό ιστολόγιο ϗ πλανήτης Ubuntu-gr
Συμβάλετε και εσείς στο ελληνικό βιβλίο Ubuntu!
1 Γνώσεις Linux: Πολύ καλό ┃ Προγραμματισμού: Πολύ καλό ┃ Αγγλικών: Πολύ καλό
2 Ubuntu 13.10 saucy 3.11.0-031100rc1-generic 64bit (el_GR.UTF-8, Unity ubuntu)
3 AMD E-450 APU with Radeon HD Graphics ‖ RAM 3555 MiB ‖ Sony Corporation VAIO
4 AMD nee ATI Wrestler [Radeon HD 6320] [1002:9806] {fglrx_pci}
5 eth0: Atheros Inc. AR8151 v2.0 Gigabit Ethernet [1969:1083] (rev c0) ⋮ wlan0: Atheros Inc. AR9285 [168c:002b] (rev 01)
Φτιάξτε και εσείς τη δική σας υπογραφή (παραπάνω κείμενο) αυτόματα με κλικ εδώ!
simosx
Επίτιμο μέλος
Επίτιμο μέλος
 
Δημοσιεύσεις: 10334
Εγγραφή: 11 Μάιος 2008, 18:52
Launchpad: simosx
IRC: simosx
Εκτύπωση

Re: OCR ελληνικών (και όχι μόνο) χαρακτήρων στο linux

Δημοσίευσηαπό simosx » 04 Φεβ 2011, 03:53

Κάτι που χρειαζόμαστε είναι οδηγίες για να εκπαιδεύσουμε οι ίδιοι το tesseract στα ελληνικά. Δεν έχουμε ιδέα ποιος έκανε την αρχική εκπαίδευση, και είναι πιθανό να είναι «κακή» εκπαίδευση, μόνο και μόνο για να υπάρχουν και τα ελληνικά.
προσωπικό ιστολόγιο ϗ πλανήτης Ubuntu-gr
Συμβάλετε και εσείς στο ελληνικό βιβλίο Ubuntu!
1 Γνώσεις Linux: Πολύ καλό ┃ Προγραμματισμού: Πολύ καλό ┃ Αγγλικών: Πολύ καλό
2 Ubuntu 13.10 saucy 3.11.0-031100rc1-generic 64bit (el_GR.UTF-8, Unity ubuntu)
3 AMD E-450 APU with Radeon HD Graphics ‖ RAM 3555 MiB ‖ Sony Corporation VAIO
4 AMD nee ATI Wrestler [Radeon HD 6320] [1002:9806] {fglrx_pci}
5 eth0: Atheros Inc. AR8151 v2.0 Gigabit Ethernet [1969:1083] (rev c0) ⋮ wlan0: Atheros Inc. AR9285 [168c:002b] (rev 01)
Φτιάξτε και εσείς τη δική σας υπογραφή (παραπάνω κείμενο) αυτόματα με κλικ εδώ!
simosx
Επίτιμο μέλος
Επίτιμο μέλος
 
Δημοσιεύσεις: 10334
Εγγραφή: 11 Μάιος 2008, 18:52
Launchpad: simosx
IRC: simosx
Εκτύπωση

ΠροηγούμενηΕπόμενο

  • ΣΧΕΤΙΚΑ ΘΕΜΑΤΑ
    ΑΠΑΝΤΗΣΕΙΣ
    ΠΡΟΒΟΛΕΣ
    ΣΥΓΓΡΑΦΕΑΣ

Επιστροφή στο Οδηγοί - How to - Tutorials