link crawler

...browsers, email, downloads, torrents, κλπ (όχι προβλήματα καρτών εδώ)

Συντονιστής: the_eye

link crawler

Δημοσίευσηαπό Alexandros » 22 Δεκ 2008, 11:55

Ξέρετε κανέναν link crawler για το ubuntu;

Π.χ. έχουμε ένα forum για ρεμπέτικα το οποίο δημοσιεύει διάφορα τραγούδια με link στο rapidshare.

Επειδή εγώ τα θέλω όλα, αντί να κάνω copy-paste κάθε link ξεχωριστά, να δώσω εντολή στην εφαρμογή να αντιγράψει όλα τα rapishare links που υπάρχουν στο συγκεκριμένο forum/domain. Οπότε μετά τα περνάω σε έναν download manager και καθάρισα!

Έχετε καμιά ιδέα;
ACER ASPIRE 5920G-934G32Bn, Intel Core 2 Duo T9300 (2.5 GHz FSB, 6MB L2 Cache, 800 MHz FSB), 4GB (2x2 GB) DDR2, Nvidia, GEFORCE 9500M-GS 512MB, 15.4 WXGA CB,802.11N - https://www.viralnews.gr/index.php/ygeia-kathimerinotita/item/392-seminario-facebook
Alexandros
daemonTUX
daemonTUX
 
Δημοσιεύσεις: 981
Εγγραφή: 08 Ιούλ 2008, 14:07
Εκτύπωση

Re: link crawler

Δημοσίευσηαπό chazisop » 22 Δεκ 2008, 21:15

Εγώ θα πρότεινα τη λύση ενός script.

Θα καλείται με όρισμα ένα αρχείο π.χ. html και θα σκανάρει το περιεχόμενο του για url , με τη χρήση της grep ... πχ αν βρίσκει μια λέξη που περιέχει μέσα "http" ή "www" ...

Αν βρεί κάτι , είτε θα μπορεί κατευθείαν μέσω pipe να στέλνει τα url? (το ? είναι εσκεμμένο) στον download manager , και να αφήνεις τον manager να σου πετάει μήνυμα αν τυχόν δεν είναι link ... Αυτό βολεύει για μεγάλο αριθμό links σε 1 αρχείο , και αν το φίλτρο (πες με κανονική έκφραση) που 8α χρησιμοποιείς για να βρεις τα url είναι καλό , δε θα έχεις πρόβλημα.

Αν πρόκειται για λίγα links , μια πιο ασφαλής λύση είναι να τα αποθηκεύει σε ένα αρχείο κειμένου και από εκεί αφού το ανοίξει με gedit για επεξεργασία ώστε ο χρήστης χειροκίνητα να αφαιρέσει ότι δε θέλει , να τα στέλνει στον download manager...
Επίπεδο Γνώσεων: Linux: Μέτριο / Προγραμματισμός: Ναι / Αγγλικά:Καλά
Ubuntu 8.10 Intrepid Ibex
Intel Core2 6400 @ 2.13GHz , 3GB RAM , Nvidia 7600 GT , 2 x 120GB Western Digital hdd , 1x1TB Seagate hdd
chazisop
punkTUX
punkTUX
 
Δημοσιεύσεις: 160
Εγγραφή: 20 Νοέμ 2008, 04:19
Εκτύπωση

Re: link crawler

Δημοσίευσηαπό Alexandros » 22 Δεκ 2008, 21:26

Ευχαριστώ αλλά δεν έχω την παραμικρή ιδέα απο scripts!
ACER ASPIRE 5920G-934G32Bn, Intel Core 2 Duo T9300 (2.5 GHz FSB, 6MB L2 Cache, 800 MHz FSB), 4GB (2x2 GB) DDR2, Nvidia, GEFORCE 9500M-GS 512MB, 15.4 WXGA CB,802.11N - https://www.viralnews.gr/index.php/ygeia-kathimerinotita/item/392-seminario-facebook
Alexandros
daemonTUX
daemonTUX
 
Δημοσιεύσεις: 981
Εγγραφή: 08 Ιούλ 2008, 14:07
Εκτύπωση

Re: link crawler

Δημοσίευσηαπό ftso » 23 Δεκ 2008, 01:00

Ρίξε πάντως και καμιά ματιά στο http://sourceforge.net/
όλο και κάτι θα υπάρχει ;)
Άβαταρ μέλους
ftso
Επίτιμο μέλος
Επίτιμο μέλος
 
Δημοσιεύσεις: 6409
Εγγραφή: 12 Μάιος 2008, 13:40
Τοποθεσία: Αθήνα
IRC: ftso
Εκτύπωση

Re: link crawler

Δημοσίευσηαπό chazisop » 05 Ιαν 2009, 02:50

Στα αποθετήρια (όλες οι εφαρμογές , δεν είναι εφαρμογή που υποστηρίζεται από την Canonical) βρήκα ένα πρόγραμμα που λέγεται gURLchecker.

Ίσως είναι αυτό που ζητάς , απ' ότι είδα έχει αρκετές προηγμένες ικανότητες. Εδώ και το site τους. http://gurlchecker.labs.libre-entreprise.org/
Επίπεδο Γνώσεων: Linux: Μέτριο / Προγραμματισμός: Ναι / Αγγλικά:Καλά
Ubuntu 8.10 Intrepid Ibex
Intel Core2 6400 @ 2.13GHz , 3GB RAM , Nvidia 7600 GT , 2 x 120GB Western Digital hdd , 1x1TB Seagate hdd
chazisop
punkTUX
punkTUX
 
Δημοσιεύσεις: 160
Εγγραφή: 20 Νοέμ 2008, 04:19
Εκτύπωση


Επιστροφή στο Εφαρμογές για Internet