Δημοσιεύτηκε: 07 Ιούλ 2011, 00:15
από pmav99
Το πρώτο parsing μπορεί να γίνει ως εξής:

1. Προσθέτουμε αυτό στο module
Κώδικας: Επιλογή όλων

from HTMLParser import HTMLParser

class Spider(HTMLParser):
def __init__(self, url):
HTMLParser.__init__(self)

self.src = ""

req = urllib.urlopen(url)
self.feed(req.read())

def handle_starttag(self, tag, attrs):
if tag == "iframe":
for attr in attrs:
if attr[0] == "src" and attr[1].startswith("playerX"):
self.src = attr[1]


2. Και μετά προσθέτουμε αυτή τη μέθοδο στην PlaylistGenerator
Κώδικας: Επιλογή όλων

def get_urls(self):
url_main = u"http://www.e-radio.gr/player/player.el.asp?sid="
for station in self.stations:
url_station = url_main + station["id"]
spider = Spider(url_station)
src = spider.src
print(src)