Δεν είδα να δίνουν οι εταιρίες τα δεδομενα με XML (π.χ. RSS), οπότε θα χρειαστεί με το χέρι να κάνεις κάτι που ονομάζεται web scraping («ξύσιμο» του Web για να εξάγεις με το χέρι τις πληροφορίες). Εδώ συνίσταται η χρήση Python ως πολύ εύκολη γλώσσα, και το
http://scrapy.org/ για το ξύσιμο.
Στο φόρουμ έχουμε οδηγό για Python οπότε μπορείς να ξεκινήσεις να μαθαίνεις.
Πάλι μέσω της Python μπορείς να επιλέξεις να αποθηκεύει τις πληροφορίες σε μια βάση, όπως sqlite3 (πολύ εύκολο) ή MySQL/Postgress/MariaDB.
Η δυσκολία στο έργο είναι στην ερμηνεία των αποτελεσμάτων. Το πρόβλημα που προσπαθείς να αντιμετωπίσεις είναι «χαοτικό» (είναι επιστημονική ονομασία), που σημαίνει ότι οι παράγοντες που πρέπει να λάβεις υπόψιν για να μαντέψεις το αποτέλεσμα είναι τόσο πολλοί (και εδώ δεν τους έχεις όλους) που για σένα είναι σχεδόν τυχαίο παιχνίδι. Ωστόσο για άλλους που έχουν προσωπική επαφή με τις ομάδες να μην είναι τόσο τυχαίο.
Το τυπικό πρόβλημα σε τέτοια παιχνίδια είναι ότι έχει νόημα να «παίζεις» μια μόνο φορά, την τελευταία ακριβώς στιγμή όπου μπορείς να έχεις μερικές παραπάνω πληροφορίες.
Παρόμοιο χαοτικό πρόβλημα είναι η πρόγνωση του καιρού. Με τον καιρό μπορείς να λάβεις δεδομένα όπως ατμοσφαιρική πίεση, νέφη, άνεμος κτλ από όλο τον κόσμο, και να παράγεις λεπτομερή πρόγνωση για κάθε σημείο στην Ελλάδα. Η δυσκολία είναι να μαντέψεις τον καιρό μετά από 5 ή περισσότερες ημέρες. Για τέτοια πρόγνωση πρέπει να λάβεις υπόψιν ανέμους και ατμοσφαιρική πίεση σε μεγάλη ακτίνα από την Ελλάδα, π.χ. Ατλαντικό Ωκεανό και Σιβηρία.