Le module HTML::LinkExtor permet d'extraire les liens données dans une page web.
C'est une façon rapide et facile d'obtenir la liste des adresses d'une page, ou de savoir le chemin des images qui y sont référées. On peut alors facilement télécharger ces documents pour utilisation future à votre discrétion...
Le module suppose que vous lui donnez accès à un document HTML : pour extraire les adresses à partir d'un URL, il suffit de le coupler avec LWP. La documentation de HTML::LinkExtor donne un exemple de ce genre d'utilisation.
Posted by at février 24, 2004 01:27 PM