Page 1 sur 1

[R] Extraire les liens d'une page intranet

Posté : lun. 08 sept. 2014 14:15
par KDekk
Bonjour à tous,

Voici mon problême : Je souhaite ouvrir un fichier d'un dossier d'un site intranet.
Je voulais m'épargner de m'aventurer dans les relations avec le serveur, je m'explique :

=> Je récupère la source de la page intranet correspondant à mon dossier qui contient mon fichier voulu.
(http://www.XXX.com/dossier/)
J'essaye de faire un _stringExplode sur la source renvoyée afin d'en récupérer que les liens présents (donc correspondant aux fichiers existants dans le dossier). A noter que les fichier auront toujours une synthaxe identique (commandeXX..CommandeX+1, commandeX+2 ...)

Quelle serait la façon le plus simple pour obtenir une chaine de caractère qui recenserait ces liens ?

Merci par avance,
Kévin

Re: [..] Extraire les liens d'une page intranet

Posté : lun. 08 sept. 2014 14:26
par jguinch
Un moyen (peut être pas le plus simple) est d'utiliser les expressions régulières.
Ca peut être un truc dans ce genre :
► Afficher le texte

Re: [..] Extraire les liens d'une page intranet

Posté : lun. 08 sept. 2014 14:57
par mikell
Si les liens ont une syntaxe particulière on peut même la cibler

Code : Tout sélectionner

$aLinks = StringRegExp($sContent, '(?i)href="([^"]+commande([^"]+)', 3)
en admettant bien sûr que les liens cités soient de la forme href="....Commande..."

Re: [R] Extraire les liens d'une page intranet

Posté : lun. 08 sept. 2014 15:08
par KDekk
C'est EXACTEMENT ce qu'il me fallait, un grand merci !!!!