Je me lance dans un projet pour lequel je n'ai clairement pas le niveau. Je m'y lance car il me permettra de grandir, et je pense que c'est long, mais pas forcément compliqué. Autant je pense connaitre les principales instructions (je les ai utilisées dans d'autres codes) que je devrais utiliser pour générer mon script, autant j'ai un gros problème d'organisation, de méthodologie et de chronologies des actions à mener.
Je souhaite télécharger les pdf d'un site web. Ce sont des vues éclatées ou notices de produits électroménager, libres de droits. Ce script m'évite de solliciter chaque fournisseur, de renommer les fichiers qu'il me communique etc.
Pour chiffrer un peu l'ampleur du nombre de fichiers à télécharger, on a 713 marques comportant de 0 à 3000 fichiers.
L'objectif est de télécharger, renommer et classer sur mon bureau.
Puis-je communiquer l'url sur ce post de façon à ce que ça serve à chacun? l'ennui, c'est que je fais ça à titre professionnel, et j'ai peur que si le site web se rend compte qu'on lui a pompé ses infos, il le prenne mal... J'avais pensé l'envoyer en MP peut être?
J'ai commencé à ordonner un peu les dossiers sur mon bureau et comprendre les pièges que présente l'automatisation (les cas particuliers etc), et une image parle mieux qu'un long discours. Etes vous motivé par le projet? Pensez vous ma méthodologie cohérente? Vaut il mieux travailler sur le code source? Sur la page web directement en ouvrant chaque page produit? Dois je plutôt télécharger le code source en txt ou travailler directement en mémoire vive dans le clipboard?
Je précise que quand je lancerai le script au final, j'ai la possibilité de lui dédier un poste donc si ça prend plusieurs jours, c'est pas grave, je veux juste que ce soit fiable.
Voici également un bout de code "modifié" afin que vous voyiez la structure du code source. Les expressions régulières ou le "_StringBetween" seront d'une grande aide.
Code : Tout sélectionner
<tr class="tr-hover"><td><a style="display: block; line-height: 1.6em" href="marque-[$MARQUE]-reference-[$REF1]+[$REF2]+[$REF3].htm">[$MARQUE] [$REF1] [$REF2] [$REF3]</a></td><td><span class="tr-hover-categorie">Four</span></td><td class="phone-hidden"><img src="img/vueeclatee.png" height="15" /> <a href="http://pdf.[siteweb].fr/[$MARQUE] [$REF1] [$REF2] [$REF3].pdf">Vue éclatée</a></td><td class="phone-hidden"></td></tr><tr class="tr-hover"><td><a style="display: block; line-height: 1.6em" href="marque-[$MARQUE]-reference-00151555HDDW00S+857941501001+[$REF3].htm">[$MARQUE] 00151555HDDW00S 857941501001 [$REF3]</a></td><td><span class="tr-hover-categorie">Hotte</span></td><td class="phone-hidden"><img src="img/vueeclatee.png" height="15" /> <a href="http://pdf.[siteweb].fr/[$REF3] 00151555HDDW00S 857941501001.pdf">Vue éclatée</a></td><td class="phone-hidden"></td></tr>
Voilà, j'ai la page blanche, si vous avez un conseil de structure, de squelette et de fonctions à utiliser pour que je ne m'éparpille pas, je suis preneur.