PROJET AUTOBLOG


Shaarli - le hollandais volant

Site original : Shaarli - le hollandais volant

⇐ retour index

Note : UA lors d’un WGET #shaarli #blogotext

mardi 3 septembre 2013 à 16:03
Certains liens ne donnent pas de titre dans Blogotext (ni dans Shaarli).
Le truc vient de l’absence d’user-agent.

Exemple avec cette page : http://www.ldlc.com/fiche/PB00151866.html
Et voyez la différence entre les deux pages récupérées via wget :
wget http://www.ldlc.com/fiche/PB00151866.html
wget --user-agent='firefox' http://www.ldlc.com/fiche/PB00151866.html

Le premier ne marche pas (page vide avec marqué "votre ip est bannie") et la seconde fonctionne.
J’ai donc ajouté un UA dans le stream_context PHP lors de la récupération de la page.

J’ai corrigé dans Blogotext (release à venir) ainsi que dans Shaarli (voir github).

Aussi : actuellement, quand je partage un lien Youtube, ça ne marche pas. Le titre n’est pas non plus affiché. Ceci ne se produit sur mon site (pas en local). Le problème ne vient pas de Blogotext : étant donnée que je partage pas mal de liens, Youtube a décidé que l’IP de mon serveur était du spam et me demande de remplir un captcha.

Le lien récupéré par Blogotext pointe donc sur une page avec un redirection 301 sur la page du captcha, qui n’a pas de titre
C’est sûrement ce que rencontre aussi Tontof avec son bookmarklet… Je ne peux pas résoudre le captcha en PHP : je suis bloqué. Tant pis.