PROJET AUTOBLOG


Shaarli - le hollandais volant

Site original : Shaarli - le hollandais volant

⇐ retour index

Note : PHP récupérer titre d’une page

jeudi 28 janvier 2016 à 18:09
On peut faire de plein de moyens différents, généralement on passe par des preg_grep(), mais on a aussi le problème de l’encodage qu’il faut gérer.

Voilà une solution que je teste pour le moment avec assez de succès :

$url = "http://example.com/";

$html_source = file_get_contents($url);
$dom_tree = new DOMDocument();
$dom_tree->loadHTML($html_source);
$titles = $dom_tree->getElementsByTagName('title');
$title = trim($titles->item(0)->nodeValue);

return $title;



Ça utilise bien-sûr les lib intégrées à PHP pour parser du HTML. Évidemment, ça retournera plein d’erreurs si le HTML n’est pas valide (99% des pages web), donc j’ajoute aussi ça :

libxml_use_internal_errors(true);
// dom parsing
libxml_clear_errors();


Ça va laisser les erreurs de code dans la lib de parsage. Libre à vous de les ignorer ou non, mais elles ne viendront plus s’afficher en HTML.
N’oubliez pas d’ajouter les gardes-fou habituels : URL ne répond pas, URL n’est pas du HTML, etc.

Autrement, voilà :
mon code de récupération d’une page Web en PHP (avec cURL)
le même code, mis à jour pour les pages qui sont Gzipé par défaut

cURL me permet de faire une requête qui envoie des headers complètes (avec UA et autres, pour passez un éventuel "UA-gate"), de suivre les redirections, d’accepter les cookies et d’autres.

Avec ça je fais à peu près le tour.

Sinon, pour faire 150 requêtes en parallèle, file_get_contents() ne vous servira pas. CURL permet de le faire : http://lehollandaisvolant.net/?d=2014/05/20/19/21/36-php-faire-plusieurs-requetes-http-simultanees-avec-curl

Pourquoi Next INpact arrête la publicité classique et passe au HTTPS pour tous - Next INpact

jeudi 28 janvier 2016 à 16:01
Bravo, Next INpact.
— (permalink)

Pourquoi Next INpact arrête la publicité classique et passe au HTTPS pour tous - Next INpact

jeudi 28 janvier 2016 à 16:01
Bravo, Next INpact.
— (permalink)

image - 526x526px

mercredi 27 janvier 2016 à 21:41
Je ne suis pas en guerre.
— (permalink)

image - 526x526px

mercredi 27 janvier 2016 à 21:41
Je ne suis pas en guerre.
— (permalink)

Neil deGrasse Tyson on robots taking jobs - Tech Insider

mercredi 27 janvier 2016 à 18:09
« we have to be lifelong learners »
— (permalink)

Neil deGrasse Tyson on robots taking jobs - Tech Insider

mercredi 27 janvier 2016 à 18:09
« we have to be lifelong learners »
— (permalink)

Quel VPN choisir et pourquoi ? - Tech - Numerama

mercredi 27 janvier 2016 à 17:07
Une petite liste comparative (chiffrée) de quelques VPN.

Une chose est à noter quand même, j’ai testé 4 services VPN pour le moment, et tous ont le même syndrome d’être super-rapides au début mais d’avoir du mal après quelques semaines ou mois : lags, déconnexions… finissent par apparaître. C’est peut-être moi aussi, mais ça l’a fait avec tous les services que j’ai essayé, plus ou moins fortement.

Un test qui se fait au ping 10 minutes après s’être inscrit sur le site ne peut pas être fiable à mes yeux car ne représente pas ce qu’on voit après 2 moins d’utilisation.
— (permalink)

Quel VPN choisir et pourquoi ? - Tech - Numerama

mercredi 27 janvier 2016 à 17:07
Une petite liste comparative (chiffrée) de quelques VPN.

Une chose est à noter quand même, j’ai testé 4 services VPN pour le moment, et tous ont le même syndrome d’être super-rapides au début mais d’avoir du mal après quelques semaines ou mois : lags, déconnexions… finissent par apparaître. C’est peut-être moi aussi, mais ça l’a fait avec tous les services que j’ai essayé, plus ou moins fortement.

Un test qui se fait au ping 10 minutes après s’être inscrit sur le site ne peut pas être fiable à mes yeux car ne représente pas ce qu’on voit après 2 moins d’utilisation.
— (permalink)

Pokémon's Super Bowl Commercial Has Come Early and It's so Good - Cheezburger

mercredi 27 janvier 2016 à 16:45
*_*
— (permalink)

Pokémon's Super Bowl Commercial Has Come Early and It's so Good - Cheezburger

mercredi 27 janvier 2016 à 16:45
*_*
— (permalink)

Les jeux video, films et romans policiers incitent à la violence, par Nadia Khouri-Dagher

mercredi 27 janvier 2016 à 16:07
Mouais.

En attendant, le jeu vidéo incite à tuer des personnages dans le jeu lui-même. Qu’il y a des malades qui confondent le jeu vidéo et le reste, c’est un autre problème.

Non perso je m’inquiéterai plutôt de ce genre de bouquins là qui incitent à sacrifier les enfants, torturer les femmes ou crucifier des gens (pas des personnages, des gens) parce qu’ils sont différents. V'voyez ?

Je ne dis pas que tout vient de là, mais c’est quand même étrange que ces livres qui appellent ouvertement à la haine, au meurtre, au viol, soient autorisés, y compris aux enfants, là où certains jeux vidéos pourtant pas si violent que ça ont une limite d’âge.
— (permalink)

Les jeux video, films et romans policiers incitent à la violence, par Nadia Khouri-Dagher

mercredi 27 janvier 2016 à 16:07
Mouais.

En attendant, le jeu vidéo incite à tuer des personnages dans le jeu lui-même. Qu’il y a des malades qui confondent le jeu vidéo et le reste, c’est un autre problème.

Non perso je m’inquiéterai plutôt de ce genre de bouquins là qui incitent à sacrifier les enfants, torturer les femmes ou crucifier des gens (pas des personnages, des gens) parce qu’ils sont différents. V'voyez ?

Je ne dis pas que tout vient de là, mais c’est quand même étrange que ces livres qui appellent ouvertement à la haine, au meurtre, au viol, soient autorisés, y compris aux enfants, là où certains jeux vidéos pourtant pas si violent que ça ont une limite d’âge.
— (permalink)

cc @bescherelle #17190 - DTC - Où ? Dans Ton Chat (BashFR)

mardi 26 janvier 2016 à 22:44
Pas un pour rattraper les autres. C'est quand même assez épique.

L'analphabetterave est un fléau très problémationnel, comme dirait Pérusse.
— (permalink)

cc @bescherelle #17190 - DTC - Où ? Dans Ton Chat (BashFR)

mardi 26 janvier 2016 à 22:44
Pas un pour rattraper les autres. C'est quand même assez épique.

L'analphabetterave est un fléau très problémationnel, comme dirait Pérusse.
— (permalink)

Note : fin de l’univers

mardi 26 janvier 2016 à 18:07
Si les religions ont pour habitude de nous dire que la fin du monde se passera dans le chaos d’un brasier infernal, la science nous répond que l’Univers tout entier finira dans une infinie froideur où plus rien ne se passera… Jamais.

Note : fin de l’univers

mardi 26 janvier 2016 à 18:07
Si les religions ont pour habitude de nous dire que la fin du monde se passera dans le chaos d’un brasier infernal, la science nous répond que l’Univers tout entier finira dans une infinie froideur où plus rien ne se passera… Jamais.

Rocles | Assigné à résidence après avoir ramené un portefeuille perdu

mardi 26 janvier 2016 à 12:16
Il a pas compris comment vivre en France en 2016.

Il faut être un con, un égoïste, voter hollande et être Charlie. Sinon tu dégages :/
— (permalink)

Rocles | Assigné à résidence après avoir ramené un portefeuille perdu

mardi 26 janvier 2016 à 12:16
Il a pas compris comment vivre en France en 2016.

Il faut être un con, un égoïste, voter hollande et être Charlie. Sinon tu dégages :/
— (permalink)

Comment #12 : Bug #918019 : Bugs : firefox package : Ubuntu - Liens d'un Parigot-Manchot

lundi 25 janvier 2016 à 21:48
Ah c’est donc ça…

Firefox veut toujours ouvrir tous les fichiers téléchargés avec Gedit (ou Pluma sous Mint). C’est assez chiant, quand il s’agit d’un Zip ou autre. Du coup on est obligé d’enregistrer le fichier (sur la bureau par exemple) et de double-cliquer dessus une fois que c’est fini.

(ÉDIT : murphystiquement, là je veux tester, je n’ai aucun problème…)
— (permalink)