PROJET AUTOBLOG


Planet-Libre

source: Planet-Libre

⇐ retour index

Cyrille BORNE : Yacy, le logiciel libre et moteur de recherche « communautaire »

jeudi 15 janvier 2015 à 08:00

Le but de ce billet est de faire connaître à ceux qui ne l'auraient pas encore rencontré l'existence du programme YaCy, un moteur de recherche sous forme de logiciel libre pouvant être installé sur ses propres machines afin de réaliser des recherches sur le web qui seront indexées en commun pour réaliser une sorte de peer to peer des données trouvées.

Mais pour une présentation plus complète je retranscrits ici une brève citation de la description faite par les développeurs du projet afin de donner envie d'en savoir bien plus à son sujet :

« YaCy est un moteur de recherche que chacun peut installer pour indexer le web (pages publiques accessibles par internet), pour indexer un intranet ou pour parcourir d'autres données avec une fonction moteur de recherche. YaCy peut être utilisé de façon autonome, mais sa principale force est de pouvoir fonctionner en réseau peer-to-peer, ce qui fait que sa puissance s'accroit avec le nombre d'utilisateurs, qu'il est entièrement acentré (tous les "peers" sont égaux et il n'y a pas un organisme administratif central) et qu'il n'est pas censurable et ne stocke pas le comportement des utilisateurs.
. . .
Imaginez qu'il soit possible de reproduire sur plusieurs sites le fonctionnement d'un moteur de recherche professionnel en exploitant à distance la puissance inutilisée d'ordinateurs privés. C'est ce que nous essayons de créer avec le moteur de recherche YaCy en construisant un réseau avec les supporters et les utilisateurs. Le résultat de la recherche décentralisée a permis aujourd'hui d'indexer environ 1,4 milliards de documents. Ce réseau comprend plus de 600 peer-opérateurs par mois et fournit environ 130 000 résultats par jour.
. . .
 YaCy peut également être utilisé de manière autonome sans échanger avec d'autres pairs. Une telle utilisation de YaCy permet de:

    Rechercher des informations sur les sites d'un projet - une combinaison de wikis, forums et sites web
    Regrouper des sites Web autour d'un thème dans un moteur de recherche
    Préserver les informations confidentielles des entreprises qui ne souhaitent pas que leurs employés effectuent des recherches sensibles sur des portails de recherche centralisés
    Améliorer la pertinence des résultats en affinant la structure de l'index de recherche
    Préserver l'anonymat lors de la recherche »

Installation sur Debian et dérivées :
1/ On ajoute les dépendances :
aptitude install openjdk-7-jre-headless

2/ on récupère le tar sur le cite du projet, actuellement pour la version 1.8
http://www.yacy.net/release/yacy_v1.80_20140916_9000.tar.gz

puis on décompresse le fichier tar.gz

3/ On lance le moteur :
./startYACY.sh

qui affichera le message :
****************** YaCy Web Crawler/Indexer & Search Engine *******************
**** (C) by Michael Peter Christen, usage granted under the GPL Version 2  ****
****   USE AT YOUR OWN RISK! Project home and releases: http://yacy.net/   ****
**  LOG of       YaCy: DATA/LOG/yacy00.log (and yacy.log)                **
**  STOP         YaCy: execute stopYACY.sh and wait some seconds             **
**  GET HELP for YaCy: see http://wiki.yacy.net and http://forum.yacy.de     **
*******************************************************************************
 >> YaCy started as daemon process. Administration at http://localhost:8090 <<

Il suffira donc d'aller sur http://localhost:8090 pour utiliser et configurer le moteur.

Il sera possible aussi de l'utiliser en interne, d'automatiser son lancement et de le configurer selon ses besoins. Il faudra voir aussi au besoin les éventuels problèmes de sécurité s'il y a lieu.

Si vous voulez rendre votre noeud accessible de l'extérieur afin de participer pleinement au réseau YaCy il faudra configurer le pare-feu et/ou le routeur pour ouvrir le port 8090.

Yacy est distribuer sous licence libre GNU GPL : « All parts of the software known as YaCy are covered under the
terms of the GNU Lesser General Public License (files in source/net/yacy/cora) or
the GNU General Public License (all other files)  as published by the
Free Software Foundation; either version 2 of the License, or  (at your option)
any later version unless stated otherwise. »


Quelques copies d'écran

yacy2

 

yacy3

 

Gravatar de Cyrille BORNE
Original post of Cyrille BORNE.Votez pour ce billet sur Planet Libre.