Mnogosearch - Blog SEO de Marseo

0

Mnogosearch : configurer le suivi des liens

Posted on 27 janvier 2017 by marseo

Suivre tous les liens et les collecter (permet de les conserver en base pour calcul du PR interne) FollowLinks yes CollectLinks yes On peut cependant suivre quelques types de liens. FollowLinks {yes | no | a | area | frame… Lire la suite →

0

Mnogosearch : configurer les domaines à crawler

Posted on 27 janvier 2017 by marseo

Crawl d’un domaine : Server https://www.marseo.fr Crawler plusieurs sous domaines, en exclure (NoMatch). Les expressions régulières sont autorisées (Regex). Realm Regex ^https://.*sousdomaine.*\.marseo.fr Realm NoMatch https://*sousdomaine*.marseo.fr Crawl d’un site et d’un autre site avec ses sous domaines : Server https://www.marseo.fr Realm… Lire la suite →

0

Mnogosearch : configurer les directives sitemap

Posted on 27 janvier 2017 by marseo

Il est possible de suivre ou non les liens situés dans les sitemaps déclaré dans le robots.txt. UseSitemap yes UseSitemap no

0

Mnogosearch : configurer les règles de restriction pour les robots

Posted on 27 janvier 2017 by marseo

Un site peut avoir plusieurs règles de restrictions d’exploration pour les moteurs de recherche (robots.txt, X-Robots-Tag…). Mnogosearch permet de prendre en compte toutes les règles, ou aucune, ou quelques unes. Suivi de règles Robots spécifiques : Robots robotstxt Robots xrobotstag Robots… Lire la suite →

0

Mnogosearch : suivre l’évolution de son crawl

Posted on 25 janvier 2017 by marseo

Un crawl peut prendre du temps. Il existe un moyen avec Mnogosearch de suivre un dashboard en temps réel pour voir l’évolution du crawl que l’on est en train de faire. Pour cela, pendant que votre crawl tourne, ouvrez une… Lire la suite →

0

Mnogosearch : recrawl des URL en erreur

Posted on 25 janvier 2017 by marseo

Imaginons, vous avez lancé un crawl le soir, et pendant la nuit le temps le serveur a connu un redémarrage. Vous aurez allors des erreurs 500 dans votre crawl. Vous pouvez alors, au matin, relancer le crawl uniquement sur les… Lire la suite →

0

Mnogosearch : crawl d’une liste d’URL

Posted on 25 janvier 2017 by marseo

Ce crawl va récupérer une liste d’URL d’un site en récupérant : Title H1 Temps de réponse Liens internes entrants / sortants Profondeur Status code (code réponse Création de la base Je crée tout d’abord une base vide, qui sera ma… Lire la suite →

0

Mnogosearch : premier crawl essentiel

Posted on 23 janvier 2017 by marseo

Ce crawl va récupérer l’ensemble des URL d’un site en récupérant : Title H1 Temps de réponse Liens internes entrants / sortants Profondeur Status code (code réponse) Création de la base Je crée tout d’abord une base vide, qui sera ma… Lire la suite →

0

Mnogosearch : installation

Posted on 23 janvier 2017 by marseo

Prérequis Serveur Linux + BDD installée. Pour ma part j’utilise un simple LAMP (Apache / SQL). Rendez-vous sur la page de téléchargement afin de récupérer la dernière version de Mnogosearch : http://www.mnogosearch.org/download.html Installation Dézippez le dossier compressé avec la commande suivante dans… Lire la suite →

0

Mnogosearch : présentation et applications pour le SEO

Posted on 23 janvier 2017 by marseo

Introduction à Mnogosearch Mnogosearch est un moteur de recherche open source en C, développé par le Russe Alexander Barkov. Mnogosearch fonctionne en deux parties : l’indexer et le search. L’indexer va parcourir l’ensemble des ressources (HTML par exemple) afin de les… Lire la suite →