Mnogosearch : configurer les domaines à crawler
Crawl d’un domaine :
[shell]
Server https://www.marseo.fr
[/shell]
Crawler plusieurs sous domaines, en exclure (NoMatch). Les expressions régulières sont autorisées (Regex).
[shell]
Realm Regex ^https://.*sousdomaine.*\.marseo.fr
Realm NoMatch https://*sousdomaine*.marseo.fr
[/shell]
Crawl d’un site et d’un autre site avec ses sous domaines :
[shell]
Server https://www.marseo.fr
Realm http://*.domaine2.fr/*
[/shell]
Crawl d’un site en partant d’une page interne :
[shell]
Server site https://www.marseo.fr/mnogosearch-configurer-les-domaines-a-crawler/
[/shell]
Crawl d’une seule page (pourquoi pas) :
[shell]
Server page https://www.marseo.fr/mnogosearch-configurer-les-domaines-a-crawler/
[/shell]
Crawl d’un répertoire :
[shell]
Server https://www.marseo.fr/theme/outils/mnogosearch/
[/shell]



Laisser un commentaire