Mnogosearch : configurer les domaines à crawler

Mnogosearch : configurer les domaines à crawler

Crawl d’un domaine :

[shell]

Server https://www.marseo.fr

[/shell]

Crawler plusieurs sous domaines, en exclure (NoMatch). Les expressions régulières sont autorisées (Regex).

[shell]
Realm Regex ^https://.*sousdomaine.*\.marseo.fr
Realm NoMatch https://*sousdomaine*.marseo.fr

[/shell]

Crawl d’un site et d’un autre site avec ses sous domaines :

[shell]

Server https://www.marseo.fr
Realm http://*.domaine2.fr/*

[/shell]

Crawl d’un site en partant d’une page interne :

[shell]

Server site https://www.marseo.fr/mnogosearch-configurer-les-domaines-a-crawler/

[/shell]

Crawl d’une seule page (pourquoi pas) :

[shell]

Server page https://www.marseo.fr/mnogosearch-configurer-les-domaines-a-crawler/

[/shell]

Crawl d’un répertoire :

[shell]

Server https://www.marseo.fr/theme/outils/mnogosearch/

[/shell]

 

Laisser un commentaire

You May Have Missed