package com.github.xjtushilei.example;
import com.github.xjtushilei.core.Spider;
/**
* Created by shilei on 2017/4/11.
*/
public class MiniRegexSpider {
//爬取《交大新闻网》的所有信息,并将信息打印到控制台!
public static void main(String[] args) {
Spider.build()
.addUrlSeed("http://news.xjtu.edu.cn")
.addRegexRule("+http://news.xjtu.edu.cn/.*") //限制爬取《交大新闻网》以外的其他站点的信息
.run();
}
}