1打开eclipse,创建一个maven项目,叫webmagic2在pom.xml文件中添加webmagic-core、webmagic-extension两个jar包依赖3开始爬取数据开发,创建一个类PageProcessorDemo实现PageProcessor接口4PageProcessorDemo类开发内容如下图,每行代码均有注释,比较好理解。以某新闻页面为例,爬取新闻页面的第一条新闻的标题以及URL链接。内容比较简单,后续根据需求扩展增加。5爬取数据结果显示如下。