请选择 进入手机版 | 继续访问电脑版
查看: 39|回复: 3

有用神箭手的吗,问个正则问题?

[复制链接]

7

主题

98

帖子

237

积分

中级会员

Rank: 3Rank: 3

积分
237
发表于 2018-1-24 11:51:58 | 显示全部楼层 |阅读模式
我想采集1-45页的内容,
helperUrlRegexes: ["http://***\/page\/^([1-9]|[1-3][0-9]|[4][0-5])$"], //列表页
这样子写似乎不对,在测试时直接提示“测试运行结束,爬虫自动停止,测试完毕!”,只跑了个示例的page=1
是这个正则有问题还是xpath的语法不对啊?求指导

回复

使用道具 举报

7

主题

98

帖子

237

积分

中级会员

Rank: 3Rank: 3

积分
237
 楼主| 发表于 2018-1-24 12:08:37 | 显示全部楼层
来个大佬~~~

回复

使用道具 举报

0

主题

22

帖子

50

积分

注册会员

Rank: 2

积分
50
发表于 2018-1-24 12:17:50 | 显示全部楼层
本帖最后由 Carseason 于 2018-1-24 12:19 编辑
http:\/\/[^"]+\/page\/[1-4]{0,1}[0-9]$
这样子试一试
回复

使用道具 举报

7

主题

98

帖子

237

积分

中级会员

Rank: 3Rank: 3

积分
237
 楼主| 发表于 2018-1-24 12:48:53 | 显示全部楼层

Carseason 发表于 2018-1-24 12:17
http:\/\/[^"]+\/page\/[1-4]{0,1}[0-9]$
这样子试一试

多谢!

按照你的方式测试了下,果然OK..
只要不带^的起始符就好了
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋| 主机之家 |网站地图

返回顶部