URLCatcher设计文档

鬼谷子叔叔 - 2024-12-31 17:11

介绍


原理

Client端

catchUrl:提交抓取任务,等待抓取结果

Worker端

popCatch:领取抓取任务,执行抓取任务

updateCatch:更新抓取任务,上报抓取结果

Group(分组):

在Client端提交抓取任务的时候指定Group,那么在Worker端领取抓取任务的时候也必须指定相同的Group,在Worker端更新抓取任务的时候同样必须指定相同的Group。

Delay模块

registerCatchGroup:给指定分组设定延迟规则

unregisterCatchGroup:撤销指定分组的延迟规则(进行中的不受影响)

resetCatchGroupData:重置指定分组针对当前Worker端的进行中的数据