某大型的教育百科数据采集规则,数据有200w左右,全站采集规则,可以进行学习使用。
采集规则要求:
规则有两个,因为站点数据模板有不同,所以写了两个规则,可以一起并行跑
数据过滤了不需要的字符,只保留了段落标签
导入要求:火车头9.8以上版本
某大型的教育百科数据采集规则,数据有200w左右,全站采集规则,可以进行学习使用。
采集规则要求:
规则有两个,因为站点数据模板有不同,所以写了两个规则,可以一起并行跑
数据过滤了不需要的字符,只保留了段落标签
导入要求:火车头9.8以上版本