智能采集方法


智能采集方法:


智能采集分为2种方式(企业版功能):

1、如果输入多个关键词(用竖线 | 隔开),则会爬取各个关键词在搜索引擎的搜索结果,采集对应关键词在搜索引擎中的文章内容。

2、如果输入新闻资讯类网址,则会尝试爬取文章内容页,无需采集规则直接采集内容(只对部分网站有效,属于万能规则类似的原理)。



上图说明:进入“智能采集”。



1、如果输入多个关键词(用竖线|隔开),则会爬取各个关键词在搜索引擎的搜索结果,采集对应关键词在搜索引擎中的文章内容。


如果输入关键词:适合热点关键词,每天会有足够数量的最新的文章出现,如果关键词不热,短时间二次采集容易重复。

如果需要数量多和质量高的文章,建议使用导入采集规则(企业版云规则) ,每天都能采集到足够数量的文章而不重复。



上图说明:输入多个关键词(用竖线|隔开)后,并填写分类名称,其它保持默认即可。示例:


比特币|以太坊|EOS|瑞波币



上图说明:点击“开始采集”。



上图说明:智能采集爬取各个关键词在搜索引擎的搜索结果,采集对应关键词在搜索引擎中的文章内容。


2、如果输入新闻资讯类网址,则会尝试爬取文章内容页,无需采集规则直接采集内容(只对部分网站有效,属于万能规则类似的原理)。



上图说明:也可以直接输入新闻资讯类网址,并填写分类名称,其它保持默认即可。



上图说明:点击“开始采集”。



上图说明:直接输入新闻资讯类网址,则会尝试爬取文章内容页,无需采集规则直接采集内容(只对部分网站有效,属于万能规则类似的原理)。