教程搜索

其它

    智能采集方法


    智能采集方法:


    智能采集分为2种方式(企业版功能):

    1、如果输入多个关键词(用竖线 | 隔开),则会爬取各个关键词在搜索引擎的搜索结果,采集对应关键词在搜索引擎中的文章内容。

    2、如果输入新闻资讯类网址,则会尝试爬取文章内容页,无需采集规则直接采集内容(只对部分网站有效,属于万能规则类似的原理)。



    上图说明:进入“智能采集”。



    1、如果输入多个关键词(用竖线|隔开),则会爬取各个关键词在搜索引擎的搜索结果,采集对应关键词在搜索引擎中的文章内容。


    如果输入关键词:适合热点关键词,每天会有足够数量的最新的文章出现,如果关键词不热,短时间二次采集容易重复。

    如果需要数量多和质量高的文章,建议使用导入采集规则(企业版云规则) ,每天都能采集到足够数量的文章而不重复。



    上图说明:输入多个关键词(用竖线|隔开)后,并填写分类名称,其它保持默认即可。示例:


    比特币|以太坊|EOS|瑞波币



    上图说明:点击“开始采集”。



    上图说明:智能采集爬取各个关键词在搜索引擎的搜索结果,采集对应关键词在搜索引擎中的文章内容。


    2、如果输入新闻资讯类网址,则会尝试爬取文章内容页,无需采集规则直接采集内容(只对部分网站有效,属于万能规则类似的原理)。



    上图说明:也可以直接输入新闻资讯类网址,并填写分类名称,其它保持默认即可。



    上图说明:点击“开始采集”。



    上图说明:直接输入新闻资讯类网址,则会尝试爬取文章内容页,无需采集规则直接采集内容(只对部分网站有效,属于万能规则类似的原理)。