【第四课】合理使用过滤器,过滤不想要的数据

By | 2017年5月1日

创想亚马逊ASIN采集器提供了强大的过滤器功能,可以通过指定的过滤词过滤掉不想要的商品。方便筛选不需要的产品。

(注意:过滤器仅依照用户设置的信息进行过滤,除用户完整添加过滤词外,无法保证100%过滤侵权、品牌保护的商品)

提示:创想亚马逊采集器目前还支持采集各类子项目:reviews评论内容、跟卖卖家、关联商品、QA等数据,这些数据也可以使用条件过滤器的配置进行过滤,例如reviews评论内容采集会显示在产品名称列里,因此,在条件过滤中,过滤标题中设置过滤词,也会应用到过滤评论中。 评论时间在上架时间列中,因此设置过滤上架时间,也可以用于过滤删除评论项的评论时间。

因此条件过滤不仅可以用于过滤商品,还能用于过滤其他子项目,对应过滤项目,按子项目对应列进行过滤。例如评论内容位于产品标题列中,则使用过滤标题功能、评论的买家ID在brand列中,则设置过滤品牌也可以进行过滤评论项。其他子项目的以此类推均可过滤。(如果不想过滤器过滤reviews评论内容、QA问答等数据,可在采集设置中关闭即可)

同时过滤配置也可以用于条件删除。

 

 

点击这里查看创想亚马逊数据采集器使用教程视频

条件过滤器使用介绍视频:

 

 


操作方法



1.在采集设置里,找到商品过滤器,点击“配置条件过滤器”。当然,在软件上方也可以点击“条件过滤”按钮也能打开配置窗口

 



2.打开过滤器配置窗口,就可以开始配置我们想要筛选的条件了。


使用过滤器前,要想采集时过滤器生效,务必勾选“采集时开启条件过滤器”,如上图

也可以在“采集设置”中开启“开启条件过滤器”功能即可。如果不想采集时进行过滤,关闭该项即可。

不同项目介绍:

过滤标题:用于过滤产品名称列里的内容

过滤分类:过滤表格中 分类列 里的内容

过滤品牌:过滤表格中 BRAND列里的内容

综合过滤:当用于采集时过滤,则会匹配整张网页的文字,如果用于条件删除器,会匹配当前整行内容进行过滤

过滤型号:用来过滤 型号列 内容,可以过滤颜色文本、尺码等信息

过滤数值:用来设置过滤的价格、RANK、上架时间等信息

过滤设置:可以设置过滤的范围

如果还需要过滤reviews评论项以及offer跟卖卖家信息,可以在采集设置里 设置。

 

 

设置过滤文本说明

例如 : 过滤标题   里   在不采集标题包含这些文本一栏中设置“nike”。那么采集时,只要标题里带有“nike”就会被过滤掉并删除。值得注意的是,有些词语可能会包含nike。也会被过滤,因此建议设置nike时,可以加个空格,就可以保证被匹配为单词,而不是单词中的一段字母。

如果开启了全文匹配。那么会匹配此项目所有文本。全文匹配一般用途较少,不建议使用,只有整行文本完全一致才会被过滤。例如过滤标题时,添加的过滤文本必须和标题整行完全一致(少一个空格也不行)

如果开启  所有过滤词一起匹配才过滤  那么采集过程中,必须该项所有设置的文本都存在才能过滤。例如过滤标题里设置 nike     tshirt 两个过滤词,那么标题必须同时存在这两个文本才会被过滤,否则不会触发。其他的选项同理

 

需要采集时过滤,请先打开过滤选项。


 

 

 

 

同时还支持各类数值过滤,如下图,我们可以设置只采集的价格、只采集的跟卖数量(offer数量)、只采集的RANK等等。

若要设置采集大于1的,可设置1-999999即可  具体大家可以动手操作一下便知哦

软件中已经提供了使用说明。


编辑完过滤配置,只需要点击“保存或添加过滤器配置”即可保存当前的过滤器配置,如图
设置完过滤配置务必记得保存哦!配置名称不要包含特殊符号以及文件名不允许的字符



保存完这个过滤配置

接下去可以开始采集了,采集过程中将会按设置的条件对采集的商品、reviews、变体等项目进行过滤。只要信息符合过滤要求,就会被过滤不采集。

同时,设置的过滤配置文件,我们可以放到其他电脑上使用,非常方便。

 

其他介绍

复制过滤配置到其他电脑使用

如果从其他地方复制过滤配置(.filter文件)到本机使用,可将.filter文件,复制到过滤器文件存放目录即可(过滤器配置中,点击定位配置存放目录即可定位此目录),粘贴到此文件夹后,重新开启过滤器窗口刷新即可获取到刚刚粘贴的过滤器配置文件。如果要复制给他人也是从过滤器文件存放目录复制。

总而言是,过滤器配置文件.filter必须存放在 过滤器配置目录(过滤器配置中,点击定位配置存放目录即可定位此目录) 中才可以正常显示和使用

 



使用过滤器配置填写说明

在相应的过滤栏目中,填写要过滤的关键词以及过滤价格区间、评论数、offer等等信息后,然后输入要保存的过滤器配置名称,点击“保存/添加过滤器配置”即可保存过滤器配置。
您也可以设置保存多种过滤器配置,可随意切换不同配置,切换后立即生效,方便您的过滤

 

1.配置完过滤器务必点击“保存或添加过滤器配置”保存过滤器设置,否则无法生效。

2.若要切换过滤器,在右边栏中 选择要使用的过滤器配置即可立即生效

3.过滤词添加后,必须勾选点击确定才能够生效,未勾选的过滤词不会触发过滤机制

4.上架时间填写方法为:2016-10-10这种格式,若2个时间点都留空则表示不过滤,若只填写任意一个上架时间,则过滤之前和之后的时间。具体请自行测试。

5.过滤数值填写方法为

     例如如果需要只采集0-100之间评论数的商品,则需要设置0 –  100才能生效(价格、offer等也如此填写)

     例如如果只采集100以上评论数的商品,则设置100-9999999999 即可采集到100以上评论数的商品(价格、offer等也如此填写)

      例如如果只采集0评论数的商品,可填写 -1 – 0,就会只采集评论数 大于或等于-1,小于或等于0的项目,请不要两项都设置0,因为两项都设置0等于关闭该项过滤,其他的价格、评论数等也和此处说明一样设置

6.需要批量复制过滤词,点击列表右键即可批量复制

7.所有过滤词的过滤关系是 或 的关系

8.过滤词为一个整体,t shirt和shirt是不一样的,因此设置过滤词 t shirt是无法过过滤标题中带有shirt的商品,只能过滤带有t shirt的商品。

9.个别情况下需要过滤单词时,最好加上一个空格,例如商品标题为 xxxx caption xxxx,因为caption词中也有cap字符,因此也会被过滤,所以要过滤单词,建议两边设置一个空格,例如“ cap ”即可避免这种情况的发生

10.过滤数值设置若前面的数值大于后面的数值则删除两数字以外的项目,例如设置过滤RANK时设置10-5,这样设置只会采集大于10小于5



说明:也可以批量导入过滤词,只需要从EXCEL复制或从TXT复制,一行一条,并点击粘贴批量添加即可批量添加过滤词。

 

 

 

设置AND关系匹配 介绍说明

(此功能仅20177790以上版本包含)

默认所有过滤词按照or的关系进行过滤,也就是或。

例如:

开启了AND关系匹配后,过滤商品标题为 “PopSockets: Expanding Stand and Grip for Smartphones and Tablets – Cat” ,设置不采集商品包含的文本有Expanding、Grip,两个词,那么此商品就会被过滤,如果设置Expanding、iphone 两个词,此商品将不会过滤,因为标题中没有同时包含Expanding和iphone这两个词,因此必须同时包含所有词才会被过滤。

若没有开启AND关系匹配,那么软件将按默认的OR(或)进行匹配,过滤商品标题为 “PopSockets: Expanding Stand and Grip for Smartphones and Tablets – Cat”,如果设置不采集商品包含的文本有Expanding、iphone 两个词,将会被过滤,因为标题中包含了Expanding词,只要是存在过滤词中的一个就会被过滤。

以上例子对于“只采集商品XX包含这些文本的”项目也一样。总结意思就是,开启AND关系匹配,所有过滤词都必须存在或不存在才会被过滤,若未开启,有一条过滤词符合条件将会被过滤。

因此此功能可以用于过滤一些特殊的商品标题,如下图可以开启关闭不同过滤内容的AND关系匹配

 


对已经采集的或导入的商品数据进行过滤


过滤配置不仅支持采集时过滤,还支持对采集后的数据或导入的数据进行过滤

可在软件中,找到“条件删除”功能,可选择需要使用的过滤配置,选中过滤配置,点“开始进行条件删除”按钮即可按照当前选中的过滤条件进行匹配删除,非常方便哦~,如下图:

 

条件删除器中,如果配置了综合过滤,那么过滤是将会使用整行所有文本进行匹配过滤。


选择好需要使用的过滤配置,然后点击分析即可删除,删除前会提示用户是否删除。

还可以输出过滤原因,方便您查找问题。

 

【进阶知识】筛选和条件删除器使用帮助:http://blog.cxsup.com/archives/594

发表评论