【技巧篇】利用采集器采集筛选搜索不到的ASIN或关键词

热度 2,728 | 2017-06-16 12:51:44

By | 2017年6月16日

本教程介绍如何从一批ASIN中筛选出被亚马逊删除的商品的方法。

 

有些ASIN会被亚马逊删除,有两种情况:

1.搜索ASIN搜索不到,该ASIN商品页面也无法打开

2.搜索ASIN搜索不到,但是商品页面可以打开

 

下面我们先介绍第一种情况的ASIN的筛选方法

搜索无法搜索到,同时商品页面也无法打开的ASIN,我们可以通过添加采集单个商品的方法进行采集。失败的则为被删除的ASIN,采集成功的则代表未被删除。

如下图添加这些ASIN,并开始采集:

等待这些ASIN采集完,我们可以看到如下结果:

方框圈出来的这些商品,没有采集到标题价格等信息,一般是采集失败所致,因此这些未采集到信息的就是被删除的ASIN,有采集到数据的则未被删除的ASIN

通过以上方法我们就可以快速从一批ASIN中筛选出被删除的ASIN。

现在我们介绍第二种情况的ASIN的筛选方法:

若搜索ASIN搜索不到,但是商品页面可以打开。这种情况的ASIN使用上面的方法筛选显然是不可行的,因为商品页面可以打开,因此通过上述方法采集,也会采集到商品信息,因此我们需要利用采集器的任务采集自动转换功能来进行筛选。

首先,我们在系统设置中,找到非网址自动转换功能,选中“转为搜索结果链接”,开启后我们就可以提交关键词进行采集了。也就是直接采集ASIN,如下图:

然后,删除清空采集器所有任务,避免和之前的任务混希。再添加任务,将这些要筛选的ASIN添加到任务列表中。

将这些ASIN添加到采集器任务区,进行搜索采集。

采集结果如下图。我们可以看到,有5条成功采集到数据的ASIN被筛选出来。未采集到的即为被删除的ASIN。

为了更加直观查看,我们可以直接将任务列表导出,通过excel进行查看。如下图

点击任务区右键,导出这些采集结果。

导出表格后,如下图所示:

从excel中就可以很快看出,采集页数列为0页,采集总计商品数量也为0,这代表这些商品没有搜索到。

我们可以利用excel的筛选功能,批量将这些ASIN提取出来。如下图:

如上图,设置筛选出列数值为0的项目,即可将这些被搜索不到的ASIN筛选出来。

 

至此筛选被删除的ASIN方法介绍完毕。

补充:

有些ASIN会采集失败导致也没有采集到数据,您可以参看采集日志中有无失败提示说明即可。

以上方法仅供参考便捷

发表回复