【进阶】使用多线程采集亚马逊 提高采集详细信息速度

热度 787 | 2022-04-14 12:59:20

By | 2022年4月14日

前置条件

多线程采集需要旗舰版授权,如需升级点击这里

 

其他多线程采集介绍

本节介绍采集详细信息或简单信息时使用多线程模式采集。

如需了解采集变体详细信息使用多线程,请点击这里

如需了解图片下载使用多线程,请点击这里

使用多线程提高采集速度最佳实践,点这里查看

 

开启多线程采集

如下图,您可以在【系统设置】下【采集速度】中设置线程数量,即可完成设置。

    • 线程数我们建议您不要设置过大,多线程采集会消耗大量CPU资源,因此建议根据您的电脑合理设置线程数量。
    • 开启了变体采集、各种过滤器、各种子项时,采集时将仍然按1个线程来采集。
    • 多线程采集时,由于是并发请求亚马逊,每个线程可能都会弹出一次验证码输入,因此如果遇到采集验证码屏蔽弹窗,您仅需要输入一次验证码,如果短时间内多次弹出验证码输入框,您可以直接点击【继续采集】即可。
    • 设置多线程后采集不稳定,请根据情况酌情降低线程数量。

 

采集效果

开启多线程采集后,您就可以开始采集详细信息了。有关采集详细信息,请看这里

如下图,10条线程,将有同时10个ASIN被采集,大幅提高了采集速度。

 

最佳实践

如果您是新手,且是旗舰版授权,请按下面方法设置,即可大幅提高采集详情的速度,同时也能支持采集变体、使用过滤器。

  1. 请您先停止采集。
  2. 打开【开启异步采集】,设置缓存数量为5-10,(建议根据线程数来设置!)
  3. 设置 采集详细信息线程数为 3-10,这里设置5个线程,代表会有5个线程同时下载数据。根据您的电脑配置设置此值,不是越高越高,请您根据我们建议来设置,设置过高会加大屏蔽等问题。

按上面设置后,再开始采集详情,可大幅提高速度。

 

原理解释:设置多线程下载会同时采集5条ASIN的网页数据,并投递到异步采集中处理(异步采集是单线程的,因为要保证变体、过滤器等功能正常使用),采集最慢的步骤就是下载数据,我们设置多线程后会有5个线程同时发起请求,大幅提高了采集速度。

 

 

注意事项

  • 采集多线程时,不支持采集变体、过滤器等功能,这些会增加项目和删除项目,因此不支持多线程,采集时将仍然按1个线程采集。(20240009版本起支持多线程采集变体和用过滤器)
  • 多线程稳定性有待测试,若您采集不稳定,请按单个线程采集
  • 采集多线程会占用大量系统资源,请根据电脑实际情况来设置线程数。
  • 采集多线程会提高屏蔽的概率

温馨提示

本软件提供的多线程采集数据的功能不建议设置过高,由于本软件定位为轻量化的数据采集需求,例如简单的铺货数据采集、选品等,因此对于多线程我们没有做太多优化,请勿过度依赖多线程采集,多线程采集还会加大亚马逊采集屏蔽的概率,导致数据采集失败。多线程下载图片比较稳定,建议设置5个线程左右,能提高图片的下载速度。