【扩展】使用谷歌Chrome浏览器进行采集 提高采集数据稳定性

By | 2021年10月14日

20210028及以上版本已加入了谷歌chrome浏览器采集插件,让您轻松使用chrome浏览器来进行数据采集和缓存读取,即看即采集的模式让您轻松掌控数据,获取采集数据更加简单。

目前由于本功能刚发布,等待几个版本稳定后,我们将作为默认开启项。目前为默认不开启,需要您手动开启此功能

开启条件

  • 升级到最新版本的创想亚马逊数据采集软件(20210028)
  • chrome浏览器建议使用版本为93.0以上。

 

优势

  • 您只要在chrome浏览器设置好代理或邮编信息,本软件就可以直接采集,直接调用谷歌浏览器来采集,因此您无需再在采集软件中配置邮编、语言、代理IP等等采集时的信息。
  • 很多代理或VPN软件只支持谷歌chrome浏览器,因此通过谷歌chrome浏览器采集模式,可直接支持
  • 使用chrome浏览器更加符合主流,让您可以直接采集到您看到的数据。
  • 即看即采集模式,采集过程一目了然,让您轻松掌控数据来源。
  • chrome浏览器采集更加稳定高效,相较于之前版本的MB浏览器速度和稳定性大大提高。

开启方法

请先确认已安装Chrome浏览器,否则将载入异常。如果没安装将导致开启失败或者请求数据时异常!也会导致采集很慢很卡!

如下图,在系统设置里,下图中:

1.表示采集使用chrome浏览器采集,我们建议非必要不要使用chrome采集,建议您使用默认的winhttp模式采集数据。

2.为cookie和缓存来源使用chrome。您可以仅开启此项,采集时将使用chrome浏览器的邮编地区、语言等信息进行采集。

开启后,采集时将通过chrome浏览器进行采集。

如果需要查看状态和是否正常载入了chrome浏览器,请点击下图:

补充说明

  1. 如果您使用chrome浏览器进行采集,您只需要在浏览器中设置好邮编、语言或登录买家账号(必要的话),可以关闭本软件中的 邮编配置、语言等,如下图,将自动刷新设置为0,避免系统自动设置邮编,浪费资源,也能提高采集软件打开的速度。
  2. 如果您采集时遇到屏蔽验证码,请您到谷歌浏览器中手动输入验证码!(如果谷歌浏览器中无法输入验证码或提示正在采集请勿操作的提示,您可以刷新页面再试。)
  3. 如果您使用多线程采集商品数据,建议使用默认的IE浏览器获取cookie。

 

问答

  • 问:开启谷歌浏览器采集和不开启有什么区别?
    答:直接使用谷歌浏览器采集,省去配置邮编、地址、买家账号(如有必要)、代理IP等配置,您谷歌浏览器中看到什么数据采集下来就是什么数据,避免因不同浏览器采集不同的情况。
  • 问:为什么我开启谷歌浏览器后又自动关闭了?
    答:请检查杀毒软件不要删除CBrowserHelp.exe文件.该文件是谷歌浏览器内核插件,若丢失或无法运行,则导致无法开启谷歌浏览器访问模块。具体原因可查看【采集日志】
  • 问:谷歌浏览器采集和谷歌浏览器获取cookie有什么不同?
    答:谷歌浏览器采集是直接利用谷歌浏览器访问亚马逊获取数据解析到表格。谷歌浏览器获取cookie则是读取谷歌浏览器的环境信息(如邮编、登录状态等信息)进行采集。
  • 问:采集时是否可以关闭谷歌浏览器?
    答:无法关闭。因为需要读取谷歌浏览器的数据和操作浏览器进行采集。
  • 问:谷歌浏览器采集是否支持多线程?
    答:不支持,仅支持多进程(多开采集器)。多线程将在后续进行支持,目前如果您开启谷歌采集又开启多线程采集详细信息,则会导致程序异常,请谨慎操作。
  • 问:为什么开启Chrome浏览器采集后,打开很多浏览器窗口但是没有反应也没有使用Chrome采集?
    答:请先检查chrome浏览器的版本为93.0以上,然后再检查是否安装了”卖家精灵” 等各类Chrome浏览器插件导致兼容性出现问题.您可以尝试停用此类插件或尝试关闭所有Chrome浏览器窗口再尝试开启Chrome浏览器采集模式。

 

注意

  • 使用谷歌浏览器采集,请勿开启多线程采集商品详细信息,否则会导致异常
  • 开启上面任意一个使用chrome浏览器的功能时,本软件都会打开一个chrome浏览器窗口,请勿操作或关闭此窗口,否则会导致采集过程中异常、断线、程序未响应。
  • 该功能目前为测试版,建议您非必要情况,使用默认方式进行采集。(此功能主要用来解决用户IE浏览器配置邮编失败而提供的备选方案,也是采集的备选方案)
  • 开启使用谷歌浏览器采集时,系统采集数据将调用chrome浏览器内部接口进行采集,过程中请千万不要关闭正在运行采集的窗口和标签页,避免采集中断或未响应。(虽然本软件已做应对机制,但仍然请您不要进行任何操作)
  • 使用谷歌浏览器采集时,以下功能将不会被生效:
    1.HTTP代理切换:如需使用代理,请直接让chrome使用代理IP访问即可。
    2.模拟环境
    3.暂不支持无图模式采集
    4.暂时不支持多线程
  • 提供chrome浏览器采集仅供测试方便您整理电商数据,严禁用于大批量数据采集等行为,造成任何影响后果自负。