【进阶知识】采集器文件编码介绍

By | 2017年9月10日 阅读量: 128

由于创想亚马逊数据采集器支持全球各类亚马逊站点采集,语言不尽相同,编码也不同,本文介绍如何解决乱码问题。

我们分两种乱码情况进行介绍解决。

 

第一种是中国站、日本站的乱码字符

例如标题采集下来是:iPhone 6s 6 ガラスフィルム 液晶保護フィルム 4.7インチ フィルム 強化ガラス 硬度9H ラウンドエッジ DOLPHIN47 EDGE

这种的就是中日站点采集常见的乱码

第二种德国法国意大利西班牙等非英语站点的乱码字符

例如标题采集下来是:Apple iPhone SE Smartphone débloqué 4G (Ecran : 4 pouces – 16 Go – Simple Nano SIM – iOS) Argent

这种非英文字母也是乱码。

以上这些类似 “é”、“ン”代码名为  HTML实体,您不了解也没关系,按教程解决即可。

 

第三种非HTML实体,显示乱码字符

此种方法,可在“系统设置”中打开,编码强制转换功能可解决大部分符号编码问题,若无法编码的Unicode符号,会被编码为?号,请注意

 

首先我们介绍第一种中日本站乱码解决办法:

中日站点要解决此问题,只需要在采集设置中,打开“中日站点自动编码转换”。采集时程序就会自动进行转码,非常方便。

 

第二种非英语站点的乱码字符解决办法:

此问题目前在最新版本20177801以上版本可通过导出数据时进行编码转换解决。

首先正常采集即可。可以看到采集的数据中存在“HTML实体”乱码,如下图:

接下去,点击保存数据,保存。并打开“自动对保存文件进行HTML实体编码”功能,如下图:

开启后,保存数据即可导出被转码的数据文件。

转码必看说明:

1.转码后的文件将无法直接导入采集器中,若您需要将转码后的文件导入采集器,利用记事本打开文件,点击菜单栏的文件,选择另存为,编码选择“ANIS”编码,然后保存,保存转码后的文件即可正常导入采集器中。

2.若数据量比较大,转码过程会比较慢,请耐心等待

3.如果默认的HTML实体编码无法满足需求,可自定义添加,添加方式按“文件编码设置”处提示操作。

4.此功能尚处于实验测试期,若您使用中有BUG或疑问,可以联系我们反馈。

 

发表评论

电子邮件地址不会被公开。 必填项已用*标注