【进阶知识】采集器文件编码介绍

By | 2017年9月10日

由于创想亚马逊数据采集器支持全球各类亚马逊站点采集,语言不尽相同,编码也不同,本文介绍如何解决乱码问题。

我们分两种乱码情况进行介绍解决。

三种常见乱码问题:

第一种是中国站、日本站的乱码字符

例如标题采集下来是:iPhone 6s 6 ガラスフィルム 液晶保護フィルム 4.7インチ フィルム 強化ガラス 硬度9H ラウンドエッジ DOLPHIN47 EDGE

这种的就是中日站点采集常见的乱码

第二种德国法国意大利西班牙等非英语站点的乱码字符

例如标题采集下来是:Apple iPhone SE Smartphone débloqué 4G (Ecran : 4 pouces – 16 Go – Simple Nano SIM – iOS) Argent

这种非英文字母也是乱码。

以上这些类似 “é”、“ン”代码名为  HTML实体,您不了解也没关系,按教程解决即可。

 

第三种特殊字符显示为问号

例如Verschiedene 10ner Sets Fruit of the Loom T Shirts. Diverse Farbsets auswählbar. Viele Sets bis 5XL auswählbar 中的ä 等字符,在采集器中采集下来会变成问号,这是由于程序编码不支持导致的。解决办法请看下面

 


以上乱码问题解决操作步骤:

首先我们介绍第一种中日本站乱码解决办法:

中日站点要解决此问题,只需要在采集设置中,打开“中日站点自动编码转换”。采集时程序就会自动进行转码,非常方便。

 

第二种非英语站点的乱码字符解决办法:

此问题目前在最新版本20177801以上版本可通过导出数据时进行编码转换解决。

首先正常采集即可。可以看到采集的数据中存在“HTML实体”乱码,如下图:

接下去,点击保存数据,保存。并打开“自动对保存文件进行HTML实体编码”功能,如下图:

第三种 特殊字符变成问号的问题解决:

为了解决特殊字符本软件不支持的问题,我们在20180148及以上版本增加了特殊字符变相的解决方案,您仅需按我们操作即可。

本功能仅能够编码常见的特殊字符,还有一些特殊字符尚未收录,如果您有需要可以联系我们。

首先在系统设置中,打开 特殊字符自动转换功能:

打开该项后,所有特殊字符会被编码成类似 ä 的字符,例如特殊字符 ä 的编码为ä,那么在采集器中文本 auswählbar会被显示为为auswählbar,只有保存成excel文件后,才能看到特殊字符。

然后我们保存文件,并在“文件编码设置”中打开“对保存的文件进行HTML实体编码”如下图:

开启本项目后,保存文件后,软件会自动将文件中所有特殊字符还原。特殊字符仅限在excel软件中查看,如下图

通过这种方式,虽然软件中依然是乱码,但是导出后不会乱吗,算是一种妥协的解决办法。

 

 

开启后,保存数据即可导出被转码的数据文件。

转码必看说明:

1.转码后的文件将无法直接导入采集器中,若您需要将转码后的文件导入采集器,利用记事本打开文件,点击菜单栏的文件,选择另存为,编码选择“ANIS”编码,然后保存,保存转码后的文件即可正常导入采集器中。

2.若数据量比较大,转码过程会比较慢,请耐心等待

3.如果默认的HTML实体编码无法满足需求,可自定义添加,添加方式按“文件编码设置”处提示操作。

4.此功能尚处于实验测试期,若您使用中有BUG或疑问,可以联系我们反馈。

 

One thought on “【进阶知识】采集器文件编码介绍

发表评论

电子邮件地址不会被公开。