用RAW类型解决不同字符集数据库中文乱码问题

在跟外单位做数据交换时,对方提供了一个默认字符集(WE8MSWIN1252)的数据库

用RAW类型解决不同字符集数据库中文乱码问题

我这边是ZHS16GBK的数据库,我需要每天从对方库里抽取增量数据,跨字符集后查询是乱码:

用RAW类型解决不同字符集数据库中文乱码问题

对方仅给我方开放了一个查询用户,可以查询一个视图。我方通过DBLINK方式获取对方数据,此时考虑了一下只能通过RAW类型中转的方式进行处理,要求对方修改视图,对中文字段转换成raw类型。

用RAW类型解决不同字符集数据库中文乱码问题

现在我方表里加一个RAW类型字段,将对方的非中文字段和RAW类型字段取过来,然后做个RAW->VARCHAR2的反操作,就完成了数据迁移。

用RAW类型解决不同字符集数据库中文乱码问题

值得注意的是,如果直接在我方用UTL_RAW.CAST_TO_RAW对远程表进行查询,数据库实际上会将中文乱码转换成RAW编码,无法达到目的,因此只能通过视图或另加字段的方式在对方数据库中先完成编码转换。

用RAW类型解决不同字符集数据库中文乱码问题