我们在接下来会开始讲网络通信相关的内容了。既然是网络通信,那必然会涉及到序列化的相关技术。

下面是 ccx-rpc 序列化器的接口定义。

/**
 * 序列化器
 */
public interface Serializer {

    /**
     * 序列化
     *
     * @param object 要序列化的对象
     * @return 字节数组
     */
    byte[] serialize(Object object);

    /**
     * 反序列化
     *
     * @param bytes 字节数组
     * @param clazz 要反序列化的类
     * @param <T>   类型
     * @return 反序列化的对象
     */
    <T> T deserialize(byte[] bytes, Class<T> clazz);
}

接口只包含序列化、反序列化两个最基础的方法。不同的序列化器只需要实现这个接口即可,再配合 SPI 就可以使用了。
下面是 ccx-rpc 的一小段反序列化代码:

// 获取序列化类型
SerializeType serializeType = SerializeType.fromValue(codec);
// 获取序列化器
Serializer serializer = ExtensionLoader.getLoader(Serializer.class).getExtension(serializeType.getName());
// 根据消息类型选择反序列化的 Class
Class<?> clazz = messageType == MessageType.REQUEST.getValue() ? RpcRequest.class : RpcResponse.class;
// 进行反序列化
Object object = serializer.deserialize(decompressedBytes, clazz);

序列化算法有多种多样,各有千秋,我们需要结合自己的业务,选择合适的序列化算法。

序列化算法的选择通常有下列一些常用的指标:

  • 通用性:是否跨语言,跨平台。如果 RPC 调用涉及到其他语言、平台,这个指标不可忽视。
  • 性能:通常指解析速度、序列化后的大小。序列化后的数据一般用于存储或网络传输,其大小是一个很重要的指标;解析的速度无需多言,当然是越快越好。
  • 可扩展性:系统升级不可避免,某一实体的属性变更,会不会导致反序列化异常,也应该纳入序列化算法的考量范围。
  • 易用性:API 使用是否复杂,会影响开发效率。

下面我们来看一下常见的序列化算法。

常见序列化算法

1. Java 序列化

Java 序列化大家都很熟悉了,使用起来也不算复杂。先实现 Serializable,生成序列号 serialVersionUID,最后调用java.io.ObjectOutputStreamwriteObject() / readObject() 进行序列化与反序列化。

Java 序列化有个致命缺点:那就是不跨语言,而且性能也不太行。所以 Java 序列化很少人用,也成为了我们最熟悉的陌生人

2. FastJson

FastJson 是阿里开源的 JSON 解析库。正如其名,“快”是其主要卖点。从官方的测试结果来看,FastJson 确实是最快的,比 Jackson 快 20% 左右,但是近几年 FastJson 的安全漏洞比较多,而且版本升级可能会存在较大的兼容问题,所以在选择的时候,还是需要谨慎一些。
JSON 的优点就是可读性高,但是其序列化结果的体积比较大。

3. Jackson

Jackson 相对 FastJson 的功能比较多,安全漏洞也比较少,社区活跃。虽然性能相对于 Jackson 稍差,但是用着安心。
但是其序列化结果的体积比较大,对 RPC 框架来说,还是不大适合的。

4. Kryo

Kryo 是一个高效的 Java 序列化/反序列化库,其特点是 API 代码简单,序列化速度快,并且序列化之后得到的数据比较小。
优点:接口易用、解析快、体积小
缺点:只支持 Java、增删字段会异常

5. Hessian

Hessian 是一种支持动态类型、跨语言的序列化协议,Java 对象序列化的二进制流可以被其他语言使用。
优点:接口易用、解析快、支持多语言
缺点:异常机制不完善,提示信息不足

6. Protobuf

Google 公司开发的一套灵活、高效、自动化的、用于对结构化数据进行序列化的协议。相比于常用的 JSON 格式,Protobuf 有更高的转化效率,时间效率和空间效率都是 JSON 的 5 倍左右。Protobuf 可用于通信协议、数据存储等领域,它本身是语言无关、平台无关、可扩展的序列化结构数据格式。目前 Protobuf 提供了 C++JavaPythonGo 等多种语言的 API。
优点:解析快、体积小、支持多语言。
缺点:需要先定义 proto 结构,使用相对麻烦,不过 Java 可以使用 Protostuff 解决这个问题。

总结

在上文,我们介绍了序列化器的定义,很简单,只有序列化,反序列化两个方法。
然后,介绍了常见的序列化算法,例如Java 序列化、FastJson、Jackson、Kryo、Hessian、Protobuf 等。这些算法各有优缺点,大家在使用时,可以结合自己的业务情况进行选择。

08-27 13:36