diff --git a/docs/.vuepress/sidebar.ts b/docs/.vuepress/sidebar.ts index 0d84850e..04771113 100644 --- a/docs/.vuepress/sidebar.ts +++ b/docs/.vuepress/sidebar.ts @@ -106,6 +106,7 @@ export const sidebarConfig = defineSidebarConfig({ collapsable: true, children: [ "why-there-only-value-passing-in-java", + "serialization", "reflection", "proxy", "io", diff --git a/docs/java/basis/serialization.md b/docs/java/basis/serialization.md new file mode 100644 index 00000000..826c1bbd --- /dev/null +++ b/docs/java/basis/serialization.md @@ -0,0 +1,199 @@ +--- +title: Java 序列化详解 +category: Java +tag: + - Java基础 +--- + +## 序列化和反序列化相关概念 + +### 什么是序列化?什么是反序列化? + +如果我们需要持久化Java对象比如将Java对象保存在文件中,或者在网络传输Java对象,这些场景都需要用到序列化。 + +简单来说: + +- **序列化**: 将数据结构或对象转换成二进制字节流的过程 +- **反序列化**:将在序列化过程中所生成的二进制字节流的过程转换成数据结构或者对象的过程 + +对于Java这种面向对象编程语言来说,我们序列化的都是对象(Object)也就是实例化后的类(Class),但是在C++这种半面向对象的语言中,struct(结构体)定义的是数据结构类型,而class 对应的是对象类型。 + +维基百科是如是介绍序列化的: + +> **序列化**(serialization)在计算机科学的数据处理中,是指将数据结构或对象状态转换成可取用格式(例如存成文件,存于缓冲,或经由网络中发送),以留待后续在相同或另一台计算机环境中,能恢复原先状态的过程。依照序列化格式重新获取字节的结果时,可以利用它来产生与原始对象相同语义的副本。对于许多对象,像是使用大量引用的复杂对象,这种序列化重建的过程并不容易。面向对象中的对象序列化,并不概括之前原始对象所关系的函数。这种过程也称为对象编组(marshalling)。从一系列字节提取数据结构的反向操作,是反序列化(也称为解编组、deserialization、unmarshalling)。 + +综上:**序列化的主要目的是通过网络传输对象或者说是将对象存储到文件系统、数据库、内存中。** + + + +
https://www.corejavaguru.com/java/serialization/interview-questions-1
+ +### 实际开发中有哪些用到序列化和反序列化的场景? + +1. 对象在进行网络传输(比如远程方法调用RPC的时候)之前需要先被序列化,接收到序列化的对象之后需要再进行反序列化; +2. 将对象存储到文件中的时候需要进行序列化,将对象从文件中读取出来需要进行反序列化。 +3. 将对象存储到缓存数据库(如 Redis)时需要用到序列化,将对象从缓存数据库中读取出来需要反序列化。 + +### 序列化协议对应于TCP/IP 4层模型的哪一层? + +我们知道网络通信的双方必须要采用和遵守相同的协议。TCP/IP 四层模型是下面这样的,序列化协议属于哪一层呢? + +1. 应用层 +2. 传输层 +3. 网络层 +4. 网络接口层 + + + +如上图所示,OSI七层协议模型中,表示层做的事情主要就是对应用层的用户数据进行处理转换为二进制流。反过来的话,就是将二进制流转换成应用层的用户数据。这不就对应的是序列化和反序列化么? + +因为,OSI七层协议模型中的应用层、表示层和会话层对应的都是TCP/IP 四层模型中的应用层,所以序列化协议属于TCP/IP协议应用层的一部分。 + +## 常见序列化协议对比 + +JDK自带的序列化方式一般不会用 ,因为序列化效率低并且部分版本有安全漏洞。比较常用的序列化协议有 hessian、kyro、protostuff。 + +下面提到的都是基于二进制的序列化协议,像 JSON 和 XML这种属于文本类序列化方式。虽然 JSON 和 XML可读性比较好,但是性能较差,一般不会选择。 + +### JDK自带的序列化方式 + +JDK 自带的序列化,只需实现 `java.io.Serializable`接口即可。 + +```java +@AllArgsConstructor +@NoArgsConstructor +@Getter +@Builder +@ToString +public class RpcRequest implements Serializable { + private static final long serialVersionUID = 1905122041950251207L; + private String requestId; + private String interfaceName; + private String methodName; + private Object[] parameters; + private Class>[] paramTypes; + private RpcMessageTypeEnum rpcMessageTypeEnum; +} +``` + +> 序列化号 serialVersionUID 属于版本控制的作用。序列化的时候serialVersionUID也会被写入二级制序列,当反序列化时会检查serialVersionUID是否和当前类的serialVersionUID一致。如果serialVersionUID不一致则会抛出 `InvalidClassException` 异常。强烈推荐每个序列化类都手动指定其 `serialVersionUID`,如果不手动指定,那么编译器会动态生成默认的序列化号 + +我们很少或者说几乎不会直接使用这个序列化方式,主要原因有两个: + +1. **不支持跨语言调用** : 如果调用的是其他语言开发的服务的时候就不支持了。 +2. **性能差** :相比于其他序列化框架性能更低,主要原因是序列化之后的字节数组体积较大,导致传输成本加大。 + +### Kryo + +Kryo是一个高性能的序列化/反序列化工具,由于其变长存储特性并使用了字节码生成机制,拥有较高的运行速度和较小的字节码体积。 + +另外,Kryo 已经是一种非常成熟的序列化实现了,已经在Twitter、Groupon、Yahoo以及多个著名开源项目(如Hive、Storm)中广泛的使用。 + + [guide-rpc-framework](https://github.com/Snailclimb/guide-rpc-framework) 就是使用的 kyro 进行序列化,序列化和反序列化相关的代码如下: + +```java +/** + * Kryo serialization class, Kryo serialization efficiency is very high, but only compatible with Java language + * + * @author shuang.kou + * @createTime 2020年05月13日 19:29:00 + */ +@Slf4j +public class KryoSerializer implements Serializer { + + /** + * Because Kryo is not thread safe. So, use ThreadLocal to store Kryo objects + */ + private final ThreadLocal