General
Google Protocol Buffer
구티맨
2022. 8. 9. 10:57
목차
개요
Protocol Buffer는 언어 및 플랫폼 중립적으로 사용할 수 있는 구조화된 데이터를 직렬화 할 수 있는 확장가능한 메커니즘 입니다.
데이터를 직렬화 하여, 데이터의 크기를 줄이고 빠른 파싱 속도를 장점으로 실제 구글 내부에서도 다양하게 사용을 하고 있으며 ( gRPC, Google Cloud, Envoy Proxy 등 ) Avro 파일 포맷에서도 사용 하고 있습니다.
Google에서 공식적으로 여러 언어에서 지원(오픈소스)을 할 뿐만 아니라, Third-Praty에 의해 여러 언어에 대해서 지원을 하고 있습니다.
Protocol Buffer는 .proto 파일, 컴파일러, protocol buffer 라이브러리로 구성이 됩니다.
: .proto 파일에서는 직렬화 할 메시지를 정의
: 컴파일러는 .proto 파일에 정의된 메시지 값을 설정하고 직렬,역직렬화에 사용할 클래스 코드를 생성해 줍니다.
: 라이브러리는 실제 직렬화, 역직렬화를 해주는 알고리즘 코드가 들어있습니다.
// .proto file
message Person {
optional string name = 1;
optional int32 id = 2;
optional string email = 3;
}
// project code using PB Code
Person john = Person.newBuilder()
.setId(1234)
.setName("John Doe")
.setEmail("jdoe@example.com")
.build();
output = new FileOutputStream(args[0]);
john.writeTo(output);
활용
하위/상위 호환성이 가능하기 때문에 구조화 된 데이터를 사용한다면 서버간의 통신 뿐만 아니라, 저장소에 데이터를 저장할 때도 유용하게 사용할 수 있습니다.
제약사항
- 데이터가 수 MB가 넘어가는 경우는 적합하지 않고, memory에 한번에 올릴 수 있는 데이터 사이즈인지 고려해봐야 합니다.
직렬화를 위해 여러 data copy가 발생하여 memory spike 하는 상황이 발생할 수 있습니다. - 직렬화된 data는 서로 다른 여러 binary 직렬화를 가지기 때문에 직렬화된 data로는 같고 다름의 비교가 불가합니다.