개발 플랫폼
Apache Arrows는 일종의 개발 프로그램이라고 보는것같다
In-Memory로 작동하고, 데이터간 이동하는 기술을 Python에서는 Pyarrow로 구현할수 있다
Zero-Copy
ROW기반이 아닌 Column기반(열기반) 의 인메모리 포맷으로 Zero-Copy 직렬화를 수행한다고함
원래는 데이터가 인프라를 공유하기위해선 Serialization, Deserialization이 필요했는데, 이 과정에서 데이터가 크면 클수록, Overhead가 크다는 단점이 있었다
그래서 직렬화를 없에버리려는 목적으로 Zero-copy Serialization framework 가 탄생되었다 ( 당연히 serialization을 하지않기때문에, deserialization도 하지않는다 )
'Dev' 카테고리의 다른 글
아파치 오픈소스 다운로드아카이브 http://dlcdn.apache.org (0) | 2022.11.12 |
---|---|
Numpy Array Memory구조 확인하기 (1) | 2022.11.01 |
Parquet는 왜 쓸까? (0) | 2022.11.01 |
PyObject 객체와 Numpy (0) | 2022.10.29 |
서버리스의 장단점 (0) | 2022.08.14 |