Skip to content

Latest commit

 

History

History
10 lines (4 loc) · 384 Bytes

README.md

File metadata and controls

10 lines (4 loc) · 384 Bytes

数仓/数据湖数据源

大数据处理,离不开数仓或者数据湖。Byzer 引擎能够支持 Hadoop 中 Hive 数据目录的读写,也能够支持内置的 Delta Lake 的读写。

数仓中有三件事比较棘手,第一件是数据同步,第二件是流式支持,第三个是小文件问题。 本章节将会详细阐述 Byzer 是如何解决他们的。