数仓/数据湖数据源 大数据处理,离不开数仓或者数据湖。Byzer 引擎能够支持 Hadoop 中 Hive 数据目录的读写,也能够支持内置的 Delta Lake 的读写。 数仓中有三件事比较棘手,第一件是数据同步,第二件是流式支持,第三个是小文件问题。 本章节将会详细阐述 Byzer 是如何解决他们的。