在使用数据源是HIve的时候,设计sql数据集的预览、更新等操作,都会提交三次HIve查新。在执行前两次查询的时候提示是等待更新,第三次查询的时候开始显示更新进度。第三次查询结束才更新完成这个数据集
这总多次查询在数据量小的时候还没啥影响。但是查询数据量大几十个TB的时候一次查询就需要几十分钟,像这种重复查询三次就太浪费资源了。
不知道这种重复提交查询的FineBi的某种机制,还是对接Hive数据集的问题。希望有办法能规避这个问题 有清楚是怎么回事儿的吗
实时数据应该是没有办法避免的吧,因为数据一直在发生变化