本文针对使用Core ORC API的VectorizedRowBatch 读取ORC文件详解,并给出详细的示例源代码
数据作为包含1024行数据的VectorizedRowBatch实例传递给ORC。重点在于速度和直接访问数据字段。cols是ColumnVector的数组,size是行数。
ColumnVector是不同类型列的父类型,并且具有一些跨所有列类型共享的字段。示例如下:
noNulls标志;isRepeating标志。noNulls == false的列,如果该值(isNull)为空,则isNull数组为真public abstract class ColumnVector {/** Reference count.