基于云计算的多重查询优化系统
葛星 沈耀 徐常亮
在常规海量数据分析作业中,CPU / IO 密集型的查询语句通常复杂、耗时并存在大量可复用的公共部 分。如何检测、共享和复用回归查询集中语句间的公共部分成为亟需解决的问题。为此,提出特征值索引方 法,并构建适用于云计算场景的LSShare 多重查询优化系统。基于查询语句的抽象语法树将语句划分为不同的 查询层次,针对每个查询层次抽取特征向量并计算特征值。建立简单高效的特征值索引表以识别多重查询语 句间的公共部分,并结合SQL 重写技术来复用其中的公共部分。随着运行迭代次数的增加,LSShare 系统将逐 步优化云计算场景中的回归查询集。实验结果表明,该系统在运行效率上优于传统查询语句系统,可节约近1/3的执行时间。
基于云计算的多重查询优化系统