hive作为hadoop的生态系统的重要的一环,将关系型数据库和hadoop生态系统连接了起来。 而hive支持类sql结构化语句查询,所以有时候就需要优化它。 hive的执行是由mapreduce驱动的,所以hive的优化也需要去配置mapreduce。 ========================优化原则总结======================== join连接时的优化:当三个或多个以上的表进行join操作时,如果每个on使用相同的字段连接时只会产生一个mapreduce。 join连接时的优化:当…