老***蒋
elasticsearch-Hadoop是一个深度集成Hadoop和ElasticSearch的项目,也是ES官方来维护的一个子项目,通过实现Hadoop和ES之间的输入输出,可以在Hadoop里面对ES集群的数据进行读取和写入,充分发挥Map-Reduce并行处理的优势,为Hadoop数据带来实时搜索的可能。 项目网址:http://www.elasticsearch.org/overview/hadoop/ 运行环境: CDH4、ElasticSearch0.90.2 http://www.cloudera.com/content/cloudera-content/cloudera-docs/CDH4/latest/CDH4-Quick-Start/cdh4qs_topic_3_3.html https://github.com/medcl/elasticsearch-rtf Hive和ES的互操作: #安装,HIVE里面添加ElasticSearch-Hadoop的JAR路径 #下载hadoop-es jar包,https://download.elasticsearch.org/hadoop/hadoop-latest.zip