1.准备Linux环境
1.0先将虚拟机的网络模式选为NAT
1.1修改主机名
vi /etc/sysconfig/networkNETWORKING=yes
HOSTNAME=mini11.2修改IP
两种方式:
第一种:通过Linux图形界面进行修改(强烈推荐)
... waitig 3年前 (2017-09-10) 538℃ 0评论 0赞
HIVE是基于Hadoop的一个数据仓库,可以将结构化的数据文件映射成一张表,并提供类SQL的查询语句,其SQL操作的基本原理是MapReduce,在本文最后的例子中,可以发现在某些操作时,Hive SQL其实是调用了MapReduce过程进行处理,因此使用Hive可以完成数据... waitig 3年前 (2017-09-09) 754℃ 0评论 0赞
什么是Hadoop?
Hadoop是Apache的一款开源框架,使用java语言编写,可以通过编写简单的程序来实现大规模数据集合的分布式计算。工作在Hadoop框架上的应用可以工作在分布式存储和计算机集群计算的环境上面。Hadoop具有高扩展性,其集群能够从单台机器扩展到数千台机... waitig 3年前 (2017-09-03) 519℃ 0评论 0赞
问题导读:
1.hadoop编程需要哪些基础?
2.hadoop编程需要注意哪些问题?
3.如何创建mapreduce程序及其包含几部分?
4.如何远程连接eclipse,可能会遇到什么问题?
5.如何编译hadoop源码?
阅读此篇文章,需要些基础下面两篇文章
... waitig 3年前 (2017-08-31) 631℃ 0评论 0赞
一,HA的架构
Hadoop HA 即Hadoop的高可用,不同于普通的namenode+second namenode的模式,second namenode只能作为namenode的冷备份,当namenode挂掉后,second namenode不能自动充当namenode的角... waitig 3年前 (2017-08-29) 818℃ 0评论 0赞
1.start-dfs.sh
2./home/hadoop/apps/spark-1.6.1-bin-hadoop2.6/sbin/start-all.sh
3./home/hadoop/apps/spark-1.6.1-bin-hadoop2.6/bin/spark-she... waitig 3年前 (2017-08-27) 1024℃ 0评论 0赞
HDFS java API Base
首先要拷贝hadoop配置文件 和 log4j.properties 到maven项目的类路径(e.g. resources 目录)
<!-- hadoop客户端依赖包-->
<dependency>
<... waitig 3年前 (2017-08-25) 804℃ 0评论 0赞
vi /etc/profile
JAVA_HOME=/usr/java/jdk1.8.0_131
CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar
SCALA_HOME=/usr/local/scala-2.1... waitig 4年前 (2017-05-06) 920℃ 0评论 0赞
在使用Hadoop建立文件的时候,出现“Cannot create directory /user/hadoop/input. Name node is in safe mode.”问题的原因及解决方案问题描述
将本地文件复制到hdfs上去或者在hafs上新建文件时会出现“... waitig 5年前 (2015-08-31) 4670℃ 0评论 2赞