Java操作Hadoop集群文件的步骤
更新时间:2024-03-04 13:55:01 阅读量: 综合文库 文档下载
Java操作Hadoop集群文件的步骤
2016年7月19日22:31:26 Huangxin[永州职业技术学院]
大家可以到百度搜索【数据堂】,里面有很多各种行业的大数据文件
0.配置Eclipse。先把Linux里面的/usr/hadoop/lib里面的jar包。和/usr/hadoop里面的jar包全部拷贝到Windows里面的Eclipse里面(选中java工程名,然后Ctrl+V),然后选中所有的jar包右键—>【构建路径】-?【配置构建路径】
1. 关闭 linux的防火墙 Chkconfig iptables off
2. 修改linux里面的master 主机里面的 /usr/hadoop/conf里面的hdfs-site.xml文件
在里面添加一个属性
意思就是不检查权限。 然后在hadoop集群里面,重启集群(先stop-all.sh然后start-all.sh)关闭安全模式(hadoop dfsadmin –safemode leave) 3. 在Eclipse里面编写程序操作hadoop集群里面的文件。 ① 取文件
步骤:A:获取到HDFS配置文件
Configuration conf2 = new Configuration();
B:得到HDFS文件系统
FileSystemhdfs=FileSystem.get(newURI(\.137.200:9000\
C:读取文件
FSDataInputStream is = hdfs.open(new
Path(\
D:输出
IOUtils.copyBytes(is, System.out, 30, true); 这里要注意的问题:1.import 引包: (这里针对的是那些不能自动引包的用户)
import java.net.*;
import org.apache.hadoop.fs.*; import org.apache.hadoop.conf.*; importorg.apache.hadoop.io.IOUtils; import org.apache.hadoop.fs.Path;
importorg.apache.hadoop.hdfs.server.common.*; ② 新建文件夹
//创建文件夹
Configuration con3 = new Configuration();
// FileSystem hdfs2 = FileSystem.get(new URI(\
// Path path = new Path(\ if(!hdfs2.exists(path)) { hdfs2.mkdirs(path); } ③ 新建文件
//创建文件夹
Configuration con3 = new Configuration();
// FileSystem hdfs2 = FileSystem.get(new URI(\
// Path path = new Path(\ if(!hdfs2.exists(path)) { hdfs2.mkdirs(path); }
④ 文件的拷贝(从Windows到Hadoop集群)
//然后创建一个文件
Path path2 = new Path(\
if(!hdfs2.exists(path2)) {
hdfs2.createNewFile(path2); }
有两种方法。方法1.使用流
Configuration conf0 = new Configuration(); FileSystem hdfs0 = FileSystem.get(new URI(\
Path path = new
Path(\
//创建一个,创建该文件的输出流
FSDataOutputStream fos = hdfs0.create(path); //z在Windows上读取一个文件
FileInputStream fis = new FileInputStream(new File(\
// //
IOUtils.copyBytes(fis, fos, 30, true);
方法2.使用hdfs里面自带的copyFromLocalFile(src,dsc) Configuration conf0 = new Configuration(); FileSystem hdfs0 = FileSystem.get(new URI(\
Path path1 = new
Path(\
Path path2 = new Path(\
hdfs0.copyFromLocalFile(path2, path1); ⑤ 重命名文件
//重命名文件
Configuration conf0 = new Configuration();
FileSystem hdfs0 = FileSystem.get(new URI(\
//定位文件 //源文件
Path path = new
Path(\
//目标文件
Path path2 = new Path(\//注意了,不但可以重命名,还移动了位置
hdfs0.rename(path, path2);
⑥ 从HDFS文件系统,拷贝文件到Windows里面 方法1.
Configuration conf0 = new Configuration();
FileSystem hdfs0 = FileSystem.get(new URI(\
//定位HDFS上面文件
Path path = new Path(\//建立文件输入流(从文件里面读到HDFS里面) FSDataInputStream fis = hdfs0.open(path); //定位Windows上面的文件
File file = new File(\
//
//创建一个输出流(从HDFS写入到Windows里面)
FileOutputStream fos = new FileOutputStream(file);
//
IOUtils.copyBytes(fis, fos, 30, true);
//方法2。
Configuration conf0 = new Configuration(); FileSystem hdfs0 = FileSystem.get(new URI(\
//定位HDFS上面文件
Path path = new Path(\
//定位Windows上面的文件
Path path2 = new
Path(\
//
hdfs0.copyToLocalFile(path, path2);//现在我是子
HDFS文件系统上面,所以使用下载to
⑦ 删除文件
Configuration conf0 = new Configuration(); FileSystem hdfs0 = FileSystem.get(new URI(\
Path path = new
Path(\
hdfs0.delete(path, true);//true表示的是递归删除
正在阅读:
Java操作Hadoop集群文件的步骤03-04
七年上英语Starter Unit105-09
2017年郑州大学联合培养单位许昌学院655数学分析考研冲刺密押题05-03
小学数学第一册教案集锦学科信息04-30
环境激素对鱼类影响的研究进展03-04
悼念湖北省大冶市保安镇芦嘴(咀)村党支部老书记周国才爷爷09-09
2014-2019年中国椰子汁市场深度研究与投资前景调研报告04-17
中国石油天然气股份有限公司进入受限空间作业安全管理办法11-17
重点地区排查整治自检自查工作总结04-29
工贸企业安全生产标准化评审办法和评审实务04-22
- 多层物业服务方案
- (审判实务)习惯法与少数民族地区民间纠纷解决问题(孙 潋)
- 人教版新课标六年级下册语文全册教案
- 词语打卡
- photoshop实习报告
- 钢结构设计原理综合测试2
- 2014年期末练习题
- 高中数学中的逆向思维解题方法探讨
- 名师原创 全国通用2014-2015学年高二寒假作业 政治(一)Word版
- 北航《建筑结构检测鉴定与加固》在线作业三
- XX县卫生监督所工程建设项目可行性研究报告
- 小学四年级观察作文经典评语
- 浅谈110KV变电站电气一次设计-程泉焱(1)
- 安全员考试题库
- 国家电网公司变电运维管理规定(试行)
- 义务教育课程标准稿征求意见提纲
- 教学秘书面试技巧
- 钢结构工程施工组织设计
- 水利工程概论论文
- 09届九年级数学第四次模拟试卷
- 集群
- 步骤
- 操作
- 文件
- Hadoop
- Java
- 不需要处方的13个天然抗生素 - 图文
- 关于成立安全环保领导小组的通知
- 思科第一学期第七章试题+答案
- 成都七中育才14届初三下语文3月阶段性考试答题卷(2)
- 金融专业个人求职简历模板-范文模板(2页)
- 人教版小学数学二年级下册期末试卷1-3
- 自动控制原理试卷A答案
- 整合教育资源 实现教育公平调研报告
- 初二物理简单运动 测量 单元测试
- 我们的文化、经济权利
- 2014秋季4年级课次学生版
- 15年中考化学专题训练 - 巧计算
- 国家基本公共卫生服务 - 预防接种规范考试
- 数学课堂效率提高的手段之一
- 何时获得最大利润说课稿
- 关于开展5s整顿的通知
- 2014华师中小学班主任在线作业答案
- 安全现状评价所需资料清单
- 小学科学教师专业素质竞赛试卷附答案
- 强化六大措施做好就业服务工作