Java操作Hadoop集群文件的步骤
更新时间:2023-12-19 23:01:01 阅读量: 教育文库 文档下载
Java操作Hadoop集群文件的步骤
2016年7月19日22:31:26 Huangxin[永州职业技术学院]
大家可以到百度搜索【数据堂】,里面有很多各种行业的大数据文件
0.配置Eclipse。先把Linux里面的/usr/hadoop/lib里面的jar包。和/usr/hadoop里面的jar包全部拷贝到Windows里面的Eclipse里面(选中java工程名,然后Ctrl+V),然后选中所有的jar包右键—>【构建路径】-?【配置构建路径】
1. 关闭 linux的防火墙 Chkconfig iptables off
2. 修改linux里面的master 主机里面的 /usr/hadoop/conf里面的hdfs-site.xml文件
在里面添加一个属性
意思就是不检查权限。 然后在hadoop集群里面,重启集群(先stop-all.sh然后start-all.sh)关闭安全模式(hadoop dfsadmin –safemode leave) 3. 在Eclipse里面编写程序操作hadoop集群里面的文件。 ① 取文件
步骤:A:获取到HDFS配置文件
Configuration conf2 = new Configuration();
B:得到HDFS文件系统
FileSystemhdfs=FileSystem.get(newURI(\.137.200:9000\
C:读取文件
FSDataInputStream is = hdfs.open(new
Path(\
D:输出
IOUtils.copyBytes(is, System.out, 30, true); 这里要注意的问题:1.import 引包: (这里针对的是那些不能自动引包的用户)
import java.net.*;
import org.apache.hadoop.fs.*; import org.apache.hadoop.conf.*; importorg.apache.hadoop.io.IOUtils; import org.apache.hadoop.fs.Path;
importorg.apache.hadoop.hdfs.server.common.*; ② 新建文件夹
//创建文件夹
Configuration con3 = new Configuration();
// FileSystem hdfs2 = FileSystem.get(new URI(\
// Path path = new Path(\ if(!hdfs2.exists(path)) { hdfs2.mkdirs(path); } ③ 新建文件
//创建文件夹
Configuration con3 = new Configuration();
// FileSystem hdfs2 = FileSystem.get(new URI(\
// Path path = new Path(\ if(!hdfs2.exists(path)) { hdfs2.mkdirs(path); }
④ 文件的拷贝(从Windows到Hadoop集群)
//然后创建一个文件
Path path2 = new Path(\
if(!hdfs2.exists(path2)) {
hdfs2.createNewFile(path2); }
有两种方法。方法1.使用流
Configuration conf0 = new Configuration(); FileSystem hdfs0 = FileSystem.get(new URI(\
Path path = new
Path(\
//创建一个,创建该文件的输出流
FSDataOutputStream fos = hdfs0.create(path); //z在Windows上读取一个文件
FileInputStream fis = new FileInputStream(new File(\
// //
IOUtils.copyBytes(fis, fos, 30, true);
方法2.使用hdfs里面自带的copyFromLocalFile(src,dsc) Configuration conf0 = new Configuration(); FileSystem hdfs0 = FileSystem.get(new URI(\
Path path1 = new
Path(\
Path path2 = new Path(\
hdfs0.copyFromLocalFile(path2, path1); ⑤ 重命名文件
//重命名文件
Configuration conf0 = new Configuration();
FileSystem hdfs0 = FileSystem.get(new URI(\
//定位文件 //源文件
Path path = new
Path(\
//目标文件
Path path2 = new Path(\//注意了,不但可以重命名,还移动了位置
hdfs0.rename(path, path2);
⑥ 从HDFS文件系统,拷贝文件到Windows里面 方法1.
Configuration conf0 = new Configuration();
FileSystem hdfs0 = FileSystem.get(new URI(\
//定位HDFS上面文件
Path path = new Path(\//建立文件输入流(从文件里面读到HDFS里面) FSDataInputStream fis = hdfs0.open(path); //定位Windows上面的文件
File file = new File(\
//
//创建一个输出流(从HDFS写入到Windows里面)
FileOutputStream fos = new FileOutputStream(file);
//
IOUtils.copyBytes(fis, fos, 30, true);
//方法2。
Configuration conf0 = new Configuration(); FileSystem hdfs0 = FileSystem.get(new URI(\
//定位HDFS上面文件
Path path = new Path(\
//定位Windows上面的文件
Path path2 = new
Path(\
//
hdfs0.copyToLocalFile(path, path2);//现在我是子
HDFS文件系统上面,所以使用下载to
⑦ 删除文件
Configuration conf0 = new Configuration(); FileSystem hdfs0 = FileSystem.get(new URI(\
Path path = new
Path(\
hdfs0.delete(path, true);//true表示的是递归删除
正在阅读:
Java操作Hadoop集群文件的步骤12-19
2019-2020年高三语文下学期综合练习试题(一)(I)10-10
刘飞:收缴违纪违法财物应遵循五大原则12-25
秋天的泰山作文500字07-14
社会文化理论的主要内容01-22
外国人名汉译的五大原则06-18
DF8B故障处理 - 图文11-14
ICU健康教育08-09
- exercise2
- 铅锌矿详查地质设计 - 图文
- 厨余垃圾、餐厨垃圾堆肥系统设计方案
- 陈明珠开题报告
- 化工原理精选例题
- 政府形象宣传册营销案例
- 小学一至三年级语文阅读专项练习题
- 2014.民诉 期末考试 复习题
- 巅峰智业 - 做好顶层设计对建设城市的重要意义
- (三起)冀教版三年级英语上册Unit4 Lesson24练习题及答案
- 2017年实心轮胎现状及发展趋势分析(目录)
- 基于GIS的农用地定级技术研究定稿
- 2017-2022年中国医疗保健市场调查与市场前景预测报告(目录) - 图文
- 作业
- OFDM技术仿真(MATLAB代码) - 图文
- Android工程师笔试题及答案
- 生命密码联合密码
- 空间地上权若干法律问题探究
- 江苏学业水平测试《机械基础》模拟试题
- 选课走班实施方案
- 集群
- 步骤
- 操作
- 文件
- Hadoop
- Java
- 2013-2014 东财《经济学B》题库以及答案
- 何时获得最大利润说课稿
- 1.2和1.4m方柱钢模板计算书
- 本人能够认真贯彻执行党的路线
- 文明修身小结
- 整合教育资源 实现教育公平调研报告
- 2017年尔雅网课《中国历史人文地理(上)》期末考试题目及答案
- 降低国家助学贷款违约率之我见
- 国家基本公共卫生服务 - 预防接种规范考试
- 模电期末汇总
- 大管轮轮机基础 辅机部分 题库
- 4B、5A词汇、句型整理
- 地基处理灰土换填施工方案
- 浅谈如何做好新兵下连后的思想政治教育工作
- 从空中看风景
- 八年级物理物态变化单元检测试题A
- 医药信息检索作业重点归纳
- 青岛版小学数学一年级下册《厘米的认识》听课评课记录
- 刑事诉讼原理与律师攻防顾永忠4
- 测量沉降位移观测实习报告