前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >ERROR Shell:396 - Failed to locate the winutils binary in the hadoop binary path java.io.IOE...

ERROR Shell:396 - Failed to locate the winutils binary in the hadoop binary path java.io.IOE...

作者头像
bboy枫亭
发布于 2020-09-22 03:25:45
发布于 2020-09-22 03:25:45
1.6K0
举报
文章被收录于专栏:csdn_blogcsdn_blog

ERROR Shell:396 - Failed to locate the winutils binary in the hadoop binary path java.io.IOException: Could not locate executable null\bin\winutils.exe in the Hadoop binaries.

文章目录

1. 错误描述

刚配置完 windows 的 pySpark 开发环境,cmd 执行 pyspark报这个错误,貌似不影响使用,但是看着是真的难受。

2. 解决步骤

2.1 下载对应版本的 hadoop 文件并解压配置。

下载所安装的 Spark 版本对应的 Hadoop 版本的压缩包,找个目录进行解压。

比如我当时解压安装的是 spark-2.3.1-bin-hadoop2.6.tgz,那么我就要下载 hadoop2.6.x 的版本。

2.2 copy 文件到 Sysytem32

xx\xx\hadoop-2.6.5\bin 下的 hadoop.dll 文件和 winutils.exe 文件拷贝到 C:\Windows\System32 下面各一份(若有文件重复,忽略此步骤)

2.3 配置 hadoop 环境变量

(1)新建系统环境变量 HADOOP_HOME ,值为刚刚解压的 hadoop 所在目录。

(2)修改 path 变量:添加一项配置 %HADOOP_HOME%\bin

(3)测试 hadoop 环境变量配置成功没有。

出现版本信息即可。

2.4 测试

这个时候再来试一下,发现不报错了。

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2020/09/21 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
windows下搭建spark测试环境
在windows 环境中搭建简单的基于hadoop 的spark 环境,进行本地化测试。
数字悠客
2020/07/31
2.3K0
hadoop_eclipse及HDT插件的使用
Hadoop Development Tools (HDT)是开发hadoop应用的eclipse插件,http://hdt.incubator.apache.org/介绍了其特点,安装,使用等,针对
甜橙很酸
2018/06/20
6680
我攻克的技术难题:大数据小白从0到1用Pyspark和GraphX解析复杂网络数据
在本文中,我们将详细介绍如何在Python / pyspark环境中使用graphx进行图计算。GraphX是Spark提供的图计算API,它提供了一套强大的工具,用于处理和分析大规模的图数据。通过结合Python / pyspark和graphx,您可以轻松地进行图分析和处理。
努力的小雨
2024/01/18
6490
干货--安装eclipse-hadoop-plugin插件及HDFS API编程两个遇到的重要错误的解决
在Windows的eclipse上写hdfs的API程序,都会遇到两个错误,在网上查了很多资料,都没有解决的办法,经过了很多时间的研究,终于把这个问题解决了 错误是 1.java.io.IOException :HADOOP_HOME or hadoop.home.dir are not set. 2.java.io.IOException:could not locate executable D:\hadoop-2.6.4\hadoop-2.6.4\bin/winutils.exe in the
汤高
2018/01/11
1.2K0
干货--安装eclipse-hadoop-plugin插件及HDFS API编程两个遇到的重要错误的解决
使用Python写spark 示例
个人GitHub地址: https://github.com/LinMingQiang
py3study
2020/01/10
1.3K0
详解Window10下使用IDEA搭建Hadoop开发环境
经过三次重装,查阅无数资料后成功完成hadoop在win10上实现伪分布式集群,以及IDEA开发环境的搭建。一步一步跟着本文操作可以避免无数天坑。
时代疯
2021/07/22
3.6K0
windows 安装 spark 及 pycharm 调试 TopN 实例
首先声明本文搭建的环境为:windows8.1 + spark1.6.0 + python2.7 + jdk8,spark on windows 对 windows及python版本不怎么挑,但是对 spark 版本要求极其苛刻,比如 spark1.6.1 就无法运行。 1、安装 jdk 安装spark第一步就是安装jdk(无论windows还是linux),spark执行依赖jdk。在oracle官网上下载jdk,这里我选择的是8u74 windows x64版本,你也可以根据自己的需求下载,jdk的安装
用户1177713
2018/02/24
2.2K0
windows 安装 spark 及 pycharm 调试 TopN 实例
java.io.IOException: Could not locate executable null\bin\winutils.exe in the Hadoop binaries.
本文介绍了如何在Windows系统下配置Hadoop环境,并实现通过Java操作HBase进行数据表创建、删除、更新和查询。主要包括了配置环境变量、配置Hadoop、创建HBase表、使用HBase Java API进行操作等步骤。在开发过程中需要注意一些细节,例如环境变量配置、HBase和Hadoop的版本适配问题等。通过本文的介绍,可以帮助开发人员快速搭建起一套可运行的Hadoop和HBase集成环境,为进一步的Hadoop和HBase应用开发提供支持。
别先生
2018/01/02
1.4K0
hadoop报错解决方案---安装系列三
操作过程中主要出现以下几个错误: Unsupported major.minor version 51.0 处理办法: eclipse下的项目的jdk环境和liux下的jdk环境不一致,将windows下的eclipse中的jdk环境与linux的环境更改一致 切换linux的jdk版本为1.7: 上传jdk7压缩包并解压 配置jdk变量 vi /etc/profile 在终端里面输入: alternatives  --install   /usr/bin/java  java  /usr/local/jvm/jdk1.7.0_79/bin/java 300 alternatives  --install   /usr/bin/java  java  /usr/lib/jvm/jdk1.8.0_101/bin/java 300   jdk1.8.0_101为之前安装的jdk 如想切换至1.8 还需更改环境变量/etc/profile 红色部分自行修改目录(安装JDK的目录) 接着执行alternatives  --config  java 输入想要切换的jdk序号 Java -version 在myeclipse里添加1.7的jdk,创建java项目时选择jdk版本为1.7 重启hadoop集群报错: java.net.BindException: Port in use: 0.0.0.0:50070 Caused by: java.net.BindException: Address already in use 处理办法: 1)sudo lsof -i:端口 -P 2)sudo kill -9 PID 以50070端口为例: sudo lsof -i:50070 -P 控制台输出内容: COMMAND  PID USER   FD   TYPE             DEVICE SIZE/OFF NODE NAME   java   6501 root  189u  IPv4 0x782e003217773193      0t0  TCP *:50070 (LISTEN) 然后kill掉: sudo kill -9 6501 hadoop主节点缺少NameNode log信息: java.io.FileNotFoundException:/home/hadoop/app/dfs/name/in_use.lock (Permission denied) 处理办法: 有两种场景出现 1):在原来正常的时候,有一次突然使用了原来不同的用户启动了一次hadoop。这种场景会产生一个in_use.lock 文件夹在你设置的目录中,这时候可以删除这个文件夹直接,然后重新启动 2):在格式化hadoop的时候和当期启动的用户不是同一个,也会导致该问题。这个时候可以使用格式化hadoop的那个用户重新启动hadoop。也可以解决此错误。 hadoop主节点缺少SecondaryNameNode log信息: Cannot lock storage /home/hadoop/app/tmp/dfs/namesecondary. The directory is already locked 处理办法:删除该目录 java项目运行不报错 处理办法: 新建一个文件,命名为“log4j.properties”,放到src目录下。向里填入一下信息: log4j.rootLogger=INFO, stdout log4j.appender.stdout=org.apache.log4j.ConsoleAppender log4j.appender.stdout.layout=org.apache.log4j.PatternLayout log4j.appender.stdout.layout.ConversionPattern=%d %p [%c] - %m%n log4j.appender.logfile=org.apache.log4j.FileAppender log4j.appender.logfile.File=target/spring.log log4j.appender.logfile.layout=org.apache.log4j.PatternLayout log4j.appender.logfile.layout.ConversionPattern=%d %p [%c] - %m%n 保存后重新运行 通过java接口向hbase插入一张表时报错:  [org.apache.hadoop.util.NativeCodeLoader] - Unable to load native-h
Dlimeng
2023/06/29
3280
Windows 安装配置 PySpark 开发环境(详细步骤+原理分析)
这个比较简单,安装原生的 Python 或者 Anaconda 都可以,至于步骤这里就不多说了。
bboy枫亭
2020/09/22
16K0
Windows 安装配置 PySpark 开发环境(详细步骤+原理分析)
win10搭建hadoop和spark
jdk8-x64:https://www.oracle.com/java/technologies/javase-jdk8-downloads.html
静谧星空TEL
2021/04/27
1.1K0
win10搭建hadoop和spark
Windows下搭建Spark+Hadoop开发环境
1. 下载Hadoop2.7.1版本(写Spark和Hadoop主要是用到了Yarn,因此Hadoop必须安装)
全栈程序员站长
2022/07/20
4520
Windows启动HDFS报错 - Could not locate Hadoop executable: E:\soft_work\hadoop-2.6.0\bin\winutils.exe
Windows 7 环境下启动 HDFS,执行 start-dfs.cmd 出现Could not locate Hadoop executable: E:\soft_work\hadoop-3.0.0\bin\winutils.exe,报错信息如下:
夹胡碰
2020/10/27
1K0
Win10+Python3.6配置Spark创建分布式爬虫
介绍Spark在Win 10系统中的的安装、配置以及在分布式爬虫中的使用,Python版本为3.6.8。
Python小屋屋主
2019/12/13
9080
Win10+Python3.6配置Spark创建分布式爬虫
Windows10系统下Hadoop和Hive开发环境搭建填坑指南
笔者目前需要搭建数据平台,发现了Windows系统下,Hadoop和Hive等组件的安装和运行存在大量的坑,而本着有坑必填的目标,笔者还是花了几个晚上的下班时候在多个互联网参考资料的帮助下完成了Windows10系统下Hadoop和Hive开发环境的搭建。这篇文章记录了整个搭建过程中的具体步骤、遇到的问题和对应的解决方案。
Throwable
2020/11/05
1.7K0
Windows10系统下Hadoop和Hive开发环境搭建填坑指南
pyspark在windows的安装和使用(超详细)
本文主要介绍在win10上如何安装和使用pyspark,并运行经典wordcount示例,以及分享在运行过程中遇到的问题。
languageX
2023/03/01
8.2K0
spark+hadoop集群搭建
环境: hadoop-2.6.5 spark-2.3.0 scala-2.12.5
foochane
2019/05/23
2K0
spark+hadoop集群搭建
本机连接Spark Standalone--最简单的spark调试方式
去官网 http://spark.apache.org/downloads.html 选择对应版本下载 tar包
大数据流动
2019/08/08
1.6K0
python 安装spark_Spark环境搭建 (Python)
—————————————————————————————————— 2018-5-11更新
学到老
2019/02/14
1.1K0
2021年大数据Hadoop(十二):HDFS的API操作
HDFS在生产应用中主要是客户端的开发,其核心步骤是从HDFS提供的api中构造一个HDFS的访问客户端对象,然后通过该客户端对象操作(增删改查)HDFS上的文件。
Lansonli
2021/10/11
1.2K0
相关推荐
windows下搭建spark测试环境
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档