本工具源码来自 EnMAP-Box,重新进行了封装
随机森林简介
作为新兴起的、高度灵活的一种机器学习算法,随机森林(Random Forest,RF)拥有广泛的应用前景。随机森林就是通过集成学习的思想将多棵树集成的一种算法,它的基本单元是决策树,而它的本质属于机器学习的一大分支—集成学习(Ensemble Learning)方法。从直观角度来解释,每棵决策树都是一个分类器,那么对于一个输入样本,N棵树会有N个分类结果。而随机森林集成了所有的分类投票结果,将投票次数最多的类别指定为最终的输出。
随机森林的特点
随机森林是一种很灵活实用的方法,具有如下几个特点:
在当前所有算法中,具有极好的准确率
能够有效地运行在大数据集上
能够处理具有高维特征的输入样本,而且不需要降维
能够评估各个特征在分类问题上的重要性
在生成过程中,能够获取到内部生成误差的一种无偏估计
对于缺省值问题也能够获得很好得结果
实际上,随机森林的特点不只有这六点,它就相当于机器学习领域的Leatherman(多面手),你几乎可以把任何东西扔进去,它基本上都是可供使用的。在估计推断映射方面特别好用,以致都不需要像SVM那样做很多参数的调试。
具体的随机森林介绍可以参见随机森林主页:https://www.stat.berkeley.edu/~breiman/RandomForests/cc_home.htm#inter
以上内容摘自:
http://www.cnblogs.com/maybe2030/p/4585705.html
基本功能
基于随机森林算法实现影像监督分类。
版本要求
ENVI5.3及以上。
工具安装方法
有以下两种安装方式,推荐使用ENVI App Store安装该扩展工具。
ENVI App Store安装
1)ENVI App Store工具见
http://www.enviidl.com/appstore
2)在ENVI App Store找到“随机森林分类工具”,点击Install App进行安装。
3)重启ENVI。
手动安装
https://pan.baidu.com/s/19jDShxRy6zctzDAstZwIWw
密码:qppt
2)下载ENVIRandomForestClassification.zip,将解压后的custom_code、extensions文件夹拷贝到…ENVI5X下,覆盖并替换;
3)重启ENVI。
使用说明
一.启动
在Tool Box中,打开/Extensions/Random Forest Classification,工具界面如下图所示。
图Random Forest分类工具参数面板
二.参数设置
Input Raster:待分类影像,有以下两个要求。
1)必须是ENVI标准格式数据(二进制文件+*.hdr头文件),若不满足,则会有以下提示(以*.tif为例):
2)在选择“Input Raster”时,不能进行空间、光谱裁剪或掩膜,否则会有以下提示:
Input Train ROIs:训练样本,格式为*.xml或者*.roi;可基于ROI工具构建。对于ENVI 5.3及5.3.1,在选择Input Train ROIs有可能弹出如下提示:
解决方法有两个:
1)启动工具前就将训练样本和与之关联的待分类影像在ENVI中打开;
2)在选择“Input Raster”时同时选中待分类影像和训练样本并打开。
Number of Trees:随机森林树的数量,值越大,构建耗时越长,反之用时越少。默认为100
Number of Features:特征数量,默认使用“Square Root”方法,即Number of Features=sqrt(nb);若选择“Log”方法,则Number of Features=log(nb)。其中nb为输入的待分类影像波段数
Min Node Samples:Minimum number of samples to stop splitting(……翻译不到位,请自行理解吧)
Min Impurity:Minimum impurity to stop splitting(……翻译不到位,请自行理解吧)
Display Result:是否在ENVI中显示分类结果,默认为“Yes”
Output Raster:分类结果输出路径
三、RF分类示例
对于Random Forest分类参数,一般保持默认即可(RF的一大优势,即基本不需要调参即可获得良好的分类结果)。综上,笔者以一景Landsat-5 TM数据为例,在影像上均匀选取居民地、水体、休耕地、留茬耕地和绿植耕地样本,使用Random Forest分类工具默认参数进行监督分类,得到分类结果如下:
图RF分类结果(左,分类结果;右,Landsat-5 TM标准假彩色显示)
领取专属 10元无门槛券
私享最新 技术干货