本文会简单介绍一下Weka软件的特点
和作为零基础,学习机器学习的感(xue) 想(lei)。
01
机器学习 与 Weka
机器学习
站在概念层面理解,机器学习是一种数据驱动解决问题的手段。假设数据中存在某种规则,模式,我们这些规则我们一般无法获取。通过学习算法,我们可以让机器自己寻找蕴藏在数据内的模式。学习到模式后,下次再来对新数据做出决策和预测。
例如这样一个数据,sunny,85,85,FALSE,no(晴天,温度85,湿度85,不刮风,结果为这个人不出去玩)。机器学习找到规律后,我们可以预测在其他的天气情况下,这个人是不是会出去玩。
Weka
人工智能,机器学习,数据分析火爆的当下,每一个领域都在试图引入这些概念。而作为编程的新手,很难快速入门。
Weka是一款免费的基于Java环境下开源的机器学习和数据挖掘软件。Weka作为一个公开的数据挖掘工作平台,集合了大量能承担数据挖掘人物的机器学习算法,包括主要有六大功能:数据预处理;分类;聚类;关联规则;特征选择;可视化。
他以图形界面(GUI- graphic user interface) 的方式,实现了在新的交互界面的可视化。
Weka界面
数据预处理界面
Weka处理的数据是一个二维的表格,每一行是一个实例(instance),例如上面提到的 sunny,85,85,FALSE,no。载入这些实例后,他们的属性(attribute)分布都以可视化的方式展现。
数据分类界面(classify)
通过选择合适的分类器来实现预测功能。
02
作为完全的新手使用Weka面临的困难
不懂数学
对于数据和编程,我唯一的基础在于大一学习的简单版微积分,线性代数和visual basic编程。 优点在于数据和编程都是我比较喜欢的和还算擅长的东西。
这次跨专业参加了我校计算机系开设的研究生课程introduction to computation and data。这门课的核心在于以软件Weka为工具,学习数据挖掘和机器学习。
在我上这门课之前,老师的课程介绍说,是一门很简单的课,即使不会用电脑的人也完全可以学会。 而我信以为真参加了这门课之后发现我面临的最大的问题与电脑和编程无关,而是:不懂数学。
概念比工具重要
Weka作为一个工具,只是一个工具,他让我们省去了作为新手,在编程上的麻烦。而作为一门机器学习与数据挖掘的课,背后核心的在于基础知识:
分类:朴素贝叶斯算法(Naive Bayes),决策树(decision tree).....
概率论:期望(expectation), 离散(variance),大数定理(Law of large numbers), 中心极限定理( central limit theorem)
机器学习:分类,聚类,数据回归, 关联规则.......
.......
03
机器学习数据分析与设计师
由此可见,作为新手,入门要考虑的更多是对于基础概念和知识的理解。
说到底工具是工具,将来全民数据时代,一定会有更多类似于Weka的容易上手的工具给大家使用,作为设计师,或其他非码农专业,我们考虑的更多的是,这些工具怎样服务于我们,我们能通过这些做到什么。
现在是一个用户体验(User experience) 时代,全球化时代。过去,设计师用的是传统的经验式的思维。以个人的经验去判断和设计。而现在的产品,面向的受众是如此的广泛,经验已经不再可取。数据分析,是一种更可靠的方式。
有任何问题和想交流的内容,欢迎后台讨论,么么哒
Reference
知乎/维基百科/ Introduction to computation and data
领取专属 10元无门槛券
私享最新 技术干货