Hi.
我是一个在UTS读IT专业,数据分析方向的小辣鸡。
About Me
作为数据分析的研究生,python这门语言基本上涵盖了所有课程,但是我们在学习它的时候遇到了许多问题,比如不熟悉基础的packge的调用和一些参数的设置,导致在导入数据以后得出的精确度不够, recall不平滑。与此同时,我在上网找相关的阅读资料的时候,由于数据不同,需要诠释的东西不同,网络上给出的代码不能够很好的fit这个数据。
根据以上的原因,我决定做一个自己的公众号,对平时作业中的数据做一点数据分析啥的,或者做一点可视化的东西(基本上是很漂亮的图啦),给朋友圈的大神前辈看一看,帮我做一点改进。
KNIME
UTS第一节数据分析基础课(Fundamental of Data Analytics), 对于数据分析初学者,老师介绍的是以KNIME这个软件作为数据分析的入门,原因是初学者对于计算机程序语言不熟悉,而KNIME是一个图形用户界面的数据挖掘软件,很好的克服了这个初学者的通病。如果用户需要导入数据或者调用某个算法,只需要从工具栏中把它拉到空白的panel里面,像这样:
看见那个CSV Reader了吗?把它往界面上拖过去。
出来以后是这样:
一般把nodes拉出来以后进行配置,导入数据,把想用到的算法放进去,设置参数,评价模型,就可以啦,这里附上KNIME的下载地址:https://www.knime.com/。
至此,由于KNIME是个很呆的东西,众所周知,我不喜欢呆的东西,所以就不介绍了,不过借此机会,给大家看看我的工作流也是可以的,一般呢,有这样的:
或者这样的,
怎么样,这个逼装的还可以吧......
Python
不好意思献丑了,继续说,对于数据分析的学者来说,python是一个很棒的工具,2017年IEEE发布的编程语言排行榜中,Python首局高位「1」。因为python语言更人性化,入门简单,如果你用c语言编写一个程序需要一万行,那么java就需要一千行,而python只需要一百行就可以做到,更厉害的是, python中自带的包和一些算法省去了很多麻烦事,一个程序最短可以用9行代码做出来,就非常棒了。
但是python也有自己的缺点,比如运行速度慢,就像刚才说的一万行c语言的程序可能需要运行十秒,而python可能需要运行1000秒,很多东西都是相对的,既然选择了其编写便捷性,就需要放弃运行时间。比如我,虽然我长得帅还非常优秀,但我也有别的自己没发现的缺点...
1.安装
我忘了,自己想着装吧...但是别忘了除了python3.7 版本以外,还要给它装一个用户界面,就是anaconda。
2.打开anaconda
这个简单,打开电脑上的终端(terminal),在里面输入jupyter notebook,就进去了。
进去以后的界面是这样的:
我们进入的这个界面类似于一个文件夹,新建一个文件,就可以开始敲代码了,具体内容我今天打不动了,下次再说吧。。
Reference
1.http://36kr.com/p/5084329.html
领取专属 10元无门槛券
私享最新 技术干货