Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >我该选择谁? | SAS R Python的比较

我该选择谁? | SAS R Python的比较

作者头像
数说君
发布于 2018-04-04 08:55:08
发布于 2018-04-04 08:55:08
4.9K0
举报
文章被收录于专栏:数说工作室数说工作室

几天(上周日),我在分答上回答了一个问题,问题是:

Python,R,SPSS,SQL这类软件哪个最适合初学者入门以及进阶学习的顺序(以就业为导向)

语音中我从“职能方向”和“行业方向”聊了一下自己的看法,推荐的三个软件是SAS、R和Python。感兴趣的可以去我的分答“偷听”。

(二维码可以翻看之前推送的消息,或者在后台回复【fenda】获取,也可以在分答中搜索“数说君”,那个最帅的就是我)。

今天再推荐一篇文章作为补充资料,这篇文章讨论的就是SAS、R和Python这三个工具,从几个方面进行了比较,每个方面都给予了打分。

原文载于analyticsvidhya.com,作者Kunal Jain(原文见左下角“阅读原文”),数说工作室原创翻译,转载请注明微信号和微信ID


SAS vs. R (vs. Python) – which tool should I learn

SAS和R的比较已经是分析界最大的争论了,Python也值得一辩。本文再对这三个工具进行比较和讨论,希望大家可以从中获得收益。

难道这样的比较还不够多吗?

很多了!但是我仍然觉得有必要再讨论,因为:

  • 咱们这行日新月异,变化很快;
  • 此前的比较一直都不太重视Python,我认为现在咱们需要认真的考虑一下它;
  • 本文是从全球的角度来比较这三个工具的应用情况。

背景

关于这三者的简单介绍:

(1)SAS:在商业分析领域,它是无可争辩的霸主。SAS提供了丰富的统计功能,友好的GUI界面可以让分析师快速上手,技术支持也做的相当到位。但,太贵了,并且对于一些最新的统计分析方法,SAS更新比较慢。

(2)R:R可以看做SAS的一个“开源版本”,在学术研究上的应用一直很广泛。由于它是开源的,新的模型和算法也更新很快,并且网上有很多说明文档,是个蛮划算的选择。

(3)Python:最早是一个开源脚本语言,近几年使用率大增。如今一些库(如numpy、scipy和matplotlib)和函数的引入,也使得它能支持几乎所有统计分析和统计建模工作。另外也由于Pandas这个库,使得Python在结构化数据的处理上非常给力。

比较

我将从如下几个方面来比较这三个工具:

1. 成本 2. 易学性 3. 数据处理能力 4. 图形处理能力 5. 更新速度 6. 工作前景 7. 客服支持和社区资源

对于每一个方面,作者都给出了一个评分(1分最低、5分最高)。

1. 成本

SAS是商业软件,对于大部分分析师个人来说,是根本买不起的!但是SAS在机构或公司中拥有最高的市场份额。而R和Python是免费的,并且可以任意下载,所以我的评分是:

  • SAS - 2
  • R - 5
  • Python - 5

2. 易学性

首先,SAS非常容易上手,比如它的PROC SQL命令,对于任何一个学过SQL的人来说都可以立即上手。并且SAS有一个很好的GUI界面,网上有很多学习资源。SAS公司也提供了资格认证考试,当然,这又增加了学习者的成本。

R的使用要求懂一点编程,但它是一个低阶的编程语言,也因此一个简单的程序需要编写更长的代码。

在编程界,Python以简易性闻名,在数据分析界也是如此。虽然目前为止还没有一个很好的GUI界面,但我希望Python的notebook可以变得越来越主流,因为它非常方面编辑、记录与分享。

  • SAS - 4.5
  • R - 2.5
  • Python - 3.5

3. 数据处理能力

数据处理能力曾经一直是SAS的优势。R的计算都在RAM内存中进行,于是它的计算过程受限于32位机器的RAM内存大小。当然,这一切都将不再是问题(数说君注:由于机器的性能提升?),这三种软件都有非常好的数据处理能力并且可以并行计算

因此在我看来数据处理能力已经不能区分这三个工具(当然可能有一些我并不知道的创新),因此我给它们打分一样:

  • SAS - 4
  • R - 4
  • Python - 4

4. 图形处理能力

SAS在“功能性”图形处理上表现不错,然而仅仅是对“功能性”而言。如果你想对图进行一些定制化的修改,则需要去了解纷繁难懂的SAS图形包。

与其他2款软件相比,R在图形处理上的表现最好,有非常多的包可以帮你实现。

Python的表现居中,你不仅可以使用本地库(matplotlib),还可以调用R使用一些衍生库。

  • SAS - 3
  • R - 4.5
  • Python - 4

5. 更新速度

这三个工具都提供了基本的、以及最常用的分析函数,你可以应付大部分模型的构建。但假如,你正好需要使用最新最前沿的技术或算法怎么办?

R和Python由于其开源性,算法可以很快得到更新,R因为一直广泛使用于学术界,因此更新最快,SAS则要再下一个版本中得到更新。

但从另一方面来说,SAS的更新是自有的研发团队完成的,并且得到了很好的测试。而R和Python的更新是“公开贡献”的,出错的可能性要比较大。

  • SAS - 4
  • R - 4.5
  • Python - 4

6. 工作前景

全球而言,SAS仍然是公司和机构中使用最多的工具,尤其是大型公司。而R/ Python更多是初创公司的选择,或者是一些想要节约成本的公司。最近几年,R和Python在工作中的使用率增长很快,下面是网络上公开的,使用R和Python的工作数量趋势图:

在印度(数说君:作者是印度人),我估计SAS占据约70%的市场份额,R大概15%,而Python不到5%,但增长趋势与全球差不多。

  • SAS - 4.5
  • R - 3.5
  • Python - 2.5

7. 客服支持和社区资源

R有最大的在线社区,但没有客服支持,因此出现麻烦只能自己想办法解决,当然也会得到别人的很多帮助,Python也类似。

SAS有专门的客服支持系统,也有在线社区,所以如果遇到安装或者其他问题,你可以找他们解决。

  • SAS - 4
  • R - 3.5
  • Python - 3

(数说君:当然,这个评分在中国约等于没用,原因你懂的:-D)

8. 其他因素

还有几点值得注意:

  • Python在网站开发中应用广泛,所以如果你从事的是互联网相关工作,用Python会比较方便。
  • SAS在端到端的部署上(可视化分析、数据仓库等),曾经有巨大的优势,但由于近年一些平台如SAP HANA和Tableau上对R的集成和支持,使得SAS的这一优势下降。尽管和SAS的无缝集成相比差距还很远,但道路已经开启。

结论

行业日新月异,现在说谁输谁赢还太早,根据你自己的情况(职业阶段、财务情况等),选择合适自己的。这里有几个小建议:

  • 如果你是数据分析行业里的新人,我会建议你首先使用SAS,它非常好学,并且市场占有率最高。
  • 如果你在数据分析行业已经摸爬滚打了几年,那你应该学习一个新的工具来扩展你的专业技能。
  • 对于此行业里的专业人士,至少应该掌握2种工具,以应对未来的机会与挑战。
  • 如果你在一家创业公司,或者你是个自由职业者——我想你还是老老实实用R或者Python吧!(数说君:这条不供参考,原因你也懂得)

最后的得分总结如下:

.END.

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2016-06-07,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 数说工作室 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
全方位为你比较3种数据科学工具:Python、R和SAS(附链接)
关于三种数据科学工具Python、R和SAS,本文从8个角度进行比较分析并在文末提供记分卡,以便你随时调整权重,快速做出选择。
Python数据科学
2019/05/13
4300
全方位为你比较3种数据科学工具:Python、R和SAS(附链接)
Python、 R 语言、SAS、SPSS 的优缺点比较
(致各位挚爱的数粉,因近期小编忙于处理其他急事,未能及时回复给大家资料链接,且微信公众号目前已经限制必须在48小时内回复,否则公众号后台消息发不出去,导致现在仍有很多朋友为收到资料下载链接,小编表示诚挚道歉——已按要求转发或点赞的朋友如果超过48小时以上未收到资料下载链接的,需要再次回复截图给小编,给大家带来不便敬请谅解,谢谢~) 互联网行业可能R语言是最为流行。因为R语言是开源的,所以互联网企业很多在手还有一些通迅行业的咨询公司,不过上手还是需要长期的学习; SPSS界面友好型,不过企业用正版也要很大一些
机器学习AI算法工程
2018/03/09
2.7K0
Python、 R 语言、SAS、SPSS 的优缺点比较
扫盲!SPSS,SAS,Stata,R有何区别,你选哪个?
对于各式各样的数据统计分析软件,你了解多少呢?经过潜心搜集,整理,我总结了一些软件的大体介绍及区别,欢迎大家指正和补充。 这里先略过Excel和Eviews这种入门软件的介绍,直接从SPSS开始吧! SPSS:傻瓜相机 SPSS(Statistical Product and Service Solutions),“统计产品与服务解决方案”软件,是数据定量分析的工具,适用于社会科学(如经济分析,市场调研分析)和自然科学等林林总总的统计分析,国内使用的最多,领域也多。 SPSS就如一个傻瓜相机,界面友好,
CDA数据分析师
2018/02/05
16.2K0
扫盲!SPSS,SAS,Stata,R有何区别,你选哪个?
Python、 R 语言、SAS、SPSS 优缺点比较?给你常用的投一票!
从事数据分析要学那些语言呢?其实小编跟跟学员还有已经从事数据分析行业的人接触下来,给我的感觉是对于这个初级的数据分析师来,一般前二年做差不多都是老大让你做的是处理临时需求为主,如果小明给我做个报表,给市场部那边拉一些流量情况,所以主要前两年可能如果精通SQL与EXCEL再会点SPSS就差不多了,2年以后,老大会把一些:经营性分析需求与竞品分析给你,这里你可能你要需求统计软件,3年以后会让你做一些会员营销及其它的数据挖掘,这里一般说来如果是互联网行业可能R语言是最为流行。因为R语言是开源的,所以互联网企业很多
小莹莹
2018/04/23
2.1K0
Python、 R 语言、SAS、SPSS 优缺点比较?给你常用的投一票!
数据分析5大软件「优势PK」:Python、Excel、R、SAS、SPSS你最爱哪个?
Microsoft Excel是微软公司的办公软件Microsoft office的组件之一,是由Microsoft为Windows和Apple Macintosh操作系统的电脑而编写和运行的一款试算表软件。Excel 是微软办公套装软件的一个重要的组成部分,它可以进行各种数据的处理、统计分析和辅助决策操作,广泛地应用于管理、统计财经、金融等众多领域。
1480
2020/07/31
1.9K0
用【机器学习】来研究【机器学习】:SVM为最热门研究主题,Python超越SAS和R
前几天BAT齐聚深圳,机器学习、人工智能成了热门话题。有人问我,机器学习这么逆天,怎么不用来学习学习“自己”(指机器学习本身)呢? 别急,今天介绍两个研究,都是分析“自己”的: 一个是对招聘网站上数据分析工具出现的数量进行统计分析,得出数据分析软件的热门排名; 一个是对54000篇关于机器学习的论文的摘要进行文本分析,得出机器学习领域中排名前10 的研究主题 1. Python的热度已经远超R和SAS 《R for SAS and SPSS Users》的作者Bob Muenchun,近日在他的个人
数说君
2018/04/08
8000
用【机器学习】来研究【机器学习】:SVM为最热门研究主题,Python超越SAS和R
数据分析师在物联网的哪个环节?
2005年,国际电信联盟的一份报告中描绘了“物联网”时代的图景:当司机出现操作失误时汽车会自动报警;公文包会提醒主人忘带了什么东西;衣服会“告诉”洗衣机对颜色和水温的要求等等。 这么美好的图景里面,我们——学过统计、用R用SAS跑模型、努力学习Python(【统计师的Python日记】已经更新到第6天了→第6天:数据合并)、平凡又伟大、美丽又善良的数据分析师,主要参与哪个环节? 不是部署报警器,也不是研发智能洗衣机,本质上就是跟你白天刚刚做的工作:整理、分析、建模、预测。本着学习的态度,数说君收集了一些资料
数说君
2018/04/04
1.3K0
数据分析师在物联网的哪个环节?
【学习】一文读懂R语言 R可以做所有SAS做的事情
以下5种语言NODE、LUA、Python、Ruby、R ,哪个在2014年的应用前景会更好? 我毫不犹豫的选择R。R不仅是2014年,也是以后更长一段时间的主角。 1. 我的编程背景 本人程序员、架构师,从编程入门到今天,一直深信着Java是改变世界的语言,Java已经做到了,而且一直很辉煌。但当Java的世界越来越大,变得无所不能的时候,反而不够专业,给了其他语言发展的机会。 本次要比较要5种编程语言(NODE,LUA,Python,Ruby,R)
小莹莹
2018/04/18
1.4K0
【学习】一文读懂R语言 R可以做所有SAS做的事情
【精华干货】Quant 需要哪些 Python 知识
谢谢大家的支持!现在该公众号开通了评论留言功能,你们对每篇推文的留言与问题,可以通过【写评论】给圈主留言,圈主会及时回复您的留言。 想在市场上赚钱,必须同时具备两样能力: 研究:做出正确的能够获利的决策,也就是寻找Alpha的能力 交易:基于研究的结果和交易信号,执行相应的下单风控等操作,也就是将Alpha落实到你账户盈利上的能力 研究方面 python编程能力: python基础编程,必须掌握,不仅仅是会语法,还有各种语言细节的坑(当然比C++少很多)。对于常年使用R MATLAB SAS的研究人员来
量化投资与机器学习微信公众号
2018/01/29
2.2K0
【解惑】一文告诉你,该学R还是Python!
Python和R是统计学中两种最流行的的编程语言,R的功能性主要是统计学家在开发时考虑的(R具有强大的可视化功能),而Python因为易于理解的语法被大家所接受。 在这篇文章中,我们将重点介绍R和Python以及它们在数据科学和统计上地位之间的差异。 关于R的介绍 Ross Ihaka和Robert Gentleman于1995年在S语言中创造了 开源语言R,目的是专注于提供更好和更人性化的方式做数据分析、统计和图形模型的语言。 起初R主要是在学术和研究使用,但近来企业界发现R也很不错。这使得中的R成为企
小莹莹
2018/04/20
8870
SAS or R:谁更适合你?
大家好!新一期的大猫课堂又和大家见面啦。这次开篇先和大家说两件事:首先是感谢各位老板的打赏(好多天饭钱T_T)。大猫一开始只是对打赏这个功能很好奇,于是自己先打赏了自己一次,想看看微信后台是如何运行的。没想到后来竟然有好多老板跟着也打赏了大猫,大猫简直惊讶得合不拢嘴——只能在心里一遍遍感谢各位恩主……
用户7652506
2020/10/23
5640
长篇巨献|数据科学界华山论剑:R与Python巅峰对决
大数据文摘作品,欢迎个人转发朋友圈;其他机构、自媒体转载,务必后台留言,申请授权。 来源|DataCamp 编译|于婷婷 魏子敏 康欣 小小编辑| Ivy 如果你是数据分析领域的新兵,那么你一定很难抉择——在进行数据分析时,到底应该使用哪个语言,R还是Python?在网络上,也经常出现诸如“我想学习机器语言,我应该用哪个编程语言”或者“我想快速解决问题,我应该用R还是Python”等这类问题。尽管两个编程语言目前都是数据分析社区的佼佼者,但是它们仍在为成为数据科学家的首选编程语
大数据文摘
2018/05/21
1K0
033Python爬虫学习笔记-1从入门到爬取豆瓣书评影评
1.什么是爬虫 可以理解为抓取、解析、存储互联网上原始信息的程序工具,Google、Baidu底层都是爬虫。 2.为什么学Python和爬虫 从2013年毕业入职起,我已在咨询行业呆了4.5年,期间历经了从尽职调查、战略规划、业务转型,到信用风险管理、数据管理等多类项目,也经历了从Analyst到Consultant到Senior再到Manager的角色转变,收获良多。 然而时代在变,市场环境、金融行业、科技融合程度已今非昔比,自身发展需求与职业瓶颈的矛盾越来越突出。在当前的年纪,所有职业路径判断与选择
企鹅号小编
2018/02/01
1.7K0
033Python爬虫学习笔记-1从入门到爬取豆瓣书评影评
专访 ▏陈春宝——大数据应该如何更接地气儿?
作者:CDA 数据分析师 基于数据的科学决策正成为趋势,国内外主要公司都在建立用数据说话、洞察、优化与创新的管理机制。如何利用数据、让数据切实产生价值是每一位数据从业人员应该深入学习并不断实现的目标。今天很有幸采访到了《大数据与机器学习:实践方法与行业案例》的作者陈春宝老师,告诉我们大数据究竟应该如何更接地气儿。 嘉宾介绍 陈春宝 上海交通大学工业工程博士,经济学硕士。在银行、信用卡、医药与电信等行业拥有近十年数据挖掘分析与 SAS 建模经验,现就职于商业银行,在数据挖掘、机器学习
CDA数据分析师
2018/02/26
1.5K0
专访 ▏陈春宝——大数据应该如何更接地气儿?
C++都从事哪些工作能挣钱不?
java大行其道的今天我们来谈谈c++,现在学c++的人越来越少了。问题在哪?互联网盛行的年代,能吸引眼球的就是能赚钱的。所以一看招聘,发现做java开发是抢手货,起步价比c++高。 再则学习c++难度都比其它语言较高。而它的学习难度,太复杂性。现在c++的使用范围比以前已经少了很多,java、C#、python等语言在很多方面已经可以代替c++。但是也有很多地方是其他语言完全无法替代的,主要集中在需要运行效率比较高的行业,比如游戏、高效的服务器,网络等。 一、游戏开发 游戏开发都有哪些,引擎开发(
程序员互动联盟
2018/03/15
3.1K0
C++都从事哪些工作能挣钱不?
当PowerBI遇到R语言
PowerBI作为微软系最新的商务智能办公系统,自去年发布以来,一直都备受瞩目。 他的更新频次相当之高,功能更新迭代非常迅速。 大概对可视化领域稍有涉猎的朋友们,都明白其中缘由,大数据与云计算的趋势席卷全球,海量数据处理成为了限制各行业发展的掣肘。而受制于编程工具的门槛,大部分数据处理业务人员,可能要严重依赖Excel以及其他无需编程的可视化自助操作软件。 以上需求也称为自助式BI工具,也就是无需IT人员主导的、业务人员可自行操作的商务智能工具。 而目前这个领域,Tableau的成功商业化使其已经赢得先机,
数据小磨坊
2018/04/11
2K0
当PowerBI遇到R语言
写给设计师的人工智能指南:虚拟私人助理
本期谈谈 《虚拟私人助理》相关的内容。 我们先大致看下人工智能10大细分行业的典型应用: 1、深度学习/机器学习: 预测数据模型与分析数据的软件平台; 垃圾邮件检测; 金融诈骗检测; 2、自然语言处理: 语音识别; 智能客服; 智能化软件帮助系统; 智能化知识管理系统; 智能企业形象代表; 智能导游; 智能查询系统; 3、计算机视觉/图像识别: 面部识别软件; 基于内容的图片检索; 智能交通; 医疗计算机视觉和医学图像处理; 军事探测和导弹制导; 无人驾驶环境检测; 4、手势控制: 电脑手势指令系统; 游
mixlab
2018/04/16
2K0
写给设计师的人工智能指南:虚拟私人助理
Apache顶级开源项目——机器学习库MADlib简介与应用实例
内容来源:2017年11月4日,Pivotal Greenplum Madlib研发工程师梅靖怡在“Greenplum和机器 学习客户研讨会”进行《Machine Learning on Greenplum—MADlib简介与应用实例》演讲分享。IT 大咖说作为独家视频合作方,经主办方和讲者审阅授权发布。 阅读字数:4809 |6分钟阅读 摘要 Apache MADlib是Pivotal与UCBerkeley合作的一个开源机器学习库,提供了精确的数据并行实现、统计和机器学习方法对结构化和非结构化数据进行
企鹅号小编
2018/01/24
2.1K0
Apache顶级开源项目——机器学习库MADlib简介与应用实例
《前端开发职位的发展方向 -- 大前端》| 微课-文字版
/1/ 大前端的说法,是如何出现的?范围是多“大”? 对于许多新人来说,他们最开始接触前端这行,都是从前端开发工资高啊,好找工作啊,入门门槛低,这些方面开始了解的。当他们开始学习前端一段时间之后,许多人不可避免的开始迷失在前端技术栈之中。 任何行业都有一个时机的问题,你听说前端的时候,前端还是html+css+js,等你准备好了加入前端行业的时候,它已经变成了nodeJs,Rn,pc,移动端等多平台多设备的综合技术栈。 但这个分水岭,也就是大前端这个词到底是什么时候出现的,并没有明确的说法,甚至是谁最先提
web前端教室
2018/02/06
1.9K0
用Python制作可视化GUI界面,顺便实现自动分类整理文件!
有时候,我们写了一些简单、有用的小代码。此时,如果能够有一个可视化GUI界面,是不是显得很舒服。今天介绍的一个Python库,超级牛逼,几行代码就可以实现一个可视化界面!
快学Python
2021/09/07
2.9K0
推荐阅读
相关推荐
全方位为你比较3种数据科学工具:Python、R和SAS(附链接)
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档