分类战车SVM (第一话:开题话) ---- 开题诗: KKT条件, 像绵延起伏的万水千山 隔断了我的视线, 却隔不断我对远方的期盼 少年傲然,曾经,要追寻生命的最优参 我倚核函数之剑迭代循环, 穿过水榭,越过山峦, 到达SMO算法的彼端 人生暮然,原来,你才是我生命的最优参。 ---- 回复“SVM”查看本《分类战车SVM》系列的内容: 第一话:开题话 第二话:线性分类 第三话:最大间隔分类器 第四话:拉格朗日对偶问题(原来这么简单!) 第五话:核函数(哦,这太神奇了!) 第六话:SMO算法(像Smo
1.四位女生用"刷脸支付"改变传统金融 人脸识别技术能带来什么?用户需来到银行,当面核实身份,才会给予办理。若利用人脸识别,该环节就能大大简化。它通过“看脸”核实身份,能做到远程身份验证。 8月,Linkface在金融业搅出声响,与银联、京东联合推出人脸识别新品。这是一家新锐的人脸识别技术服务商。 它成立于去年夏天,创始团队由四位“高颜值、高学历、高智商”的女生组成。两位毕业于香港中文大学,一位毕业于中国科技大学,一位毕业于清华大学。也就是这四名女生,在过去一年多的时间里,把Linkface人脸识别算
昨天的logistic回归:从生产到使用【上:使用篇】(在微信公众号“数说工作室”中回复“logit1”查看),有不少数说网友们建议把最后的建模指南图单独发一下。 另外对logistic的拟合原理(涉
logistic回归:从生产到使用【下:生产篇】 上篇介绍了logistic模型的原理,如果你只是想使用它,而不需要知道它的生产过程,即拟合方法及编程实现,那么上篇就足够了。如果你想知道它的上游生产,那么请继续。 本篇着重剖析logistic模型的内部生产流程、以及每一个流程的工作原理,暴力拆解。 上下两篇的大纲如下: 【上篇:使用篇】 1. Logistic回归模型的基本形式 2. logistic回归的意义 (1)优势 (2)优势比 (3)预测意义 3. 多分类变量的logistic回归 (1)
分类战车SVM (第一话:开题话) 大家好,今天开始给大家介绍机器学习世界的一种新武器——支持向量机,代号为SVM。 (1)支持向量机的出身:新贵家族“模式识别” 数说君曾经介绍过logistic回归模型(在微信公众号“数说工作室”中回复“logit1”和“logit2”查看),实际上它是一个“线性分类器”,比如,我们用客户的收入、年龄去判断该客户流失/不流失的概率: P(Y=流失)=收入+年龄 这是一个很简单的分类模型,它试图根据某人的收入和年龄来区分他“流失/不流失”的可能性。 其实,它的原理也不是那么
开篇话: 前段时间数说君征原创稿,果真得到了不少牛人的赐稿,比如本文的作者Ansta,作为数说工作室的特约撰稿人,将会承担下“【SAS Says】高级篇” 的写作。 SAS基础篇中,我们介绍了一些入门的东西。在进阶篇中,我们将介绍一些统计方面的SAS应用,包括主成分分析、判别分析、非参数检验、logistic模型等等。进阶篇要稍晚些与大家见面,我们首先邀请Ansta为大家带来高级篇,高级篇将介绍SAS的IML模块、SQL模块、宏语句以及贝叶斯(插一句,如果大家觉得好,求打赏,1元不嫌少,5元不嫌多;如果大
分类战车SVM (第二话:线性分类) 回复“SVM”查看本《分类战车SVM》系列的内容: 第一话:开题话 第二话:线性分类 第三话:最大间隔分类器 第四话:拉格朗日对偶问题(原来这么简单!) 第五话:核函数(哦,这太神奇了!) 第六话:SMO算法(像Smoke一样简单!) 附录:用Python做SVM模型 ---- 1. 回顾 上一集我们大致介绍了机器学习世界的一种新武器——支持向量机,代号为SVM(微信公众号“数说工作室”中回复“SVM1”查看)。它具有以下优良特性: 小样本——SVM配备“支持向量”识
本节目录: 1. IML基本语句 2. 标量、向量与矩阵 (1)定义标量 (2)定义向量 (3)定义矩阵 3. 矩阵的元素运算 (1)四则运算 (2)比较运算 (3)取值运算 4. 矩阵运算 (1)矩阵相乘 (2)水平连接 (3)垂直连接 (4)转置 (5)截取运算符 ---- 【SAS Says · 扩展篇】IML:入门 你还在一边用SAS做统计分析、一边用MATLAB做矩阵运算吗?SAS IML模块可以直接做矩阵运算
本文由数说工作室提供,非学术探讨,旨在激发大家的学习热情和欲望。数说君根据文献、课件、史料(正史/野史)、网络资料和自己的臆想,将凶残的概率论暴力拆解,再清新组合,力图趣解,如有不适者请移步!
数说工作室之前写过一个系列《大数据与金融业》,主要搜集了数据分析挖掘在金融领域的应用和最新动态。 很多人问能不能写一下其他各领域的情况。在之前写的SVM系列中,数说君也发现了对SVM应用感兴趣的人,远
数说工作室提供策略编写、数据分析服务和量化支持。
前几天(上周日),我在分答上回答了一个问题,问题是: Python,R,SPSS,SQL这类软件哪个最适合初学者入门以及进阶学习的顺序(以就业为导向) 语音中我从“职能方向”和“行业方向”聊了一下自己
第一天学习了Python的基本页面、操作,以及几种主要的容器类型,学习大纲如下: 一、为什么学Python? 二、安装与熟悉 1、安装 2、熟悉 三、容器 1、什么是容器 2、序列的一些通用操作 3、列表操作 4、字符串操作 5、字典操作 日记小结 想偷窥我第一天的学习日记,回复python1 今天学习python的函数、循环和条件、类,这样才算对Python有一个大致的了解。今天的学习大纲如下: 四、函数 1、定义函数
原标题:Here’s how you can get a 2–6x speed-up on your data pre-processing with Python
本系列搜集了一些大数据在金融领域应用的文章,编辑成册,让大家更有方向的学习。有好的文章欢迎推荐,愿与大家一起成长。 第一文介绍了P quant和Q quant。过去是Q quant的天下(不知道Q quant与P quant的,在微信公众号“数说工作室”中回复“dsj1”查看),而一场金融危机,Q quant搞出来的无人能看懂的定价模型已经把大家的钱一把火烧光了,事实上,次级债危机的源头就是David X. Li搞出来的定价模型(不错,David X. Li是个中国人),这个定价模型曾经像圣经一样被人膜拜,
我们将过去10天里播报的大数据新闻,浓缩成17条精选资讯,您只要在20分钟就可以读完,了解下这个行业的变化吧~ 1. 数说× “各行各业都在装备大数据” 2. 数说内参 ”大数据行业内的【技术、人才、资本】最新动向“ 3.数说笔记 ”算法、模型、学科、语言“ ---- 洞察商机、行业前沿,聊天面试、约会饭局,坚持订阅数说工作室的【十日大数据参考】,让你 不至out,反得永潮 数说工作室 | 大数据 云计算 高逼格 ---- 十日大数据精选 | 20151123-20151202 一、数说× “各行各业都
分类战车SVM (第二话:线性分类) 1. 回顾 上一集我们大致介绍了机器学习世界的一种新武器——支持向量机,代号为SVM(微信公众号“数说工作室”中回复“SVM1”查看)。它具有以下优良特性: 小样本——SVM配备“支持向量”识别系统,精准打击 非线性——SVM嵌入了尖端前沿的“高维映射”技术。 高维度——SVM配备了“核函数”子装置,有效节省成本,轻便节能。 关注结构风险——SVM装备风险自我识别系统,为驰骋疆场提供全面的保驾护航。 另外,SVM与logistic都是线性分类器的一种,那么它们有什么
数说君的文前话 女:“老公,睡了吗?” 男:“还没” 女:“哦,那快睡吧” 男:“恩” 女:“你跟我说话那么不耐烦,那么不走心,那么简短连符号标点都没有!你根本就不爱我!!!” 这样的一幕大家多多少少都会遇到过一点,尤其是广大男同胞们,文字无法反应出一个人全部的情绪信息,没有语气、没有语调,但多打一个“呢”字——还没呢~/恩呢~——就好像自己要被掰弯了似的,于是闹出误会。 在商业社会中,各种标准格式的客户调查、售后问卷,更是冷冰冰的文字数据,所反映的客户情感信息就更少了,客户所选择的或者填写的,他们对产品的
1.灵感·大数据× 大数据在各行各业的应用、以及最新分析报告。 2.内参·大数据产业 大数据行业的【人才、资本、战略】最新动向 3.利器 算法、模型、学科 ---- 【精选】7日大数据精选 01 灵感·大数据× 大数据在各行各业的应用、数据分析最新资讯 携程机票大数据 携程APP大数据发现,在预订机票的旅客中, (1)20%的人会通过网站或App提前选座; (2)其中“靠窗位”占比超过“过道位”; (3)而28-35岁的男性商务人士则是最爱选座的人群。 看美国如何实现农业大数据的建设 据悉,爱荷华州全职农民
自定义菜单能够帮助公众号丰富界面,让用户更好更快地理解公众号的功能。开启自定义菜单后,公众号界面如图所示:
数说君曾经在公众平台上发起过这个话题: 【小样本预测模型哪家强?】想要用X1、X2、X3预测Y,训练样本只有30个或者以内,有什么用的模型可选?您的推荐是? 收到了各位大神的各种建议,如: 样本小,当然贝叶斯; bootstrap然后再用回归什么的吧(这个最多); 灰色预测模型(PS:该模型是一位中国人提出的); 人工神经网络; 等等... 还有一位同学的回答,数说君认为很经典: 不在于样本数多少,在于是否够——足够近似到正态。当然不能太少了,否则随机性很强。 数说工作室特约撰稿人飞扬博士的建议是: 巧用交
量化投资之资本资产定价模型 (CAPM) 目录 一、前言 二、CAPM模型 1. 切点组合、分离定理与市场组合 2. 资本市场线 3. 证券市场线(资本资产定价模型) 4. 超额收益形式的CAPM模型 三、后记:quant的未来 附:量化投资系列 一、前言 数说君在《量化投资之动量反转》中曾经介绍过(微信公众号“数说工作室”中回复dlfz),现代金融学的两大基石是有效市场假说(EMH)和资本资产定价模型(CAPM)。有效市场假说是为了方便研究金融市场而对经济世界做的一
文本分析很有用,数说君自己也玩过,炒鸡有意思,从论坛、网页上爬取网友的舆情数据,然后整理、统计、画图,就可以知道舆论的风暴是什么,可以知道网友最热议的话题、最想去的旅游景点、最喜欢的饮料等等,也可以从这些舆情数据中挖掘出两个话题之间的关联性等等。 扯的有点远,本系列【SAS Says · 扩展篇 · 正则表达式】介绍的是SAS里正则表达式的应用,对于一些杂乱无章的非结构化数据,正则表达式可是一个处理的利器! 它的使用其实很简单,一旦你弄懂它们,你就能把数小时辛苦而且易错的文本处理工作压缩在几分钟甚至几秒钟
云工作室是一款由腾讯云推出的在线代码编辑器,它可以在浏览器中运行,所以不需要安装任何软件,仅需一台稳定的网络连接就可以使用。云工作室是一个适用于团队协作的开发工具,可以用于开发和部署云应用程序,提供了多种代码语言和框架支持。本操作手册将详细介绍云工作室的使用方法和功能。
本集目录为: 一、简化版SMO算法 二、LIBSVM包 1.简介 2.数据格式 3.安装 4.简单的使用方法 三、题外话 上一集介绍了SMO的算法原理,本集是《分类战车SVM》系列的最后一个,介绍如何用代码实现,给出了简化版的SMO代码,以及LIBSVM的使用方法。 前面6集可以在微信公众号“数说工作室”(搜不到就搜微信号“shushuojun”)中回复“SVM1”(开题话)、“SVM2”(线性分类)、“SVM3”(最大间隔分类器)、“SVM4”(拉格朗日对偶问题)、“SVM5”(核函数)
动画产业一直以来都基本上被私有软件所垄断,这些软件来自例如Autodesk、Adobe等大公司。但是现在,情况已经开始发生改变。在本视频中,有多年开源动画软件工作经验的Frank Rousseau在FOSDEM 2020上进行了题为“FOSS in Animation”的演讲,介绍了动画和视觉特效行业中免费、开源软件的现状。
---------------------------------------------------------------------------------------
分类战车SVM (附录:用Python做SVM模型) 回复“SVM”查看本《分类战车SVM》系列的内容: 第一话:开题话 第二话:线性分类 第三话:最大间隔分类器 第四话:拉格朗日对偶问题(原来这么简单!) 第五话:核函数(哦,这太神奇了!) 第六话:SMO算法(像Smoke一样简单!) 附录:用Python做SVM模型 转载请注明来源 ---- 本集目录为: 一、简化版SMO算法 二、LIBSVM包 1.简介 2.数据格式 3.安装 4.简单的使用方法 三、题外话 上一集介绍了SMO的算法原理,本
另一个世界系列,从另一个角度看数据分析的方法、应用。 本文结构: 1、数据的时效性 2、流式计算与批量计算 3、总结与相关产品 (1) 流式计算流程 (2) 流式计算特点 (3) 相关产品 1、数据的时效性 日常工作中,我们一般会先把数据储存在一张表中,然后对这张表的数据进行加工、分析。既然数据要储存在表中,就有时效性这个概念。 如果我们处理的是年级别的数据,比如人口分析、宏观经济分析,那么数据最新日期距今晚个一两周、甚至一两个月都没什么关系。 如果我们处理的是天级别的数据,比如各大网站的用户偏好分析、零售
量化投资投资之动量反转 微博:@数说工作室网站 微信公众号:数说工作室 那一年,你在我的有效市场里随机游走,不经意间毁灭了我的理性人假设。从此,维持与你相爱的动量效应,成为我人生唯一的投资策略。 ——送给她 一. 行为金融学 1. 行为金融学的发展 20世纪80年代,股票市场一系列经验研究发现了与有效市场不符现象,如股权溢价之谜、动量效应与反转效应、期权微笑等。到20世纪90年代,该领域涌现了大量高质量的理论和实证文献,形成最具活力的行为金融学派。 2002年,诺贝尔经济学奖授予了美国行为经
分类战车SVM (第四话:拉格朗日对偶问题) 转载请注明来源 微信公众号:数说工作室 新浪微博:数说工作室网站 前段时间热映的《星际穿越》想必大家都看过,在这部烧脑大片中,主角库珀进入到了高维度空间
本文是【统计师的Python日记】第8天的日记 回顾一下: 第1天学习了Python的基本页面、操作,以及几种主要的容器类型。 第2天学习了python的函数、循环和条件、类。 第3天了解了Numpy这个工具库。 第4、5两天掌握了Pandas这个库的基本用法。 第6天学习了数据的合并堆叠。 第7天开始学习数据清洗,着手学会了重复值删除、异常值处理、替换、创建哑变量等技能。 原文复习(点击查看): 第1天:谁来给我讲讲Python? 第2天:再接着介绍一下Python呗 【第3天:Numpy你好】 【第
分类战车SVM (第五话:核函数 修正版) 转载请注明来源 微信公众号:数说工作室 新浪微博:数说工作室网站 前段时间热映的《星际穿越》想必大家都看过,在这部烧脑大片中,主角库珀进入到了高维度空间,
前几天飞扬博士更新了一篇算法文章,关于softmax regression的,它是logistic模型的扩展,因此要是能有些logistic regression的底子就看起来非常容易,因此在发softmax regression之前,重新复习一下logistic模型。 一句话介绍: logistic regression,它用回归模型的形式来预测某种事物的可能性,并且使用优势(Odds)来考察“某事物发生的可能性大小”。 ---- 之前介绍过的几个算法,如KNN、决策树等(在微信公众号“数说工作室”中回
logistic回归:从生产到使用【上:使用篇】 前面介绍过几个算法,如KNN、决策树等(在微信公众号“数说工作室”中回复“jrsj”查看,不要引号),都可以用若干个“属性变量”来预测一个“目标变量”
要深入 Azure 机器学习,首先确保你有一个工作区。如果你还未设置工作区,那么请按照指引,完成必要的资源配置来搭建你的工作区,并了解其基本操作。
人工智能最大的任务不是分类和识别,而是让机器学会“思考”。 本文展示了MIT在人工智能的最新研究成果,一个新的人工智能系统,它: 1)通过了视觉图灵测试(图灵测试是什么?你试试看最上面的那个图,能不能分别图中每个字符下面,哪一个是机器画的,哪一个是人类画的,如果分别不出来,那么这个机器就通过了); 2)使用了Bayesian Program Learning,拥有“one-shot learning”的能力 本文来自GIZMODO.com, 原标题:A new AI system passed a vi
随着构建无国界元宇宙方面的炒作越来越甚,苹果公司采用的一种开源文件格式俨然枯木逢春,其起源可以追溯到30年前。 在本周开幕的GPU技术大会之前发布的新闻发布会上,英伟达Omniverse平台副总裁Richard Kerris将Universal Scene Description(通用场景描述,即USD)称为是“3D的HTML”。 如今英伟达支持这种文件格式,视为在其Omniverse软硬件平台上构建协作式元宇宙的一个关键部分,许多公司可以通过该平台构建和渲染复杂的3D世界、AI模型以及动画化身。 专家小
创业工作室的理念正变得越来越流行,并且有充分的理由。有一些基本的可重复流程可以在创建一个工作室内的初创企业时具有相当大的影响力。物联网是一个重要的、广泛的技术进步的想法在我们的世界里已经不再是争论的话题。这不是一种时尚; 这是真实的,留在这里。也就是说,我们仍然看到了大量的物联网试点项目远远少于生产物联网的例子,更不用说完全集成并符合组织的大型信息技术架构。通过深入研究创业工作室模型为什么会变得越来越流行,以及为什么更广泛的物联网市场正在努力从试点转向生产,我们可以发现一种相关性,这种相关性重新强调了物联网工作室模型的概念。
Geoffrey Hinton,可能未必所有人都听过, 但他创立的门派——深度学习,却无人不知,点开本文的高傲的你,也许就是、或者即将成为,他的徒孙。 Geoffrey Hinton,将反向传播BP用于多层神经网络、发明了玻尔兹曼机(Boltzmann machine),深度学习领域的开山祖师、三大巨头之首。 PS:另2位巨头是Yann LeCun和Yoshua Bengio,其中Yann LeCun是Facebook的人工智能研究总监,CNN(卷积神经网络)之父,同时也是Hinton的学生! 他还有
VRPinea欲在丁酉鸡年年底,就曾经专访过的VR厂商进行一个回访,摸一摸今年的底同时,顺便探一探明年的风。本次厂商年终回访报告共罗列了17家VR厂商(排名不分先后),涵盖VR硬件、VR游戏、VR影视
你是否想学习编程呢?可以从 Python 开始,它因为简洁的语法和面向对象的特性而非常受欢迎,是最常见的编程语言之一。而且 Python 是一门解释型语言,这意味着你无需知道如何把 Python 代码编译为机器语言 —— Python 会帮你做到这一点,从而使你能够在编写代码的同时立即进行测试。
AI科技评论按:6.13号上午,中科院计算所研究员徐君在微博中宣布,Easy Machine Learning 系统开源,欢迎大家下载。AI科技评论编辑第一时间为大家带来该系统的功能介绍。 在许多大
凭借VR电影《 Dear Angelica》和《Henry》等作品获奖的工作室Oculus Story Studio即将关闭。Facebook周四下午在Oculus内容总监Jason Rubin的博文
月华初上,暗下的天色里车子亮起了大灯,游成了一尾尾鱼。办公室内,爱健身的DT君(ID:DTcaijing)一边默念“老板看不见我”,一边第一个冲出了公司。
除了谢菲尔德和诺丁汉分公司以及位于印度浦那的一个团队外,纽卡斯尔工作室将成为Sumo Digital的第四家工作室。去年,该公司还收购了艺术工作室Atomhawk。 CCP Games的原34名员工将
从学生到游戏开发者: 我学到的五件事 Gamelook报道过三年前,我参加了一个游戏研发课程,在此之前我从来没有学过编程。现在,我非常自豪地成为了Failbetter Games工作室的一名开发者。这期间的过程常常感觉一头雾水,由于没有基础,所以大多数的时间都埋头在知识的海洋里,很少有时间停下来反思一些事情,写 这篇博客就是很难得的一次。这里,我希望分享这个过程中所学到的5条经验,希望能够给准备成为开发者的同行们一些帮助。 1.不要只想着进大公司 当我开始学习游戏研发的时候,我总觉得自己和希望工作的游戏工作
Gamelook报道过三年前,我参加了一个游戏研发课程,在此之前我从来没有学过编程。现在,我非常自豪地成为了Failbetter Games工作室的一名开发者。这期间的过程常常感觉一头雾水,由于没有基础,所以大多数的时间都埋头在知识的海洋里,很少有时间停下来反思一些事情,写 这篇博客就是很难得的一次。这里,我希望分享这个过程中所学到的5条经验,希望能够给准备成为开发者的同行们一些帮助。
据外媒报道,索尼PlayStation通过对“提升效率和运营效果”的考量,决定将关闭在英国曼彻斯特的第一方游戏工作室。据悉,该工作室成立近5年,曾有传闻称其或在开发一款3A级VR游戏,但一直没有看到任何成果。
一般来说,黑色产业指的是从事具有违法性的活动且以此来牟取利润的产业。而灰色产业则指的是不明显触犯法律和违背道德,游走于法律和道德边缘,以打擦边球的方式为“黑产”提供辅助的争议行为。
领取专属 10元无门槛券
手把手带您无忧上云