12月15日,由腾讯云主办的首届“腾讯云+社区开发者大会”在北京举行。本届大会以“新趋势•新技术•新应用”为主题,汇聚了超40位技术专家,共同探索人工智能、大数据、物联网、小程序、运维开发等热门技术的最新发展成果,吸引超过1000名开发者的参与。以下是大数据AI分会场的演讲内容,稍作整理,分享给大家。
机器之心报道 机器之心编辑部 3 月 23 日,在机器之心 AI 科技年会上,蚂蚁集团金融机器智能部总经理周俊发表了主题演讲《可信 AI 在数字经济中的实践与探索》。 周俊介绍,如果将数字经济比作一棵树,树干中的人工智能 (AI)、大数据、云计算等技术,构成了数字经济的核心,起着承上启下的作用;树根中的隐私、安全等因素,决定长势以及未来;树干跟树根必须紧密融合,才能枝繁叶茂,其中 AI + 隐私、AI + 安全等成为当下亟需突破的方向。而可信 AI 技术理念将是数字时代抵御风险、提升科技包容度的关键能力之
作者 何从庆 授权自 AI算法之心 近些天在微信群里经常看小伙伴问到“机器学习如何入门,看哪些资料 ?”,于是乎想根据笔者学习两年多的学习经验,介绍下机器学习如何入门,该看哪些资料?下面我将从以下几个
来源商业新知,原标题:机器学习入门方法和资料合集 | 资源 近些天经常有小伙伴问到“机器学习如何入门,看哪些资料 ?”,于是乎想根据笔者学习两年多的学习经验,介绍下机器学习如何入门,该看哪些资料?下面
谷歌tensorflow官方推出了免费的机器学习视频课,总计25个课时,支持中英文语言播放、大量练习、实例代码学习,是初学tensorflow不机器学习爱好者必看的良心精品,课程授课的老师都是来自谷歌AI团队不Tensorflow框架的开发团队,可以说是唯一的业界良心免费教程。从本文开始,【OpenCV学堂】将推出一系列的文章介绍课程各个章节内容不代码演示部分,前面相关文章阅读回顾:
对于深度学习框架而言,PyTorch是一匹十足的黑马,虽然Tensorflow依然占据着老大哥的位置,但是从2019年的各项数据显示PyTorch大有一飞冲天之势。关于各个深度学习框架的盘点,请看这篇文章:深度学习框架盘点。小编在这里给大家盘点一下PyTorch比较好的入门书籍,方便大家查阅学习。
机器学习作为近几年的一项热门技术,不仅凭借众多“人工智能”产品而为人所熟知,更是从根本上增能了传统的互联网产品。在近期举办的2018 ArchSummit全球架构师峰会上,个推首席数据架构师袁凯,基于他在数据平台的建设以及数据产品研发的多年经验,分享了《面向机器学习数据平台的设计与搭建》。
AI 科技评论按:今日在腾讯研究院年会中,腾讯副总裁姚星发表演讲《AI 真实的希望和隐忧》,他在大会中介绍了“低调”的腾讯 AI 部门所做的事,并深入讲解该如何提升机器学习的能力以及对 AI 的看法。文章由 AI 科技评论进行编辑。 腾讯在 AI 方面确实很低调,很多人问我腾讯有没有做 AI?怎么从来没有向外宣传呢? 解密腾讯 AI 部门 实际上从 2016 年 4 月份开始,腾讯成立了自己的 AI 部门。目前这个部门拥有 30 多个科学家,90% 以上的人都是博士学历,绝大多数人都是海外名校归来,包括
原文: Graph-powered Machine Learning at Google 作者: Sujith Ravi 译者: KK4SBB 责编:何永灿,关注人工智能,投稿请联系heyc@csdn.net或微信号289416419 近些年来,机器学习技术取得了巨大的进步,使得计算机系统能够解决复杂的现实问题。其中一项先进技术就是由Google研究院的Expander组开发的大规模、基于图的机器学习平台。基于图的机器学习是一款功能强大的工具,被广泛用于我们日常接触到的Google产品和功能,比如用于收
导语:数据决定了任务的上限,模型方法决定达到上限的能力。在机器学习三要素里面,经验数据是极其重要的一环,直接决定了该机器学习任务的最终能达到的效果。尤其是在进入大数据时代,数据获取上面会比以往容易许多,选取数据集有时候带来的提升比更改模型带来的要快速的多。
作为编程人员或者工程师,你去企业面试的时候这些企业通常依据公司常用的编程语言来觉得是否适合该公司的工作,想一些大型的互联网公司还会考虑到你的学历层次,受教育情况,个人参与的项目成就等,但最重要的因素通常是你的工作经验以及你是如何获得这些经验的,实际上,小公司或初创企业往往更关心你使用哪些特定的语言或技术。 虽说编程并不是一件很简单的事情,但也绝非难事,比如就有那么一些比较好学的编程语言,相比较其他的编程语言更容易学习,比如 JavaScript 比Java更容易学习,Python 比 C++更容易学习。
摘要:TalkingData目前提供应用统计分析、游戏运营分析、移动广告监测、移动数据DMP平台、移动行业数据分析等。随着各项业务快速发展,数据规模也越来越大,带来很大的挑战。本文将简要介绍我们应对这些挑战的一些经验。 TalkingData诞生于2011年,目前提供应用统计分析、游戏运营分析、移动广告监测、移动数据DMP平台、移动行业数据分析和洞察,以及企业级移动数据分析和挖掘的解决方案等产品和服务。随着各项业务快速发展,需要机器学习支撑的需求也越多越多,数据规模也越来越大,带来很大的挑战。而且Talki
选自:TVM社区 作者:陈天奇 Alexnet 横空出世的两年之前,我选择了深度学习作为本科毕设方向。当时的深度学习并没有现在那么火热,也没有现有的 GPU 卷积实现,我在实验室的 GTX 470 上面第一次手写 GPU 卷积用以支持卷积 RBM,当时针对 CPU 十多倍的加速比让我兴奋不已。虽然最终那段研究经历并没有结果,但是计算本身对于机器学习的推动作用却深深地印在了我的脑海里。 深度学习系统支是推动进步的引擎,而在引擎的核心,则是像 cuDNN 这样的针对硬件的高效算子实现。每一个高效的算子库的背
目前机器学习可以说是百花齐放阶段,不过如果要学习或者研究机器学习,进而用到生产环境,对平台,开发语言,机器学习库的选择就要费一番脑筋了。这里就我自己的机器学习经验做一个建议,仅供参考。
顾仁民,谷歌资深工程师,目前负责谷歌机器学习技术在国内的技术推广与企业合作。曾任谷歌展示广告系统研发团队主管,支撑国外若干大型网站的广告系统营收。
JupyterLab 是用于笔记本、代码和数据的最新的基于 Web 的交互式开发环境。其灵活的界面允许用户配置和安排数据科学、科学计算、机器学习方面的工作流程。模块化设计邀请扩展来扩展和丰富功能。
博主目前不是相关从事人员,本文的书写时,博主学习机器学习与深度学习已有2月有余,如有知识性错误还请指正。
几年前图片美颜教育了市场,到了直播时代,美颜同样成为直播平台的标配。女主播要是在直播中不能自动美颜,那只能靠更精致的妆容来补,而实时直播美颜技术恰好解决了这个问题。 目前最新的美颜技术已经发展到了2.
通过本篇文章大家可以对ML的常用算法形成常识性的认识。没有代码,没有复杂的理论推导,仅是图解,介绍这些算法是什么以及如何应用(例子主要是分类问题)。 今天的算法如下: 1、决策树 2、随机森林算法 3、逻辑回归 4、SVM 5、朴素贝叶斯 6、K 最近邻算法 7、K 均值算法 8、Adaboost 算法 9、神经网络 10、马尔可夫 1. 决策树 根据一些 feature 进行分类,每个节点提一个问题,通过判断,将数据分为两类,再继续提问。这些问题是根据已有数据学习出来的,再投入新数据的时候,就可以根据这棵
读书的时候,很喜欢数学,然则,发现生活中很少用到稍微深点的数学知识,毕业后发现工作里真心也很少用到数学,因为算法都基本用不上。再也没有接触到数学。但是我知道数学给了我比较好的逻辑思维能力。最近开始学习机器学习里的深度学习,刚开始在慕课网上看了基本的机器学习概念,然后开始看吴恩达在斯坦福的教学视频,惊奇的发现他都是在推倒数学公式。然而有些数学知识我已经忘的差不多。机遇巧合之下,在部门的图书馆发现了一本深度学习的书,里面把深度学习里要用到的数学基础知识大概了讲了一遍。这一刻,我终于知道数学在实际中如何运用了,并
Python 是一种开源编程语言,用于 Web 编程、数据科学、人工智能和许多科学应用。学习 Python 使程序员能够专注于解决问题,而不是专注于语法,其丰富的库赋予它完成伟大任务所需的力量。
想必国内绝大多数网民都有新浪微博的用户账号。据最新数据显示,2018 年第四季度财报,微博月活跃用户突破 4.62 亿,连续三年增长 7000 万 +;微博垂直领域数量扩大至 60 个,月阅读量过百亿领域达 32 个。毫无疑问,从 2009 年 8 月上线至今,微博已是当前业界领先的中文社交媒体,成绩斐然。
针对垃圾邮件分类这个项目,一般的做法是,首先由一堆的邮件和是否是垃圾邮件的标注,如[(邮件内容1,是),(邮件内容2,否),(邮件内容3,是)...]。然后我们针对邮件的内容去做分词,搜集全部词语组织成词表;由于邮件内容的词通常都是常用词,因此可以取top500的词组织成词表,然后替换内容邮件。
有爬虫经验的各位小伙伴都知道,正常我们需要登录才能获取信息的网站,是比较难爬的。原因就是在于,现在各大网站为了反爬,与爬虫机制斗智斗勇,一般的都加入了图片验证码、滑动验证码之类的干扰,让我们的爬虫半途折返。
【导读】我们在上一节的内容中已经为大家介绍了台大李宏毅老师的机器学习课程的regression问题,其中简要提及了梯度下降(gradient descent),这一节将主要针对梯度下降问题展开分析。本文内容涉及机器学习中梯度下降的若干主要问题:调整学习率、随机梯度下降、feature scaling、以及如何直观的理解梯度下降。话不多说,让我们一起学习这些内容吧。 春节充电系列:李宏毅2017机器学习课程学习笔记01之简介 春节充电系列:李宏毅2017机器学习课程学习笔记02之Regression 课件网址
这背后所利用的技术就是人工智能中很重要的神经网络与机器学习,神经网络模拟电信号在人脑神经元之间的传递过程,对输入数据进行处理。利用分层的神经元,从大量样本数据中总结出共同特征,由此生成高还原度的合成声音。
对人工智能而言,2017是不平凡的一年: AlphaGo再胜人类 腾讯宣布进军AI 百度无人驾驶汽车上五环 AI教育要从娃娃抓起 寒武纪成全球AI芯片首个独角兽 阿里巴巴成立达摩院 类人机器人Sophia首获公民身份 国家正式公布人工智能四大平台 .......... 近年来,人工智能技术在各行各业中的应用越来越普及,相关专业技术人才也是供不应求,各大公司或是创业公司不惜重金招募AI人才。 最近一项统计显示,人工智能相关职位平均年薪达到30万元-60万元,从业时间长的甚至能达到年薪百万。下面是来自一些招聘网
机器之心原创 作者:高琳 这个世界上的研究,总会有一些人去坐冷板凳,而坐冷板凳的人,他今天去坐明天不一定去坐。就像深度学习现在这么热,之前也有过很冷的阶段。 创业的这个过程中能够义无反顾,这是思必驰团队非常有特色的一个点。当然不是傻的义无反顾,如果说大家都没有学习能力,只是撞南墙是肯定不行的。但是如果没有这种义无反顾的决心,遇到困难就放弃,我不认为是一个合格的创业者。 对于创业者来讲,如果说他在很多事情上,不能够拿自己底层的东西去拼的话,这个创业,恐怕一遇到困难就会垮掉。 从研究到创业,这是俞凯在机器之心
雷锋网按:本文内容来自涂图 CTO 邱彦林在硬创公开课的分享,在未改变原意的基础上进行了编辑整理。 几年前图片美颜教育了市场,到了直播时代,美颜同样成为直播平台的标配。女主播要是在直播中不能自动美颜,那只能靠更精致的妆容来补,而实时直播美颜技术恰好解决了这个问题。 目前最新的美颜技术已经发展到了 2.0 阶段,打个比方,如果美颜 1.0 只是化妆(磨皮、祛痘、肤色调整)的话,美颜 2.0 基本就能达到整容的效果——把眼睛变大,把圆脸变成瓜子脸。而实现这一效果的基础就是人脸识别。 硬创公开课特邀专攻直播美颜的
最近刷到某乎,看到有小伙伴提问到 「"深度学习如何入门,有哪些学习资料?"」。看到这里,笔者想整理下一些翻山越岭,爬坑超车的经验,帮助刚入门深度学习的小伙伴。如果有想了解机器学习入门方法的朋友,可以看我之前写的机器学习入门方法和资料合集。
本文主要介绍如何利用大数据技术搭建机器学习平台,包括数据处理、特征提取、算法训练以及模型评估等方面。同时,还介绍了平台的架构和展望,包括个性化、融合其他算法包等方面。
知乎:https://www.zhihu.com/people/huangzhe
update 1:很多同学还是私信我,让我推荐或者提供一些电子书给他们,我这边也打包了一些我认为比较重要的,如果有需要的同学可以「邮箱」联系我。申明,我所发送的书个人均已购买正版实体书,建议大家也支持正版,谢谢。
通过前面的小节,我们知道了kNN算法中k这个参数值,在sklearn中k这个值被封装成了k_neighbors参数。在前面我们随机的指定参数k的值,究竟k的值为多少的时候,模型才是最好的呢?这就涉及到了机器学习领域非常重要的问题~超参数问题。
机器学习越来越火爆,各种资料也越来越多。在网上随意一搜,就能看到一大串长长的书单和一大堆视频教程。堆积如山的资料,很容易让新手一脸懵逼,无所适从,最后没当成炼丹术师,反而成了著名的资料收藏家。 怎样避免成为资料收藏家?道理大家都懂,不就是挑好学习资料后狠下心钻研下去,没学好前尽量不再换教材嘛。但是,说起来很简单,做起来并不容易,毕竟第一步挑资料就不容易。这时,该怎么办?当然是来看这篇新手指南。
受访者:陈天奇 采访者:何通 编辑:王小宁 简介:陈天奇,华盛顿大学计算机系博士生,研究方向为大规模机器学习。他曾获得KDD CUP 2012 Track 1第一名,并开发了SVDFeature,XGBoost,cxxnet等著名机器学习工具,是Distributed (Deep) Machine Learning Common的发起人之一。 何:你的本科在上海交大的ACM班就读,是怎么开始做机器学习研究的呢? 陈:我们当时的培养计划里面有一项,就是希望我们尽早地接触学术研究。于是我们在大二
在 Google I/O 大会上,谷歌公布了最新的机器学习算法——AutoML,随即,Quoc Le 与 Barret Aoph 大神在 Google Research Blog 上发布了一篇名为《采用机器学习探索神经网络架构》的文章。AI科技评论进行了编译,并做了不改动原意的编辑和修改。 「在谷歌团队,我们成功地将深度学习模型应用于非常多的领域,从图像识别、语音识别到机器翻译等等。自然,这些工作离不开一整支工程师与科学家团队的努力。人工设计机器学习模型的过程实际上绝非坦途,因为所有可能组合模型背后的搜
张夏天,曾在IBM中国研究院,腾讯数据平台部,华为诺亚方舟实验室任职。对大数据环境下的机器学习,数据挖掘有深入的研究和实践经验。现任TalkingData首席数据科学家,主要工作有三块:一是大规模机器学习能力的建设,二是基础数据的深度挖掘和整理,三是支持不同业务的数据挖掘和业务建模的工作。前两个工作都是为了支持第三个工作的高效进行。 CSDN:您对算法是怎样的理解?以及相比于产品决策团队、数据工程师,算法工程师在一个公司里如何安排好自己的位置? 张夏天:算法是机器学习的核心,所有的研究都是为了最后设计出更
姚 星 腾讯集团副总裁、腾讯AI Lab负责人 过去的二十年是信息高速发展的二十年,它经过了几个发展阶段。从发展的方向上来讲,应该是在上世纪九十年代初期,中国第一次连上互联网,进入到互联网这个
记者 | 张明明 2017年12月16日,由IBM与CSDN共同举办的第四季 "Power AI 人工智能马拉松编程大赛"在北京马哥孛罗酒店开幕。此次赛季围绕人工智能在医疗的应用展开。 本次大赛选手总共分为20组,每组选手3~6人不等。从报名情况来看,选手阵容非常豪华,来自北大、清华、中科院、北邮、北师大、北航、腾讯、微软亚洲研究院、搜狗、今日头条等知名院校及科技公司的选手比比皆是。 大赛从上午9:00正式开始,选手需要通过利用半监督的训练方法从有标注和无标注的图像数据中训练出一个模型,并且模型要能够
2019秋招算法求职之路分享 作者:选择咋那么难呢 链接:https://www.nowcoder.com/discuss/155407?type=2&order=3&pos=26&page=1 来源
采写:鸽子 7 月22 - 23 日,由中国人工智能学会、阿里巴巴集团& 蚂蚁金服主办,CSDN、中国科学院自动化研究所承办的第三届中国人工智能大会(CCAI 2017)将在杭州国际会议中心盛大开幕。 大会开幕前,CSDN独家采访到本届大会程序委员会主席、蚂蚁金服副总裁兼首席数据科学家漆远博士。 本次采访中,漆远博士首次对外批露了日前刚刚完成的一项重大创新——把深度学习和图模型结合起来,在知识图谱上做相关推理的能力,这在行业应用上绝对是第一次。 此外,漆远博士还谈到了蚂蚁金服目前正紧缺的图像人才,以及蚂
【新智元导读】与机器学习不同,数据挖掘关注对特定问题及其数据的理解,针对每个问题设计最适合的解决方案。但本文作者却使用同一个管道,解决 3 个不同数据分析预测问题,都取得了比较好的结果。这种思路与机器学习类似:不针对某个具体问题,而是优化模型或算法。同时,在这三项竞赛中,都涉及了随机森林、PCA 等常用的机器学习算法。希望作者的 Kaggle 竞赛实践经历能对你有所启发。 (文/Ying Dong)近年来大数据已成为一个热门话题。由于计算机技术和数据存储能力的快速发展,世界上的数据量已经在各种领域呈爆炸趋势
大数据文摘作品,转载要求见文末 原作者 | Per Harald Borgen 编译 | 魏子敏,赖小娟,张礼俊 “对外行来说,想要入门机器学习可能是个不可完成的任务。然而,在沉溺于一周的机器学习基础学习之后,我发现它比我之前想象的更容易理解。” 这篇文章来自于medium,一位作者亲历了一周入门机器学习后,分享他的“从下到上”的学习经验给各位,希望给那些有兴趣入门机器学习的读者一个容易上手的详细日程表。 背景 在我开始我的机器学习周之前,我已经了解这个项目一段时间了,浏览了一半Coursera上Andr
AI科技评论按:随着诸如 Twitter、Facebook、新浪微博等社交平台的兴起,每天有成千上万的消息在这些平台上产生并传播。在如此大体量的消息中,如何能提前预测某条消息在未来的关注转发量(流行度),对于用户和平台而言都具有很大的意义。因此,本文将为大家介绍目前的网络信息流行度预测研究进展,以及中科院博士生曹婍提出的基于深度学习技术的端到端流行度预测框架(DeepHawkes 模型)。该工作已被国际会议 CIKM 2017 录用并发表。 曹婍,目前就读于中国科学院计算技术研究所的网络数据科学与技术重点实
最近遇到了一些朋友在群里讨论数据有哪些工作内容,看了一些讨论后总感觉不是很全面。今晚就顺便整理一波居士自己对数据工作内容的理解,这次会从数据团队的角度出发有哪些工作内容,希望能帮助大家理清思路。
作者 | 温芳 360 系统部数据开发高级工程师 一年前,360 系统部开始研究云舟项目——打破传统存算一体结构、保持近实时的弹性,云原生计算存储分离类似 Snowflake 的 DaaS 数仓平台,并支撑公司日益增多的机器学习任务 。 我们遇到的第一个挑战就是线下存储如何与云上的计算资源适配,数据依然存储到云下的 PoleFS 存储中,无法对接云上的 Serverless 弹性容器实例。我们倾向于使用 serverless 容器,因为它简单易用、极致弹性、最优成本、按需付费;但同时 Serverless
作者 | 韩建飞 2023 年 2 月 5-7 日,QCon 全球软件开发大会在北京举行。作为全球领先的智能终端科技企业,OPPO 云服务中心高级总监韩建飞受邀出席,并发表了题为《OPPO 全球混合云建设之路》的演讲,与现场开发者共同探讨 OPPO 在混合云领域的探索与实践。本文为韩建飞老师的现场演讲实录 大家好,我今天分享的主题是《OPPO 全球混合云建设之路》。 众所周知,OPPO 是一家智能终端科技企业,我们今天将从用户视角出发,和大家分享 OPPO 的全球混合云建设和使用经验。 今天的分享
领取专属 10元无门槛券
手把手带您无忧上云