【AI科技大本营导读】在经过一年多的开发工作之后,LibRec 3.0 版本终于发布了。LibRec 是一个基于 Java 的开源算法工具库,覆盖了 70 余个各类型推荐算法,可以有效解决评分预测和物品推荐两大关键的推荐问题,目前已经在 GitHub 上收获了 1457 个 Star,612 个 Fork。
作为编程语言中最为通俗易懂的Python,学好它不仅需要正确的方法,更需要不断的算法训练。
最具含金量的信息学竞赛当然是信息学奥赛。信息学奥赛和奥数、物理奥赛、化学奥赛、生物奥赛,合称五大科奥赛。奥赛的含金量远超文科类的竞赛比如全国英语竞赛和新概念作文竞赛,也远超五大科其他类型的竞赛。
开发者写代码,和数学家写公式一样是非常自然的一件事。开发者将完成某个任务的步骤和逻辑,一行行写成代码,并期待达到预定的效果。数学家从某个事实出发,将思考过程一行行写成表达式,并期待找到复杂逻辑背后的简单关系。
关键字全网搜索最新排名 【机器学习算法】:排名第一 【机器学习】:排名第一 【Python】:排名第三 【算法】:排名第四 源 | AI深入浅出 最近几个月小编遨游在税务行业的智能问答调研和开发中,里面涉及到了很多的自然语言处理NLP的功能点。虽然接触NLP也有近两年的时间了,现在真正要应用到问答中,避免不了还是需要再重新熟识并深入研究理解。 下面是与NLP相关的一些书籍推荐、课件推荐和开源工具推荐。 主要是记录下入门的资料,由于资料的存储位置没有做规整,所以本文没有附带资源下载链接。如果有同学需要其中的资
我这个版本之前还没发到pypi,因此用起来比较麻烦。不能直接pip install **。而github上已有的bm25相关package都是低速版本,我的版本是有倒排索引来加速计算bm25得分的。因此今天把自己的库发到pypi了。过程相当顺利,没有审查,几分钟就制作好了。感叹国外的基础设施真是优秀!
主要包括计算机科学中基本的算法与数据结构,结合算法思想和Leetcode实战,总结介绍。
日前,方正集团旗下6家上市公司齐发提示性公告表示,北京银行申请对方正集团重整。若能顺利进入重整程序,6家公司的股权结构可能会发生变化。
公众号 1、Python爱好者社区,微信号:python_shequ 人生苦短,我用Python。分享Python相关的技术文章、工具资源、精选课程、视频教程、热点资讯、学习资料等。每天自动更新和推送。 2、Python爬虫分享,微信号:python_shequ 知乎专栏“爬虫从入门到放弃”作者。目前在知乎连载爬虫从入门到放弃到精通系列文章 3、张俊红,微信号:zhangjunhong0428 中国统计网专栏作者,数据分析路上的学习者与实践者,与你分享我的所见、所学、所想。 4、数据小魔方,微信号:data
他们在实习期间,研究出一种新的AI算法,相关论文已经被人工智能顶级会议ICLR 2019收录,并被领域主席赞不绝口,完全确定建议接收。
TensorFlow 2.0已发布,现在,这里有一份全中文教学的快速上手指南,基于Keras和Eager Execution(动态图)模式,北大学霸出品,获得TensorFlow官方认可。其名为,简单粗暴TensorFlow 2.0。
AI的算法你还记得多少?他们都是如何用Python和Java实现的?恐怕很多人一下子就慌了。
📷 向AI转型的程序员都关注了这个号👇👇👇 机器学习AI算法工程 公众号:datayx 一个从 中文自然语言文本 中抽取 关键短语 的工具,只消耗 35M 内存。 1.抽取关键短语 在很多关键词提取任务中,使用tfidf、textrank等方法提取得到的仅仅是若干零碎词汇。 这样的零碎词汇无法真正的表达文章的原本含义,我们并不想要它。 For example: >>> text = '朝鲜确认金正恩出访俄罗斯 将与普京举行会谈...' >>> keywords = ['俄罗斯', '朝鲜', '普京',
摘要:本篇主要分享腾讯开源的文本分类项目NeuralClassifier。虽然实际项目中使用BERT进行文本分类,但是在不同的场景下我们可能还需要使用其他的文本分类算法,比如TextCNN、RCNN等等。通过NeuralClassifier开源项目我们可以方便快捷的使用这些模型。本篇并不会重点剖析某个算法,而是从整体的角度使用NeuralClassifier开源工程,更多的是以算法库的方式根据不同的业务场景为我们灵活的提供文本分类算法。
无论是科研院所,商业巨头还是初创企业,各行各业都在大力开发或者引进人工智能,由于储备不足,导致人工智能人才现在出现缺口,而且非常巨大。
文章首发于本人CSDN账号:https://blog.csdn.net/tefuirnever
前期,将自己完整的SQL学习历程尽可能详细的总结了一遍,后台也收到了一些读者的反馈,并私信交流Python的学习历程,恰好这也在个人的计划之中。私以为,相较于SQL这种知识体系相对单一、内容体量有限(是指常用操作范围,如果想成为数据库专家自然也是学海无涯的)的知识,分享Python的学习历程要复杂得多。一方面。编程语言本身要涉及计算机组成原理、部分数学基础、数据结构与算法等等,要求更为综合;另一方面,各种编程语言之间也相对互通,若有一门编程语言的基础的情况下再学其他编程语言就会相对容易得多。所以,本篇仅就自身在学习Python过程中的基本路径进行总结。
最近,北大开源了一个中文分词工具包,它在多个分词数据集上都有非常高的分词准确率。其中广泛使用的结巴分词误差率高达 18.55% 和 20.42,而北大的 pkuseg 只有 3.25% 与 4.32%。
每天给你送来NLP技术干货! ---- 老铁们,越来越多的人来询问我是否有好的NLP ASR 推荐系统 计算广告 搜索 CV等AI算法方面实习、校招和社招职位,同时很多公司询问是否有优秀的人推荐。 为了拉进你与公司的距离,索性直接建立了一个知识星球(易于搜索 提问等),里面内容包括各个公司的最新招聘内容、最新面试笔试题、小道消息等,其中发了的和待发的包括字节跳动、美团、小红书、网易、阿里(达摩院 淘宝 阿里云)、腾讯、丁香园、快手、b站、好未来、58同城、搜狗、数美、数坤、贝壳等招聘【直接内推】,每天更新
每天给你送来NLP技术干货! ---- NLP算法工程师 职位描述 【岗位职责】 - 参与面向法律合同文本的NLP相关算法实现及代码框架搭建,如文本分类、序列标注、语义匹配等 - 在法律文本及相关数据上进行模型训练和测试,应用于相关产品,提升产品性能 - 跟进和调研学术界、业界新进展新技术,优化已有算法效果 职位要求 【岗位要求】 1. 拥有计算机专业本科及以上学历,在顶级NLP或AI相关会议或期刊发表论文者优先; 2. 有NLP、机器学习领域的理论基础和实践经验,掌握常见机器学习和深度学习基本算法;
---- 新智元报道 编辑:克雷格 【新智元导读】昨天(5月2日),北大微纳电子大厦报告厅举办了“百廿E心 共创未来”北京大学科技创新校友高峰论坛,邀请了数位走在时代前沿的科学家、企业家和投资人,开启一场关于科技创新与未来发展的探讨。 北大建校120周年之际,信息科学领域的校友回母校开启了一场高峰论坛。 这次活动主办方为北大信息科学技术学院和北大科技创新校友会,北京大学信息科学技术学院院长、中国科学院院士黄如,北京大学科技创新校友会理事长雷鸣做致辞,演讲嘉宾包括百度副总裁、AI技术平台体系总负责人王
每天给你送来NLP技术干货! ---- NLP算法工程师(校招) 工作地点:北京 工作时长:早10晚7,从不加班 工作职责 1. 负责数美风控业务场景下自然语言处理技术;包括文本分类、句法分析、自动摘要、情感分析和语义理解等; 2. 负责关键词识别、文本分类、意图识别、语义蕴含学习等工作; 3. 应用NLP技术解决场景中的对话评价、情感分析、引导、内容识别、问答匹配等工作; 4. 通过对数据的敏锐洞察,深入挖掘产品潜在价值和需求,进而提供更有价值的产品和服务,通过技术创新
编辑:弗格森 【新智元导读】 机器学习博士马超近日在微博上介绍他和导师肖臻教授一起开发的一款专门针对大规模稀疏数据的机器学习库xLearn并开源。并称, vision 是将 xLearn 打造成和 xgboost,MXNet一样的工业事实标准。 该项目由肖臻教授和马超博士合作完成。 肖臻教授 美国康奈大学博士 之前任美国AT&T 和 IBM 科学家。研究方向分布式系统和机器学习。在国际顶级刊物发表论文60余篇,论文引用超过4000次。 马超,北大云计算课题组博士生,研究方向分布式系统与大规模机器学习。同
昨天在悟空问答上看到这个问题,不免回忆到自己那些学神朋友,顺手写一篇文章,向这些学神们致敬!
4月27日,北京大学人工智能研究院成立,中国科学院院士黄如担任人工智能研究院首任院长,科技部副部长黄卫,国家自然科学基金委副主任谢心澄,教育部科技司司长雷朝滋,北京市科委主任许强,北京大学党委书记邱水平、校长郝平出席会议并讲话。
杨净 鱼羊 发自 凹非寺 量子位 | 公众号 QbitAI 北大本科生,刚刚凭借在芯片领域的贡献,斩获国际计算机学会(ACM)年度学生科研竞赛总决赛第一名(本科生组)! 还收获了来自《人民日报》的点赞。 这位少年名叫郭资政,是北京大学图灵班大四学生,目前已直博本校集成电路学院。 而此次比赛的获奖,在他的科研/竞赛履历中并不是第一次。 此前,他已经作为北京大学超算队的一员,收获世界大学生超级计算竞赛ASC一等奖。 还在DAC、ICCAD、DATE等芯片设计自动化(EDA)领域国际顶会上发表了8篇一作论文。
整理 | 伍杏玲 出品 | AI 科技大本营(ID:rgznai100) 回顾人工智能 60 多年的发展历程,我们经历了第一代以知识驱动的人工智能,第二代以数据驱动的人工智能,如今来到第三代以安全、可控为主的阶段。 为何 AI 安全如此重要?譬如去年引发全民“吃瓜”的“AI 换脸杨幂”等换脸技术,在娱乐之余,还有可能被不法分子应用到黑产以及金融欺诈事件中。 另外,由于算法存在的“对抗样本”特征,黑客可基于对抗样本技术,通过简单伪装,便能引发 AI 算法新漏洞,随之攻击系统。去年美国东北大学和麻省理工学院共同
测试表明,新研究能解验证集中90%的题目,包括NOIP、Codeforce、Leetcode等比赛中的分治和动态规划题目——这些题目,很多大模型也难以解决。
文中明确“朱松纯受聘担任北京大学人工智能研究院院长”,而朱教授则表示“感谢北京大学的诚挚邀请”。
之前发了一篇关于文件处理小实验的文章,不知道大家有没有看呢?那篇文章真的很关键,之前我本以为没有爬取成功的原因是因为我的文件处理部分出现的问题,后来经过两个小测试之后才发现并不是我的文件处理出现了问题,而是提取url的过程中出现了问题。
决策树是一种常见的机器学习算法,它的思想十分朴素,类似于我们平时利用选择做决策的过程。
马云说:大家还没搞清PC时代的时候,移动互联网来了。还没搞清移动互联网的时候,大数据时代来了。如今,早已经从O2O时代进入了人工智能时代。作为互联网从业者,“终身学习”是万年不变的真理。
中文主要有:NLTK,FoolNLTK,HanLP(java版本),pyhanlp(python版本),Ansj,THULAC,结巴分词,FNLP,哈工大LTP,中科院ICTCLAS分词,GATE,SnowNLP,东北大学NiuTrans,NLPIR,;
Django 提供一种强大而又直观的方式来“处理”查询中的关联关系,它在后台自动帮你处理JOIN。 若要跨越关联关系,只需使用关联的模型字段的名称,并使用双下划线分隔,直至你想要的字段:
---- 新智元报道 来源:weibo 编辑:yaxin 【新智元导读】一瓶矿泉水,三个馒头,就是一餐,一条90后北大数学老师的视频爆红网络。他就是韦东奕,15岁拿下IMO国际数学竞赛金奖,18岁保送北大,哈佛还为争取他不惜打破百年校规。 这位北大数学老师一夜之间圈粉无数! 手提一瓶矿泉水、三个馒头,朴素得像个「学生」。 他,是北大数学系的老师——韦东奕。 他,「横扫」各种数学竞赛『金奖』。网友称其为超脱外物的「韦神」。 韦东奕接受采访时自我介绍称,「我是北京大学数学系2010级本科生、2014
欧院长年初就让我写篇关于大数据学习的心得体验,因为申请的重大专项正式通知没有下来,一直迟迟不肯动手写。今天是十月一假期,来到办公室整理结题的两个课题材料,顺便准备一下两个大数据重大课题任务书,午休时间写下这篇欧院长让我写的小作文。
在这个号称史上最惨烈的春节档,原本被寄予厚望的电影纷纷扑街,小众的科幻片《流浪地球》却异军突起,逆袭票房第一。
每天给你送来NLP技术干货! ---- 来源 | 文化纵横(ID:whzh_21bcr) 作者 | 白如冰、梁晨 编辑 | 学妹 最近很流行一个说法,就是北京的学生考清华北大很容易,那么考入清北的北京学生和那些外省学霸们相比,水平到底有差么?如果在进入北大清华之后,地域的差异并没有影响个体的发展高度,是否意味着现有的选拔制度是合理的? 我有必要开宗明义地讲一下,我只是陈述我这些年的见闻。我老家在农村,初中就读于一家小县城中学,高中来到省会城市,大学考到北京,大学期间还辅导过学生,我亲身体验到了中国各个发展程
这段时间我会把蓝桥杯官网上的所有非VIP题目都发布一遍,让大家方便去搜索,所有题目都会有几种语言的写法,帮助大家提供一个思路,当然,思路只是思路,千万别只看着答案就认为会了啊,这个方法基本上很难让你成长,成长是在思考的过程中找寻到自己的那个解题思路,并且首先肯定要依靠于题海战术来让自己的解题思维进行一定量的训练,如果没有这个量变到质变的过程你会发现对于相对需要思考的题目你解决的速度就会非常慢,这个思维过程甚至没有纸笔的绘制你根本无法在大脑中勾勒出来,所以我们前期学习的时候是学习别人的思路通过自己的方式转换思维变成自己的模式,说着听绕口,但是就是靠量来堆叠思维方式,刷题方案自主定义的话肯定就是从非常简单的开始,稍微对数据结构有一定的理解,暴力、二分法等等,一步步的成长,数据结构很多,一般也就几种啊,线性表、树、图、再就是其它了。顺序表与链表也就是线性表,当然栈,队列还有串都是属于线性表的,这个我就不在这里一一细分了,相对来说都要慢慢来一个个搞定的。蓝桥杯中对于大专来说相对是比较友好的,例如三分枚举、离散化,图,复杂数据结构还有统计都是不考的,我们找简单题刷个一两百,然后再进行中等题目的训练,当我们掌握深度搜索与广度搜索后再往动态规划上靠一靠,慢慢的就会掌握各种规律,有了规律就能大胆的长一些难度比较高的题目了,再次说明,刷题一定要循序渐进,千万别想着直接就能解决难题,那只是对自己进行劝退处理。加油,平常心,一步步前进。
机器之心专栏 机器之心编辑部 由来自卡内基梅隆大学、美国东北大学、哥伦比亚大学、加州大学洛杉矶分校的成员共同开发的工具α,β-CROWN 获得了第二届国际神经网络验证大赛总分第一,以及 5 个单项第一!其中该团队的学生作者均为华人。 近日,一年一度的国际神经网络验证大赛VNN-COMP落下帷幕。由来自卡内基梅隆大学(CMU)、美国东北大学、哥伦比亚大学、加州大学洛杉矶分校(UCLA)的成员共同研发的工具α,β-CROWN获得了第二届国际神经网络验证大赛总分第一,比分大幅度领先。该工具由华人学者张欢(CM
之前我是数据分析师的时候,我想继续深造成为一名数据科学家,我意识到两者有很大不同。并不是说数据科学与数据分析用完全不一样的工具和编程语言,我甚至觉得数据科学是数据分析的一种形式,因为最终你是在与数据打交道——转换格式,进行可视化,得出可用的结论。
只要有一本好书,有一个舞台,每一个人都可能成为大牛级的高手,希望大家通过我精心搜集的这些网站找到自己的兴趣爱好,以增强自己的信心。
在某些办公场景下,python的确是一大利器,尤其是操作某一个特定的任务,比如批量修改文件名,某一个文件夹里的所有文件下的文件名,几行代码就能让你轻松实现批量修改文件名,省时省力,大呼,神器!
一名程序员经过自己的努力终于进了名企,但发现身边都是名校出来的学生,而自己只是普通学校出身,顿感压力山大,觉得很自卑,如下就是其在职场论坛的吐槽,很快引来了众多网友的热议。
每天给你送来NLP技术干货! ---- 编辑:zenRRan 来自:深度学习自然语言处理公众号 岗位:⾃然语⾔处理算法实习⽣ 部门:智能学习事业部 实习薪资:250~380 + 每天20元餐饮补助 工作地点:北京海淀区清河 岗位描述 1. 以打造技术影响⼒为⽬的,包括发表学术论⽂、获得⾼⽔平竞赛名次; 2. 参与信息抽取、问答、对话、搜索、知识图谱等相关应⽤的技术的研究; 岗位要求 1. 计算机/数学/统计等相关专业本科、硕⼠、博⼠在读。 2. 具有扎实的机器学习和⾃然语⾔处理理论
【新智元导读】被业界称为人脸识别“世界杯”的微软百万名人识别竞赛 MS-Celeb-1M 冠军团队技术分享。Panasonic-NUS 合作团队认为,竞赛最大的难点是如何在有限的时间内高效地对海量数据(百万级别的类别,千万级别的数量)进行收集、清理和训练,其中数据清洗工作至关重要。美国东北大学 SmileLab 实验室团队表示,实际应用中的人脸识别系统,往往需要用到“分治法”的思想,针对不同的情况进行处理,最后进行融合,往往比使用一个单一的系统要有效、准确、鲁棒。 业界公认的人脸识别“世界杯”——微软百万名
经验正交函数分析方法(empirical orthogonal function,缩写EOF)也称特征向量分析(eigenvector analysis),或者主成分分析(principal component analysis),是一种分析矩阵数据中的结构特征,提取主要数据特征量的一种方法。
你听过瑞文氏标准推理测试(Raven’s Progressive MatriCES)么?上面这张图就是一道标准的瑞文氏测试题目,是不是很眼熟?在公务员考试、一般的智力测试中我们经常看到它。 那么问题来了,你知道图中这道题的答案么?如果不知道,也用不着沮丧,因为有75%的美国人大概也不知道。但坏消息是:计算机可能知道。 近日,美国西北大学的科研团队研发了一个全新的计算模型,在瑞文氏标准推理测试中达到或超越了75%美国普通大众的表现。被媒体誉为人工智能史上的又一里程碑。 要知道,根据2016年的数据显示,一
在庆祝清华大学110周年大会上,北大校长郝平宣布:北大清华联手建立通用人工智能实验班(简称“通班”),由朱松纯领衔。
领取专属 10元无门槛券
手把手带您无忧上云