首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    [编程经验] 拉勾网爬虫数据的后续处理

    上一篇我们介绍了如何爬拉勾的数据,这次介绍一下如何分析爬下来的数据,本文以自然语言处理这个岗位为例。 上次那个爬虫的代码有一点问题,不知道大家发现没有,反正也没有人给我说。。然后后面我把我最后改好的代码附在本文的最后。 本文主要分析的是岗位职责和岗位要求,基本思路是先分词,然后统计词频,最后最词云展示出来。先看下效果 从这个图可以看出来,自然语言处理大多数需要掌握深度学习,需要用深度学习去解决问题,然后是工作经验,项目经验,以及对算法的理解。 首先分词,要正确分词,需要有一份高质量的词典,因为在岗位

    08

    网络编程懒人入门(六):史上最通俗的集线器、交换机、路由器功能原理入门

    即时通讯网整理了大量的网络编程类基础文章和资料,包括《TCP/IP协议 卷1》、《[通俗易懂]深入理解TCP协议》系列、《网络编程懒人入门》系列、《不为人知的网络编程》系列、《P2P技术详解》系列、《高性能网络编程》系列、甚至还有图文并貌+实战代码的《NIO框架入门》等,目的是帮助即时通讯类应用的开发者,至少要掌握网络编程最基本的原理,所谓知其然更要知其所以然。尤其现在移动网络大行其道的时代,在网络环境如此复杂的情况下,能写好一套技术精湛、用户体验等俱佳的IM或消息推送系统,显然不是随便用用Netty、MINA、AFNetwoking、okhttp等服务端和客户端框架就能搞定的事。总之,即时通讯技术归根结底还是网络编程技术的应用,只有更深入地了解了网络编程及其相关知识,才能更好地写出优质的应用。

    03

    中科院用不起的知网,一年主营业务收入11.6亿元,毛利率高过工商银行

    金磊 发自 凹非寺 量子位 | 公众号 QbitAI 知网,又一次被架在火上炙烤。 而这次被全网热议的直接原因,是与一则网传的消息有关—— 中科院将停用知网CNKI数据库。 从网传消息来看,中科院方面对于“停用”一事做出的解释是: 续订费近千万且连年上涨;将用万方和维普来替代。 而后又有消息称,已从中科院图书馆某位负责落实此事的老师证实,此事“属实”。 且对于是否恢复对知网访问的问题,据称“至少今年应该是没有这个计划了”。 但随后,知网方面却对此发出了不一样的声音:“不属实”。 并且于今天下午发布了与中

    02

    千字1.5元、研究生学位论文3次免费,知网开放个人查重服务,网友:「毕业了才开放」

    机器之心报道 编辑:杜伟、陈萍 不过,对于 2022 届的毕业生来说,知网的这一决定来得似乎晚了一点。 一年一度的毕业季要结束了,论文答辩也早已提上日程,在这之前你的论文查重了吗? 毕业论文是普通中等专业学校、高等专科学校、本科院校、高等教育自学考试本科及研究生学历专业教育学业的最后一个环节,要想顺利毕业,这一关是必须要过的。 对绝大多数学生来说,毕业真是一把辛酸泪,自己辛辛苦苦准备的论文,完成全部内容已然元气大伤,但令人头疼的还在后面:论文查重,因为查重率直接影响着你能否顺利毕业。 大部分学校都要求查重率

    05
    领券