腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
首页
学习
活动
专区
圈层
工具
返回腾讯云官网
JasonhavenDai
专栏成员
举报
26
文章
40994
阅读量
24
订阅数
订阅专栏
申请加入专栏
全部文章(26)
NLP 服务(8)
python(7)
编程算法(6)
其他(4)
机器学习(4)
java(2)
爬虫(2)
线性回归(2)
scrapy(2)
数据库(1)
sql(1)
ide(1)
eclipse(1)
jar(1)
搜索引擎(1)
中文分词(1)
强化学习(1)
监督学习(1)
markdown(1)
scikit-learn(1)
数据处理(1)
搜索文章
搜索
搜索
关闭
在Eclipse里设置查看Java源码的方法
java
eclipse
jar
ide
作者:Christinewj 链接:https://www.jianshu.com/u/92e23757315f 來源:简书 著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
JasonhavenDai
2022-05-13
1.5K
0
命名规则
java
作者:Christinewj 链接:https://www.jianshu.com/u/92e23757315f 來源:简书 著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
JasonhavenDai
2022-05-13
1.3K
0
统计学习方法之线性回归法1.线性回归2.损失函数(Cost Function)3.梯度下降4.最小二乘法5.数据归一化6. 模型评估7.参考文献
线性回归
机器学习
1.线性回归 回归,统计学术语,表示变量之间的某种数量依存关系,并由此引出回归方程,回归系数。 线性回归(Linear Regression),数理统计中回归分析,用来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。 线性回归模型: ε表示误差项,也叫随机干扰项,即真实值和预测值之间的差异。ε服从均值为0的正态分布,其中只有一个自变量的情况称为一元线性回归,多个自变量的情况叫多元线性回归。 对模型设定的假设: 回归模型是正确设定的,即模型选择了正确的变量,且选
JasonhavenDai
2018-04-11
2K
0
快速学会LATEX数学符号和公式1.概念2.空白距离3.特殊字符$ % ^ & _ { } ~ \4. 数学公式5.参考
markdown
1.概念 LATEX 源文件的格式为普通的 ASCII 文件,你可以使用任何文本编辑器来创建。LATEX 源文件不仅包括你所要排版的文本,还包括 LATEX 所能识别的,如何排版这些文本的命令。 LATEX 使用一种特殊的模式来排版数学符号和公式(mathematics)。段落中的数学表达式应该置于 ( 和 ), $ 和 $ 或者 \begin{math} 和\end{math} 之间。 2.空白距离 LATEX 将空格和制表符等空白字符视为相同的空白距离(space)。 多个连续的空白字符等同
JasonhavenDai
2018-04-11
2.1K
0
朴素贝叶斯练习实例
编程算法
文本分类:过滤恶意留言 此处有两个改进的地方: (1)若有的类别没有出现,其概率就是0,会十分影响分类器的性能。所以采取各类别默认1次累加,总类别(两类)次数2,这样不影响相对大小。 (2)若很小是数字相乘,则结果会更小,再四舍五入存在误差,而且会造成下溢出。采取取log,乘法变为加法,并且相对大小趋势不变。 # -*- coding: utf-8 -*- """ Created on Sun Dec 10 13:51:56 2017 文本分类:应用过滤恶意留言 @author: jaso
JasonhavenDai
2018-04-11
861
0
统计学习方法之感知机1.感知机模型2.学习策略3.学习算法4.源代码
编程算法
机器学习
1.感知机模型 在机器学习中,感知机(perceptron)是二分类的线性分类模型,属于监督学习算法。输入为实例的特征向量,输出为实例的类别(取+1和-1)。感知机对应于输入空间中将实例划分为两类的分离超平面。感知机旨在求出该超平面,为求得超平面导入了基于误分类的损失函数,利用梯度下降法 对损失函数进行最优化(最优化)。感知机的学习算法具有简单而易于实现的优点,分为原始形式和对偶形式。感知机预测是用学习得到的感知机模型对新的实例进行预测的,因此属于判别模型。感知机由Rosenblatt于1957年提出的
JasonhavenDai
2018-04-11
975
0
统计学习方法之K近邻法1.k近邻法(k-nearest neighbor,k-NN)2.k近邻模型3.k近邻算法的实现
其他
1.k近邻法(k-nearest neighbor,k-NN) k近邻算法是一个基本分类和回归方法,k-NN的输入时实例的特征向量,对应于特征空间的点,输出是实力的类别,可以取多类。k-NN不具有显式的学习过程,k-NN实际上利用训练数据集对特征向量空间进行划分,并且作为其分类的“模型”。 k-NN简单直观:给定一个训练集,对新的输入实力,在训练数据集中找到与该实例最近邻的k个实例,这k个实例的多数所属于的类别就作为新实例的类。 输入:训练数据集T=(x1,y
JasonhavenDai
2018-04-11
1.4K
0
统计学习方法之概论1.基础概念2.统计学习三要素3.模型评估与模型选择、正则化和交叉验证4.分类问题、标注问题、回归问题5.学习小结
监督学习
强化学习
线性回归
编程算法
1.基础概念 统计学习是关于计算机基于数据构建概率统计模型并运用模型对数据进行预测与分析的一门学科,也称统计机器学习。统计学习是数据驱动的学科,是一门概率论、统计学、信息论、计算理论、最优化理论及计算机科学等多个领域的交叉学科。 统计学习的对象是数据,它从数据出发,提取数据的特征,抽象出数据的模型,发现数据中的知识,又回到对数据的分析与预测中去。统计学习关于数据的基本假设是同类数据具有一定的统计规律性,这是统计学习的前提。 统计学习的目的就是考虑学习什么样的模型和如何学习模型。 统计学习方法包括模型的假
JasonhavenDai
2018-04-11
1.1K
0
论文相关知识1.核心期刊2. A、B、C类3.相关概念4.阅读方法5.参考阅读
数据库
sql
1.核心期刊 CCL,全国计算语言学学术会议 ACL,国际计算语言年会 NIPS,神经信息处理系统进展大会 SCI SCI即《科学引文索引》(Science Citation Index),是由美国科学信息研究所(Institute for Scientific Information 简称ISI)创建的,收录文献的作者、题目、源期刊、摘要、关键词,不仅可以从文献引证的角度评估文章的学术价值,还可以迅速方便地组建研究课题的参考文献网络。SCI创刊于1961年。经过40年的发展完善,已从开始时单一的印刷
JasonhavenDai
2018-04-11
1.5K
0
统计学习方法之朴素贝叶斯1.概述2.基础知识3.基本方法4.参数估计5.简单实现
编程算法
1.概述 朴素贝叶斯分类是贝叶斯分类器的一种,贝叶斯分类算法是统计学的一种分类方法,利用概率统计知识进行分类,其分类原理就是利用贝叶斯公式根据某对象的先验概率计算出其后验概率(即该对象属于某一类的概率),然后选择具有最大后验概率的类作为该对象所属的类。 总的来说:当样本特征个数较多或者特征之间相关性较大时,朴素贝叶斯分类效率比不上决策树模型;当各特征相关性较小时,朴素贝叶斯分类性能最为良好。另外朴素贝叶斯的计算过程类条件概率等计算彼此是独立的,因此特别适于分布式计算。 朴素:特征条件独立 贝叶斯:基于
JasonhavenDai
2018-04-11
824
0
自然语言处理绪论1.词法分析歧义2.两类不同的语言处理模型3.评测技术4.图灵实验5.学习姿势
NLP 服务
1.词法分析歧义 自然语言处理中的歧义 分词歧义,作为自然语言处理的第一个步骤。 词性标注 语法分析歧义 语义分析歧义 语用歧义 2.两类不同的语言处理模型 2.1能力模型 基于语言学规则的模型 建模步骤: 语言学知识的形式化 形式化规则算法化 算法实现 2.2应用模型 根据不同的语言处理应用而建立的特定的语言模型,通常是基于统计的门票性。又称为“经验主义的” 语言模型 建模步骤
JasonhavenDai
2018-04-11
1.4K
0
Docker初尝试1.What is Docker?2.Try It3.Use It
其他
1.What is Docker? 关于Docker,网上有很多讲解,不在此处赘述,提供两个不错的学习链接,望自行学习。 Docker Github Docker Doc Docker — 从入门到实践 网易云课堂 2.Try It 本机环境:windows 10 Docker's Doc 原本想用最新的docker for windows,结果需要开启windows自带的Hyper-V,结果创建的Hyper-V适配器与锐捷认证冲突(尴尬的锐捷...),于是选择用DockerToolbox方
JasonhavenDai
2018-04-11
727
0
使用EndNote管理文献1.EndNote2.下载安装3.登录客户端4.同步EndNote Web5.关联Micrasoft Word
其他
1.EndNote 官网 知乎 2.下载安装 链接 3.登录客户端 选项->首选项->同步(Sync) 具体的EndNote使用方法,网上有很多,这里不再大篇幅叙述。 4.同步EndNote Web
JasonhavenDai
2018-04-11
1.2K
0
搭建Visual Studio Code+Python开发环境1.对象简介2. 搭建步骤3.小结
其他
1.对象简介 此次介绍的对象是Visual Studio Code。什么是Visual Studio Code呢? Visual Studio Code是一个轻量级但功能强大的源代码编辑器运行在你的桌面和可用于Windows,MacOS和Linux。它配备了JavaScript的内置支持,TypeScript和Node.js有一个丰富的生态系统,对其他语言的扩展(如C++,C #,java,Python,PHP,GO)和运行时。 同类型的编辑器还要sublime text,atom,vim等,那它有什
JasonhavenDai
2018-04-11
1.4K
0
自然语言处理概论1.NLP相关学科2.相关术语3.知识内容4.发展概况5.中文特征6.中文语言处理发展的主要困难7.基础理论8.主要应用
NLP 服务
1.NLP相关学科 语言学 信息论 生物学 计算机科学 数学 等等...... 2.相关术语 中文信息处理 中文语言处理 计算语言学 自然语言理解 智能化人机接口 3.知识内容 3.1基础 音位学->形态学->词汇学->句法学->语义学->语用学 举例 语音输入:delete file x 音位学处理:dilet'#fail#eks 形态学处理:"delete" "file" "x" 词汇学处理:(“delete”VERB)(“file”NOUN)(“x”ID) 句法分析处理:
JasonhavenDai
2018-04-11
1K
0
人民日报标注语料库(PFR)1.标记说明2.格式说明3.例子4.生语料库和熟语料库5.其他语料库汇总
NLP 服务
PFR语料库是对人民日报1998年上半年的纯文本语料进行了词语切分和词性标注制作而成的,严格按照人民日报的日期、版序、文章顺序编排的。文章中的每个词语都带有词性标记。目前的标记集里有26个基本词类标记(名词n、时间词t、处所词s、方位词f、数词m、量词q、区别词b、代词r、动词v、形容词a、状态词z、副词d、介词p、连词c、助词u、语气词y、叹词e、拟声词o、成语i、习惯用语l、简称j、前接成分h、后接成分k、语素g、非语素字x、标点符号w)外,从语料库应用的角度,增加了专有名词(人名nr、地名ns、机
JasonhavenDai
2018-04-11
5.3K
0
学习使用Jieba1.Jieba2. 特点3.功能4.安装5.使用6.其他中文分词工具
编程算法
中文分词
NLP 服务
搜索引擎
python
1.Jieba 相信大多数知道NLP的人都知道什么是Jieba,但对于像我这样的新手而言,也仅限于知道而已,并没有学习过它,使用过它,打算用几天的时间来记录自己学习、使用Jieba的过程。 jieba是一款开源的中文分词工具 github ,“结巴”中文分词:做最好的 Python 中文分词组件 "Jieba" (Chinese for "to stutter") Chinese text segmentation: built to be the best Python Chinese word s
JasonhavenDai
2018-04-11
1.4K
0
小爬虫之爬取豆瓣电影排行榜1.技术路线2.任务3.分析4.运行结果5.源码
python
scrapy
1.技术路线 python 3.6.0 scrapy 1.4.0 2.任务 爬取豆瓣电影排行榜电影相关信息 2.1查看豆瓣的robots User-agent: * Disallow: /subject_search Disallow: /amazon_search Disallow: /search Disallow: /group/search Disallow: /event/search Disallow: /celebrities/search Disallow: /location/dram
JasonhavenDai
2018-04-11
793
0
自然语言处理构建文本向量空间1.百科2.源代码3.参考:
NLP 服务
编程算法
1.百科 TF-IDF 2.源代码 系统环境 python 3.6 scikit-learn==0.19.1 # utf-8 import os import math import numpy as np ''' 不使用NLTK和Scikits-Learn包,构建文本向量空间模型 reference: https://mp.weixin.qq.com/s/DisMF8frY2pkpGMfrWk4Wg ''' def load_doc_list(file): with open
JasonhavenDai
2018-04-11
530
0
《Python自然语言处理》答案第一、二章
python
NLP 服务
第一章 1 12/(4+1) 2 26**100 4 len(text2) len(set(text2)) 7 len(list(nltk.bigrams(text5))) 15 [w for w in sorted(text5) if w.startswith('b')] 17 def find_word(text,word): ...: pos=0 ...: while pos<len(text): ...: try: ...:
JasonhavenDai
2018-04-11
1.1K
0
点击加载更多
社区活动
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·干货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档