随着大数据的普及,网络数据资源真正成为一种潜在的宝藏,让我们非计算机专业背景的人也可以借助机器学习、人工智能等相关方法对问题进行研究。
传统的结构化数据,拿来就可以进行分析。但是网络上的文本数据,由于属于非结构化的数据,需要我们使用一定的技术和方法将其先转化为计算机能够理解的特征信息,然后我们才能对其进行分析。
文本分析(自然语言处理)是当今人工智能研究和应用的重要方向。本课程主要起到帮大家了解文本分析、简单入门自然语言处理。本课程结合十几个案例,将每章节中学到的知识通过实战方式加深各位对知识的理解,具有很强的实用性,内容覆盖了文本分析的重要方面,为相关应用的开发和研究提供了很好的参考价值。
课程目标
学会Python语言基本语法
掌握Python爬虫基本原理及方法
掌握文本分析相关库
理解文本分析思路及原理,并能实现基本的文本分析操作
了解机器学习,了解如何进行文本分类、聚类
主讲老师
适合人群
文本数据处理与分析初学者
Python爬虫初学者
高校相关专业的师生在职人员零编程基础,有分析文本数据需求者
(包括但不仅限于以上人群)
内容要点
➤第一节:初识Python(8月13日 19:30-21:30)
1、能用来做什么?
2、怎么学?
3、多久能学好?
4、环境配置
➤第二节:Python语法学习(8月14日 19:30-21:30)
1、基本语法
2、数据类型-list、str、tuple、dict、set
3、For循环、if逻辑
4、try-except
5、常用函数
6、案例1:爬虫代码中各知识点使用情况
7、案例2:文本分析代码中各知识点使用情况
➤第三节:文本数据采集(8月15日 19:30-21:30)
1、网络爬虫原理
2、requests库
3、bs4
4、元素定位
5、数据抓包
6、数据存储(txt、csv)
7、案例1:知乎live抓取
8、案例2:淘宝店铺评论抓取
➤第四节:文本分析初级篇(8月16日 19:30-21:30)
1、中文分词-jieba
2、自然语言处理-nltk库
3、可视化-pyecharts
4、数据分析-pandas库
5、案例1-词频统计
6、案例2-制作词云图
7、案例3-excel文件中的时间及字符串操作
8、案例4-基于情感词典进行情感计算
➤第五节:文本分析初级篇(8月17日 19:30-21:30)
1、one-hot
2、n-gram
3、TF-IDF
4、理解特征矩阵
5、有监督与无监督
6、机器学习库-sklearn语法学习
7、案例1-文本情感分析
8、案例2-话题分析(话题聚类)
9、案例3-文本分类(垃圾邮件识别)
10、案例4-计算消费者购物偏好
课程准备
需要提前安装Python 软件,老师会提供统一版本和安装指导文档。
课程信息
费用:399元
直播方式:知深平台直播
时间:2018年8月13/14/15/16/17日
时长:每节课2小时,每晚19:30-21:30,讲解+操作+答疑
报名截止:2018年8月13日17:00
(为保证课程效果,此次课程有限额,请大家尽快报名!)
长按下方二维码即可报名
注意事项
2、课程一经报名不再退费,请谨慎思考后报名。
3、本次为知深平台直播,详细直播方式请进群查看群文件。
4、本次课程提供回放,课程结束后会将录制视频上传至群文件,但是仅局限于报名的学员复习,不得外传于他人。
5、发票在课程结束后的一个月内开具,优先提供电子发票。
领取专属 10元无门槛券
私享最新 技术干货