前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >误差分析助力人工智能系统设计

误差分析助力人工智能系统设计

作者头像
讲编程的高老师
发布2021-05-13 11:17:20
4340
发布2021-05-13 11:17:20
举报
文章被收录于专栏:讲编程的高老师

本文是吴恩达《机器学习》视频笔记第67篇,对应第6周第9个视频。

“Machine Learning System Design:——Error analysis”

01 笔记

上一个视频讲到,在设计实现一个人工智能系统之前该做哪些准备。在那个阶段,我们会有很多的想法,包括使用样本的哪些特征啊、使用什么样的算法啊等等,那如何对这些想法进行快速验证呢?本节视频就告诉我们一个解决这个问题的办法,误差分析。

快速构建实现需求的简单系统

一个有经验的老手在拿到一个人工智能系统需求的时候,一般会这样做:

  1. 快速地(24小时以内)构建一个简单粗暴的智能算法系统来实现这个需求,先有一个粗糙的结果。当然这个系统采用的算法不会很复杂,整个系统的流程也是很不完善的,但求快速实现一个东西可以对交叉验证数据算出一个结果来,先有一个感性认知。
  2. 绘制第1步快速实现的学习曲线、检验误差。这样做的好处是,你可以比较快速地预知下一步工作的重点,比如是否需要采集更多的样本数据啊、是否需要对样本的特征集进一步完善啊、是否需要尝试新的算法啊,诸如此类的。
  3. 误差分析。以垃圾邮件智能分拣系统为例,在起始阶段我们经常需要手动分析算法在交叉验证集上的误差表现。看看那些最容易被错分的邮件具备哪些特点和规律,看看如何改进我们的系统才能避免这种情况。

误差分析方法简介

还是以垃圾邮件分拣系统为例。

假设交叉验证集中有500封邮件,而算法错分了其中的100封邮件。现在要做些什么工作呢?首先需要对错分的100分邮件进行归类,当然这个归类工作是要手工完成的。

怎样归类错分的邮件呢?可以基于这样两点:(1)邮件类型,比如垃圾邮件是由哪一类公司发出的啊,还有是广告邮件还是病毒邮件,还有发件人的特点啊等等;(2)看看邮件还有哪些被忽略的特征可以帮助我们的算法正确对邮件进行分拣,比如常用的拼写错误啊、邮件路由啊等等。当然也可以按其它一些你能想到的对这些错分的邮件进行归类。

快速动手做一下之后,你就可以对你要解决的问题、你可能采用的算法等等有个相对全面的认识。能把努力的重点快速聚焦到合适的点上。

数值估算的重要性

如果你心中预想了一些针对你要解决的问题的可能算法,那你能快速得到这些算法的定量评价,会对你的下一步工作有重大帮助。

比如说,你不确定是否应该将“discount"\"discounts"\"discounted"\"discounting"当成同一个单词来处理,你可以去网上搜一些词干(stemming)提取软件来把这些词的词干提出来,然后决定是否把相同词干的单词当成同一个词来处理。

那怎样决定呢?这就需要我们对采用、不采用两种方案的表现进行定量的分析,分析这两种方案的错误分拣率,然后再来决定具体使用哪种方案。

具体数值评价采用什么样的方法,就要根据我们要解决的问题具体情况具体分析了。总之,如果有一些新的算法在我们脑海中闪过、或者在小组讨论会上被提出来,那最好有一个客观的评价指标来决定是否采用这种新的算法。这个可以在交叉验证集上实现。

小结

相对于花大把时间设计新的算法,前期更应该先快速把整个流程跑通,能够快速地给出一些结果。

先不用担心用的算法简单或者实现的效果很差,只有先把流程跑通了,才能帮助我们快速地验证我们一些新的算法设想是否可行。

02 视频 http://mpvideo.qpic.cn/0bf2d4b2iaadeeaoz55ognpvgh6duqpqhjaa.f10004.mp4?dis_k=3825acc0f39e1ccae433befa3d13a22c&dis_t=1620875756&spec_id=MzAxMDYwMTc4Nw%3D%3D1620875756&vid=wxv_1603892976953393152&format_id=10004

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-05-04,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 讲编程的高老师 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 01 笔记
  • 快速构建实现需求的简单系统
  • 误差分析方法简介
  • 数值估算的重要性
  • 小结
  • 02 视频 http://mpvideo.qpic.cn/0bf2d4b2iaadeeaoz55ognpvgh6duqpqhjaa.f10004.mp4?dis_k=3825acc0f39e1ccae433befa3d13a22c&dis_t=1620875756&spec_id=MzAxMDYwMTc4Nw%3D%3D1620875756&vid=wxv_1603892976953393152&format_id=10004
相关产品与服务
图像处理
图像处理基于腾讯云深度学习等人工智能技术,提供综合性的图像优化处理服务,包括图像质量评估、图像清晰度增强、图像智能裁剪等。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档