算法是机器学习领域的重要组成部分。
您需要了解哪些算法在那里,以及如何有效地使用它们。
简化这一知识的简单方法是查看已知的算法,并对其进行研究。
在这篇文章中,您将会发现研究机器学习算法的重要性,以及您可以用来加速对机器学习算法的理解的5个不同来源。
研究机器学习算法
你需要理解算法来掌握机器学习。
机器学习算法不像您可能熟悉的排序算法等这样的算法。
机器学习算法不仅依赖于数据,而且是自适应的。一个给定的机器学习算法的核心往往是一个随机的优化过程,这意味着它具有随机性的元素。因此,这使得机器学习算法更难以分析,并对最佳和最差性能做出苛刻的判断。
您需要应用,实施或深入思考算法以了解它们。
你可以描述一个算法如何作为一个数学方法,但要理解它的行为在实践中,你必须研究它的行动。您可以通过对算法进行实验,将其应用于很多问题,并提炼出其行为方式,以及如何在面对不同的问题类型时揭露和利用这些行为。
或者,您可以采取的捷径是深入了解其他人在您之前了解的算法。
你只需要从研究它们的算法中获得背景。
方便的机器学习算法思维导图示例。
我创建了一个按照类型组织的60多个算法的方便的思维导图。
下载它,打印并使用它。
也可以独家使用机器学习算法电子邮件迷你课程。
研究机器学习算法需要从多个来源对算法进行系统研究。
这听起来可能比实际上更可怕。你的目标是建立你自己对不同机器学习算法的一致理解,并且一致的理解对你是个人的,并且需要从多个来源对给定算法的解释进行整理。
不同的来源可以用于不同的目的,所以你需要仔细挑选和有目的地选择这些来源。
首先明确为什么要研究一个给定的机器学习算法,然后选择那些能够最好地回答您的问题的来源。
有5个不同的来源,您可以在您的机器学习算法的研究中使用,我们将依次审查。
权威来源提供算法的专家解释和描述。
它们对于加快算法速度很有用,因为解释通常是严格的,有些标准化的,至少在材料中是这样。
这些描述也可以是密集的,经常沉浸在数学中,并且侧重于使用学术语言的理论方面。这样,如果没有足够的背景,它们就很难穿透。
权威来源的例子包括:
精髓来源是算法的专家来源和原始描述。
精确的来源对于进入原作者的头脑或者机器学习算法的描述器是有利的,并且可以排除算法参数和过程的意图。
这些来源几乎总是学术和理论的,只是偶尔包含有用的使用信息。
精浆来源的例子包括:
许多算法正在进行研究。这可以采取扩展,更深入的调查,甚至简单的应用和方法与其他方法的比较的形式。
我把这些资源称为领先优势,因为它们揭示了关于机器学习算法的有用的新的和最先进的信息。
领先的边缘资源可以用来了解当前正在处理的与算法有关的问题。这些可能代表您可以注意到的算法中的有趣或困难的子流程。
通常前沿资源是密集的和技术性的,并且将需要许多工作来解释工作的意图,并提取有助于更好地理解算法的显着细节。
前沿资源的例子包括:
在实际应用中研究机器学习算法时,使用启发式算法和最佳实践可能是您感兴趣的关键信息类型。
使用启发式源提供了一个关于如何在实践中使用给定的机器学习算法的专家描述。它们对实际使用建议很有帮助,如参数配置,建议的数据准备步骤以及如何针对特定类别的问题调整和缩放算法的建议。
通常情况下,这些来源中缺少的细节必须通过直接联系作者推断或寻求。不要指望能够轻松地从这些来源重现结果,专注于提取可用于提示算法使用情况的启发式算法。
使用启发式资源的例子包括:
您可能对研究算法感兴趣,因为您想要实现它。除了上面列出的其他来源之外,您应该咨询实施来源。
这些资源是由专家或半专家在图书馆和工具中作为例子提供机器学习算法的实现。样本可能会根据许可或开源许可证发布,供您学习。
这些资源是很好的想法如何给机器学习算法可以被转换成一个可执行和可用的系统。
实施来源的例子包括:
通常,博客帖子上的实现是为了教程和理解目的而提供的,可能不会为了速度或可伸缩性而编写。在库和工具中找到的开源算法实现往往是高度优化的,不是为了便于阅读而编写的。
你可以研究机器学习算法。不要被正式的学术语言和文章和文章所吓倒。
您不需要成为博士研究生,也不需要机器学习算法专家。
您可以像任何人一样阅读论文,书籍和算法实现。
读者难以阅读的问题往往在于作者,而不在于读者。编写一个算法或研究的良好技术处理是非常困难的,当你发现它们时,那些好的来源就是宝石。
在这篇文章中,您发现了研究机器学习算法的重要性,以及您可以用来在机器学习算法中找到所需信息的5个来源。
下一步是练习你的新技能。
分享你学到的东西。