机器学习在当今大多数主流行业中盛行。世界各地的企业都在争相将机器学习融入其职能,为有抱负的数据科学家提供的新机会也成倍增长。
然而,行业需求与现有资源之间存在巨大差距。很多人并不清楚机器学习是什么以及它是如何工作的。但“教机器”的想法由来已久。还记得阿西莫夫的机器人三定律吗?机器学习的理念和研究已经存在了几十年。然而,近年来出现了大量的行动、发展和热议。读完本文,您不仅会了解机器学习,还会了解它的不同类型、不断增长的应用列表以及该领域的最新发展。
机器学习是一门教会机器如何自学的科学。现在,你可能会想:我们为什么要这样做?因为它在分析和自动化应用方面有很多好处。其中最重要的是:
机器可以高精度地完成高频重复性任务,而不会感到疲倦或无聊。
为了理解机器学习的工作原理,我们以拖地和清洁地板为例。当人类完成这项任务时,结果的质量各不相同。几个小时的工作后,我们就会感到疲惫/无聊,生病的几率也会影响结果。根据地点的不同,拖地对人类来说也可能是危险的。另一方面,如果我们能教会机器根据地板的状况和类型来检测地板是否需要清洁和拖地,以及需要多少清洁,那么机器就能更好地完成同样的工作。它们可以继续工作而不会感到疲倦或无聊!
这就是机器学习的目标!让机器能够自主学习,从而回答诸如:
机器学习分为三种类型:
任何机器学习模型的开发大致可以分为六个步骤:
一个显而易见的问题是:机器学习已经存在了几十年,为什么现在才出现这种情况?
这种发展是由一些潜在的力量推动的:
这四种力量共同创造了一个世界,我们不仅可以创造更多数据,还可以廉价地存储数据并对其进行大规模计算。这在以前是不可能的,即使机器学习技术和算法已经存在。
机器学习中使用多种工具和语言。工具的具体选择取决于您的需求和运营规模。以下是最常用的工具:
语言:
数据库:
可视化工具:
其他常用工具:
机器学习中的算法分为不同的类别。
您所看到、听到和做的一切都是数据。您只需以正确的方式捕获这些数据即可。
如今,数据无处不在。从网站和智能手机上的日志到健康设备,我们都在不断地创建数据。世界上 90% 的数据都是在过去 18 个月内创建的。
这个问题没有简单的答案。这取决于您要解决的问题、收集增量数据的成本以及数据带来的收益。为了简化机器学习中的数据理解,以下是一些指导原则:
数据大致可分为两类:
机器学习模型可以处理结构化数据和非结构化数据。但是,您需要先将非结构化数据转换为结构化数据。
既然您已经掌握了机器学习的基础知识,您可能会问它还有哪些其他应用,以及它们如何影响我们的生活。除非你一直与世隔绝,否则你的生活已经深受机器学习的影响。
让我们来看几个我们已经运用机器学习成果的例子:
虽然机器学习在过去几年取得了巨大的进步,但仍有一些重大挑战亟待解决。这是一个活跃的研究领域,我预计很快就会有人投入大量精力来解决这些问题。
机器学习是席卷全球的人工智能革命的核心。这使得人们更有必要了解它并探索其潜力。虽然它并非解决所有问题的灵丹妙药,但它为未来提供了一个充满希望的框架。目前,我们正在目睹人工智能发展与道德把关之间的斗争,而道德把关正是为控制它而设立的。随着这项技术的日益普及,人们很容易因为关注其实用性而忽视其风险,这是过去的一个严重错误。但有一点是肯定的,那就是未来的前景一片光明。