机器学习101

机器学习101

近年来,“机器学习”这个词一直出现在各种讨论和论坛上,但它到底是什么意思呢?机器学习可以定义为一种基于模式识别和计算学习的数据分析方法。它由不同的算法组成,如神经网络、决策树、Bayesian网络等。机器学习使用这些算法来从数据中学习并从数据中恢复隐藏的见解。因为机器学习的过程是迭代的,所以新数据也是在没有任何监督的情况下处理的。从以前的数据中学习并将其用于未来数据的科学并不新鲜,但它正变得越来越流行。

机器学习101
机器学习101

什么是机器学习?

虽然有些人认为机器学习并不比仍在使用的传统计算机编程方法好,但许多人认为机器学习是人工智能( AI )领域的一场革命。他们相信,使用这种技术,机器将能够用自己的经验学习和做事,而不是简单地遵循人类的指令。为了更好地理解机器学习的意义,我们可以将其与传统的计算机编程进行比较。下面将讨论更多关于机器学习及其与传统编程的区别。(如果您想要了解更多关于情机器学习的一些利弊,请参阅《机器学习的承诺和陷阱》一文。)

什么是传统编程?

当我们给计算机编程时,我们实际上是在用一种它能理解的语言来给它指引方向。然后,当我们给它输入时,它根据我们给它的指令给出输出结果。

现在,让我们设想一下,您已经提供了申请信用卡的输入。在处理您的输入信息时,系统将查看应用程序的所有重要部分,获取必要的信息并对其进行处理。然后,它将根据提供给它的程序产生接受或拒绝的输出结果。

机器学习有何不同

如果您使用机器学习来代替信用卡场景中的传统编程方法,那么结果会有所不同。其结果实际上是基于输入数据,并且系统将通过处理该输入数据获得经验。机器学习没有什么特别的编程。随着时间的推移,它的性能会越来越好。

因此,机器学习实际上是通过分析系统每次使用时生成的大量数据文件来学习的。在分析数据时,它会根据更新的需求更改其编程。这也会提高其准确性。我们也可以说机器学习就像一个线性回归,其中变量和参数被改变,以更好地匹配输入。

最流行的机器学习方法

机器学习最常用的方法是无监督和有监督的学习方法。其中,最常用的是监督法。大约70 %是受监督的,10 – 20 %是不受监督的。在许多情况下还使用半监督学习和强化学习。

监督学习

在该方法中,算法包括有标记的示例,其中标记的数据意味着数据被给出了一个描述。机器学习系统将同时接收输入和相应的输出。现在,系统可以通过将实际输出与正确输出进行比较来获得更多的经验,从而发现错误。

在分析输出和确定错误之后,系统将相应地改变其编程。系统可以使用不同的方法来预测未标记数据上的标签。此方法可根据过去的数据进行未来的事件预测。

半监督学习

这种机器学习方法在类似的情况下使用,但在训练时也使用未标记的数据。未标注的数据是任何可以自然地从世界上获得但不具备任何解释或描述的数据。通常,半监督学习对未标记数据的工作多于对标记数据的学习,但它也可以使用标记数据。这是因为未标记的数据可以轻松地收集。

这种方法也具有相同的学习因素,即预测、分类和回归。当监督学习的成本太高时,这被认为是最好的方法。

无监督学习

该方法用于未分类的数据,即未标记数据。因此,系统不知道正确的输出,因此,算法必须自行确定正确的输出。它可以通过在数据中找到某些结构来实现这一点。这种机器学习方法非常适合事务性数据。学习的因素包括最近邻映射和自组织映射,以及奇异值分解和k均值聚类。

强化学习

这种机器学习方法用于游戏、车辆导航和机器人学等领域。在该方法中,系统通过试错法学习。该方法的主要目标是在最短的时间内确定输出,这可以通过遵循适当的策略来实现。

机器学习的重要性

机器学习的重要性与日俱增,这与数据挖掘的概念如此重要的原因是一样的。这些原因包括廉价和强大的计算能力、每天产生的大量数据以及廉价和大容量的数据存储方法。这些因素确保了能够非常快速地建立强大而精确的模型,可用于分析大量的大数据,从而获得更好、更精确的输出。这意味着更好的模型可以用于在更短的时间内做出更好的公司和业务决策,而无需任何人力。

快速制作这种精确模型的一种方法是自动制作模型。这种模式应具有足够的动态性,以适应不断变化的时代。虽然人类通常每周可以创建两个模型,但是机器学习可以通过快速分析数据来创建数千个精确的模型。这就是为什么机器学习对企业和其他领域如此重要的原因。

机器学习算法与过程

机器学习算法通过帮助系统快速分析数据并产生准确的结果,有助于充分利用大数据。这些算法有助于创建可用于作出业务决策的模型。算法类型有神经网络、随机森林、k均值聚类、自组织映射和最近邻映射。

然而,使用算法并不是全部。只有遵循适当的流程才能建立最佳模型。这类过程的一些例子是全面的数据管理、对数据的交互式探索和对模型结果的可视化。

机器学习对企业的影响

机器学习对企业的影响是巨大的。机器学习为企业开辟了新的可能性。它有助于精确的模型制作,这反过来又有助于快速做出更好、更明智的决策。

一些实际用例

机器学习正被用于许多地方。推荐系统使用机器学习,根据用户的偏好和当前的市场模式实时向他们提出建议。

Promedas是一个医疗软件或“桌面医生”,是一个基于机器学习的程序,它使用数百年的医学知识来帮助医生检测和诊断疾病。它利用从以往的疾病模式记录中收集的数据来识别患者的疾病。这有助于更快速地识别和治疗疾病。

Amazon通过计算机算法实现了员工访问授权和撤销的自动化,计算机算法可以预测每个员工的资源访问。为此,计算机算法使用记录来分析风险以及员工平时的可信程度。

Cornell University也在使用机器学习算法,通过声音记录探测海洋中的鲸鱼,这样船只就可以避开鲸鱼。该算法通过分析鲸鱼的迁徙数据(它们去了哪里以及何时离开的)来确定船只应该走的路线,从而避开鲸鱼。(如果您想要了解更多关于机器学习实际应用的信息,请参阅《下一代欺诈检测中的机器学习和Hadoop》一文。)

结论

随着数据日益增多,有效处理的重要性也日益增加。为此,我们设计了机器学习方法,这有助于系统作出明智的决策,同时尽量减少人工参与。这一技术目前对信息技术部门的影响是巨大的,因此可以很容易地想象,它在今后的重要性只会继续增加。

上述文章内容是由ixwebhosting中文指南为大家提供的,如果您想转载此内容,请注明转载出处:https://ixwebhosting.com.cn/

Leave a comment

电子邮件地址不会被公开。 必填项已用*标注