首页 / 资讯中心 / 交通百科/人工智能:什么是强化学习?

人工智能:什么是强化学习?

发布时间:2018-10-12 分类:交通百科

强化学习是AI人工智能中讨论、跟踪和考虑最多的话题之一,因为它有可能改变大多数业务。在本文中,我想提供一个简单的指南,解释强化学习,并给出一些如何使用强化学习的实际示例。

人工智能

什么是人工智能系统的强化学习?

强化学习的核心是一个概念,即最优的行为或行动被积极的奖励所加强。

就像蹒跚学步的孩子学习如何走路一样,他们根据自己所经历的结果来调整自己的行为,比如,如果之前的广义步子让他们跌倒,那么他们就会采取较小的步骤,而机器和软件代理则会使用强化学习算法,根据环境的反馈来确定理想的行为。它是机器学习的一种形式,因此是人工智能的一个分支。

根据问题的复杂性,强化学习算法可以随着时间的推移不断适应环境,以便在长期内最大限度地获得回报。所以,和蹒跚学步的孩子一样,一个在强化学习中学习走路的机器人会尝试不同的方法来达到目标,得到反馈,知道这些方法有多成功,然后调整,直到达到走路的目标为止。向前迈出一大步,机器人就会跌倒,所以它会调整步子,使其变小,以确定这是否是保持直立的秘诀。它继续通过不同的变化学习,并最终能够走路。在这个例子中,奖励是保持直立,而惩罚是下降的。基于对机器人动作的反馈,使机器人的最优动作得到加强。

强化学习需要大量的数据,这就是为什么这项技术的第一次应用是在模拟数据很容易获得的领域,如游戏和机器人。

强化学习的8个实例

尽管我们还处于强化学习的早期阶段,但有几个应用程序和产品已经开始依赖于该技术。公司开始实施强化学习的问题,顺序决策是必要的,以及强化学习可以支持人类专家或自动化的决策过程。以下是几个例子:

1、机器人学

强化学习为机器人技术提供了一个“框架和一套工具”,用于难以进行工程操作的行为。由于强化学习可以在没有监督的情况下进行,这可以帮助机器人成倍增长。

2、工业自动化

得益于DeepMind的强化学习能力,谷歌能够大幅降低其数据中心的能源消耗。最近被微软收购的盆景,提供了一种强化学习解决方案,使能源、暖通空调、制造、汽车和供应链等领域的自动化和“构建智能进入复杂和动态系统”。

3、加强预测维护

机器学习已经在制造业中使用了一段时间,但强化学习将使预测维护比现在更好。

4、游戏玩法

事实上,强化学习的第一个声名狼藉的应用是AlphaGo,一种机器学习算法,在围棋游戏中战胜了世界上最优秀的人类玩家之一。目前,强化学习已被广泛应用于各种比赛中。

5、医药学

强化学习非常适合找出健康状况和药物治疗的最佳治疗方法。它也被用于临床试验以及医疗保健中的其他应用。

6、对话系统

由于公司收到了大量以客户查询、合同、聊天机器人等形式出现的抽象文本,采用强化学习的文本摘要解决方案非常令人垂涎。这些工具固有的特点是,随着时间的推移,它们会变得更好。

7、个性化

无论是你消费的媒体,是针对你的广告,还是你应该在网上商城上购买的商品,在幕后都有强化学习算法在发挥作用,以创造出色的客户体验。

8、自动车辆

大多数自动驾驶汽车、卡车、无人驾驶飞机和船只的中心都有增援算法。英国公司Wayve设计了一款自动驾驶汽车,在强化学习的帮助下,它能在20分钟内学会驾驶。

由于需要重要的数据集才能使强化学习发挥作用,更多的公司将能够利用强化学习的能力来获取更多的数据。而且,随着强化学习的价值不断增长,公司将继续投资于资源,以找出在其运营、服务和产品中实现该技术的最佳方式。