动物训练

动物训练基础知识

理解动物训练的第一步是学习一些常用的词汇和术语。

操作性条件作用

操作性条件作用是动物训练的基础。这是一种学习方式,在这种学习方式中,动物根据它在环境中活动的行为来学习。在操作性条件作用中,一种行为的可能性会因随后的结果而增加或减少。也就是说,一种行为发生的频率会增加或减少,这取决于它的结果。当一只动物做出一种能产生有利结果的特定行为时,它很可能会重复这种行为。

金宝搏188app下载动物每天都按照操作性条件作用的原则学习。例如,啄木鸟用喙在树上啄出洞来捕食昆虫。有一天,一只啄木鸟发现了一棵特别的树,树上有很多啄木鸟最喜欢的虫子。啄木鸟很可能会一次又一次地回到那棵树上。

人类也遵循同样的原则学习。例如,考虑一个孩子做家务的行为。假设一个孩子自愿做家务,比如打扫车库或洗车。如果这种行为受到积极关注的强化,比如表扬、金钱或其他奖励,孩子很可能会自己做更多的家务。如果没有得到积极的关注,重复这种行为的可能性就会降低。

动物驯兽师运用操作性条件反射的原则。如果动物执行了驯兽师希望看到的行为,驯兽师将执行一个有利的结果。

一名训练师在游泳池边上抚摸着一只浮出水面的海豚的头部。

如果动物执行了驯兽师希望看到的行为,驯兽师将执行一个有利的结果。

正强化

让我们进一步探讨一下这些有利的结果。有利的结果通常是一种身体体验——可以看到、听到、感觉到或品尝到的东西。这种体验是一种刺激。当动物的行为产生积极的刺激时,动物很可能在不久的将来重复这种行为。正刺激被称为正强化物,因为它强化了行为。当一个正强化物立即跟随一个行为,它增加了该行为被重复的可能性。为了有效,它必须立即遵循行为。

正强化也可以称为奖励。奖励有很多种形式。对动物来金宝搏188app下载说,最常见的奖励之一就是食物。事实上,野生动物的许多行为都是为了获取食物。金宝搏188app下载如果某些行为能让动物成功获得食物,那么下一次饥饿时,动物就会重复这些行为。

食物就是一个例子初级强化物。初级强化物是自动为正的强化物。动物不需要学会“喜欢”它们。其他主要强化物的例子包括水、庇护所和交配机会。几种类型的主要强化物提供触觉刺激,如良好的背部抓伤。对人来说,一个拥抱可以起到很强的强化作用。

驯兽师在水池边给逆戟鲸喂鱼。

初级强化物是自动为正的强化物。食物是主要强化物的一个例子。

并不是所有类型的强化因素都自动是积极的。有些是可以学会的。习得的强化被称为条件强化。例如,金钱不是主要的强化因素。对小孩子来说,钱只是纸。但是孩子们长大后知道钱可以用来买糖果、玩具和其他他们喜欢的东西。金钱变得非常有益。它是许多人类社会中最常见和最有效的强化因素之一。

金宝搏188app下载当动物与初始强化配对时,它们就能学习条件强化。假设一个驯兽师惊叫一声“好孩子”,然后给动物食物或挠背。重复几次后,“好孩子”的惊叹将成为对动物的奖赏。像这样的积极注意是条件强化物。

一名驯兽师俯身在泳池边亲吻海豚。

积极注意是一种条件强化物。

负强化

一种不太常见的强化是负强化。与正强化不同,正强化包括给予有利刺激,负强化包括消除不利的刺激。例如,假设一个孩子哭喊着要什么东西。如果他的父母让步并产生了期望的效果(即给孩子他想要的东西),孩子就停止哭泣。他通过消除不利的刺激,强化了父母的行为。可以说,这对父母来说未必是理想的结果——父母只是强化了孩子哭泣的行为!但这是负强化的一个例子。

负强化不是惩罚。处罚包括造成不利后果。惩罚减少重复行为的可能性。正强化和负强化都有增加重复一种行为的可能性。

钢筋时间表

对期望行为的积极强化可能发生在四种可能的强化计划中的一种。

固定的时间间隔。

这种加固计划是基于在一段固定的时间后接受加固。期望的行为必须在强化物被交付之前持续一定的时间。强化条件之间的时间总是相同的。也许最常见的固定间隔强化类型是员工每两周就会因为工作而得到报酬。工资加强了他继续工作的能力。

固定比率。

固定比率强化计划是基于在完成一定量的行为后得到强化。所期望的行为必须发生一定次数后才会得到强化。行为的数量总是保持不变。一个孩子读了五本书后收到了一个蛋卷冰淇淋。她每读五本书就会得到奖励。

变量区间。

变间隔强化发生在变化的时间长度之后。这种行为在随机的间隔中得到强化。志愿者工作可能属于这一类。因为这不是一份有报酬的工作,志愿者们可以通过金钱以外的方式得到加强。每隔一段时间,表达感激之情的语言或手势,都在不断增强。那个志愿者可能会继续他的工作。

变量比例。

可变比率强化发生在不同数量的行为之后。强化的变化是不可预测的,所以进行行为的人或动物永远不确定他们什么时候会被强化。人类可变比例强化的一个常见例子是赌博。一个往老虎机里投硬币的人永远不知道什么时候他会得到回报。最初,可变比率强化可能需要更长的时间来约束行为。但一旦受到条件限制,这种行为通常会发生得更快,需要更长的时间才能消失。

灭绝的行为

如果一种行为没有得到加强,它就会减少。最终,它完全消失了。这就是所谓的灭绝。动物驯兽师使用灭绝技术来消除不希望发生的行为。(在动物训练中,当驯兽师要求动物做出某种特定的行为,而动物没有给予回应,这也被认为是不希望的行为。)为了消除这种行为,他们只是简单地不加强它。随着时间的推移,动物会意识到某种特定的行为并没有产生预期的效果。动物停止了这种行为。

当使用灭绝技术时,重要的是要确定什么刺激正在加强一个动物。训练者必须小心不要在不受欢迎的行为后提出积极的强化物。避免加强不希望的行为的最好方法是根本不给予任何刺激。