譯文出處:動物的事奇摩部落格
行為分析學家把引發操作制約行為的習得訊號稱為「區辨刺激」(discriminative stimulus)。據我所知,行為專家並不區分哪類區辨刺激透過正增強訓練而成,哪些透過負增強訓練而成。
不過實際上,兩者之間存在一個顯著差異。
響片訓練(利用標定訊號的操作制約訓練)會讓動物先發展出行為,讓它成為動物依自由意志出現的操作制約行為,藉以獲得正增強,然後再以某個區辨刺激與這個行為產生連結,於是這個區辨刺激的出現代表此時是個獲得增強的機會,每個區辨刺激訊號都是一個表現某項(或某些)特定行為即可獲得增強的機會。
這類區辨刺激以正面方式訓練而成,它永遠為正增強「開啟大門」,如果行為沒有出現,結果只是不會獲得增強而已,而如果行為發生,我們向動物保証絕對會增強牠們(我們響片訓練師有時稱此類刺激為訊號〔cue〕,以與傳統所稱的指令〔command〕有所區分。)
當動物一旦理解這類訊號(正向區辨訊號)的意義時,它們本身如同響片一樣,即成為制約正增強物,於是這類訊號可以用來作為增強其他行為的增強物。例如:你可以拿一個動物熟知的正向訊號塑形另一個行為,或者拿它增強連鎖行為中的前一項行為;這類訊號如同響片,也可作為標定訊號,尤其可以拿來標定另一項行為當中表現很好的特點,我們已知響片可以連帶引起一些我們樂見的情緒反應,這類正向制約刺激出現時似乎也有同樣的反應。
以處罰(糾錯)訓練而來的行為也有相關的區辨刺激,告訴動物何時應該出現特定行為,然而,這些區辨訊號(或指令)不一定會帶來正增強,當動物沒有出現行為或把這行為做得不對,這些刺激即可能帶來處罰(通常稱為「糾錯」),現在這種負向區辨刺激(通常稱為指令)便成了制約負增強物,代表此時是個避免受罰的機會。
甚至行為完全以正增強訓練而成,如果你從現在開始,在給予區辨刺激(訊號或指令)之後,當動物出現正確行為即按下響片,而出現不對行為即給予負面處罰(猛扯項圈、口頭斥責等),這個區辨刺激將很快喪失作為正增強物的效果,就破壞力最低的程度來看,它將使動物混淆,不知它將帶來哪種增強。它不再像響片,不再自動引發制約正增強物連帶而來的正面情緒,在連鎖行為裡它也不一定具有增強前項行為的作用。
即使在訓練(或表演)當中或結束後提供大量的初級增強物(primary reinforcers,如稱讚、玩具和零食),這些區辨刺激本身已經同時成了「威脅」與「承諾」。
有趣的是,在這些意義矛盾的區辨刺激之前或之後所發生的行為很容易變糟:
之前的行為──因為缺少制約正增強物(positive conditioned reinforcer,此時區辨刺激已含負面意味),所以它可能開始消失
之後的行為──動物可能因為這個行為受罰,所以牠們較會避免出現這個行為。
從學習者的態度上看得到顯著轉變──從 專心熱切 轉為 遲疑拖拉 ,而且常看得出來牠們出現緊迫的徵兆。雖然動物對區辨刺激出現成功反應時獲得了獎勵,可是出錯時仍會受罰,你使得這些區辨刺激變得意義矛盾、亦善亦惡,動物無法預料它將帶來何種後果,它們已不再「安全」-- 你已經「毒害」了這些訊號。
留言列表