close

引用或轉貼請註明譯文出處,請尊重著作權

 

古典制約:順序弄錯的災難

(T What Not to Pair: The Consequence of Mixing Consequences)

作者:美國訓練師暨應用行為專家凱西.史黛歐(Kathy Sdao

原文出處: http://www.kathysdao.com/articles/what-not-to-pair/

譯者:黃薇菁(Vicki

譯文出處:動物的事‧響片訓練隨意窩部落格

 我很榮幸從2003年起便擔任凱倫布萊爾ClickerExpo響片研習會上的講師,我們至今已舉行過26次研習會,每場會上有幾百位飼主和狗狗齊聚一堂,參與三天的演講和工作坊,主題遍及響片訓練的各種層面。會上也包含一小時的座談會,席間有六位講師回答與會人士的問題。有一年座談會上有個有趣的提問,:「有沒有什麼訓練錯誤是無可補救的?」換言之,做響片訓練時,有沒有什麼時候你會不小心對動物未來的學習能力造成永久傷害?

 我們首先的回應是,使用嚴苛處罰當然有可能造成長期恐懼和學習障礙,在此聲明後,我的同儕主要回答:響片訓練相當能夠補救,幾乎可以用響片解決任何問題。

 但是我不同意這一點。我越來越意識到某個訓練錯誤,我相信它可能會嚴重破壞動物的學習能力及對訓練者的信任,在你改變處罰物或增強物的情緒意義時會犯下這個錯誤,訓練者通常不自覺發生什麼事。導致處罰物或增強物改變情緒價值的學習過程即古典制約

 古典制約是動物學習到環境刺激具有預測關連性的過程。我們都記得一百年前蘇聯的巴法洛夫教會狗狗聽到鈴聲就流口水,做法是重覆把鈴聲和狗狗進食關連起來。古典制約要能夠作用,鈴聲(制約刺激CS)必須發生在餵狗吃東西(未制約刺激US)之前,換言之,這兩個刺激必須依順序發生: CS之後是US,否則CS沒有對動物產生任何預測性(期望性)的意義,因此若要發生古典制約,US不能在CS之前,也不能讓兩者同時發生。

 另一個古典制約的必要原則是,US的情緒價值會倒回去「影響」CS,意即在多次「CS再出現US」的配對之後,動物對US的視覺、嗅覺或觸覺所產生的情緒,在牠見到CS時將反射地感受到相同情緒。制約刺激將承接到未制約刺激的情緒價值,[註:有時動物對CS的生理反應不同於對US的反應,例如老鼠對電擊的反應是突然間增加活動,但是牠對於預告電擊即將到來的聲響,反應卻是大幅減少活動。更多例子請見文獻報告:Rescorla, R. (1988) Pavlovian Conditioning: It’s Not What You Think It Is. American Psychologist, 43, 151-160

 動物訓練者可透過各式不同的有用方式利用古典制約的威力,此即創造出各種制約增強物(次級增強物)的過程,包括響片聲[註:古典制約的原則是響片聲出現後,稍候一下便給賞,如果兩者同時出現,即使動物看到的給賞只是訓練者伸手去拿食物的動作,動物也不會把響片視為增強物。因此,響片聲應該要在訓練者對於食物或玩具奬賞有任何手部、眼部或身體動作之前出現才行]。古典制約可對動物感受到的環境景象或聲響產生「制約情緒反應」(conditioned emotional responses),可能是愉悅或恐懼。它也讓訓練者能夠依據簡單原則即可成功把舊的行為訊號轉移給新的訊號。

 但是古典制約在訓練時還有一個偷偷作用的方式,我們很容易忽視這一點。古典制約可以改變動物對於增強物或處罰物的觀感,原本應具有增強性或處罰性的後果經過學習而改變了情緒價值,這種改變可能普遍持久。

 莫瑞‧西德門博士(Murray Sidman)的革命性著作《Coercion and Its Fallout》(暫譯:脅迫與附帶作用)裡,他清楚說明這個概念。為了證實這個原則,西德門博士以關在操作制約箱裡的老鼠為例,他描述可以有效使電擊轉變成正增強物的簡單步驟,甚至可以用來訓練老鼠出現全新行為。實驗人員可利用古典制約使電擊和食物產生關連性(例如老鼠接受電擊後馬上獲得食物),雖然我們的常識是電擊對於動物一直具處罰作用,但是這麼做的訓練結果是,產生疼痛的電擊刺激真的變成老鼠的增強物,會讓牠想要積極獲取。(pp. 74-75)。

 以下段落摘錄自另一本書,法蘭克‧洛根(Frank A Logan)撰寫的舊教科書《Fundamentals of Learning and Motivation》(暫譯:學習與動機的基本原則,1970, Dubuque Iowa: Wm. C. Brown)。

 「要說明建立期待反應的原則有何重要性可以利用制約刺激和未制約刺激,兩者中一個具有正向情緒反應(例如食物),另一則具有負向情緒反應(例如電擊),我們來看看變化兩者出現順序會發生什麼事。

 首先設想有個環境裡,一個生物偶爾會被電擊,這預告牠接下來可以去食槽獲取食物,依此順序,電擊是制約刺激,食物是未制約刺激,後者產生的正向情緒反應變得制約於前者,除非是強烈電擊,否則電擊會喪失它令人不快的特質。這個生物會冷靜接受電擊並且迫不及待地奔向食物。或許牠會覺得以聲響或亮光預告食物到來會更好,但牠在這樣的環境裡活得相當滿意。

 現在我們把順序倒過來,以一秒作間隔。如果之前電擊後隔半秒出現食物,現在我們把環境安排成食物可自由獲取,但是這個生物吃下一口食物後,隔半秒就遭受電擊,以此順序,電擊產生的負向情緒反應會被制約在食物上頭,生物便不太會進食了。牠生活在衝突的狀態裡,表現出不當行為,事實上牠過著悲慘的生活。

 遠觀起來,這兩種環境一模一樣:都可以獲得相同份量的食物和一樣的電擊次數,但是生物對不同環境顯然有不同反應:第二個發生的事件成為這個情況的主導,因為第二個事件的情緒反應被制約到第一個刺激上,改變了它的情緒價值,電擊可能變得令人愉悅,食物也可能變得令人厭惡。(pp 55-56)」 

 我們作為動物訓練者必須理解,這兩種學習過程(處罰物變成增強物,或增強物變成處罰物)蠻常發生而我們不自覺,這才是真正危險的地方:我們的狗狗學習到猛扯牽繩、訓斥或其他厭惡刺激其實是增強物,而食物、玩具、拍撫和稱讚其實是處罰物,這常破壞我們訓練新行為的能力,導致訓練者挫折,讓狗狗感到混淆。

 以下是訓犬時發展出這類問題的常見例子:假設你因為幼犬啃咬餐桌桌腳而對牠大駡,當牠一不咬你就稱讚牠,也許還賞牠一塊零食,有些訓練師稱此為「雙面人做法」或「恩威並重的做法」,意思是狗狗不乖時你會相當嚴厲,但是只要牠一出現較喜見的行為,你就應該從大駡或猛扯牽繩轉為柔聲甜笑還餵牠吃東西。無論這個方法對於減少啃咬桌腳的行為是否有效,它所改變的是更重要的事。

 它把訓斥(或打狗或猛抽牽繩)轉變成制約增強物,這代表隨著時間累積,這個行為後果對於壓抑行為的效果越來越差,由於你不理解為何如此,你很可能認為你必須提高責駡(或打狗或猛扯牽繩)的強度,但是如果你持續在每次提高厭惡刺激強度之後就提供正增強物,即使強烈的厭惡刺激也將失去處罰(減少前一行為強度)的能力。西德門博士陳述,即使電擊(透過操作制約箱的地板傳導)的強度足以讓老鼠電得跳起來,它也可能變成正增強物,可用作使老鼠學習新行為的動機。

 對於響片訓練者和所有正增強訓練者,了解這一點為何重要?

 我們不是會儘可能避免使用處罰嗎?是的,當然,但是我相信也有必要保留符合人道的輕度處罰物,用它的效力來抑制行為。如此一來,如果偶而決定在訓練時使用輕度處罰物(例如在狗狗前腳離地,企圖搭上廚房流理台吃咬塊烤雞時出聲:「嗯-嗯!」),它就會有預期效果。最糟的情況是,我們決定在悉心策畫的訓練裡偶而使用某個處罰物,但是發現它不但沒有壓制不喜見行為,事實上還增加了它的頻率!只有明智的訓練者才明白,這時對狗駡得更大聲無法解決問題。

 要避免這種破壞性的結果,原則很簡單:在處罰之後,不要和狗狗(馬兒或甚至你的孩子)互動一段時間,可能的話,有三十秒時間不與狗狗進行任何溝通,或者至少十秒,如果只能做到這麼久,在這段短暫時間裡與狗狗「斷線」(就心理層面,非指身體,所以別把牽繩放了!)你要確保,施予處罰後沒有任何可能反制約處罰成效的事。給予處罰物後,避免對狗狗出現任何「關愛再現」。我們當然希望正增強狗狗的任何喜見行為,但是不會在處罰後的空白斷線期間這麼做。

 那麼你是否可以利用這個過程刻意化解可能的處罰物呢?是的,我可以想到幾個例子。也許某位家人會對狗大駡,你想利用古典制約教導狗狗當牠被人駡(或有人拉牠的毛或抓牠的項圈)其實是件好事,也就是說這件事預測美味食物的到來/好玩的拔河遊戲/在院子嬉鬧。或者另一個我有許多客戶遇到的狀況是,他們在帶狗散步時若感到焦慮就會拉緊牽繩,狗狗通常會把拉緊的牽繩解讀為不自在又有壓力,但是在家裡,我給的練習作業是,讓客戶利用古典制約說服狗狗,拉緊的牽繩預測好事即將發生,在多次「牽繩拉緊(制約刺激)然後就有肝零食(未制約刺激)」的連結之後,狗狗對於牽繩拉緊就會出現如同看到肝零食的情緒反應(依比耶!!!)。

 那要是發生像羅根博士說的,食物變得令人厭惡的第二種可能性呢?這對正增強訓練師是個大問題,我挺常看到這情況。最常見的是訓練者拿出食物誘餌給狗看,然後立即出現某件發生疼痛、惹人厭或嚇人的事,重覆發生「食物出現然後馬上出現厭惡刺激」多次後,狗狗學習到不信任食物,甚至迴避食物,這是許多個案飼主說:「可是我的狗對食物缺乏動機。」的真正理由。

 以下是一些情況,顯示意外的古典制約可能造成某種程度的食物迴避現象:

。上敏捷課時使用切塊牛排誘導猶豫害怕的狗狗走上翹翹板(切塊牛排出現,接著是動來動去的可怕翹翹板)

。在冰箱門塗花生醬讓狗狗舔,同時你把牠打結的毛梳開(花生醬出現,接著是梳毛太過用力或過久,即便輕輕梳毛一下下可能沒事)

。給家中焦慮的狗狗一個塞了起司和餅乾的kong玩具,然後馬上出門上班(起司和餅乾出現後,接著是極度痛苦的分離。對於還沒有先在無壓力情況學習過把玩kong玩具的狗狗來說,這個做法的問題尤其大)

。你注意到對街有狗接近就馬上餵你家會攻擊其他狗的狗狗吃雞肉,牠吃了一些雞肉之後才注意有狗接近(雞肉出現後,接著出現「威脅性」犬隻。較佳的技巧會是在狗狗注意到其他狗之後再餵牠雞肉)

。發狗餅乾給陌生人,讓他們餵自己的害羞幼犬(狗餅乾出現後,接著與可怕的人有太多近距離互動)

。讓食物產生不當連結的情形裡,較不普遍的兩個是,訓練者一直試圖餵食已吃飽的狗(也許在訓練課結束前),或在緊迫情境(例如在獸醫院裡)裡企圖強迫餵食。

 以同樣的做法甚至可能一不小心使響片聲產生不良連結,這是為何我在處理恐懼犬時使用響片會特別謹慎,雖然響片訓練是協助狗狗克服恐懼的理想做法,重要的是響片之後不會發生令狗狗害怕或無法面對的事件。傳奇訓練大師羅伯‧貝利(Bob Bailey)說過:「你的響片是一輩子的。」所以我們必須小心讓它保持清楚明確的正向意義。 

 我訓練任何動物時非常重要的是,對於我可能決定使用的任何人道處罰物,我會保留它的負向情緒效用;至於我所有的未制約增強物(例如食物、玩具、遊戲、散步或撫摸)和制約增強物(例如響片聲、「對!」或稱讚),我會保留它們的正向情緒效用。即使訓練技巧再純熟和行為調整計畫再有創意,都無法補償沒有清楚區分增強物和處罰物的錯誤。

 

 

arrow
arrow
    全站熱搜
    創作者介紹
    創作者 VickiCT 的頭像
    VickiCT

    動物的事‧響片訓練

    VickiCT 發表在 痞客邦 留言(0) 人氣()