close

 

引用或轉貼請註明譯文出處,請尊重著作權。

 

練『走開Leave it):腳蓋住食物是不是處罰?

原文出處:http://clickertraining.com/node/1612

作者:凱倫‧布萊爾,別斃了那隻狗作者

譯者:黃薇菁(Vicki)

譯文出處:『物的事‧響片訓練』奇摩部落格

延伸閱讀書目:《別斃了那隻狗!》,商周出版

 

  你訓練「走開!」(Leave it!)──把食物丟在地上,狗兒衝過去,你用腳蓋住食物,這是環境管理或負處罰(移除想要的事物)?

  它的暗示是,如果這是負處罰,好的響片訓練者應該不需要這麼做,這引起一個問題:「怎有可能訓練走開但不必這麼做呢?」這討論可有趣了!

  我尚未完成的新書(英文書名《Reaching the Animal Mind》,預定明年秋天出版)論及處罰和消弱曲線,所以我很高興來談談。

  每個處罰物(punishers)都是厭惡刺激(aversives),但是厭惡刺激不一定是處罰物,我以前特別提過,英國響片訓練師凱依‧羅倫斯(Kay Laurence)有趣地述及她家黃金雪達犬平日生活中遇上的厭惡刺激,牠們從床上掉下去,撞上門框,繞過樹時走錯邊不小心被牽繩勒到,腳趾踢到東西等等,狗兒從這些事件中學習到什麼嗎?你可能看不出來,所以你用腳把食物蓋住對你家狗兒而言可能只是生活中的一項厭惡刺激,好比食物掉入地板的縫隙,噢-噢,能怎麼辦呢?

不同觀點

  然而,處罰的定義──猶如美感──因人而異,它是否是處罰?視狀況而定,有兩個測試方法,應用行為專家(behaviorist)的測試是「日後這個行為的發生頻率增高或減少?」你必須多次重覆這個作法才可能有答案,而且如同許多處罰方法,你可能沒法獲得你所預期的後果──狗兒在幾次嘗試之後,牠可能不會放棄衝向食物,反而可能會衝得更快,設法在你的腳蓋住前就搶吃到食物。

  動物行為學家(ethologist)測試以腳蓋住食物對狗兒而言是厭惡刺激還是處罰物的方法是從牠的行為來看:「牠是否縮起身子或是往後退開,或者,如果牠只是猶豫了一下,牠是否出現了焦慮不安的表情嗎?」如果是的話,你就知道狗兒受到了處罰。

塑形行為時利用變化性增強時制(variable ratio schedule

  在塑形過程中一定會感受到處罰嗎?我不認為如此,進行塑形法時,你需要使用變化性時制,作選擇性增強,你必須建立起一些可抗拒消弱的抗性,因為你不希望看到動物在你沒有增強行為 一兩 次之後就完全放棄(這即過去稱為二換一的作法──藉以建立抗性的塑形步驟,不知為何大家後來把它擴充為固定比例時制,視為維持行為的絕對必要工具,當然它並不是)。

  在動物最早接觸到塑形時,即使增強比例只作了小小改變,把增強對行為比從1:1 改為 1: 2,只是一次經驗即可能讓這個新手動物進入消弱曲線,而且學習者也覺得它極具處罰效果,回想一下我的訓魚錄影帶,我的魚第一次失敗時即昏暈過去──牠當時很肯定一定會成功。我與一隻新手海豚也有過相同經驗(新書中將述及這兩例)。

  等到我們開始訓練走開時,牠大概已經早就過了會被兩次行為才能換一次增強的情形嚇到不行的階段,狗的一生中充斥各種行為後果,牠們相當快就磨出抗性。所以我們多數人塑形時利用低比例的增強時制,提高塑形要求時很慢,這樣學習者多數時候才有機會成功出現反應。

  美國響片訓練師Virginia Broitman最新的DVD中有一段塑形蝴蝶犬站在盒子上的錄影,訓練師和狗兒都技巧高超,狗兒的增強比例是4:1,牠嘗試一項新行為,被增強了幾次,然後Virginia提高要求,重做一次行為現在沒用了,狗兒便加強行為表現或改變行為的呈現,試了幾次後又成功了,再繼續下去。當然,這不是個絕對固定的時制,Virginia並不是數著響片按了幾次才增強,而是增強符合要求的行為,快速提高要求,而且狗兒多半時候很成功,而行為一直朝著最終目標的方向前進。

  這隻狗兒沒有進入消弱曲線,因為Virginia沒有讓牠走入這一步,事實上未獲增強的行為消失了,獲得增強的行為則增加,而且狗兒主動地參與,這裡沒有處罰,狗兒正樂在其中。

  因此,個人謙卑的看法是,在動物可容忍的變化性增強時制之下,塑形是有可能的,不必利用剝奪、處罰或讓牠進入消弱曲線。

抗性各有不同──長時時制、消弱及壓力

  你可以幫狗兒或其他學習者建立起間隔極長的增強時制,意思是很多行為之後才能獲取一次響片,我的新書中也有一個相關的故事:我當時舉辦英國講座,我詢問是否有人想上台示範盒子遊戲,一名女子帶著一隻不錯的邊境牧羊犬上前來。觀眾選定了一項行為──鑽到椅子下,狗兒在與椅子互動一次獲得響片後,牠嘗試了十多種和椅子相關的行為,直到觀眾都大喊:「別繼續了,那隻可憐的狗,夠了!」但是狗兒似乎很安定,飼主明白牠的能耐,這是她的抉擇。接下來狗兒把鼻子伸入椅子下,咔啦!偷看一下椅子底下,咔啦!牠理解了該做什麼,牠直接跳過領賞,反而鑽到椅子底下,當牠鑽出來時滿堂喝彩!這種增強時制很具挑戰性,但是對這隻經驗豐富的狗不算太難,每項牠嘗試過但未獲響片的行為立即被淘汱,我們所見到的不是消弱,而是抉擇,你也可以稱之為改變搜尋模式,真正的行為──搜尋使響片響的行為──維持非常強烈的表現。

  當然,你可以把增強時制弄得要求過高,使動物即使在行為上出現進展仍表現出緊迫。我讀過非訓練者所寫的感想,描述他們看見狗兒塑形時出現極不安的狀態,嘴唇後拉,舌頭伸出,臉頰出現緊迫皺摺等等,一個簡單的解釋是這些塑形的要求提高過快,狗兒其實處於消弱曲線,但我無法得知,我從未目睹過這種情形。我第一次讀到某位訓練師在文中提到他的塑形技巧包括利用消弱突破時,我大感吃驚,是的,你是可以這麼塑形,但是──哎唷──你得先建立一隻抗性很強的狗兒,我覺得難過的是,有人竟找出方法把處罰置入了令人興奮的塑形經驗。

塑形計劃

  該如何劃分呢?回來看看走開的訓練,如果動物會朝向丟下的食物衝過去,這表示你的塑形要求提高得太快

  先從丟下較無趣的東西(即狗兒只是會看看是什麼的東西)開始訓練,例如撲克牌籌碼或枯葉,這樣你很容易就可在幾次按響片之後獲得「噢,好吧」的離開反應(當然,你得先塑形出這個後退的反應才能開始加口頭訊號,例如牠注視但尚未向它移動時就按下響片)。

  接下來採用稍有趣一點兒的東西,再來才使用玩具。變化自己的行為、地點、時間、戶外或屋內等等,為這個訊號建立起良好的增強史,然後再拿無趣的食物(例如生菜或胡蘿蔔)練習,最終才是在地上散布牛肉塊再召回,或練習你的終極目標。

  何時加入訊號呢?我不知道,也許在已經建立起對初期物件的走開反應後即可,這是塑形時的個別抉擇。 

建設性的響片

  獲得響片聲永遠會比搶吃到食物有效用,我很確定你們當中有許多人做過我在響片研習會上與興奮收容所狗兒的示範──按牠跟在腳側或其他的行為,起初增強頻率很高,有時把食物丟到地上,在五分鐘內,狗兒可能完全專注在要我按下響片和響片響後給予牠的零食上,即使走經的地面上全是掉落的熱狗,完全沒想到要去找地上。

  所以,如果你必須作環境管理,以腳蓋住食物,它就只是一個暫時的管理工具。如果你不斷地這麼做,不斷地防止牠做錯,你即在訓練中加入了糾正的作法。牠可能視它為這次不走運(於是搶吃的行為可能持續),或者可能把它當成訊息:「噢,走開,對候,我現在想起來了。」,或者它可能被視為處罰。動物的反應可以協助你判讀。

  處罰有其缺點,其中一項就是當你有處罰在你的工具箱中時,你極可能會再度採用它,處罰是用來停止行為的,不是用來建立行為,請改採建設性的作法。

 

 

arrow
arrow
    全站熱搜
    創作者介紹
    創作者 VickiCT 的頭像
    VickiCT

    動物的事‧響片訓練

    VickiCT 發表在 痞客邦 留言(0) 人氣()