引用或轉貼請註明譯文出處,請尊重著作權
訓練結束訊號
(The End-of-Session Signal)
作者:美國知名動物訓練師Ken Ramirez,發表於
現任凱倫布萊倫響片訓練公司的執行副總裁及訓練長
有近四十年訓練及諮詢經驗
曾在世界知名的美國Shedd水族舘擔任動物照護及訓練部的執行副總裁
著作《動物訓練:透過正增強的成功動物管理(暫譯)》
(ANIMAL TRAINING: Successful Animal Management Through Positive Reinforcement)
是動物園領域許多訓練員的必修寶典。
原文出處: http://www.clickertraining.com/the-end-of-session-signal
譯者:黃薇菁(Vicki)
譯文出處:動物的事‧響片訓練隨意窩部落格
「訓練結束訊號」是好或是壞?訓練者應該使用這個訊號嗎?上個月的賓州獸醫工作犬會議(Penn Vet Working Dog Conference)上,我與一群搜救犬訓練師對這個訊號辯論起來,討論得很熱烈。
要留意的重點是,科學文獻裡沒有出現「訓練結束訊號」,它是訓練圈子裡出現的做法。簡單來說,「訓練結束訊號」代表任何刻意使用的預測性訊號,它告知動物,訓練已結束。這個工具的應用沒有一定的做法,優缺點則取決於此訊號的使用方式。
支持使用的人
在一段壓力大或困難的訓練之後,訓練者有時會給動物一個「結束」訊號,他們解釋這個訊號的作用是增強物,不但代表耗神費力的活動結束了,也代表有休息的機會。
許多工作犬(尤其是導盲犬和某些服務犬)需要長時間專注執行特定任務。訓練師會教導「休息」訊號,向動物表明牠不再需要積極工作,直到有人下令回到工作狀態為止。舉例來說,當人帶狗狗到了餐廳,人坐在桌旁,下令讓狗狗休息,有時這可以視為「訓練結束訊號」。
有時訓練者使用「訓練結束訊號」的原因是,訓練結束後狗狗依然非常熱切專注,追隨著訓練者,一直盯著人,所以他們覺得「訓練結束訊號」向狗狗清楚傳遞資訊,代表狗狗不再需要留意人,可以做自己的事。
反對使用的人
有些訓練者主張,「訓練結束訊號」沒必要使用,甚至有壞處。如果這個訊號代表訓練結束,這通常代表不再有正增強。依定義來說,取消獲得正增強的機會是暫停的做法,技術上來說是負處罰物。在訓練最後以暫停結尾會處罰最後一個行為或最後一串行為,所以它是個好工具或壞工具呢?
在我讓使用「訓練結束訊號」的各位恐慌,擔心自己一直以來處罰了狗狗之前,請放輕鬆,事實可能不然。讓我們來看看「訓練結束訊號」的一些用法,看看每一個用法對動物的意義有何不同。
傳統訓練
在我專業生涯初期,即我學習到正增強之前,我參與使用糾錯處罰的傳統訓練,在這種情況之下,「訓練結束訊號」標示壓力的結束,於是狗狗大概會鬆了一口氣,這個訊號的作用是負增強物。
導盲犬
我做導盲犬訓練時,我們教導狗狗當牠不需要積極導盲時會叫牠「休息」,如前述的餐廳例子。許多訓練師稱這個「休息」訊號為「訓練結束訊號」。但以我之見,它只是個放鬆的「等待」行為,不過是要導盲犬執行的一長串任務之一。以此用法來說,這個訊號相當有好處。
搜救犬
我四月發表的文章《When Training Is Too Much Fun!》裡提過搜救犬卡森,因為無意間使用的「訓練結束訊號」而使牠喪失了提報行為。可預測地,這個訊號的出現意謂回家時間到了,卡森因而在無意間受到處罰。牠極愛搜尋,對於樂趣結束了而感到失望。
使用「結束」訊號的訓練者總是在給予訊號後就去上班或消失了,留下狗狗自己獨處,我認為他們的狗狗便是和卡森一樣。如果狗狗喜歡訓練,但「訓練結束訊號」出現後接下來訓練者就消失,狗狗可能會視它為非常不快、具懲罰性的經驗。
正向的替代做法
有些訓練者結束訓練時使用「結束」訊號,接著馬上發生一些事:可能是得以到戶外的機會,玩新玩具的機會,獲得可以啃咬很久的零嘴,或是開始沙發上的抱抱時間。這時的「結束」訊號不會結束增強,其實它是一個開始新增強活動的訊號。
我以前訓練過一群海象,正式訓練結束時我們總是提供牠們蛤蠣、九孔和其他有趣的零食,藏在堆積如山的冰塊裡。在能提供海象去冰塊堆裡覓食的機會時,我們就會給予訊號,參觀的訓練師常以為它是「訓練結束訊號」,但我們把它訓練成一個非常正向的增強性訊號。
結語
由於使用「訓練結束訊號」並沒有規定用什麼方法,而且它的用法不一,所以不可能以一概全地說它是好或是壞,雖然前述例子可能都稱為「訓練結束訊號」,但有可能用詞不當,因為每個訊號的作用都非常不同。
許多訓練者使用「訓練結束訊號」卻不自知:解下零食袋,給狗狗看空空的雙手,離開狗狗或結束時搓揉狗狗一下,如果我們不小心謹慎的話,這些動作可能都具有懲罰作用。
是否使用所謂的「訓練結束訊號」無法用來顯示訓練做得好不好,要點是這個訊號的用法,而且最重要的是學習者的反應。「訓練結束訊號」的最佳用法是讓人慢慢地退出當時情境,人的消失不會對之前的行為形成處罰,而增強物則自然而然地消失,例如給訊號後讓狗狗去玩,或給予玩具,或提供找零食的益智玩具。
了解自己增強或處罰了什麼行為,也要準備好可能要調整自己的做法,以讓狗狗成功。
結束訓練時觀察學習者的行為,如果牠放鬆自在,行為合宜,你可能不需要改變結束訓練的方式。相反地,如果你看到訓練結束時,狗狗表現緊張、挫折或問題行為,你可能要檢視結束訓練的方式。
觀察狗狗學習到什麼,表現出什麼,「聆聽」牠的肢體語言和行為告訴你什麼。我們的目標應該是給予明確的指導,並且營造讓學習者成功的情境。
訓練快樂!
留言列表