第八十夜 学习(三)(1 / 2)

加入书签

惩罚。

分为正惩罚和负惩罚。

正惩罚是通过惩罚弱化个体行为(与正强化相反),例如殴打、辱骂、限制自由等。

负惩罚是去除个体强化物而不直接惩罚的行为,例如扣工资、没收财产、取消聚会等。

惩罚是强化的对立行为,所以,惩罚必须持续才能起到作用,如果惩罚间断则起到相反的作用(例如职工迟到但并不是每次都被抓到或是并不是每次都会受到惩罚,那么迟到行为必定会被加强,这在进化机制上看是一种不确定性收益,相当于不定间隔强化)。

惩罚在我们人类社会被大量使用,与强化有很大的不同,惩罚者在惩罚过程中往往会有愉悦的感觉,即使他们之间并没有恩怨。

实验证实,让一个班级的孩子一部分扮演警察,一部分扮演罪犯,虽然他们之前是一起玩耍的好朋友,但扮演行为产生效力的时候,警察的孩子会因为使用权力惩罚那些罪犯孩子而感到兴奋和快乐,并自发的将惩罚不断升级。

罪犯孩子受到惩罚有明显的反抗行为,例如拒绝执行命令,推挤等排斥行为,反抗也随着惩罚升级而升级。

最终脱离所有规则双方混战成一团,尽管他们之前都是好朋友。

现实中,我们进行惩罚并不一定能取得长久的效果,例如孩子考试不及格,有的家长直接脱裤子打屁股,虽然屁股被打烂但孩子下次考试依然不及格。

家长打孩子很大程度不是为解决孩子的问题,而是为了解决自己的问题,为了解气,实质上孩子考试不及格与打屁股之间根本不存在因果关系。

这个问题还是要以进化机制的生存和繁殖角度理解,惩罚从受罚个体看,本质上是自己不希望的,大部分都是减少其生存繁殖上的收益,小部分惩罚是为其长久生存繁殖有利的。

比如小孩子训练过程中总是出现错误的动作或容易受伤的动作时进行惩罚有利于其以后更高难度动作的训练和发展。

需要注意的是,对小偷进行收监的惩罚,从小偷角度看并不是有利于其生存繁殖的,在监狱里小偷是无法偷窃用于生存的钱物等资源,所以这种惩罚要足够重或是能让小偷有其他生存手段,否则惩罚不会产生长久效果,特别是小偷认知偷窃带来的生存收益远大于其所冒的风险。

惩罚必须要全方位无死角持续,否则个体会采用所有可能手段回避惩罚,惩罚如果危及生命等重大利益时,个体会产生强烈的反抗行为,这会让惩罚者无利可图。

惩罚对于受罚者而言,多数情况下并不会起到良好效果,因为惩罚一方面严重威胁其自身生存利益,二是强大的威胁感会抑制其积极学习的心理和行为,也就是习得性无助,这时惩罚对于受罚者而言已经没有任何正面意义。

从施加惩罚个体看,惩罚在一定程度上能给惩罚者自己带来收益,这种收益直接涉及生存和繁殖。

例如通过殴打孩子能树立权威,通过罚款能获得收益,通过惩罚能得到愉悦等,这和强化存在明显的区别。

强化双方是平等互利的或是强化者无利可图,惩罚则在大多数情况下是单方收益的,只在很少情况下是互利的,本质上的差别造成了惩罚是行权者优先采用的行为,而不是强化。

惩罚之所以进化,有其适应环境的合理性,在不得不实施正惩罚时(其他手段无效,例如负惩罚),注意一是惩罚必须紧跟不良行为,而不是威胁以后怎样。

二是惩罚必须公平一致,对事不对人,每次,任何人做出同样的行为受到的惩罚必须一样,否则将起反作用。

三是惩罚适度,太轻太重都不会有良好效果。

↑返回顶部↑

书页/目录