Translate

lunes, 13 de junio de 2011

programar es progresar, premios y castigos.

En la vida cotidiana hay reglas bien definidas que rigen la existencia de cada uno de nosotros, que programan nuestros premios o castigos. Así, los padres suelen decirles a sus hijos que les darán apoyo económico o algún privilegio deseado ( por ejemplo, salir de noche), a condición de que cumplan con determinados quehaceres. 
Tambien hay ocasiones en que los padres aceden a dar los hijos regalos y recompensas si obtienen buenas notas o buen comportamiento, sin embargo esto lleva también a un condicionamiento aprendido, los niños se acostumbran digamos a si lo hago que " que daréis", mal... muy mal , se enseña a los niños a hacer las cosas por algo No por que hay que hacerlas y punto. Sin embargo el método más correcto es decir al niño esto tiene que hacerlo y si no lo haces tendrás x castigo, por que es tu obligación hacerlo. Es otra forma de educar más eficaz y enseñando a no que no sean interesados en la vida, que hagan las cosas por Si. 
De  hecho, el refuerzo constante es infrecuente. Tanto el pescador como el jugador de póker saben que no siempre pescan un lenguado u obtienen un póker de ases. Pero persisten porque sus esfuerzos se han visto reforzados ocasionalmente. Estamos sometidos a normas que podemos denominar programas de reforzamiento parcial o intermitente y que aseguran la persistencia de una conducta, mucho más que los reforzamientos constantes, que acaban por extinguir la respuesta por cansancio o rutina. Se trata de programas que promueven seguridad y variedad a la vez lo cual es sinónimo de comportamientos deseables. En los inicios del aprendizaje es preferible que se asimile con el refuerzo continuo, pero a la larga, el refuerzo parcial determina una mayor resistencia a la extensión.
¿Cuántos programas de reforzamiento intermitente hay? Los más conocidos son cuatro y están determinados por intervalos de tiempo o por coeficientes de "respuesta al reforzador". Los más conocidos son cuatro y están determinados por intervalos de tiempo o por coeficientes de " respuesta al reforzador". 
Los programas de intervalo fijo están regulados por un tiempo fijado de antemano, con una pausa igual después de cada refuerzo. Durante este período no se dispone de reforzadores, reforzándose la respuesta siguiente en el momento de concluir el intervalo fijo. Los ejemplos más claros son el sueldo o los regalos ofrecidos en un tiempo determinado por la tradición, como los cumpleaños. 
En los programas de intervalo variable, el lapso está marcado por un valor medio sometido en parte al azar, Se refuerza la primera respuesta después de intervalos variables. Uno de los ejemplos más frecuentes es el ceder ocasionalmente a las rabietas de los niños en pos de una tranquilidad que, a la larga, puede volverse contra nosotros. Los programas de intervalo variable tienden a producir una respuesta lenta pero regular. 
Los programas de intervalos variables. Uno de los ejemplos más frecuentes es el ceder ocasionalmente a las rabietas de los niños en pos de una tranquilidad que ,a la larga, puede volverse contra nosotros. Los programas de intervalo variable tienden a producir una respuesta lenta pero regular. 
Los programas de razón fija se basan en un refuerzo que aparece después de un número determinado y prefijado de respuestas. El ejemplo más conocido es el trabajo a destajo: por cada cincuenta unidades de producción se recibe una prima. El descanso mientras se cumple un programa de razón fija tiende inexorablemente a aplazar o reducir la recompensa. Quizás por ello es un programa no demasiado popular, sobre todo entre los empleados; si lo miramos desde el punto de vista de los patronos, puede considerarse un sistema eficaz porque suele producir tasas altas de respuesta, con pausas breves y momentáneas tras cada refuerzo. 
Los programas de razón variable brindan recompensa después de un número determinado pero imprevisible de respuestas. Son los más utilizados en el juego y responsables de un buen número de adicciones compulsivas, que determinan elevados índices de respuesta, porque los reforzadores aumentan a medida que se incrementa la respuesta. 


Por todo ello, para mantener un comportamiento aprendido normal o patológico, la pauta más eficaz es reforzar al principio de forma continuada, seguir con programas intermitentes fijos y terminar con premios variables y al azar .