Avançar para o conteúdo

O que é o Condicionamento Operante em Psicologia?

O condicionamento operante, por vezes referido como condicionamento instrumental, é um método de aprendizagem que utiliza recompensas e punições pelo comportamento. Através do condicionamento operante, estabelece-se uma associação entre um comportamento e uma consequência (tanto negativa como positiva) para esse comportamento.

Por exemplo, quando os ratos de laboratório pressionam uma alavanca quando uma luz verde é acesa, recebem um pellet de comida como recompensa. Quando pressionam a alavanca quando a luz vermelha está acesa, recebem um leve choque eléctrico. Como resultado, aprendem a pressionar a alavanca quando a luz verde está acesa e evitam a luz vermelha.

Mas o condicionamento operante não é apenas algo que tem lugar em ambientes experimentais enquanto se treina animais de laboratório. Desempenha também um papel importante na aprendizagem diária. O reforço e a punição ocorrem sempre em ambientes naturais, bem como em ambientes mais estruturados, tais como salas de aula ou sessões terapêuticas.

Skinner acuñó el término de condicionamiento operante.

O condicionamento operante foi descrito pela primeira vez pelo behaviorista B.F. Skinner, razão pela qual é por vezes chamado de condicionamento skinneriano.

Como behaviorista, Skinner acreditava que não era realmente necessário examinar pensamentos e motivações internas para explicar o comportamento. Em vez disso, ele sugeriu que deveríamos olhar apenas para as causas externas e observáveis do comportamento humano.

Durante a primeira parte do século XX, o comportamentalismo tornou-se uma grande força dentro da psicologia. As ideias de John B. Watson dominaram esta escola de pensamento desde o início. Watson concentrou-se nos princípios de condicionamento clássico e, numa ocasião, sugeriu que podia levar qualquer pessoa, independentemente da sua origem, e treiná-la para ser o que quisesse que ela fosse.

Os primeiros behavioristas concentraram o seu interesse na aprendizagem associativa. Skinner estava mais interessado na forma como as consequências das acções das pessoas influenciavam o seu comportamento.

Skinner utilizou o termo operant para se referir a qualquer“comportamento activo que opere sobre o ambiente para gerar consequências“. A teoria de Skinner explicou como adquirimos a gama de comportamentos aprendidos que exibimos todos os dias.

A sua teoria foi muito influenciada pelo trabalho do psicólogo Edward Thorndike, que tinha proposto aquilo a que chamou a lei do efeito.3 De acordo com este princípio, as acções que são seguidas por resultados desejáveis são mais susceptíveis de serem repetidas, enquanto as que são seguidas por resultados indesejáveis são menos susceptíveis de serem repetidas.

O condicionamento operante baseia-se numa premissa bastante simples: as acções que são seguidas de reforço serão reforçadas e mais susceptíveis de serem repetidas no futuro. Se contar uma história engraçada na aula e todos rirem, é mais provável que no futuro volte a contar essa história.

Se levantar a mão para fazer uma pergunta e o seu professor elogiar o seu comportamento educado, será mais provável que levante a mão da próxima vez que tiver uma pergunta ou comentário. Como o comportamento foi seguido de um reforço, ou de um resultado desejável, a acção precedente é reforçada.

Inversamente, as acções que resultam em castigos ou consequências indesejáveis serão enfraquecidas e menos susceptíveis de ocorrer de novo no futuro. Se recontar a mesma história noutra aula, mas desta vez ninguém se ri, será menos provável que repita a história no futuro. Se gritar uma resposta na aula e o seu professor o repreender, é menos provável que perturbe novamente a aula.

La caja Skinner es muy utilizada en los experimentos sobre condicionamiento Operante.

Skinner distinguiu entre dois tipos diferentes de comportamentos

  • Os comportamentos de resposta são aqueles que ocorrem automática e reflexivamente, tais como retirar a mão de uma panela quente ou mover a perna quando o médico lhe bate no joelho. Estes comportamentos não têm de ser aprendidos. Ocorrem simplesmente de forma automática e involuntária.
  • Os comportamentos dos operadores, por outro lado, são aqueles que estão sob o nosso controlo consciente. Algumas podem ocorrer espontaneamente e outras intencionalmente, mas são as consequências destas acções que influenciam se ocorrerão ou não de novo no futuro. As nossas acções no ambiente e as consequências dessa acção são uma parte importante do processo de aprendizagem.

Embora o condicionamento clássico pudesse explicar os comportamentos dos inquiridos, Skinner apercebeu-se de que não podia explicar grande parte da aprendizagem. Em vez disso, Skinner sugeriu que o condicionamento operante era de muito maior importância.

Skinner inventou diferentes dispositivos durante a sua infância e pôs estas competências em prática durante os seus estudos sobre condicionamento operante. Criou um dispositivo conhecido como câmara de condicionamento operante, que hoje é conhecido como uma caixa Skinner. A câmara pode conter um pequeno animal, como um rato ou um pombo. A caixa também continha uma barra ou chave que o animal podia pressionar para receber uma recompensa.

Para acompanhar as respostas, Skinner desenvolveu também um dispositivo conhecido como gravador cumulativo. O dispositivo registou respostas como um movimento ascendente de uma linha, para que as taxas de resposta pudessem ser lidas observando o declive da linha.

Há vários conceitos-chave no condicionamento operante.

Reforço

Reforço é qualquer evento que reforce ou melhore o comportamento que se segue.dois tipos de reforço. Em ambos os casos de reforço, o comportamento aumenta.

  • Os reforços positivos são eventos ou resultados favoráveis que seguem o comportamento. Em situações de reforço positivo, uma resposta ou comportamento é reforçada pela adição de elogios ou uma recompensa directa. Se fizer um bom trabalho e o seu chefe lhe der um bónus, esse bónus é um reforço positivo.
  • Os reforços negativos implicam a eliminação de um acontecimento ou resultado desfavorável após a execução de um comportamento. Nestas situações, uma resposta é reforçada pela eliminação de algo considerado desagradável

Punição

El castigo es uno de los componentes básicos del condicionamiento operante.

Punição é a apresentação de um acontecimento ou resultado adverso que provoca uma diminuição do comportamento que se segue. Existem dois tipos de punição. Em ambos os casos, o comportamento diminui.

  • A punição positiva, por vezes chamada punição por aplicação, apresenta um acontecimento ou resultado desagradável para enfraquecer a resposta que se segue. Espancar por mau comportamento é um exemplo de punição por aplicação.
  • A punição negativa, também conhecida como punição de eliminação, ocorre quando um evento ou resultado agradável é removido após a ocorrência de um comportamento. Tirar o jogo de vídeo a uma criança depois de esta se ter comportado mal é um exemplo de castigo negativo.

Programas de reforço

El contrato de contingencias se utiliza en distintos campos como la terapia y la educación.

O reforço não é necessariamente um processo simples, e vários factores podem influenciar a velocidade e a qualidade da aprendizagem de coisas novas

Skinner descobriu que o momento e a frequência com que os comportamentos eram reforçados influenciaram a velocidade e a força da aquisição. Por outras palavras, o timing e a frequência dos reforços influenciam a aprendizagem de novos comportamentos e a modificação de comportamentos antigos.

Ele identificou vários esquemas de reforço diferentes que afectam o processo de condicionamento operante:

  • Oreforço contínuo envolve a entrega de reforços cada vez que ocorre uma resposta. A aprendizagem tende a ocorrer relativamente depressa, embora a taxa de resposta seja bastante baixa. A extinção também ocorre muito rapidamente quando o reforço é descontinuado.
  • Os calendários de rácios fixos são um tipo de reforço parcial. As respostas só são reforçadas depois de um número específico de respostas. Isto leva geralmente a uma taxa de resposta bastante estável.
  • Os horários de intervalos fixos são outra forma de reforço parcial. O reforço só ocorre depois de um certo intervalo de tempo ter decorrido. As taxas de resposta permanecem bastante estáveis e começam a aumentar à medida que o tempo de reforço se aproxima, mas abrandam imediatamente após o reforço ter sido entregue.
  • As programações de rácios variáveis são também um tipo de reforço parcial que envolve um comportamento de reforço após um número variado de respostas. Isto leva a uma elevada taxa de resposta e a uma lenta taxa de extinção.
  • Os horários de intervalos variáveis são a última forma de reforço parcial descrita por Skinner. Este esquema envolve a entrega de reforços após decorrido um período de tempo variável. Isto também tende a conduzir a uma rápida taxa de resposta e a uma lenta taxa de extinção.

Ismael Abogado

Ismael Abogado

Psicólogo e aprendiz constante da mente e da alma.

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *