- Antecedentes do condicionamento operante
- Conceitos básicos de condicionamento operante
- - Reforço
- Reforço positivo
- Reforço negativo
- Reforçadores primários
- Reforçadores secundários
- - Contingência de três prazos
- - Punição
- Punição positiva
- Punição negativa
- - Extinção
- - Generalização
- - Discriminação
- Programas de reforço
- Programas de reforço contínuo
- Programas de reforço intermitente
- Programas de proporção fixa
- Programas de razão variável
- Programas de intervalo fixo
- Programas de intervalo variável
- Mudança comportamental
- Abordagens sucessivas ou modelagem
- Encadeamento
- Referências
O condicionamento operante ou condicionamento instrumental é um tipo de aprendizagem onde o comportamento é controlado com as consequências. Baseia-se na ideia de que os comportamentos que são reforçados tendem a aparecer com mais frequência, enquanto os comportamentos que são punidos são extintos.
Qual é a diferença entre o condicionamento operante e o condicionamento clássico? No condicionamento operante, uma resposta voluntária é seguida por um reforçador. Desta forma, é mais provável que ocorra uma resposta voluntária (por exemplo, estudar para um exame) no futuro.
Skinner Box
Em contraste, no condicionamento clássico, um estímulo dispara automaticamente uma resposta involuntária. Por exemplo, a comida que um cachorro vê faz com que ele produza saliva.
O condicionamento operante pode ser descrito como um processo que tenta modificar o comportamento por meio do uso de reforço positivo e negativo. Por meio do condicionamento operante, um indivíduo faz uma associação entre um comportamento particular e uma consequência. Exemplos:
- Os pais recompensam as boas notas de um filho com doces ou alguma outra recompensa.
- O professor recompensa os alunos calmos e educados. Os alunos descobrem que, ao se comportarem dessa forma, recebem mais pontos.
- Um alimento é dado a um animal cada vez que uma alavanca é pressionada.
BF Skinner (1938) cunhou o termo condicionamento operante. Skinner identificou três tipos de respostas ou operantes:
- Operadores neutros: respostas do ambiente que não aumentam nem diminuem a probabilidade de que um comportamento se repita.
- Reforçadores: respostas do ambiente que aumentam a probabilidade de repetição de um comportamento. Os reforçadores podem ser positivos ou negativos.
- Punições: respostas do ambiente que diminuem a probabilidade de um comportamento se repetir. A punição enfraquece o comportamento.
Antecedentes do condicionamento operante
Thorndike foi o primeiro a reconhecer que o condicionamento inclui mais do que apenas uma resposta e um reforçador. A resposta ocorre na presença de determinado estímulo, considerando três eventos: o estímulo, a resposta e a consequência da resposta ou reforçador.
Edward Thorndike. Por: Popular Science Monthly Volume 80
Essa estrutura facilita a associação entre estímulo e resposta. Em sua lei do efeito, Thorndike afirmou que as respostas que são seguidas por consequências de reforço terão uma probabilidade maior de ocorrência quando o estímulo reaparecer.
Ao contrário, aquelas respostas que são seguidas por consequências negativas terão uma probabilidade menor de ocorrência quando o estímulo reaparecer. A lei do efeito é o antecedente do condicionamento operante ou condicionamento instrumental, como foi denominado por Thorndike.
Para Skinner, psicólogo comportamental, o condicionamento era o fortalecimento de comportamentos de acordo com as consequências obtidas anteriormente.
Skinner
Nesse sentido, existem duas formas de condicionamento:
- O clássico ou pavloviano: baseia-se na associação de estímulos condicionados e não condicionados, sendo as respostas controladas pelos estímulos antecedentes.
- Condicionamento operante: estímulos consequentes ou reforçadores fazem com que determinado comportamento seja emitido. Skinner explica que se o comportamento for seguido por um reforçador positivo, aumentará a probabilidade de emissão desse comportamento no futuro. Pelo contrário, se uma resposta não for seguida por um reforçador ou se esse reforçador for negativo, a probabilidade de emitir tal comportamento no futuro será menor.
Rato encaixotado de Skinner
Conceitos básicos de condicionamento operante
- Reforço
É responsável pela emissão das respostas, ou seja, a probabilidade de que aconteçam, seja maior ou menor no futuro. É um estímulo reforçador e conseqüente, pois ocorre uma vez ocorrida a resposta.
É impossível saber se um determinado reforçador influencia o comportamento até que seja contingente a uma resposta e seja demonstrado que o comportamento muda como consequência do reforçador.
Existem dois tipos de reforço: positivo e negativo. Ambos têm o mesmo propósito de aumentar a probabilidade de que a resposta seja emitida em situações futuras. Além disso, para Skinner, os reforçadores são definidos por comportamentos observáveis e mensuráveis.
Reforço positivo
O reforço positivo reforça um comportamento ao fornecer uma consequência que o indivíduo considera gratificante. Por exemplo, alimentar um cachorro depois que ele se senta. Nesse caso, o comportamento sentado seria reforçado.
Reforço negativo
Remover um reforço desagradável também pode fortalecer um comportamento. Isso é conhecido como reforço negativo, porque é a remoção de um estímulo adverso para o animal ou pessoa que faz com que o comportamento se torne condicionado.
O reforço negativo reforça o comportamento, interrompendo ou eliminando uma experiência desagradável.
Por exemplo, se uma criança é abusada em casa e quando sai para a rua não é abusada, o comportamento de sair de casa estaria sendo reforçado.
Reforçadores primários
Eles seriam todos aqueles reforçadores básicos que não precisam de nenhuma história de condicionamento anterior para funcionar como tal. Alguns exemplos seriam água, comida e sexo.
Reforçadores secundários
Os reforçadores secundários seriam baseados em histórias anteriores de condicionamento graças à associação com estímulos não condicionados. Alguns exemplos seriam dinheiro e qualificações.
- Contingência de três prazos
Fonte: Joshua Seong / Verywell
É o modelo básico de condicionamento operante e é feito de três componentes: o estímulo discriminativo, a resposta e o estímulo de reforço.
Um estímulo discriminativo seria aquele que indicasse ao sujeito que o reforçador está disponível, indicando que se ele realizar um determinado comportamento, poderá obter o referido reforçador. Em contraste, temos o estímulo delta ou estímulos que indicam que o comportamento não levará à obtenção de nenhum tipo de reforçador.
A resposta seria o comportamento que o sujeito irá realizar, cuja execução levará ou não a obter o estímulo reforçador.
Um estímulo reforçador é o responsável pela emissão do comportamento, pois graças ao seu aparecimento a probabilidade de emissão de uma resposta aumentará ou diminuirá no futuro.
- Punição
A punição também é medida por seus efeitos no comportamento do alvo. Em vez disso, ao contrário do reforço, o que se pretende é a redução ou supressão de um certo comportamento.
Uma punição reduz a probabilidade de emitir um comportamento em situações subsequentes. No entanto, não elimina a resposta porque, se a ameaça de punição diminuir, o comportamento pode reaparecer.
Na punição também existem dois tipos ou procedimentos diferentes, punição positiva e punição negativa.
Punição positiva
Isso implica na apresentação de um estímulo aversivo após a realização de determinado comportamento. É dado de forma contingente à resposta dada pelo sujeito.
Por exemplo, quando um líquido é colocado nas unhas das crianças para prevenir onicofagia. A criança sente o gosto ruim do líquido (punição positiva) e diminui a probabilidade de roer as unhas novamente.
Punição negativa
Consiste na eliminação de um estímulo em decorrência de determinado comportamento, ou seja, consiste na retirada de um estímulo positivo após a realização de determinado comportamento.
Por exemplo, se uma criança deixar de usar o console de jogos após ter sido reprovada em um exame.
- Extinção
Na extinção, uma resposta é interrompida porque o reforçador não aparece mais. Este processo se baseia em não fornecer o reforço correspondente que se espera alcançar e que fez com que esse comportamento fosse mantido ao longo do tempo.
Quando uma resposta é extinta, o estímulo discriminativo se torna o estímulo de extinção. Esse processo não deve ser confundido com esquecimento, que ocorre quando a força de um comportamento diminui por não ter sido emitido em um determinado período de tempo.
Por exemplo, se uma criança não recebe dinheiro apesar de reclamar constantemente, o comportamento de reclamação será extinto.
- Generalização
Diante de uma determinada situação ou estímulo, é condicionada uma resposta, que pode surgir antes de outros estímulos ou situações semelhantes.
- Discriminação
Este processo é o oposto da generalização, ele responde de forma diferente dependendo do estímulo e do contexto.
Programas de reforço
Skinner também estabeleceu vários programas de reforço por meio de sua pesquisa, incluindo programas de reforço contínuo e programas de reforço intermitente.
Programas de reforço contínuo
Baseiam-se no reforço constante da resposta cada vez que ela ocorre, ou seja, cada vez que o sujeito executa o comportamento desejado, obterá um estímulo reforçador ou positivo.
Programas de reforço intermitente
Por outro lado, aqui o sujeito nem sempre obtém o reforçador ao realizar o comportamento desejado. Estas são definidas com base no número de respostas dadas ou no intervalo de tempo entre as respostas, levando a diferentes procedimentos.
Programas de proporção fixa
Nestes programas, o reforçador é fornecido quando o sujeito gera respostas fixas e constantes. Por exemplo, em um programa de proporção 10, a pessoa obtém o reforçador após ter feito dez respostas quando o estímulo é apresentado.
Programas de razão variável
Este é construído da mesma forma que o anterior, mas neste caso o número de respostas que o sujeito deve dar para obter o reforçador é variável.
O reforçador continuaria a depender do número de respostas emitidas pelo sujeito, mas com uma proporção variável, graças à qual o sujeito é impedido de prever quando o reforçador será obtido.
Programas de intervalo fixo
Nos programas de intervalo, a obtenção do reforçador não depende do número de respostas que o sujeito dá, mas é determinada pelo tempo decorrido. Conseqüentemente, a primeira resposta produzida após um certo período de tempo é reforçada.
Em programas de intervalo fixo, o tempo entre o intensificador e o intensificador é sempre o mesmo.
Programas de intervalo variável
Nestes programas, o reforçador é obtido após um tempo, embora o tempo seja diferente para cada reforçador recebido.
Mudança comportamental
Abordagens sucessivas ou modelagem
A moldagem consiste na mudança comportamental por meio da modelagem de comportamentos ou do reforço diferencial de abordagens sucessivas.
Uma série de etapas é seguida para moldar um comportamento específico. Em primeiro lugar, identifica-se o comportamento inicial que se pretende moldar para saber o que se quer alcançar.
Em seguida, são delimitados os possíveis reforçadores a serem utilizados e o processo para se chegar ao comportamento final é separado em etapas ou etapas, reforçando cada etapa ou abordagem sucessiva até chegar à última.
Com este procedimento dinâmico, ambos os comportamentos e suas consequências são transformados. Nesse sentido, abordagens sucessivas para um comportamento objetivo são reforçadas.
Porém, para que possa ser realizada, é necessário partir de um comportamento anterior que o sujeito já realiza, a fim de reforçar gradativamente seus comportamentos até que alcance o objetivo.
Encadeamento
Com ele, um novo comportamento é formado a partir da decomposição em etapas ou sequências mais simples, reforçando cada resposta dada em cada uma das etapas para, assim, levar ao estabelecimento de uma resposta mais complexa no repertório comportamental do sujeito.
Longas cadeias de respostas podem ser formadas com reforçadores condicionados, adotando uma unidade funcional e cujo estabelecimento leva à aquisição e definição de uma habilidade particular.
Referências
- Condicionamento operante. Recuperado de wikipedia.org
- Condicionamento operante. Recuperado de e-torredebabel.com.
- Recuperado de biblio3.url.
- Lei do efeito. Recuperado de wikipedia.org.
- Extinção. Recuperado de wikipedio.org.
- Domjan, M. Princípios de aprendizagem e comportamento. Auditório. 5ª edição.