V operantnom podmieňovaní dochádza k posilneniu vtedy, keď udalosť nasledujúca po reakcii spôsobí zvýšenie pravdepodobnosti, že sa táto reakcia objaví v budúcnosti. Silu reakcie možno posúdiť pomocou takých opatrení, ako je frekvencia, s akou sa reakcia uskutočňuje (napríklad holub môže počas sedenia viac ráz ďobnúť do kľúča), alebo rýchlosť, s akou sa uskutočňuje (napríklad potkan môže rýchlejšie prebehnúť bludisko). Zmena prostredia podmienená reakciou sa nazýva posilňovač.
B. F. Skinner, výskumník, ktorý formuloval hlavné teoretické konštrukcie posilňovania a behaviorizmu, odmietol špecifikovať kauzálny pôvod posilňovačov. Skinner tvrdil, že posilňovače sú definované zmenou sily reakcie (t. j. skôr funkčne než kauzálne) a že to, čo je pre jedného človeka posilňovačom, nemusí byť pre iného. Preto činnosti, potraviny alebo predmety, ktoré sa všeobecne považujú za príjemné alebo príjemné, nemusia byť nevyhnutne posilňujúce; možno ich za také považovať len vtedy, ak sa správanie, ktoré bezprostredne predchádza potenciálnemu posilňovaču, v podobných budúcich situáciách zvýši. Ak dieťa dostane sušienku, keď o ňu požiada, a frekvencia „správania, pri ktorom žiada o sušienku“ sa zvyšuje, sušienku možno považovať za posilnenie „správania, pri ktorom žiada o sušienku“. Ak sa však počet žiadostí o sušienky nezvýši, sušienku nemožno považovať za posilňujúcu. Jediným kritériom, ktoré môže určiť, či je predmet, činnosť alebo potravina posilňujúca, je zmena pravdepodobnosti správania po podaní potenciálneho posilňovača. Iné teórie sa môžu zameriavať na ďalšie faktory, napríklad na to, či osoba očakávala, že stratégia bude v určitom momente fungovať, ale behaviorálna teória posilňovania by sa zamerala konkrétne na pravdepodobnosť správania.
Štúdium spevňovania prinieslo obrovské množstvo reprodukovateľných experimentálnych výsledkov. Posilňovanie je ústredným pojmom a postupom v experimentálnej analýze správania a vo veľkej časti kvantitatívnej analýzy správania.
Skinner hovorí, že hoci sa to tak môže zdať, trest nie je opakom posilňovania. Skôr má niektoré iné účinky, ako aj zníženie nežiaduceho správania.
Odlíšenie „pozitívneho“ od „negatívneho“ môže byť ťažké a často sa diskutuje o potrebe tohto rozlišovania[1]. Napríklad vo veľmi teplej miestnosti slúži prúd vonkajšieho vzduchu ako pozitívne posilnenie, pretože je príjemne chladný, alebo negatívne posilnenie, pretože odstraňuje nepríjemne horúci vzduch[2]. Niektoré posilnenia môžu byť súčasne pozitívne aj negatívne, napríklad narkoman berie drogy kvôli dodatočnej eufórii a odstráneniu abstinenčných príznakov. Mnohí behaviorálni psychológovia jednoducho hovoria o posilnení alebo treste – bez polarity -, aby pokryli všetky následné zmeny prostredia.
Primárny posilňovač, niekedy nazývaný aj nepodmienený posilňovač, je podnet, ktorý nevyžaduje párovanie, aby fungoval ako posilňovač, a pravdepodobne získal túto funkciu vďaka evolúcii a svojej úlohe pri prežití druhu[3]. Príkladmi primárnych posilňovačov sú spánok, jedlo, vzduch, voda a sex. Iné primárne zosilňovače, napríklad niektoré drogy, môžu napodobňovať účinky iných primárnych zosilňovačov. Zatiaľ čo tieto primárne posilňovače sú pomerne stabilné počas života a u rôznych jedincov, posilňujúca hodnota rôznych primárnych posilňovačov sa mení v dôsledku viacerých faktorov (napr. genetika, skúsenosti). Jeden človek tak môže uprednostňovať jeden druh jedla, zatiaľ čo iný ho neznáša. Alebo jeden človek môže jesť veľa jedla, zatiaľ čo iný veľmi málo. Takže aj keď je jedlo pre oboch jedincov primárnym posilňovačom, hodnota jedla ako posilňovača sa u nich líši.
Primárne posilňovače často dočasne menia svoju posilňujúcu hodnotu prostredníctvom nasýtenia a deprivácie. Napríklad jedlo môže prestať byť účinným posilňovačom po skonzumovaní určitého množstva (nasýtenie). Po období, počas ktorého nedostáva žiadny primárny posilňovač (deprivácia), však môže primárny posilňovač opäť získať svoju účinnosť pri zvyšovaní sily reakcie.
Sekundárny posilňovač, niekedy nazývaný podmienený posilňovač, je podnet alebo situácia, ktorá získala funkciu posilňovača po spojení s podnetom, ktorý funguje ako posilňovač. Týmto podnetom môže byť primárny reinforcer alebo iný podmienený reinforcer (napríklad peniaze). Príkladom sekundárneho posilňovača je zvuk z klikera, ktorý sa používa pri výcviku klikerom. Zvuk klikera sa spája s pochvalou alebo pamlskom a následne môže zvuk klikera fungovať ako posilňovač. Podobne ako pri primárnych posilňovačoch môže organizmus pri sekundárnych posilňovačoch zažiť nasýtenie a depriváciu.
Prírodné a umelé spevnenie
Charles Ferster vo svojej práci z roku 1967 Arbitrary and Natural Reinforcement (Ľubovoľné a prirodzené posilňovanie) navrhol, že posilňovanie možno rozdeliť na udalosti, ktoré zvyšujú frekvenciu operantu ako prirodzený dôsledok samotného správania, a na udalosti, pri ktorých sa predpokladá, že ovplyvňujú frekvenciu na základe požiadavky ľudského sprostredkovania, ako napríklad v žetónovej ekonomike, kde sú subjekty „odmeňované“ za určité správanie ľubovoľným žetónom obchodovateľnej hodnoty. V roku 1970 Baer a Wolf vytvorili pre používanie prirodzených posilňovačov názov pasce správania [6]. pasca správania je taká pasca správania, pri ktorej je na vstup do pasce potrebná len jednoduchá reakcia, avšak po vstupe do pasce sa jej nedá odolať pri vytváraní všeobecnej zmeny správania. Práve použitie pasce správania zvýši repertoár človeka tým, že ho vystaví prirodzenému posilňovaniu daného správania. Pasce správania majú štyri charakteristiky:
Ako vyplýva z vyššie uvedeného, umelé posilnenie sa vytvára na budovanie alebo rozvoj zručností a na zovšeobecnenie je dôležité, aby sa buď zaviedla pasca správania, ktorá „zachytí“ zručnosť a využije prirodzene sa vyskytujúce posilnenie na jej udržanie alebo zvýšenie. Touto pascou správania môže byť jednoducho sociálna situácia, ktorá všeobecne vyplynie z konkrétneho správania po splnení určitého kritéria (napr. ak použijete jedlé posilňovače na nácvik toho, aby človek zdravil a usmieval sa na ľudí, keď ich stretne, po vybudovaní tejto zručnosti prirodzený posilňovač v podobe úsmevu iných ľudí a priateľskejších interakcií prirodzene posilní túto zručnosť a jedlé posilňovače môžu zaniknúť)[8].
Harmonogramy posilňovania
Keď je okolie zvieraťa kontrolované, jeho vzorce správania po posilnení sa stávajú predvídateľnými, a to aj v prípade veľmi zložitých vzorcov správania. Plán posilňovania je protokol na určenie toho, kedy budú reakcie alebo správanie posilňované, od kontinuálneho posilňovania, pri ktorom je posilňovaná každá reakcia, až po vyhasínanie, pri ktorom nie je posilňovaná žiadna reakcia. Medzi týmito extrémami je prerušované alebo čiastočné posilňovanie, pri ktorom sa posilňujú len niektoré reakcie.
Špecifické varianty prerušovaného posilňovania spoľahlivo vyvolávajú špecifické vzorce reakcie bez ohľadu na skúmaný druh (v niektorých prípadoch aj u ľudí). Usporiadanosť a predvídateľnosť správania v rámci rozvrhov posilňovania bola dôkazom tvrdenia B. F. Skinnera, že pomocou operantného podmieňovania môže získať „kontrolu nad správaním“, a to takým spôsobom, že teoretické spory súčasnej porovnávacej psychológie sa stali zastaranými. Spoľahlivosť kontroly rozvrhu podporovala myšlienku, že radikálna behavioristická experimentálna analýza správania by mohla byť základom psychológie, ktorá sa nevzťahuje na mentálne alebo kognitívne procesy. Spoľahlivosť rozvrhov viedla aj k rozvoju aplikovanej analýzy správania ako prostriedku kontroly alebo zmeny správania.
Mnohé z jednoduchších a niektoré zložitejšie možnosti Skinner podrobne skúmal na holuboch, ale stále sa definujú a skúmajú nové plány.
Graf demonštrujúci rozdielnu mieru reakcie pri štyroch jednoduchých harmonogramoch posilňovania, pričom každá šrafovaná značka označuje podávaný posilňovač
Jednoduché rozvrhy majú jediné pravidlo, ktoré určuje, kedy sa za určitú reakciu dodá jeden typ posilňovača.
Ďalšie jednoduché rozvrhy zahŕňajú:
Účinky rôznych typov jednoduchých rozvrhov
Zložené rozvrhy určitým spôsobom kombinujú dva alebo viac rôznych jednoduchých rozvrhov s použitím rovnakého posilňovača pre rovnaké správanie. Existuje mnoho možností; medzi najčastejšie používané patria:
Superponované plány posilňovania je termín v psychológii, ktorý označuje štruktúru odmeňovania, kde súčasne fungujú dva alebo viac jednoduchých plánov posilňovania. Posilňovače môžu byť pozitívne a/alebo negatívne. Príkladom môže byť človek, ktorý príde domov po dlhom dni v práci. Správanie spočívajúce v otvorení vchodových dverí je odmenené veľkým bozkom na pery od manželského partnera a roztrhnutím nohavíc od rodinného psa, ktorý nadšene skáče. Ďalším príkladom superponovaných rozvrhov posilňovania by bol holub v pokusnej klietke, ktorý ďobá do gombíka. Výsledkom klovania je, že po každom dvadsiatom klovnutí sa do zásobníka dostane zrno a po každých dvesto klovnutiach sa sprístupní prístup k vode.
Superponované rozvrhy posilňovania sú typom zloženého rozvrhu, ktorý sa vyvinul z pôvodnej práce B. F. Skinnera a jeho kolegov na jednoduchých rozvrhoch posilňovania (Skinner a Ferster, 1957). Dokázali, že posilňovače sa dajú dodávať podľa rozvrhov a ďalej, že organizmy sa pri rôznych rozvrhoch správajú odlišne. Namiesto toho, aby sa posilňovač, ako napríklad jedlo alebo voda, dodával zakaždým ako dôsledok určitého správania, posilňovač by sa mohol dodať po viac ako jednom prípade správania. Napríklad od holuba sa môže vyžadovať, aby desaťkrát ďobol do spínača s tlačidlom, kým mu bude sprístupnené jedlo. Tento postup sa nazýva „pomerový plán“. Posilňovač by sa tiež mohol dodať po uplynutí časového intervalu, ktorý nasledoval po cieľovom správaní. Príkladom je potkan, ktorý dostane potravinovú peletu dve minúty po tom, ako potkan stlačil páku. Toto sa nazýva „intervalový plán“. Okrem toho môžu pomerové rozvrhy dodávať posilňovač po fixnom alebo variabilnom počte správaní jednotlivého organizmu. Podobne intervalové plány môžu poskytovať posilnenie po pevných alebo premenlivých časových intervaloch nasledujúcich po jednej reakcii organizmu. Jednotlivé správania majú tendenciu vytvárať mieru reakcie, ktorá sa líši na základe spôsobu vytvorenia plánu posilňovania. Mnohé následné výskumy v mnohých laboratóriách skúmali účinky rozvrhovania posilňovačov na správanie.
Ak sa organizmu ponúkne možnosť vybrať si medzi dvoma alebo viacerými jednoduchými rozvrhmi posilňovania v rovnakom čase, štruktúra posilňovania sa nazýva „súbežný rozvrh posilňovania“. Brechner (1974, 1977) zaviedol koncept „superponovaných rozvrhov posilňovania v snahe vytvoriť laboratórnu analógiu sociálnych pascí, napríklad keď ľudia nadmerne lovia svoje ryby alebo rúcajú dažďové pralesy. Brechner vytvoril situáciu, v ktorej boli jednoduché rozvrhy posilňovania navrstvené na seba. Inými slovami, jedna reakcia alebo skupina reakcií organizmu viedla k viacerým dôsledkom. Súbežné rozvrhy posilňovania možno považovať za rozvrhy „alebo“ a superponované rozvrhy posilňovania možno považovať za rozvrhy „a“. Brechner a Linder (1981) a Brechner (1987) rozšírili túto koncepciu, aby opísali, ako by sa superponované harmonogramy a analógia sociálnej pasce mohli použiť na analýzu spôsobu, akým energia prúdi systémami.
Okrem vytvárania sociálnych pascí majú superponované rozvrhy posilňovania mnoho reálnych aplikácií. Superponovaním jednoduchých rozvrhov posilňovania možno vytvoriť mnoho rôznych ľudských individuálnych a sociálnych situácií. Napríklad človek môže byť súčasne závislý od tabaku a alkoholu. Ešte zložitejšie situácie možno vytvoriť alebo simulovať superponovaním dvoch alebo viacerých súbežných rozvrhov. Napríklad stredoškolák by si mohol vybrať medzi Stanfordovou univerzitou a Kalifornskou univerzitou a zároveň by si mohol vybrať, či pôjde do armády alebo do letectva, a zároveň by si mohol vybrať, či sa zamestná v internetovej spoločnosti alebo v softvérovej spoločnosti. To by bola štruktúra posilňovania pozostávajúca z troch súbežných plánov posilňovania. Superponované rozvrhy posilňovania sa môžu použiť na vytvorenie troch klasických konfliktných situácií (konflikt prístupu a prístupu, konflikt prístupu a vyhýbania sa a konflikt vyhýbania sa), ktoré opísal Kurt Lewin (1935), a môžu sa použiť na operacionalizáciu ďalších Lewinových situácií analyzovaných jeho analýzou silových polí. Ďalším príkladom využitia superponovaných rozvrhov posilňovania ako analytického nástroja je jeho aplikácia na nepredvídané situácie kontroly nájomného (Brechner, 2003).
V operantnom podmieňovaní sú súbežné rozvrhy posilňovania rozvrhy posilňovania, ktoré sú súčasne k dispozícii zvieraciemu subjektu alebo ľudskému účastníkovi, takže subjekt alebo účastník môže reagovať na ktorýkoľvek z nich. Napríklad holub v Skinnerovom boxe môže mať k dispozícii dva klovacie kľúče; na klovanie môže reagovať na oboch a po klovaní na oboch môže nasledovať posilnenie potravou. Rozvrhy posilnenia usporiadané pre klovanie na oboch kľúčoch môžu byť rôzne. Môžu byť nezávislé alebo môžu mať medzi sebou určité prepojenia, takže správanie na jednom kľúči ovplyvňuje pravdepodobnosť posilnenia na druhom kľúči.
Nie je nevyhnutné, aby boli odpovede na oboch harmonogramoch fyzicky oddelené: v alternatívnom spôsobe usporiadania súbežných harmonogramov, ktorý zaviedol Findley v roku 1958, sú oba harmonogramy usporiadané na jednom tlačidle alebo inom zariadení na odpovede a subjekt alebo účastník môže odpovedať na druhom tlačidle, aby sa prepínalo medzi harmonogramami. Pri takomto „Findleyho súbežnom“ postupe sa na signalizáciu toho, ktorý rozvrh práve platí, používa podnet (napr. farba hlavného tlačidla).
Súbežné rozvrhy často vyvolávajú rýchle striedanie kľúčov. Aby sa tomu zabránilo, bežne sa zavádza „oneskorenie pri prepínaní“: každý plán sa deaktivuje na krátku dobu po tom, ako naň subjekt prepne.
Keď sú oba súbežné harmonogramy premenlivé intervaly, zistí sa kvantitatívny vzťah známy ako zákon zhody medzi relatívnymi rýchlosťami odpovedí v oboch harmonogramoch a relatívnymi rýchlosťami posilnenia, ktoré poskytujú; prvýkrát ho pozoroval R. J. Herrnstein v roku 1961.
Formovanie zahŕňa posilňovanie postupných, čoraz presnejších priblížení reakcie požadovanej trénerom. Napríklad pri výcviku potkana na stlačenie páky sa najprv posilní jednoduché otočenie smerom k páke. Potom sa posilní len otočenie a vykročenie smerom k páke. S postupujúcim výcvikom sa posilňovaná reakcia postupne viac a viac podobá požadovanému správaniu.
Reťazenie zahŕňa prepojenie diskrétnych správaní do série tak, že každý výsledok každého správania je posilnením (alebo dôsledkom) predchádzajúceho správania a zároveň podnetom (alebo antecedentom) pre ďalšie správanie. Existuje mnoho spôsobov, ako učiť reťazenie, napríklad reťazenie dopredu (začína sa od prvého správania v reťazci), reťazenie dozadu (začína sa od posledného správania) a celkové reťazenie úloh (pri ktorom sa celé správanie učí od začiatku do konca, a nie ako séria krokov). Príkladom môže byť otváranie zamknutých dverí. Najprv sa vloží kľúč, potom sa ním otočí a potom sa dvere otvoria. Pri postupnom reťazení by sa subjekt najprv naučil vložiť kľúč. Po zvládnutí tejto úlohy sa mu povie, aby vložil kľúč, a naučí sa ho otočiť. Po zvládnutí tejto úlohy sa im povie, aby vykonali prvé dve úlohy, a potom sa naučia otvoriť dvere. Spätné reťazenie by zahŕňalo, že učiteľ najprv vloží a otočí kľúč a subjekt sa učí otvoriť dvere. Keď sa to naučia, učiteľ vloží kľúč a subjekt sa ho naučí otáčať, potom otvorí dvere ako ďalší krok. Nakoniec sa subjekt naučí vložiť kľúč, otočí ho a otvorí dvere. Po zvládnutí prvého kroku je celá úloha naučená. Úplné reťazenie úloh by zahŕňalo výučbu celej úlohy ako jednej série, pričom by sa podnety podávali vo všetkých krokoch. Pokyny sa pri každom kroku zmenšujú (redukujú), keď ho žiaci zvládnu.
Štandardná definícia behaviorálneho posilňovania bola kritizovaná ako kruhová, pretože sa zdá, že tvrdí, že sila reakcie sa zvyšuje posilňovaním, pričom definuje posilňovanie ako niečo, čo zvyšuje silu reakcie; to znamená, že štandardná definícia hovorí len o tom, že sila reakcie sa zvyšuje tým, čo zvyšuje silu reakcie. Správne používanie[10] posilnenia však znamená, že niečo je posilňovačom preto, lebo to má vplyv na správanie, a nie naopak. Ak sa povie, že určitý podnet posilňuje správanie, pretože je posilňovačom, stáva sa to kruhovým, a nemalo by sa to používať na vysvetlenie, prečo podnet vyvoláva takýto účinok na správanie.
Boli navrhnuté aj iné definície, napríklad F. D. Sheffield „konzumné správanie podmienené reakciou“, ale tie sa v psychológii široko nepoužívajú[11].
V 20. rokoch 20. storočia ruský fyziológ Ivan Pavlov možno ako prvý použil slovo posilnenie v súvislosti so správaním, ale (podľa Dinsmoora) používal jeho približný ruský príbuzný len zriedkavo, a aj vtedy sa vzťahoval na posilnenie už naučenej, ale slabnúcej reakcie. Nepoužíval ho, ako je to dnes, pre výber a posilnenie nového správania. Pavlovovo zavedenie slova extinkcia (v ruštine) sa približuje dnešnému psychologickému použitiu.
V populárnom používaní sa pozitívne posilňovanie často používa ako synonymum pre odmenu, pričom sa „posilňujú“ ľudia (nie správanie), čo je však v rozpore s dôsledným odborným používaním tohto termínu, pretože sa posilňuje rozmer správania, a nie človek. Negatívne posilňovanie často používajú laici a dokonca aj sociológovia mimo psychológie ako synonymum pre trest. Je to v rozpore s moderným odborným používaním, ale bol to B. F. Skinner, ktorý ho takto použil prvýkrát vo svojej knihe z roku 1938. V roku 1953 však nasledoval iných, ktorí takto používali slovo trest, a negatívne posilnenie preformuloval na odstránenie averzívnych podnetov.
V oblasti analýzy správania sa objavujú názory, že pojmy „pozitívny“ a „negatívny“ sú pri diskusii o posilňovaní zbytočným rozdielom, pretože často nie je jasné, či ide o odstraňovanie alebo predkladanie podnetov. Napríklad Iwata[13] kladie otázku: „Je zmena teploty presnejšie charakterizovaná prezentáciou chladu (tepla) alebo odstránením tepla (chladu)? (p. 363). Preto môže byť najlepšie koncipovať posilnenie jednoducho ako nahradenie stavu pred zmenou stavom po zmene, ktorý posilňuje správanie, po ktorom nasledovala zmena stimulačných podmienok.