






Preview text:
TÂM LÝ HỌC HÀNH VI CỦA SKINNER 
[Châu Hoàng Bảo1 - 2/2018]  1.1 Đặt vấn đề 
Tâm lý học hành vi được ứng dụng rất rộng rãi trong các lĩnh vực, đặc biệt là giáo dục. Các hình thức khen 
thưởng khi chủ thể thực hiện một điều tốt hoặc đạt được một kết quả tốt đó chính là một sự ứng 
dụng thuyết hành vi với mục đích kích lệ và động viên chủ thể. Bên cạnh đó việc huấn luyện một 
con thú để chúng có khả năng làm những trò như con người cũng là một ứng dụng khác của thuyết  hành vi. 
 Thuyết hành vi nghiên cứu dựa trên sự phản xạ có điều kiện của các dây thần kinh. 
1.2 Giới thiệu tâm lý học hành vi của Skinner  1.2.1 Tiểu sử 
Burrhus Frederic Skinner (20/3/1904 - 18/8/1990) tại tiểu bang Pennsylvania, Hoa Kỳ. B.F Skinner là tên 
gọi tắt của Burrhus Frederic Skinner, ngoài vai trò là một nhà tâm lý theo học ông còn được biết 
đến trong vai trò là một nhà văn, nhà phát minh và là một triết gia xã hội. 
Bạn thân nhất của Skinner là Raphael Miller, người mà ông vẫn thường gọi là DOC bởi vì cha của cậu ta 
đã từng làm bác sĩ. Hai người họ đã trở thành bạn bè của nhau vì cha mẹ họ rất tôn trọng lẫn nhau, 
và cả hai đều có cùng sự hứng thú với những thứ dụng cụ và các loại máy móc, và cũng như bao 
đứa trẻ khác ông và cậu bạn thân của mình đã có một hồi ức đẹp. 
Đã có một khoảng thời gian B.F Skinner đã muốn trở thành một tác giả chính vì thế ông đã thử gửi đi rất 
nhiều các bài thơ và truyện ngắn, nhưng sự nghiệp viết lách của ông chẳng đi đến đâu cả, sau đó 
một thời gian ông quyết định đi học tiếp và đã tốt nghiệp thạc sĩ tâm lý năm 1930, tiến sĩ năm 1931 
tại Harvard, và ở lại trường làm công tác nghiên cứu cho đến năm 1936. Vào cùng năm đó, ông lấy 
vợ sau một khoảng thời gian chung sông thì họ đã có hai đứa con và cô con gái thứ hai đã trở nên 
nổi tiếng vì cô là người đầu tiên được nằm trong chiếc nôi đệm khí do chính ông phát minh. 
Ngày 18/8/1990, B.F Skinner từ trần bởi bệnh ung thư bạch cầu. 
1.2.2 Học thuyết của B.F Skinner 
Skinner nghĩ rằng sự ý thức trong tưởng tượng và hoạt động của con người phụ thuộc vào kết quả của 
những hành động trước đó. Nếu đó là một kết quả xấu, thì có cơ hội cao nó sẽ không lặp lại một lần 
nào nữa, và ngược lại nếu kết quả là tốt, thì những hành động ấy có thể được lặp lại và phát triển   
TÂM LÝ HỌC HÀNH VI CỦA SKINNER 
một cách mạnh mẽ hơn nữa và Skinner gọi đó là nguyên tắc của sự củng cố, từ đó ông đã nghiên 
cứu và phân tích một cách kỹ lưỡng về sự vận hành của các hành vi trong cuộc sống – những phản 
xạ có điều kiện, cuối cùng học thuyết hành vi chính là kết quả của công trình nghiên cứu. 
Thí nghiệm của Skinner được mô tả như sau: Một con chuột được thả vào một cái hộp có một nút nhỏ đặt 
bên trong. Khi chuột ấn nút xuống, thức ăn sẽ rơi xuống. Ban đầu con chuột chạy khắp nơi trong 
hộp và vô tình một lần đạp phải cái nút nhỏ và phát hiện ra thức ăn rớt xuống. Lối vận hành, là hành 
vi xảy ra ngay sau khi có tác nhân củng cố, trong trường hợp này tác nhân củng cố là thức ăn. Tất 
nhiên sau đó chuột liên tục đạp vào nút và hăm hở mang thức ăn rớt xuống xếp vào một góc hộp. 
Sau đó ông kết luận: Một hành vi khi có sự xuất hiện của kích thích tác nhân củng cố - là thức ăn sẽ tạo 
một kết quả là khả năng xảy ra của hành vi ấy và sẽ diễn ra thường xuyên hơn trong tương lai. 
Khi chuột không được cho thức ăn mỗi khi đạp vào nút, sau vài lần cố gắng, chuột sẽ ngừng hành vi đạp 
vào nút. Đây là quá trình triệt tiêu (hay còn gọi là quá trình quên) hành vi đạp nút của chuột 
(extinction of the operant behavior). 
Ông kết luận rằng: Một hành vi không có sự xuất hiện của tác nhân củng cố (là thức ăn) sẽ tạo ra một kết 
quả là khả năng xảy ra (probability) của hành vi (đạp nút) sẽ giảm đi trong tương lai. 
Sau đó thức ăn lại được cung cấp, chuột đạp vào nút và nhận được thức ăn, hành vi của chuột chợt trở về 
thật nhanh, mau hơn lần đầu tiên chuột vô tình phát hiện ra thức ăn. Đơn giản là tác nhân củng cố 
(reinforcer) đã thiết lập một lịch trình củng cố trong quá khứ và đây là một quá trình gợi nhớ. 
1.2.3 Nguyên tắc củng cố 
Skinner rất thích kể về chuyện một lần ông tình cờ chứng kiến một khám phá mới mẻ. Lần ấy ông gần hết 
thức ăn trong lúc làm thí nghiệm với lũ chuột nên phải tự chế thức ăn cho chuột. Điều này đã làm 
chậm hẳn tiến độ thí nghiệm bình thường. Vì thế Skinner quyết định giảm thiểu số lần kích thích 
củng cố những thí nghiệm phản xạ có điều kiện với chuột. Ông nhận ra chuột vẫn tận tụy với những 
hành vi đạp nút của mình một cách không thay đổi. Điều này đã giúp ông thiết lập lịch củng cố 
trong những thí nghiệm của mình sau này. Dưới đây là những lịch củng cố mà Skinner đã thiết lập  được. 
Củng cố liên tục là hoạt cảnh đầu tiên: mỗi lần chuột đạp vào nút sẽ được thưởng thức ăn. 
Lịch tỷ lệ số lần cố định: là lịch củng cố đầu tiên Skinner phát hiện ra: Nếu chuột đạp nút 3 lần mới được 
thưởng. Hoặc 5 lần, hoặc (n) lần, sẽ tạo ra một tỷ lệ số lần đạp nút và được thức ăn là: (3:1], [5.1] 
và [n:1], một mô thức khoán sản phẩm. Ví dụ như may gia công sản phẩm: may 3 cái áo gối được  trả 1 ngàn đồng. 
Lịch khoảng cách thời gian cố định: sử dụng thời gian như một công cụ trong việc hình thành hiệu ứng 
phản xạ có điều kiện. Chẳng hạn trong một khoảng thời gian nhất định (ví dụ cứ 20 giây) chuột phải 
đạp nút ít nhất là 1 lần mới có thưởng. Nếu không đạp nút sẽ không có thưởng. Ông phát hiện ra 
Địa chỉ: 22/48 đường Mạc Đĩnh Chi, P. An Cư, quận Ninh Kiều, TP. Cần Thơ 
chuột học khá nhanh, rất chậm rãi trong việc đạp nút lúc đầu, và chỉ hăng hái khi thời gian điểm hẹn 
được thưởng (reinforcer) đang đến gần. 
Lịch tỷ lệ số lần thay đổi: chuột phải trải qua những thay đổi số lần đạp nút để có thưởng. Chẳng hạn lúc 
thì cứ đạp 3 lần mới có thưởng, rồi có khi 7 lần, 1 lần, 5 lần, 2 lần, (n) lần mới được thức ăn. Rõ 
ràng là thí nghiệm này khiến chuột rất bối rối. 
Lịch khoảng cách thời gian thay đổi: Chuột trải qua những lần thí nghiệm, thay đổi ở đây không phải về 
số lần đạp, mà là thay đổi về khoảng thời gian có thưởng. Nghĩa là chuột cứ phải đạp ít nhất một 
lần trong khoảng thời gian. Có lúc là cứ 10 giây, cứ 15 giây, cứ mỗi (n) giây phải đạp 1 lần mới có  thưởng. 
Với lịch thay đổi (tỷ lệ số lần và khoảng cách thời gian), chuột không còn giữ nhịp độ đạp nút nữa vì chuột 
đã không tạo ra được một liên hệ có tính chu kỳ giữa hành vi (đạp nút) và phần thưởng (thức ăn). 
Tuy nhiên một khám phá quan trọng là với hai lịch thay đổi trên, một hành vi có điều kiện khi được 
thiết lập sẽ nhớ rất lâu. Vì sao? Vì chuột nghĩ rằng sau nhiều lần đạp nút mà chẳng có thưởng, vậy 
có thể cái đạp nút sau cùng là cái đạp nút gây ấn tượng nhất. Giống như nơi người ta vẫn nghe nói:  Miếng ngon nhớ lâu. 
Điều này theo Skinner giống như ở chiến lược đánh bài nơi người. Chuột tuy không trúng thưởng thường 
xuyên nhưng chúng biết mình sẽ được trúng thưởng nếu khi chuột không bỏ cuộc. Và như thế chuột 
sẽ tiếp tục đạp nút. Cũng thế, người đánh bài hoặc chơi cờ luôn tin rằng ván tới họ sẽ thắng.  1.2.4 Tạo nếp 
Một vấn đề được nhiều người đặt ra tại sao con người có những thói quen hành vi phức tạp. Skinner đã 
đưa ra một đề nghị khái niệm quá trình tạo nếp, hay là phương pháp liên tục phỏng đoán. Về căn 
bản, quá trình tạo nếp nơi người liên quan đến việc định hình một hành vi chưa được xác định trước 
đó. Khi biết rõ điều mình thích, cá nhân sẽ tìm những hình thái vận hành để đạt được điều mình 
thích nhất. Nơi động vật những hành vi ấy thể hiện rất rõ Skinner và học trò của ông đã dạy các thú 
vật có những hành vi thường không xảy ra trong cuộc sống hàng ngày tự nhiên của chúng. Chẳng 
hạn như chuyện chim bồ câu vì muốn có thưởng đã biết chơi banh bowling. 
C. George Boeree (2006) đã kể lại một kinh nghiệm của mình khi ông có cô con gái khoảng 3 – 4 tuổi rất 
sợ đi cầu tuột. Ông đã tập cho con bằng cách đặt bé ngay dưới bệ cầu tuột rồi động viên em nhảy 
xuống. Em nhảy xuống và ông vỗ tay khen em thật nhiệt tình. Sau đó ông cứ từ từ nhích cao hơn 
lên, nếu bé sợ, thì ông ngưng lại. Mãi cuối cùng ông đã đặt được con lên đỉnh cầu tuột để bé tự thả 
mình xuống như bao trẻ em khác. Tuy nhiên ông kể rằng con gái vẫn không thể tự leo thang cầu 
tuột được. Sau đó ông phải ngừng huấn luyện con vì ông là một ông bố quá bận rộn. 
Đây là một cách được áp dụng rất phổ biến trong môi trường trị liệu gọi là phương pháp triệt tiêu cảm thụ 
hay còn gọi là tẩy xóa cảm giác từ từ, được phát minh bởi nhà tâm lý hành vi Joseph Wolpe. Ví dụ 
với một người rất sợ nhện được giới thiệu nhưng hoạt cảnh có liên quan đến nhện qua những mức 
TÂM LÝ HỌC HÀNH VI CỦA SKINNER 
độ từ cấp độ gián tiếp nhẹ nhàng đến cấp độ trực tiếp mạnh mẽ. Có thể ban đầu là chỉ nói chuyện 
về nhện, sau đó là nhện giả, nhện qua hình vẽ, tranh ảnh. Sau đó thân chủ sẽ tiếp cận một con nhện 
nhỏ, nhìn từ xa, dần dần nhìn con nhện to hơn, đứng gần hơn, sau đó nâng cấp đến mức cá nhân có 
thể cầm được con nhện lên và quan sát chúng. 
Nhà trị liệu trong quá trình nâng cấp cường độ tác nhân gây sợ. Sẽ huấn luyện thân chủ những kỹ năng 
thư giãn cơ bắp, một trạng thái sinh lý bình thản đối nghịch với trạng thái sinh lý lo lắng. Sau vài 
ngày thân chủ tập luyện và thành thục kỹ năng thư giãn cơ bắp sẽ quay trở lại gặp nhà trị liệu. Quá 
trình tẩy xóa cảm giác được áp dụng từ nhẹ đến nặng. Nếu cần thiết, thân chủ có thể được giải lao. 
Chậm nhưng chắc chắn, thân chủ sẽ áp dụng tập luyện cho đến khi tác nhân gây sợ không còn ảnh 
hưởng mạnh mẽ lên thân thủ nữa. 
Đây chỉ là một ví dụ tương đối đơn giản, trên thực tế quá trình tạo nếp thật ra còn có tác động lên những 
hành vi khác phức tạp hơn rất nhiều của con người. Ví dụ một bác sĩ giải phẫu não. Anh ta không 
chỉ thi đậu vào một trường Đại học y khoa dạy phẫu thuật, để rồi sau đó cưa xương hộp sọ của người 
khác, và rồi anh ta được trả lương cao, được mọi người kính trọng. Trên thực tế anh ta đã trải qua 
một quá trình tạo nếp lâu dài từ khi còn trẻ, qua những điều anh ta thích thú trong môi trường sống. 
Anh ta yêu thích nghề này từ khi còn bé, anh phải học thật tốt các môn khoa học tự nhiên, và rồi 
đậu Đại học Y dược, phải trải qua huấn luyện, với cả những động viên từ gia đình nữa. 
1.2.5 Những kích thích khó chịu 
Điều chỉnh lại hành vi được áp dụng trong liệu pháp của Skinner một cách rất phổ thông. Tương đối đơn 
giản, cách này là dập tắt một hành vi cần bỏ bằng cách cất bỏ đi những tác nhân củng cố tiêu cực và 
thay thế bằng những tác nhân củng cố tích cực để xây dựng một hành vi mới lành mạnh hơn. Lối 
điều chỉnh hành vi dược áp dụng trong nhiều lĩnh vực như chữa trị người nghiện, loạn thần kinh, 
xấu hổ thái quá, né tránh xã hội, và bệnh tâm thần phân liệt. Đây là liệu pháp rất có hiệu quả đối với 
trẻ em. Những áp dụng của ông đã khiến những bệnh nhân tâm thần có thể tự thay quần áo, sử dụng 
muỗng, dao khi ăn, tắm rửa và vệ sinh cá nhân trên mô thức phản xạ có điều kiện. 
Một điểm nổi bật của mô hình điều chỉnh hành vi là tặng thưởng có giá trị kinh tế (token economy). Đây 
là quá trình được sử dụng chủ yếu trong các trung tâm tâm thần, các trại cải tạo, và những trung tâm 
cải huấn trẻ em có vấn đề. Những chính sách khen thưởng cụ thể là những tặng thưởng kinh tế, 
chẳng hạn như thẻ chứng nhận tiến bộ, các thẻ lao động chăm chỉ, thẻ phấn đấu tốt hoặc những 
phiếu ghi nhận tích cực, thưởng cho những thành viên có biểu hiện tốt. Nếu các đối tượng có những 
hành vi tiêu cực sẽ dẫn đến việc bị lấy đi những tặng thưởng kinh tế nói trên. 
Những tặng thưởng kinh tế của các thành viên sẽ được chuyển đổi thành những phẩm vật có giá trị sử 
dụng như kẹo bánh, thuốc lá, sách báo, tem thư, hay thẻ điện thoại liên lạc với bên ngoài. Hoặc 
những tặng thưởng kinh tế có thể được quy ra thành những hình thức chế độ ưu đãi như được nghỉ 
lao động, được tăng số lần thăm nuôi… Cách áp dụng này đã được chứng minh là rất có hiệu quả. 
Địa chỉ: 22/48 đường Mạc Đĩnh Chi, P. An Cư, quận Ninh Kiều, TP. Cần Thơ 
Tuy nhiên có một điểm yếu của tặng thưởng kinh tế làm những phạm nhân sau khi trở về với môi trường 
đời sống khắc nghiệt cám dỗ trước đó sẽ quên đi khía cạnh tích cực này. Các thành viên sẽ thường 
trở về với những hành vi cũ. Như thế ta có thể kết luận là tặng thưởng kinh tế không có tác động 
tích cực lâu dài. Vì khi các cá nhân trở về đời sống cũ, hệ thống những tặng thưởng kinh tế ấy hoàn 
toàn không tồn tại. Và họ sẽ ứng xử bởi sự giật dây của môi trường sống.  1.2.6 Kết luận 
Theo ông, kẻ xấu làm việc xấu vì việc xấu là phần thưởng của họ. Người tốt làm việc tốt vì việc tốt là phần 
thưởng đối với họ. Sẽ không bao giờ có sự tự do tuyệt đối và cũng không có phẩm cách thật sự. 
Ngay trong lúc này, những tác nhân củng cố cho những hành vi tốt hay xấu thật ra rất khó xác định 
và vượt ra khỏi những tiêu chuẩn kiểm soát của chúng ta. 
Ông cổ súy việc chúng ta cần có thật nhiều cơ hội được cha mẹ, thầy cô, bạn bè và những ảnh hưởng tích 
cực khác tác động lên quá trình phát triển. Skinner khuyến khích hãy kiến tạo một xã hội văn hóa 
văn minh khuyến khích những hành vi tốt cần được thưởng và những hành vi xấu cần được triệt tiêu 
thay vì kiểm soát như hiện tại, sử dụng hình phạt để trừng trị. Skinner tin rằng sự kết hợp giữa khoa 
học kỹ thuật với các ứng dụng chủ thuyết hành vi chúng ta có thể kiến tạo ra một nền văn hóa như  thế. 
Hai khái niệm tự do và phẩm cách là những ví dụ mà Skinner gọi là những cấu trúc tâm thức vốn khó giải 
thích vì đây thuộc về khoa học tâm lý. Những ví dụ khác là cơ chế tự vệ, nguyên mẫu ở Carl Jung, 
khung chung sau cùng, chiến được đối phó, giác ngộ, cõi vô thức, ngay cả những phạm trù sinh lý 
khác như đói khát, cõi ý thức. Theo ông điều quan trọng nhất trong hệ thống của con người là khái 
niệm con người nhỏ của mình. Homunculus trong tiếng Latinh có nghĩa là chú người nhỏ. Chính 
chú người nhỏ ấy tồn tại bên trong mỗi chúng ta đã giật dây chi phối tất cả những hành vi của chúng 
ta, bao gồm các mảng đời sống tinh thần tư tưởng, khái niệm linh hồn, tâm thức, cái tôi, khao khát 
ý chí, bản thân, và dĩ nhiên là nhân cách của chúng ta. 
Tuy nhiên Skinner luôn động viên các nhà tâm lý hãy tập trung nhiều hơn nữa vào những đại lượng có thể 
quan sát được, đó là môi trường sống và những hành vi của chúng ta trong môi trường sống ấy.  1.2.7 Sơ đồ 
TÂM LÝ HỌC HÀNH VI CỦA SKINNER  Chủ  Hành  thể  Điều  chỉnh  Động  Không  L Nh ặp đi  ận  Lựa  Làm  L th ặp lại  ức  chọn  (suy  xét)  Làm  Xấu  Tốt   
Hình 1 Sơ đồ thể hiện mối quan hệ giữa hành vi và nhận thức 
1.3 Một số vấn đề khác và thuyết hành vi của Skinner 
Nếu suy xét một cách chân thật thì thuyết hành vi của Skinner chỉ có công tác dụng ru ngủ chủ thể, cơ hội 
để thay đổi ý thức của chủ thể rất thấp, và thuyết hành vi của Skinner chỉ là công cụ để có thể tiến 
vào vùng ý thức của chủ thể, chính vì thế đó là lí do chúng ta không được lạm dụng thuyết hành vi 
quá đà vào công trình tham vấn tâm lí. 
1.3.1 Nguồn gốc của hành vi có điều kiện (operant behavior) 
Đối với câu trả lời của Skinner cho câu hỏi đầu tiên, có nhiều nét tương đồng với câu trả của Darwin cho 
câu hỏi về nguồn góc cấu trúc của một cơ thể mới, cụ thể là sự thay đổi và lựa chọn. Tương tự như 
vật, hành vi của mỗi một cá nhân thay đổi theo từng thời kỳ, từng thời điểm khác nhau; một sự thay 
đổi đi theo sau nó chính là sự củng cố một cách bền vững tạo nên sự đặc biệt trong chuỗi hành vi 
của mỗi cá nhân đó. “Shaping” là một thuật ngữ mà Skinner dùng để nói về sự sửa đổi dần hành vi 
bằng cách tăng cường dần sự mong muốn trong ý thức. Như đã thảo luận ở phần sau của bài báo 
này, Skinner tin rằng hành vi “mê tín dị đoan” có thể nảy sinh khi một phản ứng xảy ra theo sau đó 
là sự củng cố mà nó thực sự không liên quan. 
1.3.2 Điều khiển hành vi có điều kiện (control of operant behavior) 
Câu hỏi thứ hai là “làm như thế nào để điều khiển hành vi có điều kiện” nảy sinh bởi vì, bắt đầu với, hành 
vi là sự “bộc phát” ra mà không cần bất cứ sự kích thích đặc biệt nào cả. Skinner trả lời câu hỏi này 
bằng cách nói rằng một kích thích đến để kiểm soát Operant nếu nó có mặt khi phản ứng được củng 
cố, sửa chữa và không có sự xuất hiện của operant khi nó không được củng cố. Ví dụ nếu một công 
tắc chỉ mang đến thức ăn khi đèn được bật, một con chuột hoặc một đứa trẻ sẽ học được cách bấm 
Địa chỉ: 22/48 đường Mạc Đĩnh Chi, P. An Cư, quận Ninh Kiều, TP. Cần Thơ 
công tắc khi đèn được bật. Skinner tóm tắt mối quan hệ này bằng cách nói rằng để phân biệt kích 
thích (Vd: ánh sáng) tạo ra cơ hội cho việc tao ra cơ hội cho việc củng cố (thực phẩm) của chủ thể 
vận hành (công tắc). Đây là ba giai đoạn liên tiếp xảy ra khi có một sự việc bất ngờ xuất hiện đến 
(Tác nhân kích thích – trả lời sự kích thích – sửa chửa, củng cố) là một trong những khái niệm quan 
trọng nhất của Skinner, và đặt ra lý thuyết của mình ngoài các lý thuyết chỉ sử dụng các mối liên  kết đối. 
TÀI LIỆU THAM KHẢO 
[1] Nguyễn Thơ Sinh (2013), B.F. Skinner – Thuyết nhân cách hành vi, tct: http://tuhieuminh.blogspot.com/2013/04/bf-skinner-
thuyet-nhan-cach-hanh-vi.html, ntc: 2/11/2017. 
[2] Wikipedia (2018), B.F. Skinner, tct: https://en.wikipedia.org/wiki/B._F._Skinner, ntc: 2/11/2017.  DANH MỤC HÌNH 
[1] Hình 1 Sơ đồ thể hiện mối quan hệ giữa hành vi và nhận thức   
TÂM LÝ HỌC HÀNH VI CỦA SKINNER