No dobrze, ale co właściwie oznacza „rozumieć strukturę zadania”? I skąd mysz wie, gdzie iść, skoro wcześniej tam nie była? Z pomocą przychodzi zespół naukowców z Oksfordu, który postanowił przyjrzeć się temu, jak mózg tworzy coś w rodzaju mapy zadań – nie fizycznej, jak GPS w telefonie, ale abstrakcyjnej, opisującej kolejność działań, jakie trzeba wykonać, żeby osiągnąć cel.
W badaniu opublikowanym w grudniowym numerze Nature (2024), naukowcy nauczyli myszy specjalnego zadania. Zwierzęta musiały odwiedzać cztery punkty z nagrodą (A, B, C, D), zawsze w tej samej kolejności, ale za każdym razem w innej konfiguracji przestrzennej. Innymi słowy – cel i jego kolejność się nie zmieniały, ale lokalizacja już tak. Zaskakujące? Myszki nie tylko nauczyły się tego schematu, ale zaczęły stosować go do nowych zadań od razu, bez wcześniejszego treningu. To tak, jakby ktoś pokazał Ci nową kuchnię, a Ty będziesz od razu wiedzieć, gdzie jest czajnik, bo rozpoznajesz ogólny „układ kuchenny”.
Kluczowa obserwacja? W mózgach myszy – a dokładnie w przyśrodkowej korze czołowej – badacze zarejestrowali aktywność neuronów, które nie kodowały lokalizacji czy czasu, ale… progres w zadaniu. Neurony te, nazwane „komórkami postępu do celu”, aktywowały się w zależności od tego, jak blisko mysz była do nagrody – niezależnie od tego, gdzie ta nagroda się znajdowała.
Jeszcze ciekawiej robi się, gdy spojrzymy na to z większej perspektywy. Część tych neuronów nie tylko śledziła postęp, ale robiła to z określonym opóźnieniem – tak, jakby każda komórka miała przypisane „miejsce w kolejce działań”. Razem tworzyły coś, co naukowcy nazwali buforami pamięci strukturalnej – układami neuronów, które potrafią kodować całą sekwencję przyszłych kroków.
Wyobraź sobie takie bufory jak pierścienie, po których krąży impuls – „bąbel aktywności”. Każdy taki bąbel zaczyna się w chwili, gdy mysz osiągnie jakiś punkt (np. nagrodę w miejscu B), a potem „krąży” przez sieć neuronów, odliczając kolejne etapy zadania. Gdy wraca do punktu wyjścia, mózg wie: czas zacząć od nowa. To właśnie ten dynamiczny sposób kodowania sprawia, że sieć neuronowa może „znać” cały plan działania – i to nawet zanim zwierzę wykona kolejny krok.
A co robi mózg w czasie snu? Odtwarza te sekwencje! Naukowcy wykazali, że „krążenie” aktywności w buforach pamięci dzieje się też offline – czyli gdy mysz śpi. Mózg trenuje ścieżki, wzmacniając zapamiętany schemat. To trochę jak powtarzanie choreografii w głowie – nawet bez muzyki i parkietu.
Odkrycie ma ogromne znaczenie – nie tylko dla zrozumienia myszy, ale też dla ludzi. Bo nasze mózgi też muszą planować wieloetapowe działania: gotowanie obiadu, pisanie maila, wychowywanie dzieci. Bufory pamięci strukturalnej to możliwy mechanizm, dzięki któremu umiemy planować nie tylko „co dalej”, ale i „co potem i jeszcze potem”. Dzięki temu jeden abstrakcyjny schemat – jak kolejność „A-B-C-D” – może być zastosowany do wielu różnych sytuacji, nawet jeśli wyglądają inaczej. A to otwiera drzwi do projektowania sztucznej inteligencji, która nie tylko uczy się konkretnych przypadków, ale też rozumie strukturę problemu. Jak człowiek. Albo jak sprytna myszka z labiryntu.