Twórcy Claude’a biją na alarm: AI może wymknąć się spod kontroli

Twórcy Claude’a nie wzywają do natychmiastowego zatrzymania sztucznej inteligencji, ale chcą, by świat przygotował awaryjny hamulec dla najbardziej zaawansowanych modeli. Anthropic ostrzega, że AI może coraz szybciej pomagać w budowaniu kolejnych wersji samej siebie a wtedy pytanie nie będzie brzmiało, co jeszcze potrafi, lecz kto zdoła ją zatrzymać.
Czas czytania: 6 min
Dłoń zawieszona nad czerwonym przyciskiem awaryjnym w serwerowni symbolizuje próbę kontroli nad rozwojem sztucznej inteligencji.
Anthropic, twórca Claude’a, postuluje przygotowanie awaryjnego mechanizmu dla najbardziej zaawansowanych systemów AI. Fot. thefad.pl

Jeszcze niedawno takie ostrzeżenia brzmiały jak scenariusz filmu science fiction. Dziś wypowiada je jedna z najważniejszych firm w branży sztucznej inteligencji. Anthropic, twórca Claude’a, nie żąda natychmiastowego zatrzymania AI, ale postuluje przygotowanie awaryjnego mechanizmu: możliwości skoordynowanego i weryfikowalnego spowolnienia lub czasowej pauzy w rozwoju najbardziej zaawansowanych systemów.

Nie chodzi o zwykłe chatboty, które pomagają pisać maile, streszczać dokumenty czy poprawiać kod. Stawką są tzw. modele frontier AI, czyli najpotężniejsze systemy rozwijane przez największe laboratoria technologiczne. To one mogą w najbliższych latach wpływać na automatyzację pracy, cyberbezpieczeństwo, naukę, gospodarkę i polityczną siłę państw.

Anthropic mówi więc nie tyle: „zatrzymajmy AI”, ile: „zbudujmy hamulec, zanim może być potrzebny”. Taki hamulec miałby działać tylko wtedy, gdyby został uzgodniony przez najważniejszych graczy i dało się sprawdzić, że inni rzeczywiście zwalniają. Bez tego pauza jednej firmy mogłaby jedynie oddać przewagę mniej ostrożnym konkurentom.

AI, która przyspiesza rozwój AI

W centrum ostrzeżenia jest zjawisko określane jako recursive self-improvement, czyli rekurencyjne samodoskonalenie. W największym uproszczeniu chodzi o moment, w którym sztuczna inteligencja zaczyna w istotny sposób pomagać w tworzeniu kolejnych, jeszcze potężniejszych wersji samej siebie. Najpierw wspiera programistów i badaczy. Potem może przejmować coraz większe fragmenty pracy nad nowymi systemami.

To brzmi abstrakcyjnie, ale według Anthropic proces częściowo już się zaczął. Firma przyznaje, że w jej własnej pracy coraz większy udział mają systemy AI. Claude pomaga pisać kod, automatyzuje zadania i przyspiesza pracę zespołów technicznych. Anthropic podaje, że jego inżynierowie dostarczają dziś średnio osiem razy więcej kodu na kwartał niż w latach 2021–2025.

Na razie człowiek nadal wyznacza cel, sprawdza efekty i podejmuje decyzje. To człowiek odpowiada za kierunek badań, ocenę ryzyka i dopuszczenie modelu do użycia. Pytanie brzmi jednak, jak długo ten układ pozostanie stabilny, jeśli kolejne systemy będą coraz lepiej wykonywać nie tylko pojedyncze zadania, ale całe długie procesy badawcze.

Anthropic zwraca uwagę na inny niepokojący trend: modele AI radzą sobie z coraz dłuższymi i bardziej złożonymi zadaniami wykonywanymi bez stałej kontroli człowieka. Nie chodzi już tylko o napisanie krótkiego fragmentu kodu czy odpowiedź na pojedyncze pytanie. Chodzi o zadania, które wymagają planowania, wykonywania kolejnych kroków, sprawdzania efektów i poprawiania błędów. Według autorów z Anthropic Institute długość takich zadań, które model potrafi wykonać samodzielnie, podwaja się mniej więcej co cztery miesiące. Jeśli ten trend się utrzyma, AI może coraz częściej przejmować prace, które dziś zajmują specjalistom wiele godzin, dni, a w dalszej perspektywie nawet tygodnie.

Największe ryzyko nie polega na tym, że AI nagle „ożyje” i sama przejmie laboratorium. Chodzi o bardziej przyziemny, ale potencjalnie groźny mechanizm. Jeśli modele będą coraz lepiej wspierać programistów i badaczy w projektowaniu kolejnych systemów, prace nad AI mogą zacząć przyspieszać same siebie. Lepszy model pomaga szybciej stworzyć jeszcze lepszy model, a ten jeszcze mocniej skraca następny etap badań. W takim scenariuszu człowiek nadal uczestniczy w procesie, ale coraz trudniej utrzymać nad nim tempo, kontrolę i pełne zrozumienie skutków.

Ostrzeżenie od firmy, która sama jest częścią wyścigu

Autorzy z Anthropic Institute zastrzegają, że taki scenariusz nie jest przesądzony. Nie twierdzą też, że dzisiejsze modele AI wymknęły się spod kontroli. Ich tekst jest raczej ostrzeżeniem przed kierunkiem, w którym może pójść rozwój najbardziej zaawansowanych systemów: jeśli AI będzie coraz skuteczniej pomagać w badaniach nad AI, tempo zmian może zacząć rosnąć szybciej, niż firmy i instytucje będą w stanie je oceniać.

To ostrzeżenie ma szczególny ciężar, bo nie pochodzi z zewnątrz branży. Anthropic, firma stojąca za Claude’em, jest dziś jednym z najważniejszych graczy w wyścigu sztucznej inteligencji. Według Reutersa spółka zebrała 65 mld dolarów w rundzie Series H, osiągając wycenę post-money na poziomie 965 mld dolarów. Reuters informował też, że Anthropic poufnie złożył dokumenty przed planowaną ofertą publiczną w USA.

Dlatego apel o awaryjny mechanizm można czytać na dwa sposoby. Zwolennicy ostrożności uznają go za ważny sygnał z samego środka branży: skoro nawet ludzie związani z czołowym laboratorium AI mówią o potrzebie przygotowania pauzy, ryzyka nie da się zbyć jako fantazji przeciwników technologii. W tej interpretacji chodzi o stworzenie zabezpieczeń, zanim modele staną się zbyt szybkie, zbyt autonomiczne i zbyt trudne do nadzorowania.

Krytycy mogą jednak zapytać, kto najbardziej skorzysta na nowych regułach. Jeżeli mechanizm spowolnienia będzie wymagał kosztownych audytów, rozbudowanych procedur i stałego kontaktu z regulatorami, łatwiej poradzą sobie z nim najwięksi. Mniejsze firmy, projekty open source i niezależni badacze mogą zostać wypchnięci z gry nie przez samą technologię, lecz przez koszt spełnienia wymogów bezpieczeństwa.

To właśnie dlatego debata o „hamulcu” dla AI jest tak trudna. Nie sprowadza się do prostego wyboru między bezpieczeństwem a innowacją. Chodzi o to, czy można stworzyć zasady, które realnie ograniczą najbardziej ryzykowne zastosowania, ale nie zamienią regulacji w tarczę chroniącą największych graczy przed konkurencją.

Hamulca nie da się nacisnąć w pojedynkę

Największy problem z awaryjną pauzą polega na tym, że musiałaby objąć więcej niż jedną firmę. Jeśli jedno laboratorium zwolni, a inni będą pracować dalej, globalne ryzyko się nie zmniejszy, zmieni się tylko układ sił w wyścigu AI.

Dlatego autorzy z Anthropic Institute piszą o mechanizmie skoordynowanym i możliwym do sprawdzenia. Sama deklaracja dobrej woli nie wystarczy. Potrzebne byłyby zasady, które pozwolą ocenić, kto naprawdę ogranicza prace nad najbardziej zaawansowanymi modelami, a kto tylko mówi o bezpieczeństwie.

To właśnie tu propozycja staje się najtrudniejsza. Najbardziej zaawansowane prace nad AI mogą toczyć się w firmach, państwach i instytucjach związanych z bezpieczeństwem. Bez wspólnych reguł hamulec jednej strony będzie raczej gestem niż realnym zabezpieczeniem. 

Źródło: Anthropic, Reuters

Opracowanie: Darek Frach

Link skopiowany

Powiązane

Najczęściej czytane

  1. 1

    JOMO: nareszcie modne jest nicnierobienie

  2. 2

    Gdy penis robi się mniejszy

  3. 3

    Znani politycy o homoseksualizmie Jarosława Kaczyńskiego

  4. 4

    Sny, które przychodzą przed śmiercią. Lekarze mówią, że nie są przypadkowe

  5. 5

    Adam Mazguła: Reżim PiS-panów i PiS-plebanów