Strona główna Polityka To rzut oka na przyszłość robotów AI

To rzut oka na przyszłość robotów AI

17
0


Pomimo oszałamiającego postępu w dziedzinie sztucznej inteligencji, jaki nastąpił w ostatnich latach, roboty pozostają uparcie głupie i ograniczone. Te znalezione w fabrykach i magazynach zazwyczaj przechodzą przez precyzyjnie opracowane układy choreograficzne, bez dużej zdolności postrzegania otoczenia i dostosowywania się w locie. Nieliczne roboty przemysłowe, które potrafią widzieć i chwytać przedmioty, mogą wykonywać tylko ograniczoną liczbę czynności przy minimalnej zręczności ze względu na brak ogólnej inteligencji fizycznej.

Ogólnie rzecz biorąc, sprawne roboty mogłyby podjąć się znacznie szerszego zakresu zadań przemysłowych, być może po minimalnych demonstracjach. Roboty będą również potrzebować bardziej ogólnych umiejętności, aby poradzić sobie z ogromną zmiennością i bałaganem w ludzkich domach.

Ogólne podekscytowanie postępem sztucznej inteligencji przełożyło się już na optymizm co do nowych, znaczących postępów w robotyce. Firma samochodowa Elona Muska, Tesla, opracowuje humanoidalnego robota o nazwie Optimus i Musk niedawno zasugerowane że będzie powszechnie dostępny w cenie od 20 000 do 25 000 dolarów i będzie w stanie wykonać większość zadań do roku 2040.

Dzięki uprzejmości Inteligencji Fizycznej

Poprzednie wysiłki mające na celu nauczenie robotów wykonywania trudnych zadań skupiały się na szkoleniu pojedynczej maszyny w zakresie jednego zadania, ponieważ nauka wydawała się niemożliwa do przeniesienia. Niektóre niedawne prace akademickie wykazały, że przy odpowiedniej skali i dopracowaniu naukę można przenosić między różnymi zadaniami i robotami. Projekt Google z 2023 r. o nazwie Otwórz wersję X polegało na dzieleniu się nauką robotów pomiędzy 22 różnymi robotami w 21 różnych laboratoriach badawczych.

Kluczowym wyzwaniem związanym ze strategią realizowaną przez inteligencję fizyczną jest to, że nie ma takiej samej skali danych robotów dostępnych do szkolenia, jak w przypadku dużych modeli językowych w formie tekstu. Firma musi zatem generować własne dane i opracować techniki usprawniające uczenie się na podstawie bardziej ograniczonego zbioru danych. Aby opracować π0, firma połączyła tak zwane modele języka wizyjnego, które uczą się na obrazach i tekście, z modelowaniem dyfuzyjnym – techniką zapożyczoną z generowania obrazów AI, aby umożliwić bardziej ogólny rodzaj uczenia się.

Aby roboty mogły wykonywać dowolne zadania, o które poprosi je osoba, należy znacznie zwiększyć skalę tego uczenia się. „Przed nami jeszcze długa droga, ale mamy coś, co można nazwać rusztowaniem ilustrującym przyszłe wydarzenia” – mówi Levine.



Link źródłowy