13 marca 2024 opublikowane zostały dwie prezentacje, które pokazują nam praktyczne zastosowanie generatywnego AI. Rewolucja AI zdaje się wchodzić na kolejny poziom.
Chatboty AI weszły już do mainstreamu. Zadajemy pytanie w naturalnym języku i dostajemy odpowiedź, która wygląda jakby udzielił jej człowiek. Potrafią tworzyć artykuły, wpisy, tweety czy wiersze, potrafią tworzyć działający kod, potrafią parafrazować i redagować. Daje to duże możliwości ale wciąż wymaga by to człowiek zadawał pytania, pisał prompty, a następnie decydował co zrobić z odpowiedzią.
Dziś jednak opublikowane zostały dwie prezentacje, które pokazują co nas czeka w najbliższej przyszłości.
Devin: pierwszy autonomiczny programista AI
13 marca 2024 Cognition Labs zaprezentowało swoją aplikację typu AI agent o imieniu Devin. System po otrzymaniu polecenia napisania określonego kodu tworzy plan działania, a następnie go wykonuje. Pisze kod, który potem uruchamia, naprawia znalezione błędy, znowu uruchamia i ostatecznie wykorzystuje uzyskane rezultaty. Mając dostęp do internetu potrafi pobrać z niego informacje przez przeglądarkę i również wykorzystać. W praktyce oznacza to, że Devin jest w stanie nie tylko odpowiedzieć na pytanie ale też potraktować je jako zadanie do wykonania i następnie wykonać. Wygląda to, cóż, imponująco.
Internet zalała fala komentarzy bo demo zrobiło duże wrażenie. Wystarczy chwilę pomyśleć – to już nie jest chatbot, który wyrzuci nam kawałek kodu, który następnie my musimy umieć wykorzystać. Teraz mamy aplikację, która po prostu wykonuje zadanie z użyciem kodu. My tego kodu nawet nie musimy oglądać. Sami zastanówcie się nad konsekwencjami.
Oczywiście Devin nie jest pierwszym AI agentem – o nich głośno jest już od jakiegoś czasu. Mamy chociażby AutoGPT czy babyGPT, które możemy wykorzystywać do wykonywania konkretnych zadań na naszym komputerze czy poprzez internet (nawet zakupów). Devin wydaje się jednak mieć dużo bardziej zaawansowane możliwości działając bardziej autonomicznie. Narazie nie jest jeszcze dostępny ale to tylko kwestia czasu.
Figure 01: Robot napędzany technologiami OpenAI
Wydawałoby się, że autonomiczny programista to dużo jak na jeden dzień. Ale nie. Bo jednocześnie inny startup – Figure.ai zaprezenotwała nowe demo swojego humanoidalnego robota Figure 01. Warto obejrzeć trwa niecałe 3 minuty, a wrażenie jest mocne:
Napędzany technologią OpenAI (nie wiemy dokładnie którą) robot na naszych oczach odbiera polecenia głosowe od człowieka, odpowiada na pytania i wykonuje zadane polecenia. Sama zamiana mowy na tekst, który trafia do modelu językowego i uzyskanie tekstu odpowiedzi przetworzonego na audio już widzieliśmy w aplikacjach od OpenAI. Umiejętności interpretacji obrazu w połączeniu z poleceniem – też już mamy w GPT-4 czy Gemini. Ale połączenie tego z obsługą fizycznych przedmiotów – to już jest coś nowego i fascynującego. Szczególnie, że Figure 01 nie jest naśladującą ruchy człowieka papugą jak robot od Tesli. Na dodatek szokuje szybkość czasu reakcji, a także naturalne brzmienie mowy robota (być może jest to jakiś nowy model audio OpenAI)
Nowy etap rozwoju AI?
Obie te prezentacje są imponujące i pokazują dokąd może zaprowadzić umiejętne wdrożenie technologii, którą od ponad roku fascynuje się cały świat. Automatyczne aplikacje czy prototypy robotów to kolejne dowody na trwającą rewolucję technologiczną. Na dodatek są to kolejne rozwiązania stworzone przez startupy, a nie wielkie firmy. A takich startupów jest dużo więcej.
Zobacz też: podsumowanie 2023 roku oraz mapę trendów PEST 2024
Chcesz otrzymywać najnowsze wiadomości: zapisz się na newsletter.
Komentuj na Facebook albo Instagram
Dodaj komentarz