Последни новини
Новини по криптовалути Прогнози по криптовалути

© KriptoNovini.Bg 2024. | Крипто новините са написани за вас от сърце

ChatGPT и Клод „стават способни да се справят с мисии в реалния свят“, казват учените

Близо две дузини изследователи от университета Цинхуа, държавния университет в Охайо и Калифорнийския университет в Бъркли си сътрудничиха, за да създадат метод за измерване на възможностите на големи езикови модели (LLM) като агенти в реалния свят.

LLM като ChatGPT на OpenAI и Claude на Anthropic превзеха технологичния свят през изминалата година, тъй като авангардни „чат ботове“ се оказаха полезни при различни задачи, включително кодиране, търговия с криптовалута и генериране на текст.

Обикновено тези модели се сравняват въз основа на способността им да извеждат текст, възприеман като човешки, или на техните резултати при тестове на обикновен език, предназначени за хора. За сравнение, много по-малко документи са публикувани по темата за LLM моделите като агенти.

Агентите с изкуствен интелект (AI) изпълняват специфични задачи, като например следване на набор от инструкции в рамките на конкретна среда. Например, изследователите често ще обучават AI агент да навигира в сложна цифрова среда като метод за изучаване на използването на машинно обучение за безопасно разработване на автономни роботи.

Традиционните агенти за машинно обучение като този във видеото по-горе обикновено не се изграждат като LLM поради непосилните разходи, свързани с модели за обучение като ChatGPT и Claude. Въпреки това, най-големите LLMs показаха обещание като агенти.

Екипът от Цинхуа, щата Охайо и Калифорнийския университет в Бъркли разработи инструмент, наречен AgentBench, за оценка и измерване на способностите на LLM моделите като агенти в реалния свят, нещо, което екипът твърди, че е първото по рода си.

Как интерпретаторът на кодове ChatGPT на OpenAI може да накара AI Chatbots да решават проблеми от реалния свят

Според документа за предпечат на изследователите, основното предизвикателство при създаването на AgentBench е излизането отвъд традиционните среди за обучение с изкуствен интелект – видеоигри и симулатори по физика – и намирането на начини за прилагане на способностите на LLM към проблеми от реалния свят, така че те да могат да бъдат ефективно измерени.

Това, което измислиха, беше многоизмерен набор от тестове, които измерват способността на модела да изпълнява предизвикателни задачи в различни среди.

Те включват моделите да изпълняват функции в SQL база данни, работа в рамките на операционна система, планиране и изпълнение на функции за почистване на домакинството, пазаруване онлайн и няколко други задачи на високо ниво, които изискват стъпка по стъпка решаване на проблеми.

Според вестника най-големите и най-скъпи модели надминаха моделите с отворен код със значително количество:

„[Ние] проведохме цялостна оценка на 25 различни LLM с помощта на AgentBench, включително базирани на API и модели с отворен код. Нашите резултати разкриват, че моделите от най-високо ниво като GPT-4 са способни да се справят с широк спектър от задачи от реалния свят, което показва потенциала за разработване на мощен, непрекъснато обучаващ се агент.

Изследователите стигнаха до там, за да твърдят, че „най-добрите LLMs стават способни да се справят със сложни мисии в реалния свят“, но добавиха, че конкурентите с отворен код все още имат „дълъг път да извървят“.

Публикацията на Наталия Иванова: "ChatGPT и Клод „стават способни да се справят с мисии в реалния свят“, казват учените" е написана за KriptoNovini.bg

Ще сме ви благодарни ако споделите тази новина!

Tumblr
LinkedIn
Reddit
VK
Telegram
E-Mail
WhatsApp
Viber

Новини от днес


Свързани новини

Още новини с автор: Наталия Иванова

Топ крипто новини

Solana (SOL) се б...
Solana (SOL) се бори на фона на смесени тенденции на водещите криптовалути

Solana (SOL) показва смесени тенденции сред най-добрите криптовалути Скорошен анализ показва, че Solana (SOL) е претърпял забележим спад сред...

Анализ на Dogecoi...
Анализ на Dogecoin (DOGE): Пазарни тенденции и настроения на инвеститорите

Анализ на Dogecoin (DOGE): Пазарни тенденции и настроения на инвеститорите Dogecoin (DOGE) наскоро се сблъска с отхвърляне от местната зона...

Устойчивостта и р...
Устойчивостта и растежът на Биткойн: Прозрения от експерти в индустрията

Устойчивостта и растежът на Биткойн: Прозрения от експерти в индустрията На фона на значителна инерция и случайни спадове, Биткойн (BTC)...

Биткойн и Етериум...
Биткойн и Етериум са изправени пред натиск за продажба

Биткойн и Ethereum под натиск: Анализ на активността на китовете и пазарните настроения Въпреки че Биткойн (BTC) не успя да надхвърли...

Последни новини


Новини по криптовалути


Ретро крипто новини


Крипто Прогнози


Крипто Новини


Крипто сайтове


За нас


KriptoNovini.Bg: Достоверен източник за последни крипто новини и прогнози

KriptoNovini.Bg е вашият портал към света на криптовалутите. Ние ви предоставяме най-актуалните новини, задълбочени анализи и точни прогнози за Биткойн, Етериум, Алткойни и други.

Ето какво можете да очаквате от KriptoNovini.Bg:

  • Бързи и точни новини: Бъдете в крак с най-новите разработки в света на криптовалутите.
  • Прогнози от експерти: Получавайте ценни прозрения от водещи анализатори и инвеститори.
  • Анализи на пазара: Разберете какво движи цените на криптовалутите.
  • Ръководства за начинаещи: Научете всичко, което трябва да знаете, за да започнете с криптовалути.
  • Инструменти и ресурси: Намерете всичко, от което се нуждаете, за да инвестирате разумно.

Крипто Новини Бг е вашият верен спътник в крипто пътуването. Присъединете се към нас днес!