Создатель ChatGPT, компания OpenAI, работает над новым подходом к своим моделям искусственного интеллекта в проекте под кодовым названием «Strawberry», согласно информации источника, знакомого с ситуацией, и внутренней документации, изученной агентством Reuters.
Проект, подробности о котором ранее не публиковались, появился в то время, когда стартап, поддерживаемый Microsoft, стремится продемонстрировать, что предлагаемые им типы моделей способны обеспечить передовые возможности рассуждений.
По словам инсайдера, новые ИИ-модели смогут вести «глубокое исследование», что приблизит систему к сверхчеловеческому уровню интеллекта.
Мы хотим, чтобы наши модели ИИ видели и понимали мир так же, как мы. Непрерывные исследования новых возможностей ИИ являются обычной практикой в отрасли, и все мы убеждены, что эти системы со временем будут совершенствовать свои рассуждения, — ответил представитель OpenAI на вопрос о Strawberry, но отказался поделиться подробностями.
Источник сообщил, что работа Strawberry является тщательно охраняемым секретом даже в OpenAI. По словам источника, в документе описывается проект, в котором используются модели Strawberry с целью дать возможность искусственному интеллекту компании не только генерировать ответы на запросы, но и планировать заранее, чтобы автономно и надежно перемещаться по Интернету и выполнять то, что OpenAI называет «глубоким исследованием».
Согласно интервью с более чем десятком исследователей в области ИИ, до сих пор это ускользало от моделей ИИ.
Проект Strawberry ранее был известен как Q*, и, как сообщало агентство Reuters в прошлом году, в компании уже рассматривали его как прорыв.
Два источника рассказали, что в начале этого года они посмотрели, по словам сотрудников OpenAI, демонстрационные версии Q*, способные отвечать на сложные научные и математические вопросы, недоступные сегодняшним коммерчески доступным моделям.
По данным Bloomberg , во вторник на внутреннем общем собрании OpenAI продемонстрировала демоверсию исследовательского проекта, в котором, по ее словам, были заложены новые навыки рассуждения, подобные человеческим.
Представитель OpenAI подтвердил факт встречи, но отказался предоставить подробности ее содержания. Reuters не удалось определить, был ли продемонстрированный проект Strawberry.
По словам источника, знакомого с инновацией, OpenAI надеется, что она значительно улучшит возможности рассуждений ее моделей ИИ, добавив, что Strawberry использует специализированный способ обработки модели ИИ после ее предварительного обучения на очень больших наборах данных.
Исследователи, опрошенные агентством Reuters, утверждают, что рассуждение является ключом к достижению ИИ человеческого или сверхчеловеческого уровня интеллекта.
Хотя большие языковые модели уже могут обобщать плотные тексты и составлять элегантную прозу гораздо быстрее любого человека, технология часто не справляется с проблемами здравого смысла, решения которых кажутся людям интуитивными, например, с распознаванием логических ошибок и игрой в крестики-нолики.
Исследователи ИИ, опрошенные агентством Reuters, в целом согласны с тем, что рассуждение в контексте ИИ подразумевает формирование модели, которая позволяет ИИ планировать заранее, отражать функционирование физического мира и надежно решать сложные многоэтапные задачи. Улучшение рассуждений в моделях ИИ рассматривается как ключ к раскрытию возможностей моделей делать все: от совершения крупных научных открытий до планирования и создания новых программных приложений.
Генеральный директор OpenAI Сэм Альтман заявил ранее в этом году что в области ИИ «наиболее важные области прогресса будут связаны со способностью рассуждать».
Другие компании, такие как Google, Meta и Microsoft, также экспериментируют с различными методами для улучшения рассуждений в моделях ИИ, как и большинство академических лабораторий, которые проводят исследования ИИ.
Однако исследователи расходятся во мнениях относительно того, способны ли большие языковые модели (LLM) включать идеи и долгосрочное планирование в то, как они делают прогнозы. Например, один из пионеров современного ИИ, Янн Лекун, работающий в Meta, часто говорил, что LLM не способны к человеческим рассуждениям. Strawberry является ключевым компонентом плана OpenAI по преодолению этих проблем, сказал источник, знакомый с этим вопросом.
Документ, с которым ознакомился Reuters, описывает, что Strawberry стремится сделать, но не то, как это сделать. В последние месяцы компания конфиденциально дала понять разработчикам и другим внешним сторонам, что она находится на пороге выпуска технологии со значительно более продвинутыми возможностями рассуждения, согласно четырем людям, которые слышали питчи компании. Они отказались назвать свои имена, поскольку не уполномочены говорить о личных вопросах.
По словам одного из источников, Strawberry включает в себя специализированный способ так называемого «пост-обучения» моделей генеративного ИИ OpenAI, или адаптации базовых моделей для оттачивания их производительности определенным образом после того, как они уже были «обучены» на массивах обобщенных данных.
Фаза разработки модели после обучения включает в себя такие методы, как «тонкая настройка» — процесс, используемый сегодня практически во всех языковых моделях, который существует во многих разновидностях, например, предоставление людьми обратной связи модели на основе ее ответов и предоставление ей примеров хороших и плохих ответов.
Strawberry имеет сходство с методом, разработанным в Стэнфорде в 2022 году под названием «Self-Taught Reasoner» или «STaR», сообщил один из источников, знакомых с этим вопросом. STaR позволяет моделям ИИ «загружаться» до более высоких уровней интеллекта посредством итеративного создания собственных обучающих данных и, в теории, может использоваться для того, чтобы заставить языковые модели превосходить уровень интеллекта человека, сообщил Reuters один из его создателей, профессор Стэнфорда Ноа Гудман.
«Я думаю, что это одновременно и волнительно, и страшно… если все будет продолжаться в том же духе, нам, людям, придется серьезно задуматься», — сказал Гудман. Гудман не связан с OpenAI и не знаком со Strawberry. В документе говорится, что среди возможностей, на которые OpenAI нацеливает Strawberry, — выполнение долгосрочных задач (LHT), то есть сложных задач, требующих от модели предварительного планирования и выполнения ряда действий в течение длительного периода времени, пояснил первый источник. Для этого OpenAI создает, обучает и оценивает модели на основе того, что компания называет набором данных «глубокого исследования», согласно внутренней документации OpenAI.
Reuters не удалось определить, что находится в этом наборе данных или как долго будет длиться этот длительный период. OpenAI хочет, чтобы ее модели использовали эти возможности для проведения исследований, автономно просматривая веб-страницы с помощью «CUA» или агента, использующего компьютер, который может предпринимать действия на основе своих выводов, согласно документу и одному из источников.
OpenAI также планирует проверить свои возможности на выполнении работы инженеров программного обеспечения и машинного обучения.