Ошибка!

Показать Ошибка!

Забыли пароль?

Ошибка!

Ошибка!

Скрыть Ошибка!

Скрыть Ошибка!

Забыли пароль? Напишите ваш email и мы отправим письмо с инструкциями.

Ошибка!

Обратно

Закрыть

Стэнфорд создал копию ChatGPT менее чем за 600 долларов

Стэнфорд создал копию ChatGPT менее чем за 600 долларов
Искусственный интеллект Alpaca во многих задачах работает так же, как удивительный ChatGPT, но он построен на модели языка с открытым исходным кодом и стоит менее 600 долларов США для обучения. Кажется, что эти богоподобные ИИ уже пугающе дешевы и их легко воспроизвести.


Полгода назад за развитием больших языковых моделей следили только исследователи и ученые. Но запуск ChatGPT в конце прошлого года ударил по человечеству ракетой: теперь машины могут общаться так же, как люди. Они могут писать тексты и даже программный код в головокружительном множестве предметных областей за считанные секунды, часто на очень высоком уровне. Как показывает запуск GPT-4, они совершенствуются со стремительной скоростью, и они способны коренным образом преобразовать человеческое общество, как мало какие другие технологии, потенциально автоматизируя ряд рабочих задач (особенно среди белых воротничков), что люди ранее считали невозможным.

Многие другие компании, в частности Google, Apple, Meta, Baidu и Amazon, не слишком отстают, и их ИИ скоро наводнят рынок, привязываясь ко всем возможным приложениям и устройствам. Языковые модели уже есть в поисковой системе Bing и скоро появятся в остальных. Они будут в машине, в телефоне, в телевизоре и будут ждать на другом конце линии каждый раз при попытке позвонить в компанию. Вскоре мы увидим их в роботах.

Небольшое утешение заключается в том, что OpenAI и остальные из этих крупных компаний осознают безумный потенциал этих машин для спама, дезинформации, создания вредоносных программ, целенаправленного преследования и всевозможных других вариантов использования, которые, по мнению большинства людей, сделают мир гораздо хуже. Они тратят месяцы и месяцы на то, чтобы вручную ограничить эти возможности перед запуском. Генеральный директор OpenAI Сэм Альтман (Sam Altman) — один из многих, обеспокоенных тем, что правительства действуют недостаточно быстро, чтобы возводить заборы вокруг ИИ во имя общественного блага.

А как насчет языковой модели, которую можно построить самостоятельно за 600 баксов? Группа исследователей из Стэнфорда сделала именно это, и ее впечатляющие результаты показывают, насколько быстро весь этот сектор и его потрясающие возможности могут быстро выйти из-под контроля.

Исследовательская группа из Стэнфорда начала с языковой модели Meta с открытым исходным кодом LLaMA 7B — самой маленькой и дешевой из нескольких доступных моделей LLaMA. Предварительно обученная на триллионе «токенов», эта маленькая языковая модель имела определенные заложенные возможности, но в большинстве задач она значительно отставала от ChatGPT. Дело в том, что основная стоимость и главное конкурентное преимущество моделей GPT в значительной степени связаны с огромным количеством времени и человеческих ресурсов, которые OpenAI вложил в последующее обучение. Одно дело прочитать миллиард книг, и совсем другое — пережевать большое количество пар вопросов и ответов, которые учат этих ИИ тому, в чем будет состоять их настоящая работа.

Когда модель LLaMA 7B была запущена и работала, команда из Стэнфорда попросила GPT взять 175 пар инструкций/выводов, написанных человеком, и начать генерировать больше в том же стиле и формате, по 20 за раз. Это было автоматизировано с помощью одного из услужливо предоставленных API-интерфейсов OpenAI, и за короткое время у команды было около 52 000 примеров разговоров, которые можно было использовать для постобучения модели LLaMA. Генерация этих массовых обучающих данных стоила менее 500 долларов США.

Затем они использовали эти данные для точной настройки модели LLaMA — процесс, который занял около трех часов на восьми компьютерах с облачной обработкой A100 емкостью 80 ГБ. Это стоило менее 100 долларов США.

Затем они протестировали получившуюся модель, которую назвали Alpaca, в сравнении с базовой языковой моделью ChatGPT в различных областях, включая написание электронной почты, социальные сети и инструменты повышения производительности. Alpaca выиграла 90 из этих тестов, GPT — 89.

«Мы были весьма удивлены этим результатом, учитывая небольшой размер модели и скромный объем данных для выполнения инструкций», — пишет команда. «Помимо использования этого набора статических оценок, мы также тестировали модель Alpaca в интерактивном режиме и обнаружили, что Alpaca часто ведет себя аналогично text-davinci-003 [GPT-3.5] на различных наборах входных данных. Мы признаем, что наша оценка может быть ограничена по масштабу и разнообразию».

Далее команда сказала, что они могли бы сделать это дешевле, если бы хотели оптимизировать процесс. Также стоит отметить, что любой, кто хочет воспроизвести ИИ, теперь получил доступ к гораздо более мощному GPT 4.0, а также к нескольким более мощным моделям LLaMA, которые можно использовать в качестве основы, и, конечно же, нет необходимости останавливаться на 52 000 вопросов.


Команда из Стэнфорда опубликовала на Github 52 000 вопросов, использованных в этом исследовании, а также код для создания дополнительных вопросов и код, который они использовали для тонкой настройки модели LLaMA. Команда отмечает, что «мы еще не настроили модель Alpaca, чтобы она была безопасной и безвредной», и просит, чтобы любой, кто устанавливает ее, сообщал о проблемах безопасности и этики, которые обнаружатся.

Так что же может помешать практически любому создать собственный искусственный интеллект сейчас, за сотню баксов или около того, и тренировать по своему усмотрению? В условиях обслуживания OpenAI сказано: «Вы не можете… использовать выходные данные Сервисов для разработки моделей, конкурирующих с OpenAI». И Meta говорит, что на данном этапе разрешает академическим исследователям использовать LLaMA только по некоммерческим лицензиям, хотя это спорный вопрос, поскольку вся модель LLaMA просочилась на 4chan через неделю после ее анонса.

Еще одна группа говорит, что им удалось устранить стоимость облачных вычислений, выпустив на Github больше кода, который может работать на Raspberry Pi, и завершить процесс обучения в течение 5 часов на одной видеокарте nVidia RTX 4090.

Что все это значит? Теперь можно создавать неограниченное количество неконтролируемых языковых моделей — людьми, обладающими знаниями в области машинного обучения, которым наплевать на условия или пиратство программного обеспечения — за гроши.

Это также мутит воду для коммерческих ИИ-компаний, работающих над разработкой собственных языковых моделей; если так много времени и затрат уходит на этап после обучения, и эта работа может быть украдена за время, необходимое для ответа на 50 или 100 000 вопросов, имеет ли смысл компаниям продолжать тратить эти деньги?

А для остальных из нас: трудно сказать, но удивительные возможности этого программного обеспечения, безусловно, могут быть полезны авторитарному режиму, или фишинговым операциям, или спамерам, или любому количеству других изворотливых личностей.

Джинн выпущен из бутылки, и кажется, что его уже невероятно легко воспроизвести и переобучить. Держитесь за шляпы.

Комментарии:

Еще нет комментариев, станьте первым коментатором!
Войдите на зайт или зарегистрируйтесь, чтобы оставлять комментарии!
0
В центре Млечного Пути обнаружены загадочные штрихи

В центре Млечного Пути обнаружены загадочные штрихи

Международная группа астрофизиков обнаружила нечто совершенно новое, спрятанное в центре галактики Млечный Путь.

В начале 1980-х Фархад Юсеф-Заде из Северо-Западного университета обнаружил гигантские одномерные нити, свисающие вертикально около Стрельца А*, центральной сверхмассивной черной дыры нашей галактики. Теперь Юсеф-Заде и его сотрудники обнаружили новую популяцию нитей, но они намного короче и лежат горизонтально или радиально, расходясь, как спицы в колесе, из черной дыры. Хотя две популяции филам...
03.06.23 12:42
0
0
Капсула для астронавтов Boeing сталкивается с новыми задержками запуска

Капсула для астронавтов Boeing сталкивается с новыми задержками запуска

Официальные лица заявили, что капсула астронавта Boeing сталкивается с новыми задержками запуска из-за обнаружения проблем, которые должны были быть выявлены гораздо ранее.

Boeing и НАСА объявили о последней неудаче в четверг. До недавнего времени капсула Starliner находилась на пути к июльскому испытательному полету с двумя астронавтами на Международную космическую станцию - давно запланированному полету, который уже сильно отставал от графика. Но окончательные проверки выявили проблемы со стропами парашюта и другие проблемы, которые присутствовали в прошлогоднем ...
02.06.23 09:35
0
0
Ученые выяснили: личность собаки определяется не только породой

Ученые выяснили: личность собаки определяется не только породой

Связь между людьми и собаками существует уже тысячи лет. Часто решение завести ротвейлера вместо чихуахуа принимается исходя из индивидуальных особенностей собаки. Новое исследование показало, что хотя порода остается важным фактором, характер собаки определяется сложным взаимодействием между генетикой и окружающей средой.

Личность собаки сильно влияет на отношения между ней и ее владельцем, а также членами семьи владельца и другими собаками. Несоответствие характера и нежелательное поведение, такое как агрессия, могут привести к тому, что животное будет брошено в приюте или подвергнуто эвтаназии. Черты характера животного в значительной степени генетические, при этом наследственность составляет от 40% до 50%. Но, ...
01.06.23 11:55
0
0
Генетическое исследование показало, почему шотландка не чувствует боли и быстрее выздоравливает

Генетическое исследование показало, почему шотландка не чувствует боли и быстрее выздоравливает

Несколько лет назад шотландка Джо Кэмерон оказалась чудом медицины, которая почти не чувствовала боли, страха или беспокойства, а раны заживали быстрее благодаря специфической генной мутации. Теперь ученые более подробно изучили, как это работает, в надежде разблокировать будущие мишени для наркотиков.

Пограничная сверхспособность Кэмерон была обнаружена только в середине 60-х годов, после того, как она перенесла две серьезные хирургические процедуры и впоследствии практически не испытывала боли. Когда врачи проверили ее личную историю с болью, она сообщила, что никогда не чувствовала незначительных порезов и царапин, а некоторые ожоги она даже не замечала, пока не почувствовала запах горящей пл...
31.05.23 08:23
0
0
Революционная система искусственного интеллекта читает мысли и создает текст без имплантов

Революционная система искусственного интеллекта читает мысли и создает текст без имплантов

Исследователи из Техасского университета в Остине создали систему ИИ для чтения мыслей, которая может считывать изображения активности мозга человека и преобразовывать их в непрерывный поток текста. Система семантического декодера может помочь людям, находящимся в сознании, но не способным говорить, например, перенесшим инсульт.

Новый интерфейс мозг-компьютер отличается от других технологий «чтения мыслей», поскольку его не нужно имплантировать в мозг. Исследователи из Университета Остина сделали неинвазивные записи мозга, используя функциональную магнитно-резонансную томографию (фМРТ), чтобы реконструировать воспринимаемые или воображаемые стимулы с использованием непрерывного естественного языка. ФМРТ дает изображения ...
02.05.23 11:08
1
0
Появились патч-мониторы для растений на наличие болезней и факторов стресса окружающей среды

Появились патч-мониторы для растений на наличие болезней и факторов стресса окружающей среды

Мы можем быть на один шаг ближе к использованию технологии для обеспечения продуктивных, свободных от болезней культур благодаря разработке многофункциональной электронной накладки, «носимой» растениями, и отслеживающей наличие патогенов и факторов стресса окружающей среды.

«Умное» сельское хозяйство, использование инновационных технологий для предоставления информации о таких важных факторах, как вода, типы почвы и болезни, приобрело популярность как средство обеспечения глобальной продовольственной безопасности. Болезни растений приводят к потере от 20% до 40% урожая ежегодно, что не только сокращает производство продуктов питания, но и видовое разнообразие, не го...
13.04.23 09:42
0
6
iPhone 14 и 14 Plus предлагают лучшие камеры, лучшее время автономной работы и технологию SOS

iPhone 14 и 14 Plus предлагают лучшие камеры, лучшее время автономной работы и технологию SOS

7 сентября Apple анонсировала новый iPhone 14 вместе с более крупным 14 Plus. Оба телефона 5G оснащены новой системой камер, функцией обнаружения сбоев, экстренным вызовом SOS через спутник и лучшим временем автономной работы среди всех iPhone.

У базового iPhone 14 6,1-дюймовый дисплей Super Retina XDR, а модель Plus — 6,7 дюйма. Дисплеи оснащены прочным стеклом Ceramic Shield, а также водо- и пыленепроницаемы. Широко разрекламированная система камер включает в себя новые камеры Main, TrueDepth и Ultra wide. У камеры Main большая диафрагма 1,5 и пиксели размером 1,9 микрометра, что позволяет улучшать фото и видео при всех сценариях осв...
11.09.22 10:54
0
1
Дистанционно управляемые тараканы-киборги теперь питаются от Солнца

Дистанционно управляемые тараканы-киборги теперь питаются от Солнца

Зачем создавать роботов с нуля, если природа уже сделала за нас большую часть тяжелой работы? Это причина создания насекомых-киборгов, и теперь ученые нашли способ сделать дистанционно управляемых тараканов-киборгов более совершенными, питая их с помощью специальных солнечных батарей.

Насекомые используют целый ряд мощных органов чувств, они достаточно малы, чтобы добраться до недоступных для нас мест, они могут выживать в неблагоприятных условиях, они могут с легкостью карабкаться по поверхности или летать. Все это полезные атрибуты для роботов — или, что еще лучше, киборгов, если прикрепить электронные устройства к живым насекомым. За прошедшие годы многие виды насекомых под...
06.09.22 08:12
0