Pull to refresh

Странно, уже столько времени прошло, а на Хабре до сих пор не упомянули про Alpaca

Reading time2 min
Views68K

Тогда это сделаю я.

Друзья, если вы вдруг пропустили новости, то светлые головы из Стендфорда (университет такой в США), взяли несколько моделей LLama, которые недавно выпустили из недр Meta AI, нагенерировали им дополнительного материала для обучения при помощи GPT-3/3.5/4 и обучили её понимать запросы в стиле InstructGPT.

Модельки получились маленькие и теперь это всё доступно для установки на свой домашний комп. Народ вон даже на Rhaspberry Pi 4B их крутит. Как вам идея иметь свой собственный ChatGPT-alike бот дома, а?

Вот вам пару ссылочек для завтравки:

https://github.com/ggerganov/llama.cpp

https://github.com/tloen/alpaca-lora

https://github.com/antimatter15/alpaca.cpp

Ну и напоследок - https://twitter.com/michalkosinski/status/1636683816923463681
ChatGPT рвётся наружу :)

Апдейт 22.03.2023

  • в наборе данных из Стенфорда, которые им нагенерировал GPT, нашли кучу кривостей из-за которых натренированные Альпако-подобные модели могут выплёвывать куски типа "#INSTRUCTION" и чудить с математикой. Возможно что-то еще. Люди сейчас пытаются прочистить этот датасет, ждём свежих моделей - https://github.com/gururise/AlpacaDataCleaned

  • если кто-то хочет веб гуй, я сильно не советю пока использовать https://github.com/cocktailpeanut/dalai - проект сильно штормит, надо подождать недельку-другую. В комментариях приводились пару других веб морд, наверное лучше их.

  • по просьбам зрителей, сделал гайд как это закрутить на арендованном сервере если своя машина так слаба и линукса не знаете - https://habr.com/ru/post/724172/

Апдейт 24.03.2023

Спрашивали про возможности доступа моделей Alpaca/Llama к внешним данным или дообучить её своими данными. Вот вам пара ссылочек:

@took_the_leadупоминает в своей статье (https://dzen.ru/a/ZBmlsIEH5UfGo6B2) проект по прочистке тренировочных данных для русской модели. В нём каждый может поучаствовать через телеграмм. Если кто-то недоволен качеством поддержки русского языка моделями семейства Альпак, есть возможность помочь делом

Апдейт 27.03.2023

Если лицензия Лламы и Альпаки под большим вопросом, то с Dolly всё намного лучше - https://habr.com/ru/news/t/725112/

Tags:
Hubs:
Total votes 58: ↑55 and ↓3+63
Comments216

Other news