Firemoon Feb 21 2023 at 12:37

Сколько стоит содержать виртуальную девушку? Создаем подругу, записывающую кружочки в Telegram, с помощью 4 нейросетей

Medium

18 min

49K

Selectel corporate blogPython*C++*Artificial IntelligenceVideo cards

Tutorial

+111

Comments 65

UFO just landed and posted this here

Firemoon Feb 21 2023 at 12:50

Все верно, абсолютно бесплатных вариантов нет.

Но можно получить 18$ на тесты у OpenAI и ещё 300$ у Google, которые можно потратить на Text-to-Speech

KivApple Feb 21 2023 at 12:51

Есть бесплатные с точки зрения софта, но бесплатное железо пока не изобрели. Но вы можете купить свою видеокарту и быть свободным от ежемесячной платы (кроме электричества). К сожалению, статья расположена в корпоративном блоге хостера и не рассматривает вариант подкроватного сервера, хотя с ценой аренды под 200к в месяц и отсутствия требования аптайма и пинга, он может оказаться выгоднее.

Также можно рассмотреть облачные хостинги с возможностью запускать и тушить виртуалку несколько раз в сутки. Например, нет смысла гонять её, пока пользователь спит. Возможно, почасовая оплата вместо помесячной будет дешевле.

+26

Firemoon Feb 21 2023 at 13:48

Ну, если есть RTX4090 под кроватью, то может быть и выгоднее х)

Можно снизить затраты путем смены GPU, например, на А5000. Там 24 ГБ VRAM, кажется, под эти задачи подойдет, а цена в два раза меньше.

Ну и если нет серьезных требований к аптайму, то поминутная (посекундная!) тарификация в облаке -- это отличный выбор. Отличный выбор, который можно приправить «прерывайкой» (прервываемыми инстансами), что ещё снизит затраты.

Сделать образ, который при первом запросе стремительно разворачивать, а при отсутствии запросов в течение, например, получаса, также стремительно гасить.

KivApple Feb 21 2023 at 13:55

Ну, если есть RTX4090 под кроватью, то может быть и выгоднее х)

Посмотрел цену. Прямо сейчас в DNS она стоит 150к. Сервер из статьи стоит 180к в месяц. Даже с учётом того, что к видеокарте ещё надо купить процессор, материнку, диск и БП, оно станет дешевле аренды сервера уже на второй месяц использования в худшем случае.

при первом запросе стремительно разворачивать

В статье упомянуто, что многогигабайтная модель грузится в видеокарту ощутимое время, хоть конкретных цифр и нет. Так что под вопросом насколько критичен лаг первого ответа.

+17

Firemoon Feb 21 2023 at 14:25

В статье упомянуто, что многогигабайтная модель грузится в видеокарту ощутимое время, хоть конкретных цифр и нет.

Но ведь... "Пару минут" (для float32) и "20 секунд" (для float16)...

KivApple Feb 21 2023 at 14:27

Моя невнимательность

mrise Feb 21 2023 at 14:32

На 24 гига видеопамяти можно взять m40. На алишке стоит вроде бы 30к руб. Однако, она требует или серверную, или очень самопальную систему охлаждения.

Можно так же запихнуть модель в оперативку и гонять на cpu. Будет гораздо дольше - где-то 6 секунд на 20 токенов - но RAM в разы дешевле VRAM.

По времени разворачивания - 6b модели грузятся около трёх минут.

Есть ещё момент - в Google Colab можно, если повезёт, запустить машинку с 16 гигами VRAM, на ~3 часа в сутки, притом бесплатно. Однако там есть свои сложности - вкладка всегда должна быть открыта, иногда прилетают капчи (не решил - машина гасится), машины не всегда доступны, и т.д.

venanen Feb 21 2023 at 15:03

Да с ускорителями, на самом деле, нет больших проблем, если нет цели собирать суперкомпьютер. На авито А4000 на 16 гигов стоит 25-30к, 2 таких - 60к, + проц + оперативная память - и все в сумме в 100к уложится. Да, это не кристофари от сбера, и запустить yaml от яндекса не получится, но вот такие проекты запускать, или заниматься finetune сетей - вполне реально. Да, будет дольше - но оставить сервер на ночь работать никто не мешает, в отличии от того же кагла или google collab.

dimka11 Feb 22 2023 at 09:28

Покупать на Авито / Али очень рискованно, т.к. не понятно, в каких условиях эксплуатировались карты.

Kaggle работает при закрытой вкладке, если сделать save and run , взаимодействовать с моделью при этом нельзя, но для дообучения такой вариант подходит

sergeyns Feb 21 2023 at 15:17

Посмотрел цену. Прямо сейчас в DNS она стоит 150к. Сервер из статьи стоит 180к в месяц.

Почти все статьи про облака-виртуализацию и всеобщее счастье обходят вопрос "какая же реально будет экономия от ваших облаков", заговаривая зубы "стабильность-пинг-неограниченный рост" (и события последнего года показали что и с этим тоже могут быть проблемы). Так что лучше "под кроватью" )))

lodz Feb 21 2023 at 16:00

Сложно представить бизнес, который готов держать инфраструктуру «под кроватью» :)

Areek Feb 21 2023 at 16:13

Я тут же на Хабре читал байку про "portable" сервера, которые стояли за забором и в случае проверки уезжали.

HiLander Mar 1 2023 at 10:32

Не знаю как там с "байками" а вот я реально админил "сервер" который стоял в шкафу в углу офиса. USB кабель выходил через гипсокартон за стену в туалет в другой шкаф, где стоял внешний накопитель с рабочей базой. Приезжает "маски шоу", отсоединяют все кабеля и увозят системник...

Смешно, но это сработало.

Areso Feb 21 2023 at 18:09

Многие айтишные бизнесы с этого и начинались.
У меня дома два сервера в кладовке. Когда ты маленький, ты вполне можешь написать в Твиттаре "сорян пацаны, тут техработы, сегодня мой сервис не работает", и это прокатит.

engine9 Feb 22 2023 at 14:01

Даже представлять не нужно, видел сервер предприятия который несколько лет стоял в доступным для всех живущих на вилле, прямо в гостиной, стыдливо повернутый лицевой стороной в угол.

Причём там даже не было никаких предупреждающих табличек, а его обесточить могли просто по незнанию или при ремонте элетропороводки...

FreeNickname Feb 21 2023 at 14:46

Так используемая в статье GPT-3 ведь, вроде как, недоступна standalone? Только через API? Это нужно брать другую модель (например, GPT-2), но она будет, скорее всего, хуже по качеству.

Поправьте, если я не прав.

EugeneH Feb 21 2023 at 15:25

Автор использует свободную GPT-J

FreeNickname Feb 21 2023 at 15:28

Действительно, мои извинения. Часть про GPT-J не отложилась.

Alexey2005 Feb 21 2023 at 15:59

Для чатов лучше брать не "ванильную" GPT-J-6B, а её специализированную чат-версию Pygmalion-6B, предварительно прочитав, как для неё правильно оформлять контекст, "впихивая" туда сведения о персонаже и используемой им стилистике диалогов.

В случае же, если планируется делать чат в фэнтезийном или SciFi-сеттинге, рекомендую использовать Open Pre-trained Transformer (OPT), разработанный исследователями-экстремистами из запрещённой в России организации Meta.

Их модели дают очень высокое качество генерации, поддерживают шардирование, могут квантоваться не только до 16 бит, но и до 8 бит (что например позволяет запускать 13B-модель на карточке с 16 Гб VRAM), а также могут расшаривать слои между GPU и CPU (остаток, который не влез в VRAM, досчитывается на CPU).

gchebanov Feb 21 2023 at 19:50

GPT-J-6B тоже работает с 8bit/тензорными ядрами, но только пока не на windows :(
У меня с 4090 получается примерно 15 токенов с секунду, довольно грустно, хотел ускорить.

UFO just landed and posted this here

Alexey2005 Feb 21 2023 at 16:33

Рекомендую пользоваться не ванильной версией KoboldAI, а форком от henk717 - там гораздо больше возможностей. В частности, там есть поддержка распределённого сервиса AI-Horde: любой доброволец может поднять у себя нейронку, какую только позволяет его железо, и предоставить к ней доступ для всех желающих. Соответственно, вы сможете оценить генеративные возможности даже весьма крупных сеток, просто подсоединившись к одному из таких добровольцев и погенерировав на его мощностях.

Также там есть поддержка моделей OPT со всеми их фичами, что позволяет поднимать очень крупные нейронки даже на весьма тухлых карточках. Я как-то ради интереса пускал OPT-6.7B-Erebus на древней GeForce 1070Ti с 8Гб VRAM, и оно работало, пусть даже с уполовиненным контекстом и скоростью 5 токенов в секунду.

Кстати, русскоязычная ruGPT от Сбера тоже поддерживается (кроме XL-версии, которую из-за этого их идиотского Sparse Attention вообще хрен где запустишь).

Также KoboldAI отлично интегрируется с TavernAI, что позволяет легко создавать карточки персонажей, прописывать их характер/историю и устраивать чаты с этими персонажами.

Flux Feb 21 2023 at 17:09

Да, всё как в жизни, максимльный реализм.

Кстати, если будете покупать видеокарту — оформляйте на родственников, а то придётся потом половину CUDA ядер отдавать.

Lazhu Feb 21 2023 at 12:48

И главное — сколько придется инвестировать в виртуальную подругу.

Машину лучше купи - на ней хоть ездить можно

+15

KivApple Feb 21 2023 at 13:04

По моему опыту, живая подруга выгоднее, она деньги зарабатывает, а не только тратит.

usego Feb 21 2023 at 13:28

И не такая самоуверенная, как ChatGPT ))

atepaevm Feb 21 2023 at 13:16

@Firemoonкогда уже нейросети начнут вместо Вас статью писать? Или уже?..

Firemoon Feb 21 2023 at 14:16

Человеческий мозг -- это тоже нейронная сеть. Так что 100% моих текстов написаны с использованием нейронных сетей.

+20

atepaevm Feb 21 2023 at 15:37

Честное слово, я и не подозревал, что вот уже более сорока лет говорю прозой.

А ещё, оказывается, и нейросети использую...

StjarnornasFred Feb 22 2023 at 09:10

А вы думаете, человек бы согласился на кибертульпу вместо девушки? То-то же. Автор текста про свою девушку пишет, а о себе помалкивает...

Vsevo10d Feb 21 2023 at 15:18

если дотронуться до головы, виртуальная девушка будет считать, что вы гладите ее по волосам

Во времена расцвета флэша я играл в игры, которые начинались абсолютно так же ( ͡° ͜ʖ ͡°)

+18

lain8dono Feb 21 2023 at 16:02

В этом смысле флэш и не умирал.

UFO just landed and posted this here

PsihXMak Feb 22 2023 at 00:10

можно ли дообучать модель на своей истории разговоров

Тоже интересно. Недавно обсуждали это в другом топике. Люди говорят, что это невозможно.

dimka11 Feb 22 2023 at 09:36

Почему невозможно? Если модель локальная, а не API.

Тут в статье написано, что можно GPT дообучить для корпоративного использования

PsihXMak Feb 22 2023 at 11:26

На сколько я понял, можно до обучать на определённой выборке данных. Там создаётся дополнительный нейронный слой или что то такое. Однако базовые нейронные слои и веса после обучения не меняются.

IvaYan Feb 22 2023 at 15:00

Почему это? Мы можем пере- или до- обучать любой слой по своему выбору как вместе с остальными так и отдельно. Вот только обычно это не делают с той сетью, которая развернута в эксплуатации. Если нужно дообучить, то готовят выборку, дообучют и потом перевнедряют. Одновременно эксплуатировать и ее же дообучать в общем случае не очень эффективно.

UFO just landed and posted this here

PsihXMak Feb 22 2023 at 15:16

В какой момент это должно происходить? Допустим у нас нейросеть-чатбот. Мы разговариваем с ней, даём ей имя в процессе, а так же задаём некоторые вкусовые предпочтения. Мы можем после этого до обучить нейросеть так, что бы она запомнила всё, о чём мы с ней говорили?

IvaYan Feb 22 2023 at 22:01

В какой момент это должно происходить?

Зависит от бизнес-задач

Мы можем после этого до обучить нейросеть так, что бы она запомнила всё, о чём мы с ней говорили?

Можем, но зачем? Эффективнее разделить инвариантную сеть и её "персону". Дообучать сеть уровня ChatGPT на клиентском устройстве чревато страданиями

PsihXMak Feb 23 2023 at 00:27

Можем, но зачем?

Что бы добиться наибольшего сходства с мозгом человека. Несколько дней назад я представлял, что оно всё примерно так и работает. Но оказалось, что всё совершенно по другому.

IvaYan Feb 23 2023 at 10:24

добиться наибольшего сходства с мозгом человека

А зачем? Разве мы не можем решить ту же задачу другим способом?

mrise Feb 22 2023 at 17:33

Дообучить можно. Вопрос в целесообразности. Я вижу как минимум две проблемы:
1) Занимаясь "тонкой настройкой", можно случайно превратить модель в попугая.
2) Даже в состоянии попугая, модель может спокойно выдавать следующие диалоги:

Я: какой твой любимый цвет?
М: Голубой, как ночное небо.
<меньше 100 токенов спустя>
Я: какого цвета обои в твоей комнате?
М: Красные. Это мой любимый цвет.
Я: Ты же говорила, что любишь голубой?
М: Да, Голубой, как ночное небо - мой любимый цвет.

Почему? Скорее всего, модели не хватает руководства, чего-то вроде ControlNet для Stable Diffusion. И описания W++, судя по отзывам, проблему не решают, модель всё равно чудит.
Softprompt-ы, местный аналог эмбеддингов, тоже навряд ли решат эти проблемы - но здесь я некомпетентен.

SiberianMouse Mar 8 2023 at 00:16

Ну в теории, если не ограничивать промт, то контекст будет бесконечно большой и цель будет достигнута, правда для этого нужно будет выкупить все мощности Илона маска..

UFO just landed and posted this here

chernish2 Feb 21 2023 at 17:45

Мучает единственный вопрос - зачем?

Areso Feb 21 2023 at 18:11

Потому что прикольно и потому что могут.

iBljad Feb 22 2023 at 10:28

Из спортивного интереса

i273 Feb 21 2023 at 22:17

А она звонит во время совещаний? Что делает, если 7 минут кружочек не посмотрел?

Nameless1517 Feb 21 2023 at 22:36

Странно, что никто не упомянул DDLC и Монику. Благодаря технологии из статьи ВН могут перейти на новый уровень взаимодействия персонажей и игрока.

Dima_Sharihin Feb 22 2023 at 09:30

Every day, I imagine a future where I can be with you
In my hand is a pen that will write a poem of me and you...

mrise Feb 22 2023 at 17:58

Пока что текстовые движки могут выдать ещё пару сотен фраз на тему "давай останемся здесь, только ты и я", но вот сделать целостный сценарий без вмешательства игрока может только модель на 50 миллиардов параметров, и то, у неё это получается не совсем хорошо.

Чтобы сделать взаимодействия значимыми, они должны оказывать влияние на сюжет. Соответственно, возникает вопрос, кто будет этот сюжет направлять. Если игрок - то тот же NovelAI позволяет (платно) генерировать и истории, и иллюстрации к ним. Если ИИ - то скорее всего сюжет очень быстро потеряет всякий смысл. В результате, получится бесконечный ситком, который держится исключительно на харизме персонажей. Это не плохой вариант, но он не для всех.

irony_iron Feb 21 2023 at 23:53

грустный раян Гослинг.жпг

wolfy_str Feb 22 2023 at 11:22

200K в месяц - издеваешься? Да ещё аренда, а не покупка. Это же вся зарплата за месяц! Нафига оно надо. С ума сошли со своими игрушками (сарказм). А если серьёзно, не понял нафиг оно надо тем более реально со стоимостью оборудования как зарплат среднего специалиста за месяц. Нет, я не буду ворчать как в фильмах обычно говорят, что данная тема не взлетит, может кому то и нужно. Но по мне какая то узкая развлекательная ниша.

KivApple Feb 22 2023 at 11:59

За такие деньги сервер с видеокартой проще купить и поставить под кровать (нам ведь не нужен ни сверхнизкий пинг, ни сверхвысокий аптайм). Но это корпоративный блог хостера :-)

Firemoon Feb 22 2023 at 12:15

Именно сервер, в серверном корпусе и с серверной видеокартой, вам вряд ли захочется поставить под кровать. У серверных видеокарт обычно пассивное охлаждение, так что нужен соответствующий серверный корпус, в котором вентиляторы орут так, что никакая виртуальная девушка вам будет не нужна. А может и реальная после такого уйдет.

Зато если у вас есть свободная кладовка с шумоизоляцией, то это уже совершенно другой, профессиональный подход. Как-то так мой коллега написал в блог статью о домашнем ДЦ, хотя это вызвало немало дискуссий.

Мне захотелось побыть душнилой, извините.

ITurchenko Feb 22 2023 at 12:19

Новые технологии часто стоят дорого и требуют серьезных вложений. Со временем всё обкатывается, оптимизируется и становится доступным рядовым гражданам.

Тот же StableDiffusion уже вполне годится для домашнего использования.

m1n64 Feb 22 2023 at 11:41

с таким бюджетом можно на пару лет вперёд тиндер платинум оплатить, и можешь заводить себе подруг сколько влезет. и они, на секундочку, будут реальными

Ktator Feb 22 2023 at 14:07

и они, на секундочку, будут реальными

В этом-то и проблема!! :D

+11

m1n64 Feb 24 2023 at 17:03

это, скажем так, палка о двух концах:)

SnakeSolid Feb 23 2023 at 10:21

Зависит от человека, можно 350к на знакомства слить и ни кого не найти например так.

Tzimie Feb 22 2023 at 14:16

Эх, а я в свои студенческие годы страдал один без девушек. В современном мире эта проблема будет скоро решена)

HiLander Mar 1 2023 at 10:41

Мне одному показалось что на видео модель шевелит губами и до и после того как голосовая запись началась/закончилась? Или это какие то особенности предпросмотра телеги?

yuserok Mar 7 2023 at 02:46

если дотронуться до головы, виртуальная девушка будет считать, что вы гладите ее по волосам

А если ниже?