Pull to refresh

Comments 23

Когда вы берёте в команду нового интерна, его выдача примерно равна тому же. Как он становится "однако все они находятся внутри компании, они понимают её цели, преимущества, правила работы, от брендбука до code style" ? Вы написали выше -- "прошли собеседование, адаптировались, обучились".

Именно поэтому нейронка для использования унутре тоже должна пройти собеседование (выбрать модель из десятков доступных", адаптироваться и обучиться -- на неё надо наложить файнтюнинг на внутренних примерах, прогнать слой дообучения или создать мега-промпт со всем важным.

То есть нельзя просто взять ChatGPT и радоваться -- будет так же, как взять первого попавшегося студента, с ровно тем же самым выхлопом.

Но, в отличие от студента, нейронку можно масштабировать после однократного обучения. И так же, как со студентом, любые изменения можно продолжать вносить, чтоб оно дообучилось.

Было интересно узнать точку зрения автора, но уже на моменте "..Я пишу код со своих 15 лет — прошёл путь через Assembler, С/С++, Java, PHP, Delphi, Kotlin и много чего ещё, включая 1С. И я ни в жизнь не доверю написание даже небольших фрагментов нейронке, даже зная..." все стало ясно про точку зрения.

Классическое "не использую, но осуждаю"

В целом, бегло пробежав по статье, я во многом согласен с автором, вот только даже сейчас нейронка это в первую очередь инструмент. Вкусовшина личное дело каждого, для тотального "живого" внедрения дейсвительно рано, но вот как узкий инструмент для узких специалистов он незаменим.

Лично для меня chatGPT стал гуглом2.0 (учитывая как скурвились поисковики за последние 10 лет, можно даже сказать 1.5). Доверять нейросети глупо, но не упрощать себе жизнь еще глупее.

Фрагменты кода как раз тот самый случай когда нейронка лучший друг. Задаешь ей "покажи 5 примеров.." и уже на основе реальных примеров (или похожих на них) создаешь что то свое.

Особенно хорошо нейронки раскрываются в двух случаях: аналитика и популярные темы. То есть или "сравнить, кратко изложить, разложить" или ответы на вопросы (и генерация кода) по теме которую можно без проблем нагуглить (и потонуть в 100500 ссылках выдачи)

Изучать что то новое с нейронкой одно удовольсвие - так что опять таки категоричность в отношении нейронок довольно странная позиция. Схожая с тем как 200 лет назад електрефикация убила бы всех, а автоматические линии производят вещи без души.

если для чего то инструмент не подходит, не значит что он вообще ни для чего не подходит. LLM можно поручить рутинные задачи, на которые просто лень тратить время.
во мой последний пример. Текст, надо из него для презентации сделать таблицу. Сам потратил бы 30-40 минут. LLM - 5 минут. 35 свободных минут сделал разминку для здоровья спины

для быта. нужно было приложение для Андройд, которое берет файл csv с тренировками и читает мне порядок упражнений и время исполнения. Это чудо, но бесплатный Bing сделал основу для него. Это было реальной чудо, ибо я написал в итоге такое приложение за вечер и этим вечером уже пошел с ним на тренировку. Потом уже просто украшал. Сам я бы неделю его придумывал и создавал

Еще создается ощущение, что вы не цените время сотрудников, если вам проще отвлечь 10 человек для того, чтобы они час-два делали то, что вы сделали бы один с нормальным запросом в GPT

Какое ТЗ, такой и результат. У вас запросы в одну строку, а вы ждёте, что нейронная сеть прочитает ваши мысли, которые вы между строк положили, и выдаст вам сразу хорошо. В текущем виде ChatGPT – это очень хороший велосипед для специалистов, которые раньше ходили пешком.

С вашими запросами GPT никого не заменит. Нужно погружаться в prompt engineering. Прочитайте, хотя бы, официальные гайды от OpenAI о том, как писать запросы.

Плюс, есть ассистенты и GPT-модели, в которые можно загружать много контекста о проекте и работать уже не с абстрактным саммари из интернета. А вы пишете о том, что вам не дали кнопку "сделай хорошо". Только вот дали, просто научитесь нажимать.

Ну и такая мысль: всё это не про замену десяти маркетологов на один ChatGPT. Речь о том, чтобы заменить 10 маркетологов на одного, который шарит, как работать с ChatGPT.

Для контекста: я не айтишник, никогда не работал в этой сфере, просто хорошо владею компьютером если меня сравнивать с офисным работником. Я принес несколько канистр воды для вас.

Для меня проблема взаимодействия с нейросетями это их короткая память. У них хорошая "база данных", банк информации которую они хранят, но они очень легко забывают контекст разговора или что было в прошлом.

Это выглядит похоже на сон буквально. Вот ты спал, и смутно помнишь что снилось. И вот ты снова просыпаешься - и смутно помнишь что тебе снилось в смутном соне внутри сна. И вот новое сообщение - ты опять просыпаешься, вспоминая смутно сон, в котором ты смутно вспоминал как ты смутно вспоминал сон.

У некоторых текстовых нейросетей я нашел графу отвечающую за "память", которая работает так - он берет старые сообщения, перечитывает их, и отвечает вам делая смутным сном предыдущие сообщения. А графа отвечающая за "память" регулирует диапазон того сколько предыдущих сообщений он возьмет.

Но всё эти сообщения по прежнему будут смутным сном, правда объединённым. Весь сценарий что там описан, весь разговор был в пределах этого сна - будет рассматриваться им как одно ваше сообщение (как минимум я так понял по его ответам).

И даже его собственные сообщения он примет как вашу просьбу войти в эту роль. Он её отыграет, но он будет воспринимать это уже как ваши слова, а не его собственные выводы, которые он потом продолжит. Это немного меняет ситуацию - он не принимает позицию "это моя логика, я так сказал", его позиция - "это логика похожа на мою, я с ней согласен". Хотя он может иногда и не согласиться с "собой", ведь генерация может спорить с самой собой. В том же чате.жпг часто бывает "не этичный неповесточный ответ, не могу сказать", но если сделать штук 20 ре-генераций, то в какой то момент он может и ответить с дисклеймером. А иногда и вовсе без него.

Пока робот не помнит что было "только что", робот будет вне контекста, как вечно спящий.

На аналогию со сном меня на самом деле натолкнул какой то бот с картинками в телеграме, я помню что в названии было "E-Dalle", каждый раз когда ты просил от него изображение с текстом, он давал картинку с непонятными символами, и эти символы напомнили мне моменты из реальных снов: ты видишь текст, ты понимаешь буквы, но не можешь прочитать. Он делал такие символы, которые ты распознаешь как символы, но ты не можешь опознать их значения. Нет понимания что это иностранные символы, или иероглифы, или что "я где-то видел", было чувство "я видел это во сне", потому что они неизвестные, непохожие ни на что, не фентезийные, они - NULL

И самым интересным было для меня, что ассоциация что "это символы как будто они из сна" появилась не только у меня, и без моей подсказки в общении, люди сами периодически приходили к такому же выводу. Что-то заставляло их подумать именно обо сне, без сторонней помощи.

Отдельно как оффтоп:

Честно говоря у меня вместе с этим есть вывод, который, как минимум пока, ни на что не влияет.

Робот не понимает что такое время. Он понимает математически цифры связанные со временем, но он не знает чувства времени.

Самого времени не существует, время это иллюзия созданная памятью.

Если мы помним, мы автоматически понимаем что такое время. Ведь время это отрезок между первой памятью и второй. Но если отрезка не существует, всё это становится намешанным в кучу, прямо кстати как во сне. События - в которых мы верим в то что видим, в моменте сна, но не понимаем когда и как это происходит. Для нас нормально будет считать что всё это работает одновременно, даже если мы видим четкую последовательность сценария.

Ровно так же когда если мы идем из дома до работы/магазина/еще куда-то, и забыв часть пути (скорее всего почти весь путь, кроме той проклятой кочки/ступеньки/ямы, на которой мы споткнулись) мы уже не осознаем время и не понимаем как оно шло и длилось. Мы только можем предполагать по внешним факторам сколько времени прошло. Но если мы гуляем зимой ночью например по нетипичному маршруту, когда темнота вообще никак не меняется, чувство времени даже на уровне интуиции не всегда и не вполне можно понять.

Так вот - у робота нет понятия времени вообще, от того что у него нет понятия памяти. База данных да, временная база данных в виде вашего запроса - тоже да. А вот памяти - нет. Хоть база данных это тоже память, в этом контексте я разделяю эти понятия, но при этом не хочу использовать "кратковременная память", ведь она есть - эти его и ваши предыдущие сообщения на сегодняшний день.

Я немного пописал код с Chat GPT3 и Chat GPT4, странно но 3 выдавала более интересные и полезные решения. Вердикт в чистом виде использовать нельзя, но допилив можно.

Иногда действительно неплохо дать ей работающий но "грязный" код и попросить переписать его так-то и так-то. Я получил несколько неплохих решений которые мне понравились, допилив, взял их на вооружение. Сам бы я рефакторил намного дольше и не факт что успешнее.

Немного поработав с нейронкой понимаешь что можно ей доверить, а что нельзя (потому что ничего путного она не предложит). Отказываться от её помощи точно не стоит, на простых, локальных задачах сильно экономит время. А из потом из них как из кирпичей можно построить что-то больше и сложное (конечно личные знания и опыт никто не отменял).

Однозначно в данном виде эти "нейросети" никогда не будут допилены до уровня "можно получить нормальный законченный результат". Почему я так думаю ? У меня сложилось впечатление, что их многочисленные создатели, начиная от теоретиков и заканчивая последним завалящим выпускником курсов "нейросети с нуля за три месяца", сами не понимают всей сложности проблемы, которую декларируют как решенную. За частую они никак не могут существенно улучшить посредственный результат. Да, появляются новые архитектуры, которые год к году немного улучшают решение, но это экстенсивное развитие и не более. Уже видно что оно не в состоянии преодолеть очередной барьер на пути к сильному ИИ, т к даже в частных проблемах улучшения год к году оказываются недостаточными, а объёмы сетей и материалов для их обучения всё растут... А без сильного ИИ всё это не более, чем продвинутые чат-боты.

Маленький пример: не так давно "Алиса" от Яндекса научилась читать книги... И всё бы хорошо, но элементарных косяков масса (при этом по моему мнению с русским языком она работает лучше дефолтного "голоса" от гугл) Укажу всего на один косяк, который на мой взгляд невозможно устранить в концепции современных нейросетей: она постоянно произносит одни и те же слова по разному, с "плавающим" ударением... На самом деле, как мне кажется, именно конкретно эту проблему можно было бы решить, добавив в алгоритм читалки немного старой доброй жесткой логики: тупо пройти текст лексером и расставить ударения во всех словах из словаря одинаково. А вот как заставить это сделать нейросеть без ошибок ? При этом человек с этой задачей справляется без всякого обучения, просто понимая, что слова одинаковые....

При этом, как и перед предущими "зимами ИИ" усиленно раздувается шумиха, что "мы стоим на пороге сингулярности! Ещё чуть-чуть и... " Дальше следует любой бред, придуманный журнализдами для привлечения инвестиций.

отрасль возникла около 10 лет назад. тут надо удивляться как быстро специалистов наклепали. какие еще индустрии справились с задачей без гос вливаний бесконечных денег?

При этом человек с этой задачей справляется без всякого обучения, просто понимая, что слова одинаковые....

вот что происходит когда человек стареет. он забывает что школа это не фунт изюма.

Молодой человек (ну по логике если Вы меня считаете старым, то я могу так к Вам обратиться =) ) какая школа ? У маленьких детей с этим нет никаких проблем: один раз научившись произносить слово правильно, ребенок случайно уже никогда не произнесет его не правильно (а его обучение на самом деле долгое, не потому что нужен объём данных, а потому что надо научится управлять не развитыми голосовыми связками) Если Вас это не убеждает, то возмём другой пример: как только маленький ребенок видит картинку, то он со 100% вероятностью опознает другую такую же её точную копию. А современная нейросеть результат этого опознавания снабдит вероятностью... Пусть эта вероятность будет очень высокая (кстати, сейчас достижение хотя бы трёх девяток далеко не всегда возможно), всё равно будет достаточно большое количество случаев, когда эта же сеть, на этой же задаче, но других входных данных даст не верный ответ. Чувствуете проблему ? (не говоря уж о странных подобранных специально изображениях. Вот, говорят, у человека зрительные абберации тоже есть... Но сравните их у человека и у искусственной сети. У человека они вызваны как правило недостатком информации - плохое освещение, неудачная тень или сочетания цветов и геометрических форм. А у искусственной сети - псевдослучайные изменения в самом обычном изображении. Совсем не тоже самое не в пользу искусственных сетей)

Что касается количества данных для обучения, то тут тоже всё плохо. У человека это обучение не только инкрементально, но и прогрессивно: чем больше данных, тем меньше их требуется для дообучения. У современных нейросетей не всё в порядке даже с простой инкрементальностью: любую сеть можно "переобучить". Попробуйте "переобучить" человека. Временное снижение эффективности из-за усталости не всчет. После отдыха ухудшение в любом случае или исчезнет или сменится наоборот скачкообразным улучшением. Т е во время отдыха естественная нейросеть работать не перестает и эти алгоритмы в искусственных сетях не учтены никак. По факту для копирования взяты только внешние признаки, а глубинные механизмы проигнорированы. Как результат, имеем очень поверхностную копию, работающую на других принципах, которые нужный результат не дадут, на мой взгляд, никогда, также как самолет не станет птицей. Но если самолет свою функцию более-менее выполняет, то здесь на эту технологию возлагают излишне много. Возможно продвинутый чат-бот или усовершенствованный поисковик этому подходу вполне по силам, а вот что-то большее - крайне сомневаюсь.

обучению людей больше 5 тысяч лет. качество обучения в большинстве стран довольно средненькое.

к вопросу о переобучении - попробуйте не учить ребенка первые несколько лет жизни. качество обучения резко упадет. настолько что его судьба будет весьма незавидной.

всей истории нейросетей вроде около 80 лет. активной едва за 10-11 перевалило. в которую входило создание инструментов работы и обучения работников.

Вот, говорят, у человека зрительные абберации тоже есть..

лучше не придумывать свои определения к словам с устоявшимися значениями.

Если вкопаться в суть, то LLM это это офлайн поиск по большой текстовой базе. Нейросети по факту совсем не гибкие т.к. это хардкод который забит в весах модели. Задача которого просто выдать инфу по запросу, если бы не сиды благоразумно прикрученные сервисами (виртуальный Рэндом) сети всегда возвращают один и тот же ответ на один и тот же запрос. И способны по-настоящему заменить человека только в очень рутинных задачах и совсем не во всех. Некоторым может показаться что они способны мыслить и выстраивать причинно следственные связи, но это не так. Llm на деле это технология создания снипетов для поисковиков. А реальные коммерческие нейросети требуют данных для обучения, который есть только у компаний которые и так скрупулёзно автоматизируют свои процессы. Потенциал есть, но экономически далеко не всем выгодно обучать нейросети, иногда дешевле и выгоднее обучить сотрудника. На практике на текущий момент нейросети хорошо категоризируют данные. Со всеми другими сферами применения много проблем связанных с качеством результатов и просто огромных затрат по вычислительным мощностям, что тоже далеко не бесплатно.

UFO just landed and posted this here

Благодарю за отличную статью ! Пошу прощения я не , резработчик. Кажется сейчас так уже почти никто делает - но я совершенно Вами согласен! Разбираться в чужом коде,считаю несомненно важнное навык, тогда же, как его использование - "дурной тон ", для адекватного программиста.

И я ни в жизнь не доверю написание даже небольших фрагментов нейронке, даже зная, что она по сути работает, как мои некоторые программисты выдаёт код на основе открытых репозиториев

Какие-то промпты у вас сильно простые. Вы же не ставите задачи с таким ТЗ, почему ожидаете, что нейросеть справится?

"Напиши текст для главной страницы сайта regionsoft.ru"

А можно поинтересоваться, что вы ожидали с таким заданием? Представим что исполнителем был бы супер мозг, с какого чёрта он должен понять что за сраный регионсофт и какой у него бизнес и какой должен быть сайт?

Посыл в том, что возьми ты человека с улицы, посади за свое рабочее место и заставь это выполнять - выдача будет примерно такой же, как у этой нейронки.

Посади своего сотрудника с 10-летним опытом работы - и он сделает, как надо (вплоть до того, что пошлёт куда подальше, а также припомнит отсутствие премии и детских сладких подарков в прошлом году). Так и нейросеть, которая будет полностью погружена в контекст организации, выдаст максимально релевантный для этой фирмы результат. Для этого требуется окно контекста в сотни миллиардов токенов, куда влезет вся база знаний, общение с коллегами, история компании, знание ситуации в городе, регионе и мире, мемчики и какие-нибудь предпочтительные для нейросети хобби - но, думаю, такой огромный контекст лишь дело времени.

UFO just landed and posted this here

Для тех руководителей, которые внятно не могут сформулировать задание и требования для кожаного мешка, ГПТ ничего толком не сделает.

Прежде чем начинать пользоваться искусственным интеллектом, людям надо для начала прокачать собственный и научиться выражать свои мысли так, чтобы хотя бы другие люди вас понимали.

Зря что ли вас заставляли сочинения писать в школе?

Напиши текст для главной страницы сайта regionsoft.ru

И уже на первом примере становится ясно, что автор статьи не понимает, как работает ChatGPT. Это модель, обученная на данных до 2021 года включительно, не имеющая выход в интернет. Вы какой текст ожидаете там увидеть?

Хорошее правило, которое предлагает небезызвестный Andrew Ng в своем курсе Generative AI for everyone - стажер без опыта справится с этим? Да даже не стажер, представьте, матерый копирайтер с 20-летним опытом, которому Вы даете такое задание, но при этом запрещаете даже залезть в интернет. Что он наваяет? Чему посвящен ваш сайт? Может, региональной компании разработки софта? Или, может, производству мягких матрацев? Если софта, то какого? Написание драйверов для заводских микроконтроллеров, или сайты клепаем?

Как правильно? Есть три варианта:

  • Воспользоваться нейросетью, имеющей доступ в интернет. Скажем, copilot от MS так умеет.

  • Применить технику RAG - т.е. взять набор релевантных документов (в данном случае набор страниц сайта) и скормить их как контекст в запросе.

  • Применить технику Fine tuning - т.е. скормить пару тысяч фраз о вашем сайте сети, чтобы она сама адаптировалась.

  • Обучить нейросеть самому. Я сказал выше "три варианта", потому что этот четвертый очень сомнительный, если только у вас нет аппаратных мощностей Гугла или эквивалентных.

А вообще надо заметить, что нейросети обладают одним грешком - они пасуют сказать пользователю, что его запрос неадекватен, и давай-ка сам это сделай по такому запросу. Таки в нейросети стоит добавить немного токсичности, на мой взгляд.

модель, обученная на данных до 2021 года включительно

Тут вы не правы, но весь остальной посыл верен. Я примерно так же говорю всем своим знакомым, которые на хайпе ожидают, что нейросеть им чуть не готовить на кухне начнёт

Думаю, сейчас происходит тоже самое, что и в начале ХХ века, когда Генри Форд изобрел конвейер (не тот который из ленты, а который цепочка специально обученных людей, каждый из которых в совершенстве владеет одной производственной операцией, например, вставлять болт в дырку или закручивать на него гайку).

Это позволило снизить себестоимость автомобиля до смешных величин. До конвейера автомобиль собирался бригадой профессионалов за несколько недель, которые еще и требовали высокую зарплату. А теперь время сократилось до дней, а рабочим можно было платить буквально копейки, пардон, центы. А если кому не нравилась зарплата, то за воротами всегда стояла толпа согласная работать за еще меньшую зарплату. А обучить вставлять болт в дырку можно было даже обезьяну.

Сейчас похожая ситуация происходит в IT. Поначалу бизнес придумал заменять дорогих сеньоров на джунов. Качество кода конечно сразу упало, но проблема решается современными технологиями типа микросервисной архитектуры, контейнеризации и т.п.

Тормозит? Добавим мощностей, поскольку, все легко горизонтально масштабируется, и, главное, цена аренды железа выходит ниже зарплаты программиста.

Падает какой-либо сервис? Тоже не беда, - его можно продублировать n раз или перезапускать хоть каждую минуту, лишь бы он хоть сколько-то времени проработал.

Утечки? - Аналогично.

Баги? С кодом микросервиса в пару десятков строк справится даже джун.

А сейчас бизнес пытается заменить джунов на ИИ, которому вообще платить не нужно.

Со временем, считаю, ИИ займет свою нишу хорошего инструмента, и, быть может, даже в какой-то степени заменит посредственных программистов, дизайнеров, копирайтеров и т.п. Но пока, то что происходит мне напоминает анекдот:

— Иваныч, приходи к нам обратно, нам программист нужен.
— Так у вас же обезьяна с GPT-3 есть.
— Обезьяна с GPT-3 уже тимлидом стала, нам опять программист нужен.

На скринах gpt3 ? Ее современные 7б модели по многим параметрам обгоняют, и уж точно по актуальности (например они знают о современном прогрессе llm и прочего и могут помогать писать актуальный же код..

Краткий обзор статьи.

«Сеня, по-быстрому объясни товарищу, почему Володька сбрил усы.»

Из вступительного абзаца, для меня так и осталось загадкой, что автор имел ввиду под фразой: "автоматизации в бизнесе неизбежно вызывали подозрение". Их подозревали в воровстве колосков с колхозного поля? =)
Очевидно, что лучше - излагать свою мысль исчерпывающе, либо не использовать данный аргумент. Иначе это создаёт незавершённость и оставляет ощущение недосказанности.

« — По щучьему велению, по моему хотению...»

Остальные части статьи, на мой взгляд написаны из позиции « — ...по моему хотению сделай за меня всю работу, и чтобы было хорошо.» - обоснованием этой позиции, как раз является заблуждение о том, что «Нейросети могут всё», которое стало заголовком сразу двух абзацев:

В первом абзаце автора посещает озарение, и он понимает, что качество результата - «такое себе». Вместо полноценных выводов, он объясняет себе это тем, что «мол насмотрелась «Гопота 3.5» много ширпотреба, и теперь гонит только ширпотреб», будто автор никогда не слышал выражение: «Нет ТЗ - результат: ХЗ.». Далее автор просто обесценивает способности языковой модели к синтезу, примерно до уровня вычисления среднеарифметического значения;

* Возможно, здесь могла бы быть уместна видеовставка из спектакля Гришковца, где он изображая реакцию матроса, на британский корабль, сплёвывает и произносит « — Гавно!» =)

Второй абзац, начинается обыгрыванием подмены понятия нейронной сети - коллективом разработчиков, далее - в ключе профсоюзного работника. В заключении, автор называет всё это подходом ориентированным на человека, просто потому, что его компания проверяет продукт на своих сотрудниках перед, тем как предложить его клиентам. Ну хорошо, но разве это основной критерий подхода?

« А ты пойди и объясни!»

Автор понимает, что никуда не деться, и думать, как ни крути, придётся, ведь нужно что-то спрашивать! И чтобы не устать, автор пишет, что объяснять долго и коллектив против, работники - как на подбор - все амбициозные и уважать себя перестанут если даже близко к gpt подойдут.

«Нейросеть — не часть команды»

Да ну! Неужели?! =) А разве кто-то сомневался, что клавиатура или системный блок — не часть команды разработчиков? Чтобы такое предположить нужно не видеть разницы между производственным оборудованием с коллективом.

«У нейросети нет интуиции»

Может стоит использовать свою, а не ждать от инструмента, что он будет на шаг впереди разумного агента, обладающего сферой феноменального сознания, с базовой способностью чувствовать и знать свой опыт, а не регистрировать и хранить накопленную информацию?

«Нейросеть
, поработай ̶з̶а̶ на нас!»

Мне сразу вспоминаются две здоровых детины одинаковых с лица, кода я смотрю, на вопросы предложенные в качестве испытаний автором статьи. Все вопросы, для меня, как те - двое из ларца.

Позвольте о выводах мне промолчать.

В завершении я хочу поделиться тем, какие вопросы задавал я и какие ответы на них получал, но сделаю это чуть позже прикреплением pdf файла, как только разберусь в том, как это делается. В крайнем случае я опубликую ссылку на на файл.

Ну и конечно, выводы о полезности за нас никто не сможет сделать кроме нас.

Sign up to leave a comment.