Pull to refresh
79
-0.1

Пользователь

Send message

Поросенок найден (80186)

Level of difficultyEasy
Reading time2 min
Views12K

Наверное многие слышали историю, рассказанную М. Задорновым в одном из своих выступлений, про трех поросят выпущенных в американской школе с номерами 1, 2 и 4 с панчлайном о том, как полиция долго искала поросенка номер 3.

Мое знакомство с компьютерами типа IBM PC происходило по похожему сценарию. В юности (начало 90х), в скудной литературе регулярно мелькали процессоры 8086(8088) и 80286, 386, затем 486 и т.д. Однако процессор 80186, который было бы логично ожидать не попадался.

Читать далее
Total votes 51: ↑58 and ↓-7+65
Comments55

Проблема «галлюцинирования» в больших языковых моделях на примере чат-ботов

Level of difficultyMedium
Reading time14 min
Views1.3K

Добрый день, уважаемые читатели Хабр. По роду деятельности, я уже некоторое время занимаюсь вопросами NLP, в частности, генеративными большими языковыми моделями и, реализованными, на них чат-ботами. При этом, очень часто в их разработке возникает ряд проблем, с которыми приходится постоянно бороться. Одна из них — «галлюцинирование» моделей, то есть выдача неточной информации на поступающие запросы от пользователя, и, в целом, некорректное поведение модели при длительном ведении диалогов различной степени направленности, специфики, глубины рассуждений, оценки фактов и правдивости выдаваемых ответов. 

Исходя из этого, я решил систематизировать все имеющиеся по этой теме сведения. Сразу оговорюсь, статья носит обзорный характер и я ставлю своей целью обобщение фактов, причин и признаков такого поведения. Поиск возможных вариантов, методик и подходов для решения данной проблемы будут рассмотрены в следующей статье. Здесь, не будет кода и строгих выкладок, лишь, наблюдения, аналитика, способы оценки, выявленные закономерности и оценка работы в общем. 

В качестве результата исследования, предлагается описание общей ситуации с обнаруженными возможными проявлениями феномена «галлюцинирования». На целостность и завершенность обзора, при описании полученных вариаций и проявлений данного факта, не претендую. Это результаты моего поиска и анализа. Информация собиралась, буквально по крупицам, так как все сведения сильно разрознены, проявления их в «дикой природе» не всегда можно заметить и четко классифицировать, либо они начинают проявляться спустя большое количество тестов, диалогов, рассуждений, запросов, вариантов подачи подсказок и уточнений на поставленные запросы и исходных текстов. Кроме всего прочего, градация распределения этих аномалий по степени отслеживания, так же, сильно разнится. Есть те, которые проявляются весьма быстро, а есть крайне редкие, для которых нужен специфических, очень тонкий подход. Ниже я представлю данный перечень с подробными пояснениями, так что всех прошу под кат. 

Читать далее
Total votes 11: ↑12 and ↓-1+13
Comments1

Нейроимпланты. Крах технологии?

Level of difficultyEasy
Reading time8 min
Views2.5K

Цитата Адама Дженсена «I never asked for this» крайне противоположна моим взглядам на развитие технологий. И в слиянии человеческого разума с нейроимплантами я вижу едва ли не эволюционный потенциал и становление нового вида. Но самые оптимистичные взгляды на прогресс неизбежно сталкиваются с реальностью. И эта реальность рисует весьма непростую картину.

Читать далее
Total votes 10: ↑5.5 and ↓4.5+1
Comments2

Чудесное совпадение или ожидаемая связь: почему π²≈g

Level of difficultyEasy
Reading time5 min
Views50K

Давайте ненадолго перенесёмся в школьные годы и вспомним уроки математики и физики. Помните, чему равно число π? Естественно, помните, мы же на Хабре! А чему равно π в квадрате? Это тоже странный вопрос. Конечно, 9,87. А чему равно ускорение свободного падения g помните? Ещё бы, это число так тщательно вдолбили в нашу память, что захочешь — не забудешь: 9,81 м/c². Конечно, оно может варьироваться, но для решения базовых школьных задачек мы обычно использовали именно это значение.

А теперь, внимание, следующий вопрос: а с какого это перепугу π² примерно равно g?

Читать далее
Total votes 181: ↑189.5 and ↓-8.5+198
Comments180

Делаем из битого планшета одноплатник: подключаем Android-устройства к дешевым микроконтроллерам через UART

Level of difficultyEasy
Reading time6 min
Views32K
image

В наше время, из-за санкций одноплатники стали стоить каких-то «конских» денег. Даже б/у RaspberryPi Zero стоит 2-3 тысячи рублей на барахолках, что, мягко скажем, не совсем лояльная цена для «самого дешевого одноплатного компьютера в мире». Конечно, Orange Pi Zero всё ещё можно купить в пределах 1.500-2.000 рублей, но как по мне и эта цена не слишком лояльна за те характеристики, который предлагает такой одноплатник. С другой стороны, Android-планшеты 10-летней давности продаются на барахолках по 100-300 рублей, что выглядит гораздо привлекательнее, причём на некоторые устройства практически без костылей можно установить полноценный дистрибутив Linux! Вероятно, многие читатели скажут мол «автор бомж» и будут правы: ведь в рамках этой статьи, я хочу рассказать о том, как использовать полурабочий древний планшет в качестве полноценного одноплатника путём подключения его к микроконтроллеру и выводу GPIO! Сегодня мы с вами: узнаем, как подключить микроконтроллер к шине UART в планшете и научимся работать с последовательной шиной в Android прямо из Java и нативных программ. Интересна моя концепция антикризисного одноплатника? Тогда добро пожаловать под кат!
Читать дальше →
Total votes 70: ↑78 and ↓-8+86
Comments61

«Где угодно работать, только не в локальных конторах» — у меня есть что сказать

Reading time9 min
Views99K
image

23 года я работал в американских компаниях SAS и C3 AI. Это, если что, очень дорогой интеллектуальный анализ данных корпораций и производств. Причём SAS много лет занимал места с 1-го по 3-е в мире как лучший работодатель, поэтому некоторая избалованность присутствует. Последние полтора года до ухода C3 AI из России я работал в подразделении EMEA с непосредственным руководителем в Париже.

Все эти годы коллеги убеждали меня, что в отечественных компаниях работать нельзя: там хамство, бардак, сотрудников обманывают, не уважают и не ценят. За последние два года многие мои коллеги уехали за границу со словами: «Где угодно работать, только не в локальных конторах».

Я пошёл в отечественную компанию. И не просто в отечественную компанию, а в ОМК, то есть на группу заводов (а на заводах, «ну это же общеизвестно», всегда стоит большая очередь кандидатов за забором, и где типа айтишников не ценят, всё вокруг в солидоле и мазуте, и вообще).

Ладно, про лужи смазки — для некоторых цехов это отчасти правда: утечки бывают.

По остальному мне есть что сказать. Сразу поясню: меня никто не заставлял писать этот пост, никакие эйчары не приходили и не просили. Просто достали те, кто ноет. Хорош ныть!
Читать дальше →
Total votes 270: ↑246.5 and ↓23.5+223
Comments240

«Замкнутый, как колобок, Тонет»: как в Томске заработал собственный интернет

Level of difficultyEasy
Reading time10 min
Views19K

Томск — это город ученых и студентов. По статистике, каждый 8-й житель где-то учится, а по числу научных сотрудников на душу населения он первый в России. Насыщенная интеллектуальная среда сделала город пионером в освоении интернета. А с конца 1990-х до начала 2010-х тут процветал уникальный феномен — внутригородская интернет-сеть под названием Тонет. Рассказываем об этой вехе раннего российского интернета, ставшей возможной благодаря свободной кооперации между бизнесом, учеными и интернет-энтузиастами. 

Читать далее
Total votes 44: ↑42 and ↓2+40
Comments40

TESCREAL — новая идеология Кремниевой долины. Что это такое и почему она уже всех достала

Level of difficultyEasy
Reading time11 min
Views5.6K

В 2023 году в медиа стало все чаще звучать понятие TESCREAL — его называют идеологией современного технологического капитализма. Ее главная идея в том, что благополучие современного мира — это не цель, к которой должно стремиться, а средство для достижения блага для будущих поколений. А главный инструмент TECREALистов — буквально Deux Ex Machina — общий искусственный интеллект. 

Принято считать, что ее главные апологеты — топ-менеджеры компаний-лидеров ИИ-индустрии, которые стремятся повернуть Кремниевую долину вправо и, по мнению критиков с левого фланга, могут уничтожить человечество. Разбираемся, что и кто стоит за этой аббревиатурой, и что не так с ее критикой. 

Читать далее
Total votes 16: ↑14.5 and ↓1.5+13
Comments14

Скользкая дорожка к автоматическому SMM постингу. Нейросети для каждого

Level of difficultyEasy
Reading time6 min
Views1.9K

Сразу оговорюсь, что я против засилья унылого контента, сгенерированного нейросетью. Но давайте помечтаем! Уже не за горами тот день, когда творческие навыки текстовых моделей позволят нам создавать интересный для человека контент. Тогда почему мы не можем уже сейчас начать строить автоматические системы, генерирующие тексты и картинки, которые будут сами всё это публиковать?

Вы сейчас мысленно скажете, что тогда каждый школьник сможет нажать пару кнопок и запустить такую систему, после чего мир наполнится информационным шлаком и мы все утонем во всём этом. Но не стоит ворчать. Вспомните, как все кричали, что фотография как жанр умрёт, если каждый станет сам себе фотографом или видеографом. Никто не утонул во всём этом, так как соцсети быстро научились понимать наши потребности. Так же будет и здесь: некачественный и неинтересный контент просто никому не покажут. Так что переживать не стоит, наверное.

Я же хочу больше рассказать про современные технологии и возможности. В частности, мне как человеку, не владеющему навыками программирования, было интересно найти способ построить автоматическую SMM-систему, не используя больших технических знаний и не тратя много денег.

Читать далее
Total votes 11: ↑2.5 and ↓8.5-6
Comments6

Выбираем правильный инференс: Как мы сэкономили 70к $ на ЛЛМках

Reading time4 min
Views3.7K

Недавно ко мне обратились знакомые, которые активно впиливали LLM в своей продукт, однако их смущала стоимость такого решения - они платили около 8$/час за Huggingface inference Endpoint 24/7, на что уходили просто невиданные ~100 тысяч долларов в год. Мне нужно было заресерчить какие есть способы развертывания больших текстовых моделей, понять какие где есть проблемы и выбрать оптимальных из них. Результатами этого ресерча и делюсь в этой статье)

Читать далее
Total votes 15: ↑5.5 and ↓9.5-4
Comments19

Сравнение различных схем квантования для LLM

Level of difficultyEasy
Reading time4 min
Views5.4K

Как запустить локально LLM 70B параметров на 1 видеокарте с 24gb? Нужно квантование!

Квантование - это процесс уменьшения битности вычислений в нейронной сети, используемых для представления весов, смещений и активаций. Путем снижения точности мы можем значительно сократить требования к памяти и вычислительной сложности модели.

Читать далее
Total votes 9: ↑8 and ↓1+7
Comments5

As const в Typescript

Level of difficultyEasy
Reading time3 min
Views13K

Привет, Хабр!

В разработке часто возникают ситуации, когда точность типов и нежелание допускать неясности в коде становятся первостепенными задачами. В таких случаях, разработчикам приходится искать инструменты, предоставляющие максимальную ясность и строгость в определении данных. Один из таких инструментов — ключевое слово as const. В данной статье мы рассмотрим, как as const может повысить уровень строгости и предсказуемости, а также рассмотрим практические примеры его использования для создания неизменяемых и точных типов.

Читать далее
Total votes 14: ↑14 and ↓0+14
Comments16

Страшилки про искусственный интеллект как научная фантастика

Reading time6 min
Views3K

С интеллектуальной точки зрения я всегда находил аргументы сторонников страшилок, касающихся ИИ, довольно убедительными. Однако инстинктивно я всегда считал, что они ошибаются. Это может быть предвзятым рассуждением, поскольку мысль о том, что мне придётся бросить говорить о том, что меня интересует, и сосредоточиться на этом узком техническом вопросе, мне крайне не нравится. Но на протяжении многих лет у меня в голове свербило подозрение, что с объективной точки зрения любители страшилок неправильно предсказывают будущее.

После долгих размышлений я, кажется, наконец понял, почему я не верю тем, кто считает, что ИИ имеет все шансы убить нас всех, потому что у его функция полезности не будет соответствовать человеческим ценностям. Мои рассуждения просты, но я никогда раньше не видел, чтобы кто-то сформулировал что-либо подобное таким образом. Для того чтобы любители страшилок ошибались, скептикам не нужно быть правым во всех своих аргументах. Им достаточно быть правыми в одном из них, и тогда всё построение разрушится.

Читать далее
Total votes 12: ↑8 and ↓4+4
Comments57

Яндекс запустил Нейро. Рассказываем, как он работает

Level of difficultyMedium
Reading time14 min
Views49K

Сегодня мы запустили новый сервис Нейро — новый способ поиска ответов на вопросы. Пользователь может задать Нейро любой вопрос, а тот сам подберёт подходящие материалы в Поиске, проанализирует их и соберёт найденную информацию в одном ответе, подкрепив его ссылками на источники. Нейро объединил опыт Яндекса в создании поисковых технологий и больших языковых моделей. 

Меня зовут Андрей Сюткин, и я отвечаю за ML-трек в Нейро. В этой статье покажу, как выглядит архитектура Нейро и как формируются ответы на технологическом уровне. Ну и, конечно же, поговорим о нейросетях, в том числе о YandexGPT 3, без обучения которых новый сервис просто не увидел бы свет.

Читать далее
Total votes 92: ↑91.5 and ↓0.5+91
Comments143

«ReadStreakBot» — как я начал «кодить» с чатгпт, не умея программировать

Level of difficultyEasy
Reading time10 min
Views15K

Давно не заходил на хабр, а тут решил зайти и с удивлением обнаружил у себя аж целых 60 подписчиков. Спасибо вам большое, что вы подписались, теперь мне даже как-то неловко, что я так долго ничего не писал про Обсидиан. Видимо теперь придётся всё же написать (мой сетап за это время перетерпел многих изменений и мне есть о чём рассказать).

Но сегодняшняя статья, к сожалению моих подписчиков, будет не про Обсидиан, она будет про телеграмм-бота, чатгпт и чтение, потому что всё это время вечерами я занимался своим пет-проектом, о котором и хочу рассказать.

Читать далее
Total votes 18: ↑17 and ↓1+16
Comments33

Больше ИИ-инструментов, хороших и разных: Google представила помощника для написания кода

Reading time3 min
Views6K

Всё больше компаний создают разнообразные ИИ-модели, и, конечно, крупные корпорации — впереди планеты всей. На днях Google представила свой новый проект — Gemini Code Assist, инструмент, который помогает разработчикам писать код. О том, что это за новинка и какие ей дали возможности — читайте под катом.

Читать далее
Total votes 9: ↑11.5 and ↓-2.5+14
Comments7

В чем причина галлюцинаций у нейросетей

Level of difficultyEasy
Reading time6 min
Views2.3K

О том, почему возникает такое явление, как галлюцинации у больших языковых моделей на примере работы системы вознаграждения (мотивации-поощрения) у биологических видов.

Читать далее
Total votes 6: ↑1 and ↓5-4
Comments12

Как пытались (пере)программировать мозги, и что из этого получилось? Часть 4: Нуарный коп, оргии и тюремные эксперименты

Level of difficultyEasy
Reading time10 min
Views10K

В прошлой части наш антигерой Сидни Готтлиб дорвался-таки до своего большого проекта MKUltra: ему дали много денег и ещё больше полномочий на то, чтобы научиться взламывать человеческое сознание с помощью психоактивных веществ, гипноза и любых иных способов без особого внимания к этике и законности. В ЦРУ были уверены, что КГБ и китайская разведка опережают их на несколько голов, давно отработали способы «промывки мозгов» и научились превращать в коммунистов даже самых твердокаменных либертарианцев. И считали, что для сокращения разрыва хороши все средства: ведь иначе можно однажды проснуться и обнаружить себя колхозником на кукурузных полях Оклахомской ССР!
Читать дальше →
Total votes 46: ↑51.5 and ↓-5.5+57
Comments8

Вы должны перестать вручную писать Dockerfile'ы

Level of difficultyMedium
Reading time3 min
Views52K

Вы тоже устали вручную заполнять Dockerfile и docker-compose.yaml под каждый новый проект?

Я всегда задумывался, применяю ли я известные best practices, когда пишу конфиг для Docker, и не занесу ли я случайно какие-нибудь уязвимости, вручную заполняя конфиг-файлы.

Что же, теперь мне больше не придется беспокоиться об этом, благодаря добрым людям из Docker, которые недавно реализовали инструмент для этого - docker init .

Интересно, как экономить время и быстро генерировать конфиги, даже если вы не профи в Docker? Прошу под кат.

Читать далее
Total votes 74: ↑75 and ↓-1+76
Comments66

Почему FAR — центр моей компьютерной вселенной

Reading time4 min
Views53K

Какую программу вы обычно запускаете сразу после загрузки операционной системы? Кто-то сразу стартует браузер — поглядеть, кто там сегодня в Интернете (на Хабре) неправ. У многих — это редактор кода: «Я, как утром встал, сразу за дрель!». Возможно, вы сначала привычно открываете мессенджеры и почту — проверить, что там нового и важного.

Я обычно сразу после запуска операционки открываю свой Любимый Файловый Менеджер. Это «переходящее звание» — в разные периоды моего компьютерного прошлого этой чести «удостаивались» разные приложения с классическим двухпанельным интерфейсом. Сначала это был простой, но универсальный Norton Commander. Потом появился DOS Navigator со всяческими классными фичами: CD-плеер, телефонная книга с дозвоном по модему, встроенный табличный редактор и прочие прекрасные и поразительные для тех лет вещи.

Когда Windows прочно вытеснил DOS и все понемногу забыли про файл autoexec.bat, звание моего любимого файлового менеджера плавно перешло к Total Commander. Он продержался довольно долго, но в какой-то момент в мою жизнь буквально ворвался FAR...

Читать далее
Total votes 170: ↑173.5 and ↓-3.5+177
Comments588
1
23 ...

Information

Rating
Does not participate
Location
Россия
Registered
Activity