Pull to refresh

Comments 71

Странно, почему автор, желая поговорить об NLP не начал с каменного века, там порядком интересного произошло до выхода виндоус 98, совершенно не имеющего отношения к NLP.

А когда до NLP добрался, выдохся что-ли? Или будет следующая статья?
Обычная рекламная статья про LUIS. Только вот LUIS русского языка не поддерживает.
Поэтому прежде чем начнёте создавать новую форму или корзину Интернет-магазина, спросите себя: нужен ли мне вообще этот UI?

Я могу ошибаться, но спрашивать надо не себя, а:
  • заказчика
  • потенциального пользователя

Любой продукт (и его интерфейс) нацелен на кого-то и подразумевает использование этими людьми.
Рассуждать конечно круто, но общий контекст и спрос задают правила игры
С одной стороны это так. А с другой стороны, есть известная проблема, что клиент не знает, чего он хочет и что ему надо.
Это примерно как с высокой модой. Вещи, сшитые для подиумов, могут быть смешны и неносибельны в повседневной жизни. Но высокая мода во многом задает тон и определяет то, что носится обычными людьми. Что-то приживается, что-то нет.
Если спросить у людей, чего они хотят, они скажут “коней пошустрее” ' Генри Форд (1863–1947)
Общение с веб-сервисами, ботами и прочим письменной и устной речью, к сожалению, вряд ли имеет такое будущее, которое ему приписывают фантасты. Просто потому, что это противоречит главному закону развития технологий — человеческой лени. Нажать кнопку, даже выбрав ее из длинного перечня — намного быстрее, чем писать боту сообщение, и тем более говорить, что в принципе неудобно где-либо, кроме дома.
Основная функция речи информационная и под нее все физиологически и психически заточено. Команды и приказы в базовом функциональном наборе не предусмотрены. Мало того, расширение базового набора несвойственным функционалом происходит за счет сокращения этого самого базового функционала. Что мы отлично видим на примере начальников, военных и {ми|по}лиции. Чем больше человек отдает голосом команд и приказов, тем больше у него едет крыша.
На мой взгляд оптимален гибридный подход, когда есть окно чата, в которое при необходимости бот постит форму или график
не знаю как вы, но я иногда ищу гуглом, на каком либо сайте, нужную запись
даже не представляю, если бы не было гугла и возможности написать запрос. Лень нажимать кнопочки и листать страницы, лучше ввести команду, темболее если команда имеет автодополнение при написании
Когда автор приводил в пример диалог с «savings», я подумал что кнопка с аналогичным названием справилась бы гораздо лучше, раз это настолько частый шаблон общения с ботом.
есть дизайнеры, делающие дизайн ради дизайна, так и эти господа делают функционал ради функционала, а не ради эргономики.

Все согласно ТРИЗу — идеальный интерфейс отсутствует, а функция его выполняется.

В данном случае интерфейс всё же есть.
А идеальный случай — это когда чел продавал пустую «программу», которая запускала предыдущую программу.
Обработка речевых команд была встроена в OS/2 Warp 4. Называлось оно «VoiceType Navigation and Dictation». Понимало английский из коробки на троечку — мое произношение советской школы было не очень. После «тренировок» — да, оно обучалось!!! — научилось распознавать простые короткие фразы, которым можно было назначить действия. У меня в основном это были звонки по модему и проигрывание музыки. Пытался научить русскому, но понял, что в технологии нет никакого смысла — просто представил редакционный зал, где вместо стрекота ундервудов стоит крик, как на бирже и все компы «под диктовку» набирают этот крик.
Технология эта для фриков. Проще свет включить прикосновением к контроллеру (щелкнуть выключателем), а контроллеры расположить там, где они чаще всего нужны. Речь, кстати, дана человеку не для того, чтобы командовать, а чтобы общаться.

Ну даже не знаю. Управление голосом — тоже интерфейс со своими плюсами и недостатками. Мне, например, проще свет выключить одним нажатием кнопки, пусть и по старинке — маханической на стене, чем вещать голосом на всю комнату "DeviceName выключи свет!"
А ребенок рядом с микрофоном шепотом в ответ: «DeviceName включи свет»
Только если ребенок — фанат Доктора Зло =)
А, если вы уже лежите в кровати, почитали книгу, теперь спать собираетесь, то тут уже голос рулит. Даже, если есть пульт, он тоже часто оказывается на тумбе у телевизора, или ещё где, и опять же проще сказать чтобы свет выключиться и поставить будильник голосом, чем лезть в телефон.
В умных домах голосовое управление как раз то, что доктор прописал, имхо.
А если я живу не один. Если у меня жена и двое детей и они уже все спят?
тогда со смартфона текстом или встать и выключить, зависит от самочувствия и что быстрее, как удобнее, вернее
Может всё-таки проще тогда со смартфона кнопкой?
Возвращаемся к спящим жене и детям.
Тогда надо хлопать одной ладонью. :)
И долго же вы жестами компу будете объяснять, какие файлы надо из одной папки в другую копировать.
Надо учить его читать по губам.
Да хоть по губам, хоть голосом, хоть жестами. Хотел бы я посмотреть, как вы будете объяснять компьютеру переместить или переименовать файл, например (реальный пример после скачивания) 17176352_f74828428d0b6f6a6c84606d590ad8a8_800.jpg
UFO just landed and posted this here
А если у меня таких целая папка и я собрался на ночь глядя в них порядок навести, или я одновременно качаю кучу файлов. Да много если…
Как ни крути, а ничего более удобного, чем ручные манипуляторы и кнопки пока индустрия предложить не может.

По настоящему умный дом должен сам (правильно) понять, что свет пора выключить или включить. Вот это будет лучший ui — его отсутствие.

Вот единственно здравая мысль. Какой же это умный дом, который даже не может включить/выключить лампочку? А если человек не может уснуть, включит какой-нить шум моря чтобы лучше засыпалось.
Со смартфона — найти приложение, запустить, найти там кнопку, ткнуть или набирать текст — быстрее встать и выключить свет (вернее не надо — не вставая выключить свет рядом, потому как общий погашен раньше). А то посмотрел телевизор — включился свет, холодильник заказал пиццу для черепашек, а дом — только что продекламированную яхту в кредит (хитрые рекламщики встроили ключевые фразы сразу в рекламу).
Существуют проходные выключатели, чтобы управлять светом из нескольких точек без использования электроники. Один устанавливается у изголовья кровати и всё — проблема решена.
Да но все же имеет место быть, например со светом понятно можно обойтись датчиками. Но например иные бытовые приборы. Тот же чайник, сидя в комнате за компом, не как выше пишут — командовать, а попросить поставить чай. Разве в жизни никто так не делает? Мам/Пап/Сестра/ Брат / Жена — поставь чайник? Просто первый пример из головы. Потом я бы пихал голосовое управление, там где заняты руки и естественно все это не для общественных мест.
«Чайник, кипятись. Огнетушитель, потушить пожар» (чайник был без воды, а вместо датчика отсутствия воды туда напихали разноцветной подсветки и блютус управления подогревом с точностью до 0.01 градуса). Пока вода не будет туда попадать сама — голосовое управление не поможет.
Мне кажется, до распространения нейроинтерфейсов такой метод взаимодействие обречен на провал. Это банально неудобно и энергетически расточительно(легче клацнуть на кнопку, чем набирать предложения текста или их же озвучивать).
После — тем более. Мозг постоянно занят тысячей вещей, и «освободить голову от всех мыслей, кроме идеи выключения света СЕЙЧАС ЗДЕСЬ В ЭТОЙ КОМНАТЕ ТОЛЬКО СЕЙЧАС ТОЛЬКО ВОН ТУ ЛАМПОЧКУ» не является нормальной задачей для обезьяньего мозга.
В идеале нейроинтерфейс должен не мысли читать и исполнять, а быть как бы еще одной конечностью. Вам же не надо освобождать от всех мыслей для того чтобы пошевелить рукой? Другой вопрос возможно ли это в принципе или так и останется мечтой…
Ну не знаю, мне было бы удобнее всё же «мысленно словами». Когда мысленно обдумываю, что сказать в будущем (или что нужно было кому-то ответить ранее) — мыслю вполне дословно, а не общим смыслом. И именно к этому бы и стоило привязываться нейроинтерфейсу, и именно вот тут начнутся проблемы — мы сами ещё точно не знаем, где это сознание живёт, а уж услышать внутренний голос через нейроинтерфейс…
А уж простое голосовое управление, имхо — совсем игрушка. В моём детстве и юности компьютер был то в спальне родителей, то в зале (где часто работал телевизор), сейчас я уже большой мальчик — но мой компьютер снова в зале. Честно, не представляю себе голосовое управление совсем. Тем более, если оно не привязывается к голосу и не требует дальнейшей аутентификации после сказанной фразы.
Одного понять не могу, почему для иллюстрации кастомизируемости XP приведена Vista…

Потому что на скрине XP с темой "под висту"

ничего. Теперь обратите внимание на гаджеты, которые появились в висте. На диалог копирования из висты. На адресную строку со стрелочками в проводнике, на поисковые строки в пуске и проводнике. На иконку 3d табов (которые по win+tab появляются) и т.д.

Это виста. А картинку оригинальной темы висты я привел для сравнения.
Вот, кстати, тоже виста, но с темой XP

UFO just landed and posted this here
Гаджеты и многое другое запускали на XP с помощью Alky for Applications. Большинство «плюшек» в проводнике — результат использования упомянутых в статье утилит. Скриншот вполне может быть с XP, оформление в ней можно было и не так изменить.
Одно дело через костыли запустить гаджеты, или заменить анимацию копирования файла.
Но вот тот же поиск, надо прогать. Или пульсирующую анимацию для прогресбара.

Многое можно стилизовать, да. но некоторые вещи стилизовать не получится.
Как тут не вспомнить тот старый анекдот: «Ок, железяка… Format C:\ без бэкапа — время пошло!»
Другой анекдот
— Папа, сколько времени?
— Девять
«Вист, вист»
— А точнее?
— Без пяти
«Сыграли, сыграли»

Голосовые команды понимала и Windows NT 3.5, а прорывом была DragonSpeech (вторая половина 90-х).


По комментриями о голосовом интерфейсе — тут не о чем спорить, это уже случилось. Дети командуют Алексой и общаются, на кнопки давить не интересно.


Когда говорят про текстовый интерфейс и ИИ — часто вспоминаю игру "Бизнесмен" (кажется так называлось) на компьютере Агат и игры Ларри ('87). Фантастическое чувство было — пишешь faster (или quicker) и персонаж бежит быстрее.

А текстовые адвенчуры?

Да-да, вот Ларри и был одним из первых текстовых адвенчуров с графическим интерактивом.
А совсем простые даже сами писали. "Продукционные правила". Но обычно это был интерфейс ввода вида "выберете номер действия".

Я про чисто текстовые, инфокомовские те же. Ларри из них ведь вырос.

Хотя сам Ларри ко мне попал уже тогда, когда пятая версия вышла, до этого как-то руки не доходили. Вот Space Quest и King Quest — да, в них с первых версий играл.
Но вот тот же Loom, где уже не было никаких текстовых команд, а всё делалось мышью, казался шагом в будущее.
Честно скажу, статью особо не читал, но просмотрел картинки:) (поэтому комментарий будет несколько оффтопичным). В который уже раз ловлю себя на мысли, что старые интерфейсы гораздо приятнее для восприятия чем новые. Теплая Win3.1 и совершенно холодная десятка. И все что между ними — совершенно четкое последовательное движение от «теплого» к «холодному». И это связано не только с цветовой гаммой, но и с чем-то еще… возможно с тач-ориентированностью? С утратой мелких деталей? С потерей четкости изображения в угоду спецэффектам? Даже не знаю.
Может опрос устроить? Как к этому относятся люди, не жившие и не работавшие тогда?

С одной стороны есть эффект «когда деревья были большими, а трава зеленей»..., а с другой — даже вещи, которые были «до» меня (скажем MacOS 7 или AmigaOS 2) кажутся какими-то… ну не знаю… уютными. Хотя если двигаться ещё дальше в прошлое, то, пожалуй, всякие CM/P и Tor — уже нет… GEOS — на грани.

Может быть дело в том, что если вначале шла жесточайшая борьба за то, чтобы на несчастных 4-8-16KB сделать хоть-что-то-вообще и о вмеяемом GUI говорить не приходилось, потом началась борьба за то, чтобы сделать удобнее, а потом… потом неожиданно ресурсы перестали быть очень большой проблемой и в делов вступили «дезигнеры».

Которым удалось невозможное: заставить современные компьютеры, которые в тысячи раз быстрее тех, на которых использовались Windows 3.1 и MacOS 7, тормозить. Причём тормозить безбожно, не по делу и практически везде.

У меня есть ощущение того, что основная проблема современных интерфейсов — в том, что они лагают, а не в том, что они какие-то особо «холодные»…
Интерфейсы самой ОС (сужу по Mac OS 10.8-10.13, Windows 7-8-10, Убунту 12-16) либо не лагают вообще, либо лагают не больше, чем компы на Win 98 и Win XP из моего детства и молодости. Намного меньше лагают, если уж на то пошло, SSD здорово помогают.
Интерфейсы самой ОС (сужу по Mac OS 10.8-10.13, Windows 7-8-10, Убунту 12-16) либо не лагают вообще, либо лагают не больше, чем компы на Win 98 и Win XP из моего детства и молодости.
А зачем мне сравнивать что-то с «компами вашей молодости»? Я сраниваю Windows на машинке с 512MB RAM и 1.4GHz Tualatin'ом, с Windows XP на 4-ядерной системе с 4GB памяти Phenom X4 и так далее.

Ведь именно с таких систем я переходил на более новые системы… и каждый раз обнаруживал, что вместо чего-то работающего очень быстро и плавно получаю какую-то «патоку». Ну глазом же видно, что реакция не мгновенная!

Намного меньше лагают, если уж на то пошло, SSD здорово помогают.
SSD действительно помогает, но я не совсем об этом. Я о I can send an IP packet to Europe faster than I can send a pixel to the screen. How f’d up is that?

Вот это вот всё — последствия попыток сделать «плавнее», «красивее» и «стильнее». Если старые системы были устроены так, что на достаточно быстром железе компьютер открывал новое окно за 1/60 секунды (хотя для Turbo Pascal под MS DOS было достаточно IBM XT на 4.77MHz, а для Windows 98 требовался уже какой-нибудь Pentium !!!), то «новые», «дизайнерские» OS — так не умеют! Даже если им дать SSD, быстрый процессор и кучу памяти.
Я понимаю, о чём вы говорите. Пока что не уверен, что проблема не надумана.
Тут вопрос не в надуманности проблемы, а классическое «я не могу это развидеть».

Мне ещё в школе достался древний раритет — лаптоп с 2GHz 8086 процессором, на котором я на Турбо Паскале программу писал. Так я половину на ассмеблер перевёл, чтобы реакция в один фрейм укладывалась. Типа: ну как так-то? Сам Turbo Pascal может, а я — нет? Я что — глупее всех?

И потому я вот эти игры все воспринию через эту специфическую призму: наворотили «дезигна», добились того, что моментальной реакции нет — теперь будем «лакировать»… но для меня интефейс может быть отзывчивым (реагирует быстрее, чем за 1/60 между нажатием и изображением на экране) или «патокой» (реагирует дольше… а ещё и анимацию какую-то дурацкую изображает).

Вот интересно — сколько нас таких. И вызвано ли это только работой со старыми системами, который, на хорошем железе, реагируют мгновенно, или нет.
Старые компьютеры (и прочая электроника) скорее показали, что интерфейс может быть отзывчивым и задали ориентир, которого нет у современных или менее хардкорных пользователей.

Мне первый компьютер привил любовь к стандартной библиотеке для отрисовки окон, потому что приложения на сторонних (Qt, VCL) жутко тормозили.
Видимо я предельно асоциален, раз идея управления голосом не привлекала меня с первого дня такой возможности )
Ну, все было бы неплохо, если бы общение между пользователем и этими вашими NLP не напоминало бы Равшана, Джамшута, и насяльника… Что-то пока подвижек не видно.
А где же вариант «хочу, чтобы программа считывала мысли и предугадывала мои действия»?

В статье говорится, что NLP — это то, к чему надо стремиться, но я (а судя по комментариям и не только я) так не считаю.
Во-первых сейчас NLP не может ничего сложнее чем подсказывать погоду, и ставить напоминания. А уж про корректное распознавание не-английской речи и речи не идёт(всё затачивается под США).
Во-вторых, почему обязательно NLP? Почему это не может быть один из таких вариантов:
1) Шлем, который считывает твои мысли. Зачем что-то произносить? Давайте просто об этом подумаем — и это произойдет. Ах, таких шлемов еще нет? Но ведь и NLP сейчас не в ударе?
2) А давайте дома расставим датчики, которые будут улавливать ваши жесты. Надоел свет? Навели на него пальцем, зажали палец — свет выключился. Покрутили ладонью — свет стал тускнее/ярче. Круто? -Круто! Лучше чем NLP? — лучше. Реально ли? -вполне, хотя есть трудности.

Короче статья однобокая в стиле «за NLP — будущее», и автор исключает другие все возможные варианты UX.
Вспомнил еще кучу случаев: сколько раз я ни пытался через «эй гугл» позвонить маме, папе, жене — он всегда звонил не тем людям…
> Гораздо удобнее с точки зрения user experience сказать «Эй, Сири, напомни мне написать письмо моей маме завтра в девять часов утра», чем заниматься вот этим…

Совершенно не удобнее, если это действие мне надо проделать, например, в три часа ночи в комнате, где спит несколько человек.
Совершенно не удобнее, если я не хочу, чтобы окружающие знали о моих планах кому-то что-то написать.
Совершенно не удобнее, если я простудился, и мне элементарно трудно издавать осипшим горлом какие-то звуки.
Совершенно не удобнее, если требуется сделать заметку на рок-концерте, под звуки музыки в 80 децибел.
И т.д.
Это всё хорошо, но автор по загадочной причине сравнивает свой идеальный интерфейс только с интерфейсами мобильничков. Ежу понятно, что сложный интерфейс не запихнуть на маленький экран, в который пользователь потом будет стучать пальцами-сосисками. Но мы-то знаем, десктопы — сила, мобильнички — могила! Пусть даже реальный мир с этим не согласен, это детали.
Мое мнение, что будущее все таки за мобильниками, (увы?). Но не в таком виде как оно существует сейчас, прорыв в UI(UIX) на мини дисплеях рано или поздно неизбежен. По крайней мере силы отведены немалые для этого.
Ничего не имею принципиально против системы управления голосом. НО каждый инструмент хорошо для своих целей и условий применения. Очередная «волшебная таблетка» на все случаи жизни не прокатит. Молотком можно и шурупы забивать, но назад их выкрутить можно только отверткой.
Далеко за примерами ходит не надо, тот же офис — если все будут в смартфон голосом командовать, то это будет не очень хорошо для соседей, гораздо лучше пальцами по экрану потыкать.

Моё мнение — голос должен дополнять, но не заменять.
Когда я пошёл на пробежку с одними smart часами — я хочу сказать часам "(включи) следующую песню (, пожалуйста)" или "позвони жене".


Когда ночью я валяюсь на диване с выключенным светом и мне пришла в голову умная мысль, или когда телефон глубоко в кармане рюкзака, я тоже хочу продиктовать это голосом, эта мысль через мгновение может исчезнуть и раствориться, а не ждать пока я достану телефон, и наберу это текстом, да ещё и слепить меня в темноте комнаты.
Но в кабинете, офисе, на проспекте — я не хочу рассказывать всем что я хочу или делаю голосом.

Sign up to leave a comment.

Articles