Pull to refresh
1
0
Дмитрий Донцов @Donskoy

Пользователь

Send message
Статья не про подход к программированию, а про философию обучения ML (bottom-up vs up-bottom)

Смысл в том, чтобы не усаживать новичков сразу за изучение злобного матаппарата, а сначала дать поиграть с уже собранной коробочкой, позапускать «hello world» и вовлечься в тему =)

Сами создатели fast.ai сравнивают это с музыкальным образованием. Сначала ребенку интересно понажимать на кнопки пианино, а уже потом учить сольфеджио и теорию музыки. Наоборот не работает.
Речь о том, что человек бросил заниматься тем, чем горел долгое время, что давало ему удовлетворение и в чём он достиг вершины мастерства.
Про его прошлое (особенно олимпиадное), настоящее и особенности характера довольно много известно. Например, многое описывает его бывший руководитель Сергей Рукшин. О его научной деятельности известно из рассказов коллег-математиков.
История автора напомнила путь Перельмана, который сильно любил математику со школьных времен, занимался ею всё свободное и рабочее время, около 8 лет работал над гипотезой Пуанкаре, а потом… выгорел. Уволился из института, не читает лекции, интересуется только классической музыкой.
Может быть, тоже спрашивает себя «кто я без математики?»
Если под «главным функционалом» понимать только добавление и удаление букв, то безусловно.
Но практически любая визуальная фича потребует очень долгой и вдумчивой проработки. Например, пагинация, вставка картинок, неразрывные пробелы, работа с заголовками разного уровня, применение форматирования к разным частям текста с разной вложенностью и т.д. Добавьте сюда таблицы — и возможные комбинации удвоятся. Добавили сноски — и вуаля: всё то же самое, но ещё и со сносками. Вы думаете удалить сноску и пересчитать их индексацию — это всё? — Нет, придется ещё пересчитать свободные места внизу страницы, куда влезает текст сноски. А от этого может пересчитаться пагинация. Ну и т.д. Так что, например, добавление сносок — это вполне себе мажорная фича, заслуживающая отдельного релиза.
Добавьте возможность «комментариев» — и хоп: количество комбинаций, которые нужно предусмотреть, ещё раз удвоилось
Думаю, что это если «зажечь» в сокомандниках искру и заразить их идеей общего успеха в будущем, к которому мы все сейчас должны стремиться, то можно так неплохо преуспеть в преумножении командной мотивации.

А в чём выражается/измеряется общий успех? В моём понимании общий успех — это мотивация инвестора, а не команды. Он вкладывает в проект X денег, а хорошие продажи, выходы на новые рынки, IPO и прочий «общий успех» дают ему условные 50*X. Если не брать в учет опционы и акции компании, то как меня — наёмного члена команды — замотивирует, например, сверхуспешный выход на IPO?
Название статьи:
Полиция Москвы получит очки с распознаванием лиц

Первое предложение статьи:
Мэрия Москвы, а именно Департамент информационных технологий планирует заказать разработку очков дополненной реальности с функцией распознавания лиц.
Это комментарий для теста нейросети?
Бывают ещё крайние случаи, когда работаешь на удалёнке и при этом ты единственный программист на проекте. Тут в скором времени происходит профессиональное закисание, когда перестаешь учиться чему-то у других коллег. И не обязательно у более квалифицированных специалистов. Кто-то из команды нашел удобный тул для работы, поковырялся в новом фреймворке, автоматизировал рутинную задачу по проекту, раскурил другую парадигму программирования — об этом на обеде или на кухне узнАют остальные. Не представляю, как можно набраться таких «знаний в ширину» по скайпу, даже если у тебя много крутых скайп-коллег. По-моему, эффект «банки с солеными огурцами» в полной мере достигается только при живом (в т.ч. неформальном) общении.
Под графиком с чатботами:
Источник: упоминания в прессе по данным CB Insights

Но всё равно без абсолютных значений делать выводы сложно.
А есть какие-нибудь общепринятые baseline-алгоритмы, датасеты или бенчмарки, на которых можно потестировать САР? Для английского, думаю, должны быть.
Не хочу сказать ничего плохого, но значения метрик, полученные на 5 новостных статьях, не могут быть объективной оценкой качества реферирования — было бы интересно погонять её на больших данных.
А как в этом поможет развитие экономики? Это текущий уровень развития машинного обучения и вычислительной техники не позволяет достоверно предсказывать будущее, обучив правильный алгоритм на пространстве всех возможных признаков.
Есть еще неплохой dependency-парсер для русского языка на базе malt parser.
corpus.leeds.ac.uk/mocky
Для сравнения строк, в которых меняются не отдельные символы, а сразу токены, хорошо подходит Расстояние Жаккара.
image
Сначала бьем две строки на токены, а потом делим количество совпавших на количество уникальных токенов в обеих строках.
А чем объясняется то, что на скрине 8 из топ-10 переводчиков — девушки? (Возможно, даже 9 из 10)
Или это традиционное для переводчиков распределение?
Расследование по делу вёл специальный агент Армандо Рамирез Третий (Armando Ramirez III)

Да уж, при Армандо Рамирезе Втором не было такого разгула промышленного шпионажа…
Дельта TF-IDF не пробовал, но на личном опыте убедился, что для отбора фич в sentiment analysis еще неплохо подходит мера Mutual Information.
Это не сэндвич, это Кубик Жрубика
>Остаётся надеяться, что с автоматизацией дорожного движения в будущем пробки полностью исчезнут с наших дорог, а управление автомобилем будет приносить одно только удовольствие.

По-моему, полностью исчезнет как раз управление автомобилем.
Многие матёрые автолюбители и на коробку-автомат жалуются, мол, с ней удовольствие от вождения меньше.

А с автопилотом и V2V-авторассасывателем пробок все будут ездить пьяные, смотреть в машине телевизор и испытывать удовольствие уже не от управления автомобилем =)

Information

Rating
Does not participate
Location
Санкт-Петербург и область, Россия
Registered
Activity