Pull to refresh

Comments 16

Немного не по теvе разворачивании в Azure:
А как насчет тональности по объекту?
«Маша хорошая, а Петя дурак».
Это позитивное сообщение или негативное? Для Маши позитивное, а для Пети не очень
В общем случае, должны быть выделены отдельные сущности «Маша» и «Петя», и отдельные оценки для каждой из них.
А конкретно тут это сообщение при разметке будет нейтральным и в дальнейшем оно будет отброшено, так как для обучения не используются нейтральные сообщения. А если подать его на вход, то получим -1, те система посчитает его негативным.
если оно при разметке будет нейтральным, то почему система посчитает его негативным?
Потому что в обучающей выборке было много других предложений со словом «дурак», оценённых негативно :)
Странный результат. Если в предложении два объекта, то должна быть определена тональность относительно каждого из них. Если в словаре (обучающей выборке) есть оба слова («дурак» и «хорошая»), то, как я понял, система выдаст все-таки нейтральный результат независимо от местоположения объекта. Следуя этой логике: если в розетку с постоянным напряжением (позитив и негатив) сунуть два пальца, то состояние сующего останется нейтральным?
>Если в предложении два объекта, то должна быть определена тональность относительно каждого из них.
В какой-то более сложной системе — да. Но в данном случае определяется тональность целиком для всего сообщения.

>Если в словаре (обучающей выборке) есть оба слова («дурак» и «хорошая»), то, как я понял, система выдаст все-таки нейтральный результат независимо от местоположения объекта.
Эти слова присутствуют в обучающей выборке с разной частотой, и в итоге получается, что если текст содержит слово «дурак» и слово «хороший», то он с большей вероятностью принадлежит классу «негативный»
В прошлый раз соревнование по тональности было соревнованием: кто лучше умеет использовать SVM, т.к. практически все участники использовали этот метод для классификации. Вообще, примитивная классификация сообщений в целом на хорошие и плохие мало используется на практике, т.к. не понятно: кому хорошо, а кому плохо.
На этот раз задача вроде бы интересней, но опять поставлена не корректно: смешаны две задачи сентимент-анализа (даже три): оставлена примитивная классификация и добавлена задача aspect-based sentiment analisys, которая почему-то подразумевает и тональность относительно объекта (мониторинга) и одновременно его свойств (аспектов). В мировой практике эти две задачи разнесены по разным классам и решаются разными методами (обычно не SVM). Боюсь, соревнование получится аналогичным предыдущему.
Привет!

Раньше не задумывались, но спасибо за ссылку, обязательно примем участие!
UFO just landed and posted this here
UFO just landed and posted this here
Можно ли более конкретно расписать (может картинкой) следующий момент:
Этот баг можно обойти, если загрузить CSV-файл в базу данных, а затем использовать блок Reader из раздела Data Input and Output для загрузки данных.
Имеется в виду, что вместо того, что бы читать данные из csv, данные будут чиаться из базы данных. Но вообще надо проверить как обстоят дела сейчас — Azure Machine Learning получил очень много обновлений с тех пор
в этом и заключается мой вопрос: как именно данные были загружены в базу данных?
просто хотелось бы попробовать этот пример шаг за шагом, но этап загрузки данныз через базу данных не описан.
спасибо.
Можно использовать любой инструмент для работы с SQL Server — SQL Server Management Studio, dbForge Studio или еще что-то
Sign up to leave a comment.

Articles

Change theme settings