А есть готовые датасеты с русскоязычными текстами?
Роскомнадзор и ФСБ работают над этим.
Смотря для каких целей
opencorpora.org
А как насчёт изначально цифровых данных? Исторические данные о погоде, экономических показателях, экологии, медицине, и т.п. Вот бы подборку ссылок на ресурсы, где такое брать тоже.
По медицине есть www.physionet.org и http://www.osirix-viewer.com/resources/dicom-image-library/ или имелось в виду не сигналы/картинки, а статистика?
Да, статистика. Анализы, измерения, диагнозы,…
Кое-какие диагнозы по первой ссылке точно есть в компании с измерениями различных показателей, но меня это, если честно, не очень интересовало — мы эти сигналы использовали чисто как точки которые надо отрисовать для внутреннего проекта не углубляясь в то что они означают для медиков
По погоде можно с rp5.ru взять данные. Помнится, раньше была глубина данных лет на двадцать. А сейчас только на пять…
Только полноправные пользователи могут оставлять комментарии.
Войдите, пожалуйста.