
В Южном федеральном университете объявили о запуске челенджа «Создай свой датасет», в котором смогут принять участие ученые всех вузов России. Специалистам необходимо выполнить несколько простых шагов. А именно - создать датасет в репозитории Figshare и рассказать о нем в коротком видеочелендже, разместив ролик на YouTube или ВКонтакте с хэштегом #ЮФУСоздайСвойДатасет. При этом данные не должны нарушать законодательство о защите персональных даных: ФЗ-152 и GDPR Евросоюза.
Как рассказали в вузе, датасет - это предобработанная и структурированная информация, обычно в табличном виде, предназначенная для статистического анализа, визуализации и обработки алгоритмами машинного обучения. А опубликовать датасет можно как по результатам исследования, так и в начале творческого пути, сразу привлекая внимание ученых по данным, математиков и айтишников. Кстати, это отличный способ создать междисциплинарную команду и найти соавторов будущей статьи.
К слову, в репозитории Figshare уже размещено 62 датасета ученых ЮФУ. Там, к примеру, содержатся уникальные данные инфракрасной термографии лица в ответ на эмоциональные раздражители из статьи Владимира Косоногова с соавторами в журнале PLoS ONE или датасет спайк-волновой активности при амилоидозе головного мозга у мышей из статьи Ирины Ищенко с соавторами в журнале Frontiers in Neurology.
- Не останавливайтесь на одном датасете, создайте второй, третий и последующий, - призвал участников организатор конкурса, руководитель офиса образовательных программ Алексей Целых. - Наука о данных – это доступно и увлекательно, это будущее, которое уже здесь. Когда вашими данными заинтересуются ученые по данным, они смогут быстро выгрузить датасет для работы в Colab/Jupyter Notebook.