Бойцы Армии США. Фото: U.S. Army
Полученная система была опробована на обычных административных данных. Результаты исследования опубликованы в журнале Psychological Medicine. Оказалось, что система способна с возрастающей точностью прогнозировать склонность бойцов к тяжким преступлениям.
Для машинного обучения исследователи сначала использовали административные данные о 975 тысячах 57 солдатах, проходивших службу в Армии США в 2004-2009 годах. Из них 5771 человек в этот же период совершил то или иное тяжкое преступление: убийство, убийство по неосторожности, похищение, поджог при отягчающих обстоятельствах, нападение с отягчающими обстоятельствами, ограбление. Анализ проводился по сотням параметров, включая социо-демографические, судимости, употребление наркотиков, медицинское освидетельствование.
Ученые выделили набор факторов, который, по их мнению, может влиять на склонность к совершению преступления. Например, некоторые отклонения в поведении и прочее. Чтобы определить значимость этих факторов ученые использовали стандартные методы машинного обучения (например, регрессионный анализ). В результате получилась система, способная на основании статистических данных выделять потенциальных преступников.
Анализ и обучение проводились отдельно для преступлений, совершенных мужчинами и женщинами. В результате анализа, проведенного при помощи машинного обучения, оказалось, что 36,2 процента всех зарегистрированных преступлений, совершенных мужчинами, и 33,1 процента — женщинами, были в действительности совершены пятью процентами солдат, для которых была спрогнозирована высокая вероятность насилия. Площадь под кривой ошибок для этого анализа составила 0,80-0,82.
Затем в систему ввели административные данные о солдатах Армии США, проходивших службу в 2011-2013 годах. Для этого периода пять процентов солдат, отмеченных алгоритмом в качестве потенциальных преступников, в действительности совершили 50,5 процента всех зарегистрированных за этот период преступлений. В этом случае площадь под кривой ошибок составила 0,77. По данным исследователей, дальнейшее использование машинного обучения позволит повысить точность прогнозирования.
Исследования, направленные на изучение поведенческих, социальных, демографических и множества других особенностей, американских солдат проводятся ежегодно. Полученные данные систематизируются, а на их основе исследователи пытаются разработать способы прогнозирования потенциальных военных преступников еще до совершения ими тяжкого преступления. При этом ученые формируют рекомендации по предотвращению подобных преступлений.
По материалам сайтов nplus1.ru и journals.cambridge.org.