Другие журналы
Сетевое издание Машины и установки: проектирование, разработка и эксплуатация

Издатель ФГБОУ ВПО "МГТУ им. Н.Э. Баумана". Эл. № ФС 77-61859. ISSN 2412-592X

Публикации с ключевым словом - аномалии в данных

Найдено: 2
Метод выявления аномалий в исходных данных при построении прогнозной модели решающего дерева в системах поддержки принятия решений
# 09, сентябрь 2012
DOI: 10.7463/0912.0483269
Кузовлев В. И., Орлов А. О.
Работа посвящена методам работы с шумом в исходных данных при построении моделей анализа данных в системах поддержки принятия решений. Работа состоит из пяти частей. Во введении описывается проблема наличия искажений в исходных данных при работе систем поддержки принятия решений. Ставится задача исследования и разработки методов анализа искажений в данных при построении модели решающего дерева. Вторая часть посвящена обзору существующих алгоритмов построения деревьев решений и анализу методов работы с искаженными данными в них. Также проведен обзор литературы по существующим методам поиска аномалий в данных. В третьей части описывается метод оценки показателя локальной аномальности, предложено расширение данного метода за счет использования новой формулы расчета расстояний между значениями категориального атрибута. В четвертой части предложен метод выявления аномалий в исходных данных при построении прогнозной модели решающего дерева в системах поддержки принятия решений. В заключении перечислены результаты проведенного исследования.
Повышение качества данных с использованием методики поиска аномалий на примере Портала открытых данных правительства Москвы
# 08, август 2014
УДК: 004.052.42
Кузовлев В. И., Орлов А. О.
В статье рассматриваются наборы данных Портала открытых данных правительства Москвы. Выбранные наборы данных анализируются с точки зрения оценки информативности атрибутов. Излишняя информативность одних атрибутов приводит к обесцениванию других, что снижает общее качество набора данных и его пользу для конечного пользователя Портала открытых данных. Описаны механизмы оценки информативности атрибутов данных и методики поиска аномалий. Показаны результаты применения методики поиска аномалий, продемонстрирован эффект от применения методики, выражающийся в выравнивании информативности отдельных атрибутов данных. Дана общая оценка исследованным наборам данных.
 
ПОИСК
 
elibrary crossref neicon rusycon
 
ЮБИЛЕИ
ФОТОРЕПОРТАЖИ
 
СОБЫТИЯ
 
НОВОСТНАЯ ЛЕНТА



Авторы
Пресс-релизы
Библиотека
Конференции
Выставки
О проекте
Rambler's Top100
Телефон: +7 (915) 336-07-65 (строго: среда; пятница c 11-00 до 17-00)
  RSS
© 2003-2017 «Машины и установки: проектирование, разработка и эксплуатация» Тел.: +7 (915) 336-07-65 (строго: среда; пятница c 11-00 до 17-00)