Лекция: Методы анализа информации
Система анализа данных как индуктивный метод машинного обучения выявляет шаблоны данных среди имеющихся данных. Под термином «анализ данных» понимается исследование данных с целью получения необходимых знаний или информации.
Анализ данных базируется на использовании различных наук:
— статистика представляет методы для применения, выборки и трансформации данных, а также для выявления «шаблонов данных».
— Исследование баз данных обеспечивает методы для эффективного хранения, проверки данных.
— Искусственный интеллект обеспечивает технологии для сбора информации (нейронная сеть, генетические алгоритмы).
Методы анализа данных:
Визуализация: гистограммы, диаграмма дисперсий
Классификация: распределение объектов по классам
Сегментация: объединение объектов в группы, которые до этого не были известны
Прогноз: прогнозирование неизвестных признаков на основе других признаков
Анализ зависимости: связь между признаками объекта
Анализ различий: идентификация объектов, которые не следуют закономерностям других объектов, выяснение причин
Эта схема дает представление о методах анализа данных.
Обзор методов анализа данных
Кластерный анализ:
Кластер(определенная группа), члены которой внутренне однородны и внешне разнородны
Decision tree
Выводит алгоритмы из данных имеющихся классов для классификации неизвестных объектов
Регрессионный анализ:
Выявление функциональных зависимостей между переменными