Лекция: Методы анализа информации

Система анализа данных как индуктивный метод машинного обучения выявляет шаблоны данных среди имеющихся данных. Под термином «анализ данных» понимается исследование данных с целью получения необходимых знаний или информации.

Анализ данных базируется на использовании различных наук:

— статистика представляет методы для применения, выборки и трансформации данных, а также для выявления «шаблонов данных».

— Исследование баз данных обеспечивает методы для эффективного хранения, проверки данных.

— Искусственный интеллект обеспечивает технологии для сбора информации (нейронная сеть, генетические алгоритмы).

Методы анализа данных:

Визуализация: гистограммы, диаграмма дисперсий

Классификация: распределение объектов по классам

Сегментация: объединение объектов в группы, которые до этого не были известны

Прогноз: прогнозирование неизвестных признаков на основе других признаков

Анализ зависимости: связь между признаками объекта

Анализ различий: идентификация объектов, которые не следуют закономерностям других объектов, выяснение причин

Эта схема дает представление о методах анализа данных.

Обзор методов анализа данных

Кластерный анализ:

Кластер(определенная группа), члены которой внутренне однородны и внешне разнородны

Decision tree

Выводит алгоритмы из данных имеющихся классов для классификации неизвестных объектов

Регрессионный анализ:

Выявление функциональных зависимостей между переменными

 

еще рефераты
Еще работы по информатике