Сетевое издание
Международный студенческий научный вестник
ISSN 2409-529X

ИНТЕЛЛЕКТУАЛЬНЫЙ АНАЛИЗ ДАННЫХ

Федяшов Н.В. 1 Покровский В.Г. 1
1 Пензенский государственный технологический университет
1. Конноли, Томас, Бегг, Каролин. Базы данных. Проектирование, реализация и сопровождение. Теория и практика. 3-е изд.: пер. с англ. – М.: издательский дом «Вильяме», 2003. – 1440 с.
2. Степанов Р.Г. Технология Data Mining: Интеллектуальный Анализ Данных
3. Бершадская Е.Г. Анализ технологий поддержки научных исследований // XXI век: итоги прошлого и проблемы настоящего плюс, 2015. – № 3 (25). – С. 11-17.
4. Мартышкин А.И., Бикташев Р.А., Воронцов А.А. Численный метод для определения пропускной способности приоритетного потока заявок в многопроцессорной системе с общим диспетчером задач по каждому конкретному типу приоритета // XXI век: итоги прошлого и проблемы настоящего плюс, 2014. – № 3 (19). – С. 137-145.

Мультимедиа. С доставкой мультимедийных данных сразу нескольким пользователям связан ряд новых исследовательских проблем. В общем случае, если объем данных велик, доступ к ним и доставка результатов выборки могут стать узкими местами.

Новые типы запросов. Запросы к базе данных традиционно оперируют с четкими понятиями. Многим новым приложениям приходится иметь дело с запросами, включающими нечетко определенные понятия, которые позволяют находить наилучшее доступное значение из нестрого определенного набора. Для этого требуется выработать новые языки запросов или усовершенствовать существующие языки, включив в них в качестве базовых такие понятия, как степени свободы и желаемая точность приближенного результата. Имеются экспериментальные системы, которые умеют выбирать из базы данных графические образы на основе таких нечетких характеристик, как цвет, форма, текстура. Системы этого типа потенциально способны по нечеткому описанию содержимого производить выборки в среде графических образов, аудио– и видеоинформации, подобно тому, как существующие системы позволяют выбирать текстовые или числовые данные по значению какого-либо поля [1]. Но реально здесь необходим еще значительный объем исследований.

Области использования. Традиционно системы баз данных использовались для поддержки приложений обработки бизнес-данных, и основные направления исследований были ориентированы именно на этот класс приложений. В последнее время образовались новые важные области применения баз данных, и каждая из них представляет принципиально новую среду, к которой необходимо адаптировать технологии СУБД. Эти области получили на рынке названия интеллектульного анализа данных (data mining), хранилищ данных (data warehousing), репозиториев данных (data repository), и далее мы их по очереди обсудим [2].

Интеллектуальный анализ. Идея интеллектуального анализа данных (data mining), т.е. извлечения информации из огромных массивов данных, накопленных совсем для других целей, вызывает сегодня повышенный энтузиазм. Например, авиакомпании добиваются оптимального заполнения рейсов за счет анализа накопленных ранее данных о резервировании билетов [3].

Таким образом, с добычей данных связаны следующие исследовательские направления:

- Методы оптимизации сложных запросов, включающих, например, агрегацию и группирование;

- Методы поддержки «многомерных» запросов, относящихся к данным, организованным в виде «куба», в ячейках которого находятся интересующие данные;

- Методы оптимизации использования третичной памяти;

- Языки запросов очень высокого уровня, а также интерфейсы для поддержки пользователей, не являющихся экспертами, которым нужны ответы на нерегламентированные запросы.

Хранилища данных. В хранилище данных накапливаются данные из одной или более баз данных. Существует множество потенциальных применений, а также подходов к организации хранилищ данных. В хранилище данных может сохраняться информация из многих баз данных для использования в чрезвычайных ситуациях. Например, в едином хранилище данных поддерживаются сведения о гражданской инфраструктуре (дороги, мосты, трубопроводы и т.п.), поскольку, например, после землетрясения вряд ли удастся получить эту информацию из городов, находящихся вблизи эпицентра. Еще один пример – использование хранилища данных как «материализованного представления» интегрированной информации.

Репозитории данных. Приложения, относящиеся к категории репозиториев, характеризуются тем, что они предназначаются для хранения и управления как данными, так и метаданными, т. е. информацией о структуре данных. Примеры репозитариев – базы данных для поддержки компьютерного проектирования, включая CASE (системы проектирования программного обеспечения), а также системы управления документами. Отличительная черта этих систем – частые изменения метаданных, характерные для любой среды проектирования. Транзакции – это единицы обработки данных, обладающие свойствами, существенными с точки зрения традиционных СУБД: атомарность (выполняются либо все действия, либо ни одного), сериализуемость (разные транзакции не оказывают неожиданного воздействия друг на друга) и долговечность (если транзакция зафиксирована, то ее результат не пропадет даже в случае краха системы). Эти свойства сохраняют свою значимость и для многих новых приложений, однако принятые методы реализации транзакций часто оказываются неработоспособными.

Были предложены альтернативные модели, основанные на концепциях вложенных транзакций, когда одна длительная транзакция разбивается на более мелкие шаги, и транзакций-«саг» (saga) [4], для которых обеспечивается возможность отменять результаты шагов, которые оказываются заблокированными последующими шагами.


Библиографическая ссылка

Федяшов Н.В., Покровский В.Г. ИНТЕЛЛЕКТУАЛЬНЫЙ АНАЛИЗ ДАННЫХ // Международный студенческий научный вестник. – 2016. – № 3-1. ;
URL: https://eduherald.ru/ru/article/view?id=14739 (дата обращения: 19.09.2024).

Предлагаем вашему вниманию журналы, издающиеся в издательстве «Академия Естествознания»
(Высокий импакт-фактор РИНЦ, тематика журналов охватывает все научные направления)

«Фундаментальные исследования» список ВАК ИФ РИНЦ = 1,674