УДК 004

К вопросу об определении «информационной системы»

On the definition of «information system»

Г. Н. Гатин

G. N. Gatin

Ухтинский государственный

технический университет, г. Ухта

Ukhta State

Technical University, Ukhta

В статье рассматривается понятие «информационная система». Для этого сделаны несколько отступлений в смежные, но другие области, чтобы разъяснить позицию автора. И представлена опора на труды других исследователей.

The article considers the adoption is «information system». To do this, there are a few digressions into related but other areas in order to clarify the position of the author. And given the reliance on the works of other researchers.

Ключевые слова: информация, экономика информации.

Keywords: information, the information economy.

Изучение любого объекта начинается с его определения. Поиск определения «информационная система» приводит к неожиданному выводу: любое программное обеспечение совместно с его окружением (технические средства, технологии, персонал, данные) может рассматриваться как информационная система.

Например, Федеральный закон Российской Федерации от 27 июля 2006 г. N 149-ФЗ «Об информации, информационных технологиях и о защите информации» понятие «информационная система» трактует следующим образом «информационная система — совокупность содержащейся в базах данных информации и обеспечивающих ее обработку информационных технологий и технических средств». Юристов понять можно, они описывают не информационные системы, а защищаемое законом пространство, отсюда такое широкое понимание ИС. Наши цели другие: мы стремимся понять, что такое ИС по сути, поэтому наше определение ИС, скорее всего, будет отлично от юридического. В юридическом определении также не всё в порядке. Здесь есть привязка к базам данных, что заведомо оставляет без юридической защиты файловые и файл-серверные информационные системы (мы, правда, не знаем юридического определения базы данных; очень даже может быть зря мы копья ломаем).

Википедия даёт очень широкое определение: «информационная система есть совокупность технического, программного и организационного обеспечения, а также персонала, предназначенная для того, чтобы своевременно обеспечивать надлежащих людей надлежащей информацией». Новое здесь то, что обращено внимание на организационную составляющую и безопасность/конфиденциальность информации (иначе как понимать «надлежащих людей надлежащей информацией«), но в остальном это определение любого программного обеспечения.

Существует, например, такое определение: «информационной системой называется комплекс, включающий вычислительное и коммуникационное оборудование, программное обеспечение, лингвистические средства и информационные ресурсы, а также системный персонал и обеспечивающий поддержку динамической информационной модели некоторой части реального мира для удовлетворения информационных потребностей пользователей». Ну это по-прежнему определение любого сетевого ПО. Среднему пользователю оно просто непонятно (ну скажите мне, что такое «динамическая информационная модель«). Включение же в определение «коммуникационного оборудования» оставляет открытым вопрос о локальных информационных системах. Основная беда этого определения, в том, что ИС определяются через другое, но также как ИС не определённое понятие: «динамическая информационная модель«.

В. Н. Петров в учебнике «Информационные системы» (Санкт-Петербург, ПИТЕР, 2002) вообще не определяет изучаемого понятия. Это учебник для студентов специализирующихся на работе с базами данных. Обычно этот предмет даётся примерно на третьем курсе. Видимо, предполагается, что ранее читатели уже получили все необходимые определения.

Таким образом, на сегодня нет общепринятого определения «информационной системы». Хорошо это или плохо? В конце-концов, нет на сегодня общепринятого определения «базы данных», но мы прекрасно (?) обходимся без этого определения. Здесь следует заметить, что «база данных» достаточно специальное понятие, используемое в узкой среде специалистов. Обычный пользователь использует это понятие опосредованно, через программное обеспечение (ПО) и, как правило, считает, что это совокупность данных используемых при решении задачи. С информационными же системами всё не так. Это понятие широко используется неспециалистами. Вот и появляются потом фразы типа: «Информационная система это экономический банк данных».

Цель этой статьи построить и обосновать определение понятия «информационная система». Для этого нам придётся сделать несколько отступлений в смежные, но другие области, чтобы разъяснить позицию автора. На вопрос почему мы можем дать новое определение ИС замечаем, что мы стоим в конце пути, пройденного за нас другими, мы опираемся на их труды.

Что дают нам вышеприведённые определения, как и его отсутствие: понятие «информационной системы» тесно связано с понятиями «программное обеспечение», «банк данных». Кроме того, везде отмечается тесная связь «информационной системы» с её окружением. Современные ИС (информационная система) не мыслимы без банка данных, но всё же сохраняется маргинальная ниша файловых ИС. Современные ИС, чаще всего работают в сети, но существуют локальные ИС. Включение персонала и коммуникационного оборудования в определение ИС достаточно спорно, но, к сожалению, некоторые ИС работают только под управлением конкретных личностей и на заданном техническом оборудовании.

Но это сегодня ИС и компьютер неразрывны. Существуют ли не компьютерные ИС? Да существуют, и человечество широко их использует – это библиотеки. Библиотеки, не только можно, но и необходимо рассматривать как не компьютерную ИС. Кроме того, существуют энциклопедии, которые можно рассматривать как типичный пример не компьютерной локальной ИС.

Когда появляются ИС в компьютерных технологиях? Почти одновременно с появлением ЭВМ. Более точно, когда появились запоминающие устройства, позволяющие сохранять достаточные объёмы информации/данных. Тогда ИС реализовывались на файловых системах. Структура файловой системы была просто копией структур данных, хранимых в файловой системе. Более того, структуры данных встраивались в программное обеспечение. Такая технология приводила ко множеству проблем при корректировке структуры данных. Тем не менее, даже сегодня существуют ИС реализованные подобным образом. Как правило, это простые словари. Достоинства: простота и малая стоимость реализации, незаметные объёмы потребляемой памяти, простота сопровождения, а корректировать структуры данных не требуется.

Безусловно, в общем случае, тесная связь структуры данных, файловой системы и ПО уже тогда была неприемлема. Поскольку именно корректировка структур данных приносила проблемы, то прежде всего структуры данных отделили от файловой системы. Описание структуры данных на языке описания данных выделило их в независимые от файловой системы структуры. Стало понятно, что одну и ту же структуру данных можно реализовать разными файловыми системами, что структуры данных существуют отдельно как от файловой системы, так и от ПО, работающим со структурой данных.

Вот это описание структур данных мы и считаем базой данных. В защиту своей точки зрения укажем, что это единственное что сохраняется при переносе базы данных из файловой структуры в БД или СУБД. Вводя понятие пустой базы данных, мы получаем возможность не включать данные в понятие «база данных». Необходимо помнить, что вульгарное понимание базы данных не различает описание данных и сами данные. С другой стороны, в нашем понимании, описание базы данных включает в себя не просто описание структур данных, но и описание манипулирования данными, и правила поддержки целостности данных.

Работа с базой данных требовала знания описания базы данных и, всё же, знания файловой структуры. ПО, однако, стало почти независимо от базы данных. Тем не менее, каждая база данных реализовывалась своей файловой структурой. Следующим естественным шагом стала реализация различных баз данных в единой файловой структуре или переход к СУБД – системе управления базами данных. ПО окончательно отделилось от структуры данных. Но работа в СУБД по-прежнему требовала знания как структуры базы данных, так и файловой системы.

Основной недостаток обоих подходов – открытая файловая структура. Каждый файл жил своей самостоятельной жизнью, сводя к нулю все усилия по решению вопросов целостности и безопасности данных.

Сокрытие файловой структуры от пользователя, и даже от программиста привело в появлению банков данных – БД. Работая в БД можно не знать файловой структуры базы данных. Но так как мы не знаем физическое размещение данных, то нам как-то надо указать БД какие данные мы требуем. Таким образом, сокрытие файловой структуры необходимо приводит к появлению SQL – структурированного языка запросов. Работая с SQL можно не знать файловой структуры, но структуру базы данных знать приходится. (SQL очень мощная идея. Появившись в БД, SQL с успехом стал применяться и в СУБД, и в базах данных).

Вот как только мы захотим не знать и файловой системы, и структуры базы данных, но получать ответы на свои запросы, не обязательно сформулированные на SQL, мы приходим к информационным системам!

Реальность не так гладка как изображено выше. Развитие информационных систем шло параллельно развитию баз данных, СУБД, БД и в каком-то смысле независимо от теории хранения данных. Хотелось бы обратить внимание: банк данных, но информационная система. То есть, уже на заре компьютерной эры специалисты понимали, что в информационных системах хранится нечто отличное от того, что хранится в базах данных, банках данных. (Далее везде будем считать что мы имеем дело с банком данных. На достижение поставленной цели различия между БД и базами данных не влияют).

Ответ настолько же прост, насколько он сложен: в информационных системах хранится информация, а в БД – данные. Всё было бы просто, если бы мы знали, что такое информация. Однако, отличие информации от данных мы указать можем.

Пусть имеется некая сущность/объект. Под информацией об этой сущности будем понимать некоторое множество сведений о сущности, которая обладает двумя свойствами: а) это множество может хранится и существовать независимо от сущности; б) по этому множеству специальным алгоритмом, называемым интерпретацией информации, может быть восстановлена исходная сущность. Восстановленная сущность тождественна исходной за исключением расположения в пространстве и времени.

Тождественность копии и оригинала неявно требует некоторой информации об окружении оригинала (очевидно, что, например, такой простой и строго определённый объект как монета при разных температурах имеет разные линейные размеры и т.п.). При таком подходе мы понимаем, что любая информация состоит из собственно информации о сущности и информации об окружении сущности или контекста. То есть, информация может быть правильно интерпретирована только в её контексте.

Кажется, что тождественность копии и оригинала приводит к однозначности информации о сущности. Однако это не так. Всё дело в том, что передатчик и приёмник обязательно преобразуют информацию, получаемую от источника, что приводит к неоднозначности информации о сущности (собака видит мир черно-белым и видит в темноте, человек же видит мир цветным, а в темноте совсем не видит). В связи, с этим возникают не простые вопросы: Что одинакового в информации об одной сущности сохранённой разными приёмниками? «Одинаковость» есть в самой информации или «одинаковость» появляется в результате процесса интерпретации? Как понимать «одинаковость»? Безусловно, это очень интересные вопросы, но продолжим движение в направлении к цели.

Требование тождественности можно ослабить требованием идентичности или однозначной идентификации копии и оригинала как одной сущности. В реальности, ведь, мы не строим каждый раз сущность. Требование идентичности позволяет не восстанавливать сущность, а строить её образ. Можно строить образ не конкретной сущности, а образ элемента «класса» к которому принадлежит сущность. Мысленный/виртуальный образ сущности, может заменить реальную сущность. Требование идентичности изменяет требования к контексту или информации об окружении. Образ сущности может существовать в образе окружения. Это показывает, что контекст не отменяется.

Информация о сущности и окружении всегда избыточна. При передаче информации происходит потеря некоторой доли информации. При интерпретации информации может происходить как потеря информации, так и внесение дополнительной информации. В обоих процессах возможны искажения информации. Тогда возникает вопрос о степени приближения копии к оригиналу или отличии копии от оригинала.

Этот вопрос можно изложить несколько по другому. Какова минимальная информация, позволяющая однозначно идентифицировать/восстановить сущность. Или найти множество информации минимальной мощности, позволяющее идентифицировать сущность. Очевидно, что в этом случае мы наперёд задаёмся степенью приближения образа к оригиналу.

Мы считаем, что это множество информации минимальной мощности, позволяющее идентифицировать сущность, называется знанием. Если образ, полученный в результате интерпретации, не отвечает предварительно сформулированным требованиям к степени приближения к сущности, то мы чего-то об оригинале не знаем. Здесь мы исключаем процессы ошибочной интерпретации, но в реальности и такое может быть.

Знание, таким образом, минимально необходимая информация. Минимальность знания позволяет экономить память необходимую под сведения о сущности/объекте. Сегодня, в большинстве случаев, ИС, за исключением экспертных систем, не различают информацию и знания.

Очень часто, однако, для решения некоторой задачи вся информация о сущности не требуется. Более того, избыточность информации может серьёзно мешать и осложнять решение задачи. Тогда, перед началом процесса решения из информации извлекаются
данные, необходимые для решения задачи. То есть, данные это часть информации, необходимая для решения частной задачи. Внимательное исследование показывает, что данные чаще всего выражаются конкретными числами независящими от окружения. Данные могут иметь и фиксированные текстовые значения. Данные могут выражаться и некоторым набором текстовых строк. Во всех случаях мы видим, что данные имеют значения независящие от окружения, выбираемые из некоторого фиксированного множества значений. Другими словами, данные – часть информации выраженная элементом некоторого фиксированного множества независящим от контекста (окружения). Таким образом, во-первых — данные это прежде всего информация отделённая от контекста. Во-вторых – данные это результат измерения. (Результат измерения не обязательно число, это может быть и некое текстовое значение и даже набор строк. Набор счётного множества текстовых строк элементарно отображается на числовую прямую.)

Из всего вышесказанного видим, что ИС могут хранить информацию, знания, данные. Однако, мы знаем, что БД также могут хранить информацию, знания, данные. Как тогда различать ИС и БД?

Пока идёт речь только о процессе хранения никаких различий нет. Более того, ИС используют БД именно как средство хранения. Пока речь идёт только о данных, фактически, также различий не наблюдается. (различия есть, но сейчас они для нас несущественны). Различия начинаются при обработке информации и знаний (далее везде будем писать информация, подразумевая и знания).

При помещении данных в БД стараются освободиться от зависимости данных друг от друга и, разумеется, от контекста(!). Фактически, данные предельно упрощаются. Далее с данными большинство БД может манипулировать собственными средствами. Зная SQL, любой пользователь может решать множество достаточно сложных задач, не написав ни одной программы.

Информация, однако, в БД помещается как поток байт и хранится в виде BLOB – большой логический объект. С BLOB БД работает, не раскрывая его внутренней структуры. БД может сохранить, переместить, скопировать, ввести и вывести BLOB, как поток байт. БД не может интерпретировать BLOB. Даже для адекватного отображения BLOB на экране, требуется написать программу (!), которая фактически выполняет некоторую интерпретацию информации.

БД приспособлены для хранения информации, но работать могут только с данными. Всё-таки название адекватно функциям – банк данных. Эти рассуждения косвенно объясняют трудности внедрения в БД объектной модели.

Ещё одно, очень серьёзное отличие проявляется при помещении информации в ИС. При помещении информации в ИС она усложняется (!). Ярче всего это видно на гипертекстовых ИС. Но при помещении в любую ИС к информации добавляются ссылки на другую информацию. Прежде всего потому, что информация нужна в совокупности с окружением, но кроме этого почти всегда, необходима взаимосвязь одного блока информации с другими блоками информации. Хотелось бы подчеркнуть, это ссылки обусловленные информационными структурами, а не ссылки обусловленные построением ИС, последние есть и в БД. Ещё раз: при помещении в БД данные упрощаются, при помещении в ИС информация усложняется.

Теперь нам ясно, что ИС обрабатывает информацию, а БД обрабатывает данные.

После всего вышесказанного можно поискать черты присущие всем ИС. Начнём с того, что ИС бывают универсальные и специализированные. В специализированных ИС хранится информация какой-то одной области знаний, в универсальных может храниться любая информация. Назовём это понятийной частью ИС. Чуть ниже станет ясно почему всё же важно указать понятийную часть.

Интуитивно понятно, что информация при помещении в ИС не располагается там хаотичным образом, хотя поступать она может в хаотичном порядке. Поиск в хаосе большая проблема. Следовательно, информация некоторым образом упорядочивается, систематизируется. Чаще всего информация располагается алфавитном порядке. Обычно информация располагается в некоторой иерархической структуре или иерархии. В таких ИС, как словари или в специализированных ИС иерархию «видно невооружённым глазом». Однако, в пространственных ИС, или геоинформационных системах, иерархия просто так не просматривается. Поэтому термин иерархия (дерево) заменим на менее обязывающий – «информационные структуры». Очевидно, что информационная структура должна быть выстроена до заполнения ИС, иначе невозможен хаотичный порядок ввода информации в ИС. Таким образом, любая ИС содержит структурную часть. В ИС может быть множество информационных структур (в том числе и иерархий, тогда у нас не одно дерево, а лес).

Более интересно, что любая ИС настроена на заданный класс запросов. С одной стороны это обусловлено собственно информационными структурами. С другой стороны это обусловлено понятийной областью: запросы на поиск отсутствующих понятий могут выполняться достаточно долго. Гораздо серьёзнее то, что существуют понятия, которые можно отнести к разным классам. Например: «золото», это металл или финансы? Куда отнести понятие «коса»?

Назовём эти три составляющие: понятия, информационные структуры, запросы – информационной составляющей ИС. Информационная составляющая ИС присуща любой ИС и не может быть удалена из ИС. Более того, информационная составляющая должна быть заполнена некоторым объёмом информации. Если при запуске ИС не достигнут некий минимальный объём информации, то ИС неработоспособна и почти всегда бесполезна. (Сравните с пустым БД)

Таким образом, информационная составляющая ИС краеугольный камень любой ИС. Что ещё важно в ИС? Как ни странно, способ хранения информации. Но прежде чем мы раскроем этот тезис, мы приведём, наконец-то, определение информационной системы. Далее в процессе краткого обсуждения определения станет понятна неожиданная позиция автора.

Итак: Информационная система это система управления информацией, состоящая из двух частей: собственно информационной части и способа хранения информации.

Безусловно, выше нигде автор не приводил термина «управление». Но что мы реально делаем, когда систематизируем информацию? Когда храним, редактируем, вводим, выводим информацию? Что мы делаем, когда располагаем информацию по уровням иерархии, дабы ускорить выполнении часто появляющегося запроса? Мы управляем информацией! Только термин «управление» охватывает все вышеперечисленные функции и множество неназваных, например, регулирование доступа к информации. Самая важная функция ИС это систематизация информации; в самом простом случае это директивное расположение блоков информации по полочкам. Дидро считал, что энциклопедия должна устанавливать связи между понятиями, если нельзя отобразить все знания, то хотя бы показать взаимозависимость между ними. Таким образом, основная функция ИС – управление информацией.

После вышеизложенного с информационной составляющей всё понятно. Со способом хранения немного туманней. Заметим, что хотелось бы чтобы определение охватывало все ИС, а не только функционирующие на ЭВМ. Заметим, также, что со способа хранения информации мы и начали наш путь к определению: файловая система, базы данных, СУБД, БД. Где граница между компьютерными и не компьютерными ИС? В способе хранения информации.

Сегодня человечество знает два основных способа хранения информации: книжный и электронный. Перфокарточный способ хранения рассматриваем как предельный случай книжного, когда одна книга представляет собой четвертинку страницы (существовали перфокарточные ИС). В Советском Союзе было микрофильмирование, что является также частным случаем книжного способа хранения информации: микрофильм небумажная форма книги. Если рассуждать только о способе хранения информации, то история знает ещё и мегалитический способ хранения информации, когда информация «кодировалась» в характеристики мегалитического сооружения.

Термин «электронный» способ хранения информации хотя и корректен, но недостаточен. Принципиально такой способ хранения может быть реализован аппаратно. Такие, аппаратно реализованные ИС существует и всем известны: GPS и «ГЛОНАС». Однако, GPS, с точки зрения обывателя, обыкновенный измерительный прибор. Однако, большинство систем GPS обладают памятью, куда может вводиться электронная карта. После ввода электронной карты GPS может отвечать на многие стандартные вопросы, решаемые в любой ГИС – геоинформационной системе. Обратите внимание, ввод электронной карты усложняет «данные» GPS. Теперь вы получаете не только координаты точки, но и расположение этой точки на местности. То есть, вы стали получать не данные, а информацию. Отсутствие в вашем GPS карты вроде бы сводит GPS к простому измерительному прибору. Но в систему GPS «зашита» масса информации о форме и размерах Земли и не только.

Тем не менее, на сегодня в основном электронный способ хранения реализован программно, почему под большинство существующих определений ИС и попадает программное обеспечение.

 

09.2011 – 04.2012

 

1. В. Н. Петров. Информационные системы. Санкт-Петербург. Питер. 2002.

2. Информационные системы [Электронный ресурс] // Википедия свободная энциклопедия : [сайт]. URL:     http://ru.wikipedia.org/wiki/Информационные_системы.

 

Статья поступила в редакцию: 13.04.2012

VN:F [1.9.17_1161]
Rating: 0.0/10 (0 votes cast)
VN:F [1.9.17_1161]
Rating: 0 (from 0 votes)
VN:F [1.9.17_1161]
Стиль изложения
Информативность
Сложность вопроса
Научная новизна
Коммерциализуемость
Rating: 0.0/5 (0 votes cast)