Сектор археологической теории и информатики Института Археологии и Этнографии СО РАН

Сибирское отделение Российской Академии Наук

Сектор археологической теории и информатики

Института Археологии и Этнографии СО РАН



 
19 ноября 2007

Отчет Зав. сектора д.и.н. Ю.П.Холюшкина по информационным проектам САТИ на Ученом Совете ИАЭТ СО РАН

Информатизация в гуманитарном секторе науки – свершившийся факт и сегодня уже никто не спрашивает, нужна информатика или нет, поскольку сама идея возвращения к печатным машинкам и бумажным картотекам уже выглядит чудовищным анахронизмом. На сегодняшний день во многих гуманитарных институтах уже накоплен опыт работы с информационными технологиями (ИТ) как вспомогательным инструментом.

Осознание этого факта привело к созданию в Институте археологии и этнографии СО РАН специального подразделения – сектора археологической теории и информатики – для разработки и реализации комплексной программы информатизации археологической науки.

Изначально в направлении исследований сектора наметилось несколько направлений:

1. Разработка системной классификации археологического знания.

Создание системной классификации археологической науки велось на основе выдвинутой в 1985 году Е.Д.Гражданниковым гипотезы о существовании всеобщего периодического закона, применимого для упорядочения понятий не только археологической науки, но и других научных дисциплин (Гражданников, 1985).

Системная классификация основана на использовании множества классификационных фрагментов (структурных элементов системы), каждый из которых представляет собой некоторое метапонятие (иерархически упорядоченное подмножество понятий археологической науки и смежных дисциплин с выделением базового понятия).

С помощью упорядочения множества классификационных фрагментов выстраивается трехмерная универсальная классификационная модель археологического знания. В структуре иерархии каждого классификационного фрагмента фиксируются не только системные связи между понятиями, но и содержание соответствующего археологического понятия.

Это содержание модели фрагмента раскрывается сначала последовательным выделением в базовом (опорным) понятии иерархии уровней общности его смыслов. На каждом уровне естественным образом эти смыслы фиксируются в системе соответствующих более узких частных понятий. Таким путем содержание фрагмента представляется с помощью следующих друг за другом шести понятийных образований.

Подобная форма структурного представления позволила создать более обоснованную системную классификацию археологической науки, системную классификацию археологических понятий, системную археологическую периодизацию, системную классификацию качественного цитирования публикаций и др. Очень важным является то, что новый метод рождается в компьютерный век, когда все более острой становится потребность в создании высокоинтеллектуальных информационных систем (Холюшкин, Гражданников, 2000).

2. Портал знаний. Одним из главных направлений использования системной классификации археологического знания является портал знаний по археологии и этнографии, разработанный сотрудниками сектора в содружестве с Институтом систем информатики СО РАН. Его создание ориентировано на наиболее адекватный способ представление и структурирование предметных знаний по археологии и этнографии в глобальной сети. Решение этой задачи предполагает не только обеспечение целостного представления предметной области археологии и смежным дисциплин, но и навигацию по релевантным ей информационным ресурсам и легко настраиваемый на выбранную область знаний контент. Концептуальная и информационная основа портала в форме онтологии предметной области включает четыре базовых иерархии (иерархия разделов, иерархия объектов, иерархия методов исследования, и иерархия научных результатов).

Основой для построения иерархий понятий онтологии по археологии и этнографии послужила предложенная в (Холюшкин, Гражданников, 2000; Холюшкин, 2004) и развиваемая в настоящее время одним из авторов доклада системная классификация археологической науки, фиксирующая явные и неявные связи между используемыми в ней понятиями. Привязка понятий системной классификации к онтологии портала производится таким образом, что понятия системной классификации используются для построения классов и доменов онтологии и для создания экземпляров понятий онтологии.

Так, некоторые понятия системной классификации объявляются классами онтологии и образуют упрощенную иерархию наследования. Это могут быть научные результаты (гипотеза, археологический факт, научное достижение и открытие), объект исследования (артефакт, комплекс), методология (методики и методы).

3. Музейные и библиотечные технологии

Интернет открывает новые возможности для решения многих актуальных проблем существующих реальных музеев и библиотек. Глобальная сеть интегрировать распределенные информационные ресурсы в единое пространство на использования международных стандартов описания (CIMI, RUSMARK) и протоколов открытого доступа и обмена данными (протокол Z39.50). На этой основе в Институте были создана библиотечная система на основе WinISIS. В ходе реализации музейного проекта впервые за Уралом был введен для всеобщего доступа масштабный информационный ресурс, включающий в себя агрегатор новостных лент (RSS), каталог коллекций в стандарте CIMI,выставки (flash), каталог музейных сайтов, словарь, галерею случайных изображений, публикации по музейной тематике, поиск с генерацией виртуальных музейных залов по запросам посетителей музея. В качестве отдельного компонента ресурса разработан виртуальный музей, построенный на основе технологий виртуальной реальности с кинозалом с видео и аудио коллекциями.

4. Методика статистической обработки археологической информации

В Институте было разработано несколько оригинальных методов анализа данных, учитывающих специфические особенности археологической информации. Первые программы написаны на языке C++, ориентированные на устаревший формат файлов SPSS/PC+ для входных данных, вышедший из употребления с переходом пользователей с MS DOS на Windows. Последние разработки сделаны в виде макросов Excel, что позволило обойтись без программирования интерфейса пользователя, поскольку сама электронная таблица является интерфейсом для ввода табличных данных и вывода результатов анализа в виде диаграмм деловой графики.

В последнее время появилась мысль объединить все разрозненные программные разработки в едином пакете и сделать их доступным более широкому кругу пользователей с размещением на Web-сервере. Основные принципы проекта и из них требования:

1) сервер должен предоставлять пользователю следующие возможности:

– ввод, хранение и редактирование собственных данных пользователя. Данные должны сохраняться на сервере в течение сеанса работы и (для зарегистрированного пользователя) между сеансами. Кроме того, должна быть возможность сохранения данных на стороне клиента (то-есть, экспорт/импорт);

– доступ к архиву обобществленных данных (со ссылками на источник). Из общего архива данные могут быть скопированы в личный архив, после чего их можно редактировать и сохранять. Также необходима функция пополнения общего архива, хотя она может быть реализована не полностью автоматически, а с участием человека, администратора данных;

2) пользователи хорошо ориентируются в собственных данных, но не имеют специальной подготовки в методах статистического анализа. Поэтому:

– пользователю нужна добротная консультация по поводу того, в каких случаях следует применять эти методы и какие выводы можно сделать из полученных результатов. Другими словами, нужна развернутая обучающая подсистема, включающая тексты с описанием методов и примеры анализа реальных данных;

– пользователям, которых не устраивают шаблонные интерпретации методов, можно предложить самим разобраться в сущности этих методов, предоставив пошаговую демонстрацию производимых преобразований на "живых" данных. Каждый шаг при этом должен быть снабжен описанием, достаточным для понимания и самостоятельного воспроизведения процедур анализа;

3) научные сотрудники применяют методы анализа данных не только в процессе исследования, но и для подготовки научных публикаций. Для этого:

– вместе с выводом результатов аналитических расчетов система должна предлагать достаточно строгие и точные формулировки выводов. Разумеется, эти формулировки и выводимые результаты должны быть понятны исследователю и хорошо интерпретироваться;

– все графические иллюстрации должны быть информативными, выполнены на хорошем дизайнерском уровне и отвечать всем требованиям к рисункам в научных публикациях.

В описываемом проекте систему предполагается разместить на портале "Sibirica" [http://www.sati.archaeology.nsc.ru/sibirica/].