Банк рефератов содержит более 364 тысяч рефератов, курсовых и дипломных работ, шпаргалок и докладов по различным дисциплинам: истории, психологии, экономике, менеджменту, философии, праву, экологии. А также изложения, сочинения по литературе, отчеты по практике, топики по английскому.
Полнотекстовый поиск
Всего работ:
364141
Теги названий
Разделы
Авиация и космонавтика (304)
Административное право (123)
Арбитражный процесс (23)
Архитектура (113)
Астрология (4)
Астрономия (4814)
Банковское дело (5227)
Безопасность жизнедеятельности (2616)
Биографии (3423)
Биология (4214)
Биология и химия (1518)
Биржевое дело (68)
Ботаника и сельское хоз-во (2836)
Бухгалтерский учет и аудит (8269)
Валютные отношения (50)
Ветеринария (50)
Военная кафедра (762)
ГДЗ (2)
География (5275)
Геодезия (30)
Геология (1222)
Геополитика (43)
Государство и право (20403)
Гражданское право и процесс (465)
Делопроизводство (19)
Деньги и кредит (108)
ЕГЭ (173)
Естествознание (96)
Журналистика (899)
ЗНО (54)
Зоология (34)
Издательское дело и полиграфия (476)
Инвестиции (106)
Иностранный язык (62791)
Информатика (3562)
Информатика, программирование (6444)
Исторические личности (2165)
История (21320)
История техники (766)
Кибернетика (64)
Коммуникации и связь (3145)
Компьютерные науки (60)
Косметология (17)
Краеведение и этнография (588)
Краткое содержание произведений (1000)
Криминалистика (106)
Криминология (48)
Криптология (3)
Кулинария (1167)
Культура и искусство (8485)
Культурология (537)
Литература : зарубежная (2044)
Литература и русский язык (11657)
Логика (532)
Логистика (21)
Маркетинг (7985)
Математика (3721)
Медицина, здоровье (10549)
Медицинские науки (88)
Международное публичное право (58)
Международное частное право (36)
Международные отношения (2257)
Менеджмент (12491)
Металлургия (91)
Москвоведение (797)
Музыка (1338)
Муниципальное право (24)
Налоги, налогообложение (214)
Наука и техника (1141)
Начертательная геометрия (3)
Оккультизм и уфология (8)
Остальные рефераты (21692)
Педагогика (7850)
Политология (3801)
Право (682)
Право, юриспруденция (2881)
Предпринимательство (475)
Прикладные науки (1)
Промышленность, производство (7100)
Психология (8693)
психология, педагогика (4121)
Радиоэлектроника (443)
Реклама (952)
Религия и мифология (2967)
Риторика (23)
Сексология (748)
Социология (4876)
Статистика (95)
Страхование (107)
Строительные науки (7)
Строительство (2004)
Схемотехника (15)
Таможенная система (663)
Теория государства и права (240)
Теория организации (39)
Теплотехника (25)
Технология (624)
Товароведение (16)
Транспорт (2652)
Трудовое право (136)
Туризм (90)
Уголовное право и процесс (406)
Управление (95)
Управленческие науки (24)
Физика (3462)
Физкультура и спорт (4482)
Философия (7216)
Финансовые науки (4592)
Финансы (5386)
Фотография (3)
Химия (2244)
Хозяйственное право (23)
Цифровые устройства (29)
Экологическое право (35)
Экология (4517)
Экономика (20644)
Экономико-математическое моделирование (666)
Экономическая география (119)
Экономическая теория (2573)
Этика (889)
Юриспруденция (288)
Языковедение (148)
Языкознание, филология (1140)

Реферат: Дальневосточное отделение

Название: Дальневосточное отделение
Раздел: Остальные рефераты
Тип: реферат Добавлен 13:33:49 20 сентября 2011 Похожие работы
Просмотров: 6 Комментариев: 0 Оценило: 0 человек Средний балл: 0 Оценка: неизвестно     Скачать

РОССИЙСКАЯ АКАДЕМИЯ НАУК

ДАЛЬНЕВОСТОЧНОЕ ОТДЕЛЕНИЕ

ТИХООКЕАНСКИЙ ОКЕАНОЛОГИЧЕСКИЙ ИНСТИТУТ

ИМ. В.И. ИЛЬИЧЕВА

ЕДИНАЯ ГОСУДАРСТВЕННАЯ СИСТЕМА ИНФОРМАЦИИ ОБ ОБСТАНОВКЕ В МИРОВОМ ОКЕАНЕ

(ЕСИМО)

Протокол опытной эксплуатации №_1 _

Дата 4 сентября 2007 г.

ТЕХНОЛОГИЯ АГРЕГИРОВАНИЯ МАССИВОВ ОКЕАНОГРАФИЧЕСКИХ И ГИДРОМЕТЕОРОЛОГИЧЕСКИХ ПО ЯПОНСКОМУ МОРЮ

Часть 1. Решение задач анализа климатических изменений

Общее описание технологии, версия 1.0.0 от 23.08.2007

Владивосток 2007
Содержание

1Введение

4

1.1 Цель

4

1.2 Обзор документа

4

1.3 Основные определения

5

1.4 Порядок ведения и использования

5

1.5 Нормативные ссылки

6

2 Назначение

7

2.1 Вид деятельности технологии

7

2.2 Перечень объектов автоматизации

7

2.2.1 Комплексная база данных

7

2.2.2 Программные средства технологии

9

2.2.2.1 Коммерческие программные продукты

9

2.2.2.2 Специально разработанные программные продукты

10

2.3 Перечень функций, реализуемых технологией

10

3 Описание технологии

11

3.1 Общая схема функционирования технологии

11

3.2 Общая структура технологии

11

3.3 Назначение компонент технологии

11

3.4 Программы стандартизованной статистической обработки, спектрального, корреляционного и кластерного анализа данных

12

3.5 Библиотека исходных текстов на языке Фортран

12

4 Описание компонент

13

4.1 Подготовка исходных данных

13

4.1.1 Сеточные данные температуры поверхности океана (ТПО)

13

4.1.2 Данные климатических индексов

13

4.1.3 Данные метеонаблюдений на метеостанциях

13

4.1.4 Данные наблюдений за стоком рек и ледовитостью морей

13

4.2 Специальные средства агрегирования данных

14

4.3 Подготовка выходной информации

15

5 Описание применения

16

5.1 Технологический процесс

16

5.2 Условия применения

16

6 Документация технологии

17

Список использованных источников

18

Лист изменений

19


1 Введение

1.1 Цель

Целью документа является описание информационной технологии агрегирования массивов океанографических и гидрометеорологических данных для решения задач анализа климатических изменений вод Японского моря.

Документ содержит общие сведения о построении технологии, ее компонентах, методах и средствах функционирования и предназначен для разработчиков и пользователей технологий ЕСИМО.

Разработка документа выполнена в лаборатории 1/5 информатики и мониторинга океана ТОИ ДВО РАН Дмитриевой Е.В. (e_dmitrieva@poi.dvo.ru) в соответствии с действующими положениями и руководящим нормативным документом [1].

1.2 Обзор документа

Настоящий документ состоит из следующих разделов:

Раздел 1 «Введение»

Раздел 2 “Назначение” – описывается вид деятельности, для автоматизации которой предназначена технология; дается перечень объектов автоматизации, задействованных в технологии и приводится перечень функций, реализуемых технологией.

Раздел 3 “Описание технологии” включает описание общей схемы функционирования технологии, дается общая структура технологии и назначение ее отдельных компонент; приводятся сведения о технологии в целом и ее компонентах в части методического (математического), программного, информационного и организационного обеспечения технологии.

Раздел 4 “Описание компонент” содержит общее описание каждой компоненты (назначение, структура, функции)

Раздел 5 «Описание применения» включает общее описание технологического процесса обработки данных; порядок и регламент выполнения основных работ технологии, а также программно-технические характеристики (состав и характеристики операционных систем, СУБД, ГИС и другого общего программного обеспечения, минимально необходимый набор вычислительных средств и иного оборудования для бесперебойной работы технологии, условия организационного характера и др.)

Раздел 6 “Документация технологии” содержит перечень и краткая характеристика разработанной и предъявляемой к испытаниям документации.

1.3 Основные определения

1.3.1 Автоматизированная информационная технология - совокупность методов, производственных и программно-технологических средств, объединенных в технологическую цепочку, обеспечивающая специализированную обработку и вывод агрегированной информации с привлечением ручных операций и с применением методов и средств вычислительной техники и систем связи.

1.3.2 Компонент технологии - часть технологии, рассматриваемое как единое целое, выполняющее законченную функцию и применяемое самостоятельно.

1.3.3 Программно-технический комплекс – это совокупность средств вычислительной техники, программного обеспечения и средств создания и заполнения информационной базы. Комплекс – это основная часть компонента технологии, причем сам компонент может состоять из одной или нескольких комплексов.

1.3.4 Информационная база данных технологии - это совокупность упорядоченной информации, используемой при функционировании информационной технологии.

1.3.5 Массив информации (данных) - это систематизированная совокупность однородных по структуре данных, логическая единица информационной базы данных. Массив информации может быть представлен в виде базы данных СУБД/ГИС или наборов данных в виде системы файлов данных.

1.3.6 Рабочая документация на информационную технологию - комплекс взаимоувязанных документов, в котором полностью описаны все решения по созданию и функционированию технологии.

1.4 Порядок ведения и использования

Разработка и сопровождение технологии осуществляется в лаборатории 1/5 информатики и мониторинга океана ТОИ ДВО РАН. В рамках сопровождения технологии проводится консультационное обслуживание. Использование технологии должно быть не противоречивым положениям Закона РФ об интеллектуальной собственности [2].

Для технологии устанавливается следующая схема назначения версий:

1. Первая цифра изменяется в случае кардинальных изменений.

2. Вторая цифра изменяется в случае существенных изменений.

3. Третья - в случае уточнений, исправления ошибок, незначительных поправок.

Текущая версия - 1.0.0. Помимо версионности всей технологии вводится версионность каждой компоненты технологии. Это связано с тем, что изменения в пределах компонент могут быть внесены, но не затрагивать технологию в целом.

1.5 Нормативные ссылки

ГОСТ 19.001-77 ЕСПД. Общие положения.

ГОСТ 19.101-77 ЕСПД. Виды программ и программных документов (переиздан в ноябре 1987 г. с изменениями).

ГОСТ 19.103-77 ЕСПД. Обозначение программ и программных документов.

ГОСТ 19.105-78 ЕСПД. Общие требования к программным документам.

ГОСТ 19.401-78 ЕСПД. Текст программы. Требования к содержанию и оформлению.

ГОСТ 19.402-78 ЕСПД. Описание программы.

ГОСТ 19.504-79 ЕСПД. Руководство программиста.

ГОСТ 19.781-90. Обеспечение систем обработки информации программное.

ГОСТ 34.201-89 Виды, комплектность и обозначение документов при создании автоматизированных систем.

РД 50-34_698-90 Методические указания. Информационная технология. Комплекс стандартов и руководящих документов на автоматизированные системы.

Системный проект Единой системы информации об обстановке в Мировом океане. Утвержден заказчиком подпрограммы ЕСИМО Росгидрометом (январь, 2001 года).


2 Назначение

Технология агрегирования массивов океанографических и гидрометеорологических данных по Японскому морю предназначена для совместного анализа океанографической, гидрологической и метеорологической информации с использованием модели взаимосвязанных реляционных баз данных[3]. Целью агрегирования данных является выделение главной составляющей информации за счет отказа от второстепенной.

2.1 Вид деятельности технологии

Данная технология рассматривает понятие агрегирование как процесс позволяющий объединять данные в группы, содержащие совокупную информацию: (1) выбранную согласно заранее некоторым критериям и/или (2) преобразованную при помощи различных алгоритмов. Основные виды деятельности в рамках технологии:

- описание концептуальной модели для совокупности данных, подлежащих агрегированию [4];

- приведение форматов исходных данных к виду необходимому для ввода в базу данных, согласно модели данных;

- формирование и ведение базы данных для выполнения запросов и производства расчетов;

- комплектование базы данных производными массивами данных;

- получение справочной информации;

- агрегирование данных как по временной шкале (сезонной, годовой), так и по статистическим аспектам (средние, минимальные, максимальные, временные ряды, сглаженные фильтрами с различными окнами);

- агрегирование данных как результат применении спектрального, корреляционного анализа;

- построение тематических карт;

- графическое представление результатов агрегирования.

2.2 Перечень объектов автоматизации

К объектам автоматизации технологии в первую очередь относятся данные по морской природной среде, а также используемые программные средства, как коммерческого происхождения, так и специально разработанные для нужд технологии агрегирования

2.2.1 Комплексная база данных

Комплексная база данных технологии содержит разнообразные данные по морской природной среде, полученных с помощью разработанных программных средств усвоения данных из различных источников, состоящих из временных рядов, полей метеорологических и океанографических характеристик для Японского моря и района северо-западной Тихоокеанской окраинной зоны.

Использовались следующие классы исходной информации, включающей данные метеорологических и океанографических наблюдений, глобальные поля ТПО и атмосферных характеристик, индексы атмосферной и океанической циркуляции, числа Вольфа солнечной активности:

Класс данных «Температура поверхности океана » представлен тремя источниками:

(1) НАDLEY SST –среднемесячными значениями ТПО за период с 1870 - 2006 гг. на одноградусной сетке по всему мировому океану (http://hadobs.metoffice.com/);

(2) JMA SST - среднемесячными значениями ТПО за период с 1848 - 2000 гг. на одноградусной сетки по району :15º -60º с.ш., 111º -180º в.д.;

(3) JMA SST - среднесуточными значениями ТПО за период с 1996 по 2006 гг. на четверть градусной сетки по району:20º -60º с.ш., 111º -160º в.д. (http://near-gos1.jodc.go.jp/cgi-bin/1997/near_goos_catalog).

Класс данных «Значения температуры, солености скорости звука в узлах сетки на стандартных горизонтах» представлен сеточным массивом данных по модели GDEM (Глобальный массив климатических данных по температуре, солености и скорости звука - GDEM (Generalized Digital Environmental Model, Version 2.5, 1998)(http://128.160.23.42/gdemv/gdemv.html ).

Класс данных «Солнечная активность» представлен числами Вольфа - ежедневными значениями с 1860- 2006 гг. (http://sidc.oma.be/sunspot-data).

Класс данных «Расходы рек» представлен:

(1) среднемесячными значениями стока реки Амур в Хабаровске и поселке Богородское, расположенном вблизи устья, с 1896 -2004 гг.;

(2) значениями стока реки Раздольная в устье за теплый (безледовый) и холодный (ледовый) периоды годы с 1930-2003 гг.

Класс данных «Морской ледяной покров» представлен:

(1) среднемесячными значениями сплоченности ледяного покрова с 1870- 2006 гг. (http://hadobs.metoffice.com);

(2) среднедекадными значениями ледовитости Охотского моря (1957-2004 гг.) и Татарского пролива Японского моря с 1960 -2004 гг., среднемесячными значениями за 1929-1960 гг. (Крындин, 1964, Столярова, 1977).

Класс данных «Метеорологические наблюдения» представлен:

(1) среднесуточными значениями температуры воздуха, осадков, скорость ветра, атмосферного давления по метеорологических станциях с 1994 - 2006 г.

(hftp://ftp.ncdc.noaa.gov/pub/data/globalsod );

(2) среднемесячными значениями температуры воздуха на метеостанциях мира (периоды наблюдений до 2006г.);

(3) среднемесячными значениями давления в центре сибирского антициклона с 1891-2006 гг.

Класс данных «Климатические индексы системы океан – атмосфера» представлены средними месячными значениями шести климатических индексов:

(1) Leading PC of monthly SST anomalies in the North Pacific Ocean (PDO) с 1900-2006 гг. (http://jisao.washington.edu/pdo/PDO.latest);

(2) Arctic Oscillation (АO) - 1899-2002 г; и 1950-2006 г. (http://www.atmos.colostate.edu/ao/Data);

(3) Multivariate ENSO Index (MEI) с 1950-2006 г. (http://www.cdc.noaa.gov/people/klaus.wolter/MEI/table.htmll);

(4) North Pacific Index (NPI) – 1899-2006 г. (http://www.cgd.ucar.edu/cas/jhurrell/indices.data.html#nam);

(5) Southern Oscillation Index (SOI) с1864-2006 г. (http://www.bom.gov.au/climate/glossary/soi.shtml);

(6) Aleutian Low Pressure Index (ALPI) с 1900- 2004 г.

Класс данных «Поля атмосферного реанализа» представлен средними месячными значениями атмосферных осадков и давления на уровне моря, зональной и меридиональной составляющими скорости ветра, температуры воздуха, заданными в узлах 2.5 градусной сетки за период 1948-2006 г. (Источник NCEP NCAR).

Класс данных «Океанографические наблюдения (съемки)» представлен интегрированными базами океанографических данных ТОИ (http://www.pacificinfo.ru).

2.2.2 Программные средства технологии

2.2.2.1 Коммерческие программные продукты

Коммерческие программные продукты, используемые в технологии агрегирования (помимо операционной системы) включают в себя:

- систему управления базами данных (СУБД) Paradox 11 (разработчик – фирма Correl, США);

- программный пакет Microsoft Office Excel 2003 (разработчик – фирма Microsoft);

- программное средство построения тематических карт Surfer 8.0 (разработчик – фирма Golden Software, США);

- программное средство анализа данных и вычисления статистических характеристик временных рядов Statistica (разработчик – фирма StatSoft, США);

- программное средство для графического отображения и анализа временных рядов OriginPro ((разработчик – фирма OriginLab Corporation);

- Microsoft developer Studio 4.0 и компилятор языка Фортран фирмы Microsoft.

2.2.2.2. Специально разработанные программные продукты

Технология включает следующие специально разработанные программные приложения:

- программы выборки подмножества данных, удовлетворяющего заданным условиям, из совокупности последовательных наборов данных (для массивов временных рядов НАDLEY SST, JMA SST);

- программы переформатирования данных различных форматов атмосферных индексов для загрузки в СУБД;

- пакет программных средств, состоящий из отдельных процедур расчета статистических оценок вероятностных характеристик для полей временных рядов;

- программы формирования выходной продукции в стандартном виде.

2.3 Перечень функций, реализуемых технологией

Технология агрегирования ориентирована на выполнение отдельных технологических этапов:

- формирование ведение специализированной базы данных;

- формулировка условий запроса к БД и его выполнения в среде БД;

- получение производных расчетных характеристик;

- получение мощностей спектров временных рядов;

- восполнение отсутствующих данных во временных рядах;

- фильтрация данных окнами различного размера;

- расчет стандартных статистик;

- получение вероятностных оценок;

- кластеризация совокупности временных рядов;

- получение выходной продукции в табличном виде;

- формирование выходной продукции технологии в графическом виде;

- создание тематических карт по гидрометеорологическим параметрам.

Вся функциональность технологии в основном основана на различных программных продуктах, включенных в технологию (п.2.2.2).


3 Описание технологии

3.1 Общая схема функционирования технологии

Общая функционально-логическая схема технологии агрегирования данных состоит из следующих основные компонентов:

1) Подготовка входной информации в табличном виде согласно модели данных.

2) Ввод данных в БД.

3) Работа с множеством взаимосвязанных таблиц в среде СУБД в том числе:

1. Получение справочной информации запроса к БД.

2. выборка необходимого подмножества данных.

3. агрегирование данных как по временной шкале, так и по статистическим аспектам.

4. подготовка выходной продукции в табличном виде, пригодном для ввода с специализированные пакеты анализа данных – Surfer, Statisica, Excel, OrignPro, программами Фортрана.

4) Статистическая обработка, фильтрация, кластерный и корреляционный анализ.

5) Подготовка выходной продукции в табличном виде.

6) Подготовка выходной продукции в виде тематических карт.

3.2 Общая структура технологии

Структура технологии такова, что отдельные технологические звенья выполняются независимо и общее согласование проводится только на уровне входных - выходных информационных потоков

3.3 Назначение компонент технологии

К «независимым» относится раздел компоненты «Подготовка входной информации в табличном виде согласно модели данных». По отдельным схемам выполняются блоки по видам, т.е. отдельно отрабатывается ветка океанографических данных, отдельно – метеоданных и т.п. Блок ввода данных стандартизован и реализован в виде СУБД-приложения на коммерческом программном продукте.

Получение справочной информации о составе и количественных характеристиках базы данных, выборка необходимого подмножества данных , агрегирование данных как по временной шкале (сезонной, годовой), так и по статистическим аспектам (средние, минимальные, максимальные) организовано как результат работы специального запроса по образцу.

Для статистической обработки , фильтрации , кластерного и корреляционного анализа данные выбираются из БД, далее независимо выполняется содержательная обработка пакетами Statistica/Excel/Origin (пожеланию), затем преобразованные данные по необходимости заносятся в базу.

Подготовка выходной продукции в табличном виде отрабатывается независимым программным приложением, входные данные забираются из базы, затем преобразуются в специальные структуры формата *.csv.

Для получения выходной продукции в графическом виде или в виде тематических карт используется один из предлагаемых независимых программных продуктов

3.4 Программы стандартизованной статистической обработки, спектрального, корреляционного и кластерного анализа данных

Простейшие виды агрегирования, такие как получения среднемесячных, сезонных, среднегодовых пространственных осреднений, легко осуществляются в среде СУБД Paradox.

Программы стандартизованной статистической обработки, спектрального, корреляционного и кластерного анализа данных входят в состав предлагаемых пакетов статистического анализа данных, таких как Statistica, Excel, OriginPro. В рамках данной технологии они выполняются для анализа небольшой (до 40 единиц) совокупности временных рядов. Для анализа совокупности временных рядов (полей) соответствующих, например, узлам одноградусной сетки Японского моря и прилегающих к нему акваторий, используются специальные программы, написанные на Фортране или пакет Matlab (например спектральный анализ временных рядов, соответствующих узлам одноградусной сетки для Японского моря).

3.5 Библиотека исходных текстов на языке Фортран для статистического анализа данных

В настоящее время в библиотеку исходных текстов на языке Fortran включены следующие программные средства:

- Вычисление линейного тренда.

- Кросс-корреляция для временных рядов.

- Расчет аномалий для временных рядов.

- Расчет кумулятивных аномалий для временных рядов.


4 Описание компонент

4.1 Подготовка исходных данных

Компонента «Подготовка исходных данных» разделяется по видам данных.

4.1.1 Сеточные данные температуры поверхности океана (ТПО

Технология подготовки временных рядов ТПО соответствующих узлам сетки включает в себя следующие этапы:

1) Выборка подмножества данных, удовлетворяющего заданным условиям, из совокупности последовательных наборов данных (для массивов временных рядов ТПО - НАDLEY SST(1891-2007), JMA SST (1996-2007). Этап необходим из-за громадного объема исходных данных соответствующего узлам сетки всего Мирового океана.

2) Приведение исходных данных к виду, пригодному для ввода в БД.

Эти функции реализована на языке Фортран.

4.1.2 Данные климатических индексов

Все временные ряды климатических индексов, перечисленных выше, взяты с различных интернетовских сайтов, в табличном виде, поэтому легко заносятся в БД, подвергаясь минимальной обработке в среде EXCEL.

4.1.3 Данные метеонаблюдений на метеостанциях

Технология подготовки ежесуточных метеонаблюдений на метеостанциях мира включает в себя следующие этапы:

- выборка метеостанций соответствующих акватории Японского моря и прилегающих акваторий

- первичная обработка исходных данных, включая перевод данных в метрическую систему;

- запись данных в базу.

В соответствии с этим разработаны программные средства на языке Фортран для этого раздела технологии:

- отбор данных наблюдений по заданным координатам (станции по району, станции стандартных разрезов и др.) и за определенный период времени;

- проведение преобразования данных в метрическую систему.

После проведения всех вышеперечисленных процедур, данные загружаются в БД.

4.1.4 Данные наблюдений за стоком рек и ледовитостью морей

Технология подготовки данных наблюдений за стоком рек и ледовитостью морей включает в себя следующие этапы:

- преобразование форматов исходных данных;

- восполнение пропусков данных;

- запись в БД.

Все программные средства (ПС) этого блока технологии разделяются на отдельные ПС, которые преобразуют данные и производят запись в БД.

4.2. Специальные средства агрегирования данных

Специальные средства включают спектральный, кластерный, корреляционный анализ, сглаживание временных рядов

Спектральный анализ

В рамках данной технологии для агрегирования данных с применением спектрального анализа использовался пакет Statistica. Цель анализа - разложить комплексные временные ряды с циклическими компонентами на несколько основных синусоидальных функций с определенной длиной волн. Применялся алгоритм быстрого преобразования Фурье. Вычислялись дисперсии данных на соответствующей частоте (периодограммы) [5,6,7].

Кластерный анализ

В рамках данной технологии для агрегирования данных методом кластеризации использовался пакет Statistica [5,6,7]. Кластерный анализ включает в себя набор различных алгоритмов классификации. В результате кластеризации заданная совокупность объектов A1,...,An агрегируется в небольшое количество групп – кластеров X1,...,XR. В кластерном анализе объединение объектов в группы производится, исходя из их сходства или различия, которое оценивается степенью близости объектов, выражаемой некоторой метрикой в признаковом пространстве. Кластер определяется, как совокупность точек, лежащих на расстоянии не больше, чем r от некоторого "центра тяжести" в m –мерном пространстве (внутри гиперсферы радиуса r или гиперкуба со сторонами 2r ).

В данной технологии применен метод иерархический кластерного анализа. Сущность иерархического метода заключается в том, что кластеризация начинается с рассмотрения отдельных объектов (например, кривых годового хода), и постепенно происходит их упорядочение в отдельные группы – кластеры, которые, в свою очередь, также могут образовать новые кластеры. Алгоритм использует меру сходства – расстояние в двумерном (X,Y) Евклидовом пространстве.

В качестве основного метода иерархического кластерного анализа был принят метод Варда. Этот метод отличается от всех других методов, поскольку он использует методы дисперсионного анализа для оценки расстояний между кластерами. Метод минимизирует сумму квадратов (SS) для любых двух (гипотетических) кластеров, которые могут быть сформированы на каждом шаге[5,6,7].

Корреляционный анализ

В рамках данной технологии для агрегирования данных методом корреляционного анализа [5,6,7] использовались пакет Statistica и специальные программы на Фортране.

4.3 Подготовка выходной информации

Выходная продукция подготавливается в табличном виде как результат запроса к БД, а в графическом виде и табличном виде как результат работы специальных пакетов или в виде тематических карт.


5 Описание применения

5.1 Технологический процесс

Весь технологический процесс получения комплекта расчетных характеристик представляется в виде цепочки выполняемых функций технологии:

I. При помощи различных пакетов обработки данных (Фортран, Exel и т.п) проводится формирование исходных данных согласно описанной ранее модели данных.

II. В среде СУБД PARADOX осуществляется:

- ввод данных в БД;

- формулировка запроса к БД;

- обработка запроса и получение нужной совокупности данных;

- агрегирование данных: временное (получение месячных, сезонных, годовых статистических характеристик) и/или пространственное (увеличение размера сетки или относительно района исследования);

- получение расчетных характеристик на основе исходных данных ( плотность морской воды, скорость звука и т.п.);

- формирование выходных таблиц в форме пригодной для их дальнейшего использования в пакетах Surfer, Statistica, Origin, Exel, Fortran.

III. В среде пакетов Statistica, Origin, Exel, Fortran реализуется:

- получение вероятностных оценок временных рядов;

- получение вероятностных оценок полей временных рядов оценок (Fortran);

- получение мощности спектров временных рядов (Statistica);

- получение сглаженных временных рядов фильтрами различной мощности (Origin, Statistica);

- применение кластерного анализа для совокупности временных рядов (Statistica);

- применение корреляционного анализа для совокупности временных рядов (Statistica Fortran);

-получение выходной продукции в табличном виде или графическом виде (Statistica, Origin, Exel).

IV. В среде пакета Surfer создаются тематические карты по гидрометеорологическим параметрам.

5.2 Условия применения

Обязательными условиями применения технологии агрегирования являются:

- наличие действующих компонент технологии;

- наличие необходимых информационных ресурсов;

- соответствие поставленной пользователем задачи функциональности технологии.


6 Документация технологии

Документация на технологию подготовлена в соответствии с основными требованиями ЕСИМО и включает в себя настоящий документ. Этот документ содержит общие сведения о построении технологии, ее составляющих, методах и средствах функционирования. Он предназначен для использования в ТОИ ДВО РАН, являющимся организацией - поставщиком данных и информации в ЕСИМО.


СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ

1. Документация на информационные технологии ЕСИМО. Требования к содержанию и оформлению. – Обнинск: ГУ «ВНИИГМИ-МЦД». – 2006. – с.29.

2. Закон РФ «Об интеллектуальной собственности».

3. Мейер Д. Теория реляционных баз данных. М.: Мир.1987. 608 c.

4. Дмитриева Е.В., Ростов И.Д. Информационные ресурсы и технологии реализации баз океанографических данных в Дальневосточном регионе России. Новости ЕСИМО". Обнинск: изд. ВНИИГМИ-МЦД, вып. 16. 2003. 27 с.

5. http://www.kti.ru/data/103/modules/sttimser.html.

6. Боровиков В.П. STATISTICA: искусство анализа данных на компьютере. СПб.: Питер, 2003. 650 с.

7. Айвазян С.А., Бухштабер В.М., Енюков И.С., Мешалкин Л.Д. Прикладная статистика. Классификация и снижение размерности. М.: Финансы и статистика, 1989.


Лист изменений

№ п/п

Дата внесения изменений

Номер раздела, пункта, в который вносится изменение

Номер страницы, на которой вносится изменение

Содержание внесенного изменения

Подпись

Должность, Ф.И.О.

Оценить/Добавить комментарий
Имя
Оценка

Работы, похожие на Реферат: Дальневосточное отделение

Назад
Меню
Главная
Рефераты
Благодарности
Опрос
Станете ли вы заказывать работу за деньги, если не найдете ее в Интернете?

Да, в любом случае.
Да, но только в случае крайней необходимости.
Возможно, в зависимости от цены.
Нет, напишу его сам.
Нет, забью.



Результаты(222572)
Комментарии (3008)
Copyright © 2005-2019 BestReferat.ru bestreferat@gmail.com реклама на сайте

Рейтинг@Mail.ru