Возникновение и суть концепции GRID - BioinforMatix.ru - портал по биоинформатике, имейджингу и биософту

Возникновение и суть концепции GRID - BioinforMatix.ru - портал по биоинформатике, имейджингу и биософту

Возникновение и суть концепции GRID

Печать E-mail
Автор Неизвестен   
16.11.2008 г.
Вообще-то концепция grid появилась еще в конце 60-х годов и как огромное число других ИТ- инноваций ее рождение и развитие многие годы было связано с фундаментальными научными исследованиями. Идея тут лежит на поверхности: использование для вычислений свободные ресурсы компьютеров. Это проблема было особенно актуальна 25-35 лет назад, когда для построения серьезных математических моделей были нужны мощности суперкомпьютерных центров, которых тогда в мире было совсем не много. А технически задача решалась также довольно просто, так как речь шла о разовых вычислительных заданий, без очень жестких требований по их реализации.

До сколь-нибудь широкого применения в сфере бизнеса в те времена технология grid не дошла. С одной стороны, тут сказались чисто технические причины: организовать динамическое перераспределение распределенных ресурсов для огромного числа разнородных задач — это очень непросто (в отличие от ограниченного числа уникальных научных задач). С другой — актуальность самой проблемы отошла на второй план, так как именно в 70-е годы начался небывало быстрый рост мощностей автономных компьютеров.

Сам же термин "грид" (grid - решётка) возник в середине 90-х годов и обозначал распределенную вычислительную инфраструктуру для сложных инженерных и научных расчетов. Постоянный прогресс в этой области и решение все новых классов задач привели к расширению понятия. В настоящее время концепция grid (название предложено по аналогии с электрическими сетями -- electric power grid) состоит прежде всего в глобальной интеграции компьютерных ресурсов.

Если WWW можно охарактеризовать как глобальный доступ к текстовой и графической информации, то grid - это возможность вычислений на глобальных компьютерных ресурсах. Вычисление означает использование процессора и дисков удаленных компьютеров. Соответственно владельцы компьютеров должны принимать решение о допуске "посторонних" пользователей на более продуманной и надежной основе.

Сейчас каждый знает термин software - программное обеспечение для решения самых различных задач на конкретном компьютере. Также все знают термин hardware - собственно компьютеры. А для управления работой географически распределенными grid-системами необходим новый тип программного обеспечения - middleware. Поэтому сегодня, говоря о grid, обычно имеют в виду промежуточное ПО (middleware), программный инструментарий и прикладные программы, способные работать в географически распределенной и неоднородной вычислительной среде.

В глобальных grid-системах в качестве средства middleware используют так называемый Globus Тoolkit - инструментарий, разработанный американскими учеными, который стал de facto мировым стандартом. Он включает в себя, в частности, специальный протокол на основе HTTP для использования вычислительных ресурсов GRAM (Grid Resource Allocation Management); расширенную версию протокола для передачи файлов GridFTP; службу безопасности GSI (Grid Security Infrastructure); распределенный доступ к информации на основе протокола LDAP; удаленный доступ к данным через интерфейс GASS (Globus Access to Secondary Storage).

Одно из ранних (1998 г.) определений вычислительного grid, данное Карлом Кессельманом и Яном Фостером, гласит: «Вычислительный grid является программно-аппаратной инфраструктурой, которая обеспечивает надежный, совместимый, повсеместный и недорогой доступ к вычислительным ресурсам большой мощности». Затем, в 2000 году, к этому определению добавилось «координированное распределение ресурсов и решение проблем в динамических виртуальных организациях». По предложению Яна Фостера, систему можно называть grid, если она:

  1. Координирует ресурсы, которые не контролируются централизованно. Например, объединяются компьютерные системы, находящиеся в разных организациях или разных административных единицах одной компании. Система должна решать вопросы политики доступа, безопасности, оплаты услуг и т.   д ., которые возникают в гетерогенных системах. В ином случае можно говорить о локально управляющейся системе;
  2. Задействует открытые, стандартные протоколы и интерфейсы общего назначения. Эти протоколы и интерфейсы используются для решения таких базовых вопросов, как аутентификация, авторизация, поиск ресурсов и доступ к ним. Если протоколы не являются стандартными и открытыми, система является специализированной в отношении приложения;
  3. Предоставляет новое качество. Объединяя различные ресурсы, grid позволяет предоставить новый уровень сервиса с точки зрения времени отклика, пропускной способности, доступности, безопасности и т.  д . Иными словами, польза от всей системы существенно больше, чем от простой суммы составляющих ее частей.

Исходя из этих критериев, например, из определения grid выпадают кластерные системы. Будучи инсталлированы, они обеспечивают заданный уровень безопасности, качества обслуживания и других характеристик. Однако эта система не является grid из-за полного контроля над индивидуальными компонентами и скорее подходит под определение конструкции с централизованным управлением. С другой стороны, Интернет не может называться grid — хотя доступ к распределенным системам здесь обеспечивается с помощью стандартизованных и открытых протоколов, эти ресурсы не используются координированно.

Поскольку определение grid-технологии носит весьма общий характер, компании реализуют ее самыми разными способами. Так, Sun Microsystems продвигает ПО для создания grid-кластеров. Фирмы Entropia, United Devices и др. концентрируются на построении grid-сетей из ПК. IBM делает упор на применении этой технологии для развития Web-сервисов и автономных самоуправляющихся систем. SGI предлагает пользователям совместно работать в дистанционном режиме над большими наборами трехмерных изображений. Platform Computing, пионер в данной области, выпускает средства для построения неоднородных корпоративных grid-систем, обладающих широкими возможностями совместного использования ресурсов и управления. Однако, несмотря на явные различия, все эти предложения воплощают общую идею: включение компьютеров разного типа в единую систему для совместного использования ресурсов с целью повышения общей производительности и масштабируемости и предоставления пользователям возможности коллективной работы с данными.

Сейчас grid находится в том состоянии, в котором технология Web была десять лет назад. Хотя уже реализовано немало новаторских проектов, поистине глобальной grid-сети еще не существует. Однако, похоже, что она уже не за горами. Ведь имеются все основные компоненты, необходимые для ее создания: скоростные оптические линии связи, быстродействующие процессоры, компьютерные архитектуры с массовым параллелизмом, коммуникационные протоколы, ПО для управления распределенными вычислениями, средства защиты и методы электронной коммерции. Надежду вселяет и то, что потребность в grid уже назрела. В мире накопились огромные компьютерные ресурсы, значительная часть которых пропадает зря. Осталось только доработать и адаптировать grid-технологию. И тогда, возможно, произойдут любопытные перемены. Ведь многие специалисты считают, что grid произведет такую же революцию в области вычислительной обработки, какую сеть Интернет произвела в сфере коммуникации.

Но чтобы grid-технология обрела зрелость, надо дополнить стандартные протоколы всевозможными вспомогательными средствами: защитой данных и коммуникаций, мощными механизмами аутентификации, универсальными форматами данных (здесь большие надежды возлагаются на XML), методами управления распределением ресурсов, учета потребления ресурсов пользователями и приложениями, обработки отказов и распределенного администрирования.

ПЕТЕРБУРГСКИЙ ИНСТИТУТ ЯДЕРНОЙ ФИЗИКИ

Последнее обновление ( 09.04.2009 г. )
 
« Пред.   След. »


Copyright 2012 Bioinformatix.ru