Технология Grid — путь из клетки - BioinforMatix.ru - портал по биоинформатике, имейджингу и биософту

Технология Grid — путь из клетки

Печать E-mail
Автор Михаил Попов   
27.11.2008 г.
За последние годы развитие вычислительных технологий достигло колоссального прогресса. Однако сегодня у многих складывается ощущение, что экстенсивное развитие — простое увеличение мощности процессоров, емкости накопителей, пропускной способности каналов — уже практически исчерпало свои ресурсы, и необходим качественный, концептуальный скачок в вычислениях.
 
Основа Grid — виртуализация ресурсов — идея сама по себе не новая. Новой является концепция разделения и совместного использования логических и физических устройств в сети. «Grid Computing можно обозначить как технологию распределенных вычислений в Интернете, — рассказывает вице-президент IBM по стратегическим бизнес-разработкам в странах Европы, Среднего Востока и Азии Мишель Тесседр. — Технологию Grid можно назвать третьим поколением Интернета. Его второе поколение мы наблюдаем сегодня. Для него характерно взаимодействие между двумя компьютерами: с одного мы можем присоединиться   к  другому и осуществить некую транзакцию. Третье поколение Интернета также позволит выполнять все это, но будет возможно и нечто большее: со своего компьютера вы сможете заставить работать на себя сеть компьютеров. В Интернете второго поколения компьютеры могут общаться с помощью XML. В Интернете третьего поколения роль универсального языка сможет выполнять OGSA (Open Grid Service Architecture — открытая архитектура Grid-сервисов), которая позволяет компьютерам не только общаться, но и совместно работать — в этом и заключается суть технологии. В качестве примера можно привести  новый ускоритель элементарных частиц, строящийся сейчас в исследовательском центре CERN в Швейцарии. Когда он будет завершен, объем генерируемых данных достигнет пяти петабайт в год. Эта информация будет распределяться по сотне компьютеров во всем мире. Исследователи, которым она нужна, смогут получить ее в уже обработанном виде с этой сотни компьютеров: таким образом, здесь присутствует не только виртуализация хранилищ данных, но и виртуализация обработки данных».
 
Развитие мощных компьютеров сегодня идет по пути параллельных вычислений, реализуемых внутри монолитных высокопроизводительных систем или же внутри кластеров, состоящих из однотипных вычислительных единиц. Grid представляет новое направление, позволяющее использовать вычислительную мощность и системы хранения данных в гетерогенных системах. Те, кто знаком с основами параллельного программирования, могут оценить колоссальную сложность реализации эффективного взаимодействия компьютеров в них. Попытки такого рода уже были (можно вспомнить академический проект Condor), однако даже самая остроумная реализация платформы не получит распространения без поддержки со стороны middleware и конечных приложений.
 

Сегодня Grid широко применяется в научной сфере — в качестве примеров можно привести не только вышеупомянутый ускоритель, но и UK Science Grid, а также национальный маммографический проект в Великобритании. Grid активно используется в молекулярной биологии для моделирования структуры белка, анализа последовательностей ДНК и других применений. Технология начинает проникать и в бизнес — в нефтяную отрасль, в геологоразведку. Есть примеры ее использования в банковском деле, на площадках трейдинга, для предсказания рисков, составления портфеля. В автомобильной промышленности Grid позволяет ускорить и удешевить расчет виртуальных крэш-тестов. Крупнейшие авиастроители, такие, как Airbus и Boeing, используют технологию для постоянного контроля состояния двигателей и других агрегатов и узлов самолета: показания датчиков, непрерывно собирающих информацию, через спутник передаются на землю, где и анализируются в сетях Grid. В телекоммуникационной отрасли потенциальной областью использования Grid являются онлайновые игровые системы, такие, как Butterfly.net. Вначале в Butterfly.net одновременно участвовали всего несколько тысяч игроков, но с марта этого года  к  игровой сети могут подключаться консоли Sony Playstation, так что количество игроков, встречающихся в онлайне, может составить около миллиона.

 

Image
 
IBM сама активно использует технологию Grid для внутренних нужд — по выражению Мишеля Тесседра, «мы сами едим то, что готовим»: «Основной областью использования в компании является моделирование при создании микропроцессоров следующих поколений, таких, как Power5 и Power6».
 
Путь «из науки в бизнес» является типичным для многих новых технологий и разработок — достаточно вспомнить хотя бы сам Интернет. Академическая среда оказывается более гибкой и восприимчивой, особенно  к  тому, что позволяет экономить средства. Путь Grid в бизнес лежит через тесную работу с партнерами — разработчиками программного обеспечения и с заказчиками. Иногда развитие может пойти по новому руслу. «Занимаясь развитием направления Grid в IBM, я очень интересуюсь мнением наших клиентов.
 
Не так давно они проявляли интерес  к  технологии, однако не очень хорошо представляли себе, как это все работает и чем может быть полезно в их бизнесе, и это привело нас  к  созданию Инновационного центра Grid в Монпелье, — рассказывает Мишель Тесседр. — Вначале мы считали, что Grid будет использоваться в основном для задействования простаивающих вычислительных компьютерных ресурсов с учетом нужд существующего ПО. Ведь производительность некоторых приложений может возрасти в десятки раз с минимальными затратами, путем, например, использования свободных вычислительных ресурсов ПК. Однако развитие пошло по другому пути — сейчас стало ясно, что 80–90% ПО составляют совершенно новаторские приложения, которые вообще не были бы возможны без Grid.
 
Например, у одного немецкого банка процедура расчета инвестиционных рисков занимала 13 часов. Теперь, с использованием технологии Grid на Unix-кластере, они рассчитывают риски каждые 15 минут. Другой пример из банковского сектора США: клиент, которому необходимо взять значительную ссуду, обычно сообщает об этом банку телефонным звонком с подробностями о своем бизнесе, о цели кредита и т. д.
 
В течение суток банк проводит анализ риска и сообщает клиенту о своем решении. Один из американских банков, внедривший у себя технологию Grid, сократил время на анализ риска с суток до одной минуты, так что ответ клиенту выдается сразу же. И в этом заключается конкурентное преимущество этого не самого крупного банка. Он никогда бы не купил компьютер достаточной для таких расчетов мощности и смог позволить себе такую услугу только благодаря технологии Grid».
 
Итак, во-первых, Grid позволяет вдохнуть новую жизнь в уже существующие технологии. И, во-вторых, Grid является основой для новых приложений, ранее не реализуемых. Нельзя сказать, что развитие идет без трудностей. Приложения, которые используются в бизнесе, да и в науке тоже, обычно приспособлены  к  какой-либо архитектуре и мало подходят для переделок.
 
Чтобы решить эту проблему, IBM взаимодействует с независимыми разработчиками из различных областей, заключая соглашение о «гридификации» их приложений, которое будет вестись совместными усилиями. IBM предоставляет поддержку Grid в программном и аппаратном обеспечении, а также выполняет координирующие функции. «Мы помогаем создавать ПО, использующее технологию Grid, для разных сегментов — автомобильной и авиапромышленности, финансового сектора, сельского хозяйства, разработки полезных ископаемых, биологии. П
 
ри этом применяется программное обеспечение как самой IBM, так и ее партнеров — WebSphere, Tivoli, DB2, GPFS, Globus и т. д. Очень важный момент для заказчика заключается в том, что он не покупает Grid, он строит Grid, решая свои бизнес-задачи. И мы можем помочь в этом построении», — говорит Мишель Тесседр.
 
 Во взаимодействии с разработчиками, однако, могут встречаться свои подводные камни. Следующим этапом развития должна стать «гридификация» бизнес-приложений — ERP и CRM, которая может столкнуться не с технологическими трудностями, но с проблемами иного рода. Более эффективное использование вычислительных ресурсов, которое дает Grid, может привести, например,  к  уменьшению количества продаваемых лицензий на ПО и тем самым войти в конфликт с моделью бизнеса, например, поставщика ERP-систем.
 
Может возникнуть вопрос, как производить расчет количества выдаваемых лицензий на ПО для вычислительного центра, предоставляющего свои ресурсы пользователям в разных странах. «Как скоро эти вопросы будут решены — неизвестно, однако рано или поздно это произойдет, потому что налицо давление со стороны заказчиков, а мы живем в век диктата заказчика», — подчеркивает Мишель Тесседр

С точки зрения разработчика, поддержка Grid реализуется в программных средствах нескольких уровней — на уровне системного ПО, middleware и конечных приложений. В прошлом году компанией IBM и проектом Globus была представлена совместная разработка системного уровня под названием «открытая архитектура сервисов Grid (Open Grid Service Architecture — OGSA)». Третья версия программного инструментария Globus Toolkit, которая включает в себя OGSA, должна выйти в июле под свободной лицензией.

ПО более высокого уровня — для построения кластеров и управления ими — будет частично открытым, частично — являться собственностью разработчиков. Многие разработки должны войти в программный пакет WebSphere. Тем, кто обдумывает внедрение Grid, в IBM советуют сосредоточиться на одном из приложений, важных для бизнеса в плане возврата инвестиций, и оценить возможность его внедрения с использованием Grid. Естественно, что технология сама по себе не приносит успеха, и в каждом конкретном случае необходимо решать вопрос о ее сочетаемости с практикой бизнеса.

Зачем IBM нужно не только разрабатывать Grid на системном уровне, но еще и делиться этими разработками со всеми остальными под свободной лицензией? Ведь, казалось бы, использование «дешевых» распределенных компьютерных мощностей, которые позволяет задействовать Grid, может отрицательно сказаться на бизнесе компании по продаже мощных монолитных вычислительных систем, которыми всегда была сильна IBM?

Во-первых, то, что не сделаешь ты, за тебя сделают конкуренты.

Во-вторых, многие приложения требуют больших вычислительных ресурсов на одной машине и не могут быть в достаточной степени параллелизованы. Кстати, в IBM подчеркивают, что Grid может быть реализована не только на Linux-кластерах, но и на любых архитектурах мощных SMP-серверов — и она присутствует в каждом крупном проекте высокопроизводительных систем, построенных компанией в прошлом году.

В каких областях можно применить Grid на развивающихся ИТ-рынках,  к  которым относится и российский? Мишель Тесседр считает, что технологии Grid могут быть использованы в первую очередь в государственных учреждениях и образовании: «Для вашей страны может оказаться очень выгодно использовать Grid-технологии на платформе Linux — это может сэкономить большие средства. В Европе некоторые местные правительства отказываются от ПО Microsoft в пользу Linux, пытаясь выбраться из клетки, в которую уже попали.

Мой совет — не попадайтесь в эту клетку. В некоторых областях, таких, как биологические исследования, нефтяная отрасль, финансовая отдача от использования Grid может быть получена уже в ближайшей перспективе. Начать необходимо с разработки приложений, технология Grid сама по себе не сделает вас богатыми». 

Последнее обновление ( 08.04.2009 г. )
 
« Пред.   След. »