Mi a grid?

Egy hagyományos házi számítógép a nap 95 százalékában nem végez munkát… Jelenleg tizenkét nyilvános, bárki számára elérhető grid, vagyis az otthoni pc-k kapacitását is kihasználó kutatási projekt fut a világban. Ezek közül a legfrissebb egy magyar kezdeményezés, mely a számrendszer-dimenziókat igyekszik feltérképezni. A grid-technológiát használják többek között klímakutatásra, gyógyszeripari projektekhez, de még az esetleges földön kívüli civilizációk nyomainak keresésére is. A számrendszerdimenzió-kutatás tehát csak egy a grid számos alkalmazási lehetősége közül.A grid története 1995-ben kezdődött, amikor is 17 észak-amerikai szuperszámítógépet kötöttek hálózatba, leginkább azért, hogy kiderítsék: egymástól nagy földrajzi távolságra lévő számítógépek számolási és tárolási kapacitásait a szélessávú adatátvitel segítségével fel tudják-e használni egyetlen, közös feladat elvégzésére. Ma a nyilvános gridekhez egy teljesen átlagos teljesítményí géppel, otthonról is csatlakozhat bárki egy program letöltésével. Ezek a hétköznapi felhasználók önkéntesen felajánlott kapacitást bocsátanak a kutatók rendelkezésére, akik egy szoftverrel szétküldik az egymástól bármilyen távolságra lévő, ugyancsak a program által hálózatba integrált számítógépekre a számítási feladatok részegységeit.
 
A csatlakozott felhasználók gépei a feladat elvégzése után visszaküldik az eredményeket a központi szervereknek, amelyek értelemszeríen nem végeznek számítási feladatokat, csak a kimenő és beérkező adatcsomagokat gyíjtik össze, és rendszerezik. Az ily módon tulajdonképpen a világ legerősebb szuperszámítógépévé összeépülő hálózat számítási és tárolási kapacitása csakis attól függ, hány felhasználót sikerült meggyőzni arról, hogy a projekt fontos tudományos eredményekkel szolgálhat. Az internet alapú információtovábbítási, tárolási és feldolgozási technológia míködtetéséhez tehát három összetevő szükséges, az említett alapprogram, a konkrét kutatási projekt és a processzoridőt felajánló géptulajdonos.

Virtuális szuperszámítógépek
Azt a programot, amelyet a 12 nyílvános internet-számítási projekt használ, a Berkeley Egyetemen fejlesztették ki. A BOINC (Berkeley Open Infrastructure for Network Computing – Nyitott Rendszer a Hálózati Számítástechnikáért) elnevezésí szoftver nyílt forráskódú, a különböző operációs rendszerek, processzortípusok és fordítóprogramok csaknem kétszázféle kombinációja alatt is fut. Desktop programról van szó, tehát azt, hogy éppen dolgozik a kliensgép, a képernyővédő aktiválódása jelzi a felhasználónak. A nagy számítási kapacitást igénylő feladat elvégzésére kifejlesztett program eredetileg a SETI@home projekt igényei szerint készült, ám aki telepíti számítógépére, bármelyik (vagy akár mindegyik!) nyilvános projekthez csatlakozhat. Ugyanaz a szoftver kerül fel tehát a számítógépünkre, ha a fehérjekutatásban kívánunk részt venni, mint ha az idegen lények lehetséges üzeneteinek begyíjtésére ajánlanánk fel pc-nk szabadidejét (természetesen az egyes projektek különböző segédszoftvereket használnak).

A program teljesen önmíködően, felhasználói beavatkozástól mentesen is míködik, illetve frissíti magát. Megoldották a program fejlesztői azt is, hogy a csatlakozó donorgépeket ne terheljék le képességeiket meghaladó számítási feladatokkal, s hogy az asztali számítógépek se „zaklassák” felesleges kérésekkel a szervereket, ezzel a folyamat összeomlását eredményezve. A szerverek feltörése ellen is védekeznek az egyes projektek üzemeltetői: a tízfalak míködtetésén és a magas biztonsági beállításokon túl azzal is, hogy minden futtatható állományt egy internettől független számítógépen aláírnak. Ennek eredményeképp elméletileg csekély rá az esély, hogy a donorok gépeire egyéb programokat telepítsenek.

Az egyes programokhoz csatlakozók dolga ennél nem is lehetne egyszeríbb, a kutatásokat megtervezők dolga viszont jóval komplikáltabb: a Berkeley programozói annak idején ugyanis nem fordítottak arra időt és energiát, hogy más projektek szervereinek konfigurálása, az egyes kutatások kiegészítő szoftvereinek hozzáigazítása az alapszoftver igényeihez és jellemzőihez minél zökkenőmentesebben történhessen. A BOINC ugyan nyílt forráskódú, és saját projektünkkel kompatibilis, de csak azután, hogy ezért alkalmazott informatikusaink alaposan megküzdöttek – hiszen nem kutathatunk ugyanazokkal az algoritmusokkal szabályos alakzatokba rendeződő rádiójelek, vagy a klímaváltozás okozta problémák megoldásai után.

Földönkívüli információk
A nyilvános gridek őse a sokak által legalább említés szintjén ismert, és ma is gőzerővel míködő SETI (Search for Extraterrestrial Intelligence). &Oumlt év alatt mutatta fel az első részeredményt, amikor is egy gigantikus méretí adatösszesítés (nagyjából 1 millió évnyi komputeridő alatt gyíjtött információmennyiség, 5 milliárd jel feldolgozása) után kijelölték a 200 „leggyanúsabb” célpontot, melyek közelebbi vizsgálatát is megkezdték. A világ pillanatnyilag legnagyobb szuperkomputereként ismert griddel a 300 méteres átmérőjí arecibói rádióteleszkóptól a BOINC-on keresztül érkező adatcsomagokból számított eredményeket rendszeresen a NASA-hoz továbbítják. Mára több mint 5 millió földlakó csatlakozott a rádiójel-vadászathoz.

S hogy járhat-e ez a hajsza bármilyen eredménnyel? Seth Shostak, a SETI vezető csillagásza szerint már akár egy emberöltőnyi időn belül is! A Drake-formula (egy hétváltozós képlet az esetlegesen az Univerzumban létező civilizációk számának meghatározására) alkalmazásával készített jóslata szerint akár 106 számú civilizáció is lehet a Tejútrendszerben, amely rádiójeleket sugároz, bár megtalálásukhoz szerinte is mintegy 100 milliárd csillag környezetét kell átfésülni. Ha azt veszszük, hogy első ízben 2003 márciusában kaptak megfigyelési időt Arecibóban addigi eredményeik ellenőrzésére, s az nem volt több 24 óránál, a kutatás esélyeivel kapcsolatban nem lehetünk olyan derílátóak, mint Shostak.

Amiben a vezető csillagász bízik – más rádióteleszkópok bevonásán kívül – az nem más, mint hogy a komputerek számítási teljesítménye a Moore-törvénynek megfelelően továbbra is másfél évente megduplázódik, de legalábbis az ebből a szempontból bívös határnak tartott 2015-ig mindenképpen, s akkor a grid segítségével 20 éven belül felfoghatjuk a kis zöld emberek adásait. Az már más kérdés, hogy a legoptimistább becslések szerint a legközelebbi ilyen civilizáció is a Földtől több száz fényévre fejlődhetett ki, vagyis a velük folytatott kommunikáció sajátságosan lassú tempóban zajlik majd. Shostakot a programon belül is sokan megmosolyogják véleményéért, hiszen a hét változó egyikét sem tudjuk pontosan meghatározni, csak megbecsülni, s van egy további nagyon komoly hiányossága. Éppen azt nem veszi figyelembe, hogy egy földönkívüli civilizáció számunkra elképzelhetetlen technikai fejlettsége, vagy a másokkal folytatott kommunikációval szembeni aggályai boríthatják az egész formulát.

Klaszterek: gyógyítás és hadviselés
Ma tehát tucatnyi nyilvános grid míködik a világban, s ezeket igen változatos célokkal hozták létre: a matematikai alapkutatásokon át a gravitációs hullámzás nyomainak összegyíjtéséig jó néhány természettudományos probléma megoldásában részt vehetnek azok, akik vállalkoznak arra, hogy desktop-donorokká válnak. A kulcsszó mindkét fél részéről a bizalom. A hálózaton az adatok értelemszeríen nyilvánosan száguldoznak, azok titkosításával nem foglalkoznak. A projektek tehát vakon bíznak meg teljesen ismeretlen donorokban. Vannak persze olyan kutatási területek, ahol ugyancsak alkalmazzák a grid-technológiát, ám ezek – az ipari kémkedés lehetőségét kizárandó – a nyilvánosság számára nem elérhetők. Ezek az úgynevezett zárt gridek, amelyek hétpecsétes titokként őrzött, vagy a laikusok számára túl magas szintí, de mindenképpen komoly gyakorlati eredményekkel járnak. Előszeretettel használ zárt grideket például a gyógyszeripar, ahol egy formula mégoly kis töredékének kitudódását sem kockáztathatják meg a gyártók, és ilyen természetesen a hadiipar is.

A hasonló felhasználók által felállított kapacitások már a griden belül is egy külön kasztot képeznek: ezek az egy tulajdonos birtokában lévő, földrajzilag általában (de nem feltétlenül) szoros közelségben található, egyetlen szuperszámítógéppé kapcsolt, úgynevezett klaszterek. A legkomolyabb teljesítményí klaszterekkel a brit gyógyszergyártók és az USA fegyveres erői rendelkeznek. Az Amerikai Szárazföldi Erők például 2004 augusztusában rendelt egy ilyen szupergépet, amelyet marylandi kutatóközpontjukban állítanak fel, és új fegyverrendszerek kifejlesztésére, tesztelésére használják majd. Az egymáshoz kapcsolt 1186 eServer kapacitása 10 teraflop lesz, s ezzel a világ 20 legnagyobb számítógépe közé kerül. A beruházás megrendelését röviddel azután jelentették be, hogy az amerikai haditengerészet igényt formált egy hasonló méretí gépfürtre…A grid létjogosultságát egyébként fényesen bizonyítja az orvosbiológiai kutatások során mutatott hatékonysága. A Corpuscular Physics Laboratory és a Fraunhofer-Institut idén nyáron alig több mint egy hónap alatt 46 millió, a malária elleni gyógyszerek készítéséhez potenciálisan használható vegyületet vizsgáltatott át pályázaton elnyert kapacitás igénybevételével. Arra voltak kíváncsiak, hogy egy bizonyos fehérjét melyik vegyület képes megkötni. Ha csupán egyetlen, átlagos teljesítményí asztali számítógépnek kellett volna megküzdenie ekkora munkával, akkor ehhez 80 évet vett volna igénybe. A projekt számos biztató részeredményét a remények szerint egy használható gyógyszerré lehet majd „összegyúrni”.

Időtőzsde. Az ingyenesség vége…?
A számítástechnikai ipar óriása egyébként is igen aktív, ha az új technológiáról van szó, előrejelzéseik szerint a gyógyszeripar teljesítményét megsokszorozhatja – néhány egyéb újítás mellett – a grid-technológia alkalmazása. Az informatikai fejlesztésekre jelenleg is mintegy évi 20 milliárd dollárt költő iparág a szupergépek révén egy gyógyszer előállításának fajlagos költségeit a negyedére (körülbelül 200 millió dollárra) szoríthatja vissza mindamellett, hogy a szerek 12-14 év helyett 3-5 éven belül a gyógyszertárakban is megjelenhetnek. Az egyes betegségek altípusaira is lehet majd gyógyszereket tervezni, ami hatékonyabbá teszi a gyógyítást. A gyógyszergyárak természetesen részvényeseik érdekeit is szem előtt tartják, ezért jól tudják: a hatékonyabb, gyorsabb, olcsóbb fejlesztések megnövelik cégük értékét. Az interneten, a nyilvános gridek világában sem mindenkit a puszta altruizmus vezérel, s jól tudja ezt az Archipelago Holdings és a Sun Microsystems is, amelyek közösen készülnek létrehozni a világ első – és valószíníleg nem utolsó – internetes processzoridő-tőzsdéjét… Terveik szerint olyan új elektronikus kereskedési környezetet hoznak létre, amelyben az ügyfelek ajánlatokat tehetnek processzoridő vásárlására. Mivel a vállalatok a világ bármely pontjáról dinamikusan kereskedhetnek a processzoridővel, minden eddiginél rugalmasabban tervezhetik meg a számítógépes feldolgozási teljesítmény beszerzését és használatát. Ez új fejezetet jelent a számítástechnikában.

Kevesen gondolnák, de még a szórakoztatóipar is használja a hálózatba kötött gépek nyújtotta extra számolási kapacitást. Amikor a kilencvenes évek elején a Walt Disney vezetősége kiadta az ukázt: „ettől kezdve minden évben elő kell állni egy egész estés rajzfilmmel”, azt annak tudatában tehették meg, hogy a neves filmgyártó nem kevés ilyen hálózatba köthető számítógéppel rendelkezett. Az 1995-ös Pocahontas címí rajzfilm óta gyakorlatilag ezt a metódust követik az álomgyárban, A Notre Dame-i toronyőr, a Herkules, a Mulan, a Tarzan, a Lilo és Stitch, az Atlantisz – Az elveszett birodalom vagy például A kincses bolygó mind-mind a grid-technológiának köszönheti létezését. A francia Institut de Physique du Globe de Paris szintén a grid segítségével próbál áttörést elérni a földrengéskutatásban. A legutóbbi indonéziai földrengés után tízszer gyorsabban jutottak hozzá a várt adatokhoz, mintha csupán a saját erőforrásaikat vették volna igénybe: vagyis már másnapra lokalizálták a földrengés helyét, megismerték pontos időpontját és felvázolták összefüggéseit a rengést követő cunamival.

A CERN-ben (Svájc) most építik a világ legnagyobb részecskegyorsítóját, melyben a tervek szerint 2007-től 6000 ember végzi majd tudományos munkáját. Évente 12-14 PetaByte információt kell kezelniük, amelyhez nagyjából 200 000 nagy teljesítményí processzor míködtetésére lenne szükségük. A számítási kapacitás nagy részét ennek megfelelően kénytelenek lesznek regionális központokban lekötni, egy központnak öt magyarországi intézmény is tagja. Magyarok is (és akár magyar nyelven is) részt vehetnek a Growing Interest in the Development of Teaching Science hálózat munkájába. Ez a természettudományos oktatás színvonalának emeléséhez felhasználható ötleteket, kezdeményezéseket vár a közép- és felsőfokú nevelés bármely résztvevőjétől. A természettudományos ismeretátadás érdekesebbé és hatékonyabbá tétele a diákok számára régóta kemény diónak számít; épp ezért a hálózat megálmodói azt szeretnék, ha az egyes tantárgyak innovációit mindenféle korlátozás nélkül megismerhetné az egész európai oktatási közösség. Információcsere, állapotfelmérés, a tanítás- és tanulásszervezés ideális módszerének kidolgozása, szabványosítás, nevelésfejlesztési ötletbörze a griden – így foglalható össze címszavakban a Nancy Egyetem által összefogott kezdeményezés, melynek brit, finn, magyar, belga és olasz oktatási intézmények, szervezetek, valamint az oktatásban érdekelt magáncégek a résztvevői.
 
Hatszázezres hazai hálózat
Az internetet tehát végre elkezdték arra használni, amire kitalálták, s ma már ott tartunk, hogy az Unió egyik legnagyobb tudományos projektje a grid-technológia használatában támogatja a kutatókat, amennyiben pályázatok formájában kapacitást biztosít részükre. A kutatásfejlesztési ráfordítások tekintetében Észak-Amerika és a Távol-Kelet után kullogó Európában már megszületett az egyelőre valóságos, míködtethető rácshálózat formájában még csak szakaszosan létező, ám tervek szintjén már grandiózus, a különböző projekteket, szoftvereket és kutatásokat összehangolni és szabályozni kívánó DataGrid rendszer, montpellier-i központtal. Hazánkban 2000 óta 6 grid-projekt indult útjára. Ezek vagy első, vagy a kitalált feladat mellett második szándékkal jobbára a technológia felhasználási módozatait elemezték, tulajdonképpeni demók voltak tehát, amelyek azt voltak hivatottak bizonyítani, hogy a grid míködőképes tudományos eszköz. Az agykutatás, az asztrofizika, az aerodinamika és a részecskefizika területén alkalmazható algoritmusokra is kipróbálták a technológiát, de szmogriadók elkerülésének hatásmechanizmusát is modellezték, és lefuttattak egy a Paksi Atomerőmí reaktorának élettartamát modellező alkalmazást is.

A Veszprémi Egyetemen a távolsági hálózatba kapcsolt erőforrások munkáját összehangoló programok fejlesztésén dolgoznak. Debrecenben az egyetem és egy orvosi képfeldolgozó hardverek és szoftverek fejlesztésével foglalkozó magáncég hozott létre társaságot komputertomográfiás eszközök és programok fejlesztésére. A magánszféra és a tudományos intézetek összefogása többszörösen is gyümölcsözőnek bizonyulhat: hosszú távon eredményt hozhat a rutin diagnosztikában, emellett a magáncég tomográfiás diagnosztikai programtermékei korszerísödhetnek, az intézmények számára pedig újabb pályázati lehetőségek válhatnak elérhetővé, nem is beszélve a grid-technológia további finomításáról. Nemrég átadták azt a kutatói gerinchálózatot is, amely hét egyetemet és további kutatási intézményeket köt össze egymással, kapcsolatot teremtve több száz kutatóállomás mintegy hatszázezer alkalmazottja között. A bővítés során az adatátvitel sebessége a korábbi négyszeresére, 10 gigabit/másodpercre nőtt, s ez Kelet-Európában egyedülállónak számít. Most már valóban csak míködőképes projektekre van szükség, mert – amint az jól látható a korábban vázolt példákból – némi szájpropagandával korábban nem is remélt mennyiségí processzoridő gyíjthető össze.§

  • Magyar projekt: bináris számrendszerek
    A 2005 nyarán több hazai intézmény összefogásával indított magyar programot az Akadémia Számítástechnikai és Automatizálási Kutató Intézet üzemelteti, amely itthon vezető szerepet tölt be az ilyen irányú kutatásokban. Interneten is olvasható leírása szerint annak célja minél több (bizonyos dimenzióig az összes) bináris számrendszer meghatározása. A lehetséges számrendszer-alapszámok (mátrixok) száma a dimenzió növekedésével robbanásszeríen nő, ezért a jelenleg rendelkezésre álló matematikai apparátus és számítási sebesség figyelembe vételével 11 dimenzió vizsgálata tínik lehetségesnek. A grid alkalmazására azért van szükség, mert a feladat processzorigénye a projektet más módszer alkalmazásával értelmetlen hosszúságúra nyújtaná. A kutatások gyakorlati jelentősége a kódolásban, kriptográfiában és az adattömörítésben lehet, bár a számrendszerdimenzió-vizsgálatok bevallottan inkább az alap-, mint az alkalmazott kutatásokhoz tartoznak. Az általánosított számrendszerek, és a jegykifejtések kutatását általában azért is végzik, mert segítségükkel hibamentes számításokat végezhetünk számos matematikai struktúrában.

  • Molekulaelemzések 
    Két évvel ezelőtt, decemberben – talán a karácsony közeledtének is köszönhetően – jött létre a World Community Grid neví virtuális hálózat, mely egy számítástechnikai óriáscég saját gépeinek szabad processzoridejét adja hozzá az önkéntesen csatlakozó felhasználók komputereinek teljesítményéhez. Mindezt annak reményében tették, hogy olyan problémák, mint az AIDS, a rák vagy a természeti katasztrófák megoldására alkalmas projekteket segíthetnek. A worldcommunitygrid.org weblapján természetesen az erre alkalmas szoftvert is le lehet tölteni. Most főként a rákkutatásra összpontosítanak, de egy korábbi projekt a himlőkutatáshoz is jelentős mértékben járult hozzá, amennyiben a grid  35 millió gyógyszermolekula elemzését végezte el. Az eredményeket aztán az USA védelmi minisztériumának továbbították.

  • Donor-keresők 
    A csatlakozott felhasználók számának sorrendjében a következő nyilvános gridek míködnek napjainkban: SETI@home, Einstein@home, ClimatePrediction.Net, Predictor@Home, LHC@home, Pirates@Home, Rosetta@home, SZTAKI Desktop Grid, B.U.R.P., PrimeGrid, XtremeLab, BoincAlpha (SETI), LHCalpha.