Grid-Computing und Hochleistungsrechnen für die Wissenschaften

Ansprechpartner: Dr. rer. nat. Claus-Peter Rückemann
 
Koordinator Grid-Computing
Regionales Rechenzentrum für Niedersachsen, Universität Hannover (RRZN/UH)
 
Koordination der Fachgebiete FG2-5, 2-6, 2-7, 2-8
D-Grid-Integrationsprojekt (DGI)


Die Lösung verschiedener Probleme in den Naturwissenschaften, insbesondere Geophysik, Seismologie, Seismik, Vulkanologie, Planetologie, Hochenergiephysik, Astrophysik oder Meteorologie erfordert besonders hohe Rechenleistungen. Diese Anforderungen entstehen zum einen aus der hohen Bedeutung von wissenschaftlicher Modellrechnung und Simulation z.B. für die Modellbildung, als auch aus der Notwendigkeit zur Auswertung riesiger Datenmengen zur Ableitung von neuen Forschungsergebnissen in den Naturwissenschaften.

Durch die Entwicklung im technischen Bereich können seit Jahrzehnten schrittweise bessere Hilfsmittel, d.h. Rechenressourcen, herangezogen werden. Neben der einfachen Bereitstellung schnellerer Netzwerkverbindungen (Gigabit-Leitungen sind inzwischen eine Selbstverständlichkeit), größerer Speicherkapazitäten (seit langem im Bereich jenseits von vielen TeraBytes) und neuartiger Hardware, ist für die Wissenschaft vor allem die Steigerung der Kapazitäten für das Hoch- und Höchstleistungsrechnen von zentraler Bedeutung.

Parallel zu dieser Entwicklung sind ergänzende Strömungen wie Cluster-Computing und Grid-Computing eine für die Wirtschaft besonders attraktive Möglichkeit Ressourcen verfügbar zu machen, müssen die Komponenten nun keine derart besonderen Eigenschaften mehr erfüllen. Dies Konzepte erweitern die bestehenden Möglichkeiten im Bereich des Hochleistungsrechnens um flexibel nutzbare Ressourcen für die breite Anwendung. Für komplexe wissenschaftliche Simulationen, z.B. die Rechnerische Seismologie (,,Computational Seismology``) im Bereich der Erdbebenphysik zur Simulation von Erdbebenprozessen und ihrer Folgen, sind Grid-Konzepte allein hingegen ungeeignet. Außer Kriterien wie Rechenoperationen pro Sekunde, sind dafür insbesondere auch die Verarbeitung sehr großer Datenmengen, sehr hohe Speicherbandbreiten und geringe Latenzzeiten von vorrangiger Bedeutung. Hier müssen auch in Deutschland in den nächsten Jahren große Anstrenungen im Bereich Höchstleistungsrechnen und im ergänzenden Grid-Computing unternommen werden, um den Platz an der Weltspitze in diesem Bereich zu halten und zu festigen und z.B. die Komplexität und Dynamik des Erdkörpers besser zu beschreiben.

Verbünde von Hochleistungsrechnern erschließen seit vielen Jahren Rechenleistungen, die über die Kapazitäten einzelner Hochleistungsrechner hinausgehen. So ist das Hochleistungsrechnen ein Schwerpunkt für die Ansätze wissenschaftlichen Grid-Computings. Eine weitere wichtige Aufgabe ist die Nutzung, Speicherung und Bearbeitung sehr großer Datenvolumina. Ressourcen und Daten können seit langem über die Grenzen von Einrichtungen und Netzwerken hinaus gemeinsam genutzt werden. Für den Zugang und die Vergabe von dezidierten und feingranularen Rechten sind seit langem ausgeklügelte Verfahren im Einsatz. Die rein technischen Anforderungen, z.B. an Systeme, Sicherheit und Netzwerk, sind daher nicht neu, sondern seit Jahrzehnten bekannt.

Eine Vielzahl von grundlegenderen Problemen sind im Zusammenhang des Grid-Computing noch nicht gelöst, wie die Förderung und Nutzung für die Grundlagenforschung, einige Probleme werden in der Öffentlichkeit auch nicht als solche erkannt, darunter auch der Zusammenhang mit der Veränderung der Urheberrechts- und Datenschutzproblematik, ebenso wie der verantwortliche Umgang mit wissenschaftlichen Daten und Ergebnissen.

Die größten Probleme stellen bis heute hingegen die Vielfalt der Anforderungen wissenschaftlicher Problemlösungen und die damit verbundene erforderliche Komplexität und Heterogenität dar. Diese Aufgaben werden in vielen kleineren und meist nicht zentral koordinierten Forschungsprojekten angegangen.

Auf der anderen Seite besteht zunehmend Interesse, vorhandene Rechenressourcen wirtschaftlicher auszunutzen bzw. zu fördern. Gerade in dieser Hinsicht kommt dem Themenkomplex Accounting-Billing im Grid-Computing eine bedeutende Rolle zu. Die mit diesem politisch-wirtschaftlichen Prozeß einsetzende Entwicklung von der Forschung hin zu einer Breitenwirkung, kann dank der fortschreitenden Entwicklung in der Computertechnik jedoch auch für bestimmte Anwendungen im wissenschaftlichen Bereich genutzt werden. Jeder prominentere Hersteller bietet inzwischen auch Grid-Lösungen bzw. ,,Computing-Grids von der Stange`` an. Dabei handelt es sich in der Regel um eine Vielzahl leistungsfähiger Unix-Workstations. Diese Entwicklungen sind eine Ergänzung zu den Höchst- und Hochleistungsrechnern, können diese aber auch in Zukunft nicht ersetzen.

Das Ziel muß es sein, für die Nutzer in den Naturwissenschaften verschiedene komplementäre Ansätze zu realisieren. Zum einen muß die Möglichkeit vorhanden sein, für Aufgaben ganz bestimmte Ressourcen dediziert ansprechen und auswählen zu können, zum anderen müssen die Randbedingungen eine effektive, effiziente und transparente Nutzung von ,,Rechenleistung`` für eine applikationszentrierte Ausrichtung zu ermöglichen. In vielen Fällen ist es für wissenschaftliche Nutzer notwendig, zu jedem Zeitpunkt exakt zu wissen, wo ihr Rechenauftrag gerechnet wird und wo sich ihre Daten befinden. Dies gilt in gleicher Weise, jedoch meist aus anderen Gründen, auch für die Nutzung im Bereich der Wirtschaft.

Die treibende Kraft im Grid sind einerseits die Nutzung von verfügbaren Rechenleistungen, zum anderen die wirtschaftlichen Aspekte. Hier liegen insbesondere im ,,Accounting`` die zentralen Aufgaben, da erst durch dieses eine stetige Verbindung vom ,,Monitoring`` zum ,,Billing`` geschaffen wird. Accounting wird häufig fälschlich mit dem Begriff ,,Buchführung`` oder ``Buchhaltung`` gleichgesetzt. Dies ist aber im Grid nicht zutreffend. Das Accounting hat im Grid-Computing andere, weitaus vielfältigere und grundlegendere Aufgaben. Die bestehenden Ansätze zum Accounting beinhalten teilweise bereits eigene rudimentäre Funktionen zum Monitoring, da die eigentlichen Monitoring-Werkzeuge die Anforderungen des Accountings nicht speziell berücksichtigen. Aufgrund des bislang nicht in der Breite vorhandenen Bedarfs für ein echtes Billing, sind derzeit keine eigentlichen Billing-Funktionen vorhanden.

Wichtige Fragen zu den Aufgabenstellungen im Themenkomplex dieser Fachgebiete sind:

Die Fachgebiete Monitoring, Accounting und Billing werden in den nächsten Jahren die Basis für die dazu notwendigen Konzepte und Umsetzungen im Grid-Computing liefern.

Am Regionalen Rechenzentrum für Niedersachsen (RRZN) entwickeln Wissenschaftler und Informatiker in Zusammenarbeit mit Ingenieuren und Teilnehmern aus verschiedenen Disziplinen in verschiedenen Projekten neue Strategien zur Erstellung angepaßter und marktfähiger Grid-Umgebungen. Die Schwerpunkte in diesen Projekten reichen von technischen Umsetzungen wie Netzwerk und Verschlüsselung bis hin zur Schaffung geeigneter Monitoring-, Accounting- und Billing-Lösungen, für den Einsatz insbesondere in den Naturwissenschaften sowie zur Nutzung im Bereich Hochleistungsrechnen (HLRN). Unter der Leitung des RRZN entstehen in Projekten wie dem D-Grid in Zusammenarbeit mit Forschungseinrichtungen und Institutionen in ganz Deutschland Lösungen für die anstehenden Probleme in diesen Bereichen.

Aktuelle Informationen

Aktuelle Informationen zu Arbeiten, wichtigen Dokumenten und Veröffentlichungen der Fachgebiete Monitoring, Accounting, Billing (M/A/B), insbesondere aus der Gründungs- und Aufbauphase der Fachgebiete M/A/B in den Jahren 2005 und 2006, Mitarbeiter der Koordination, Mailing-Liste, Hinweise auf E-Mail-Adressen der Ansprechpartner in den Fachgebieten usw. finden sich auf dem D-Grid-Server unter URL: http://www.d-grid.de/index.php?id=koordination sowie in den D-Grid-Veröffentlichungen unter URL: http://www.d-grid.de/index.php?id=198

Literatur

Accounting 2005, 2006
Accounting (2005, 2006). Fachgebiet Accounting im D-Grid-Integrationsprojekt. URL: http://dgi.d-grid.de/index.php?id=88.

Billing 2005, 2006
Billing (2005, 2006). Fachgebiet Billing im D-Grid-Integrationsprojekt. URL: http://dgi.d-grid.de/index.php?id=87.

D-Grid 2005, 2006
D-Grid (2005, 2006). D-Grid. URL: http://www.d-grid.de.

D-Grid-Integrationsprojekt 2005, 2006
D-Grid-Integrationsprojekt (2005, 2006). D-Grid. URL: http://dgi.d-grid.de.

HLRN 2003, 2004, 2005, 2006
HLRN (2003, 2004, 2005, 2006). Norddeutscher Verbund für Hoch- und Höchstleistungsrechnen (HLRN), Höchstleistungsrechenzentrum Nord. URL: http://www.hlrn.de.

Koordination 2005, 2006
Koordination (2005, 2006). Koordination der Fachgebiete Monitoring, Accounting, Billing im D-Grid-Integrationsprojekt. URL: http://dgi.d-grid.de/index.php?id=90, URL: http://dgi.d-grid.de/index.php?id=koordination.

Monitoring 2005, 2006
Monitoring (2005, 2006). Fachgebiet Monitoring im D-Grid-Integrationsprojekt. URL: http://dgi.d-grid.de/index.php?id=89.

Projekt-Informationen, Koordination 2005, 2006
Projekt-Informationen, Koordination (2005, 2006). Projekt-Informationen, Koordination der Fachgebiete Monitoring, Accounting, Billing im D-Grid-Integrationsprojekt. URL: http://www.unics.uni-hannover.de/cpr/x/rprojs/de/index.html#DGI (Projekt-Informationen).

RRZN 2003, 2004, 2005, 2006
RRZN (2003, 2004, 2005, 2006). Regionales Rechenzentrum für Niedersachsen, Universität Hannover (RRZN/UH) URL: http://www.rrzn.uni-hannover.de.


© 2006 Dr. Claus-Peter Rückemann / E-Mail [--] / Tel. [--]
vi betrieben.
Letzte Änderung: So, 12. Feb 2006, 20:18:09 MEZ