SERVIRA / Felhő hírek / Microsoft - adatközponti frissítés eredménye a szolgáltatás kimaradás

Microsoft - adatközponti frissítés eredménye a szolgáltatás kimaradás

Csütörtökön csütörtököt mondott a Microsoft adatközpontja

Csütörtökön a Hotmail szerverei túlmelegedtek, ez okozta a szolgáltatás kimaradását a Microsoft webes email szolgáltatásában. Mind a Hotmail és az Outlook.com offline volt mintegy 16 órán át, miután egy szoftverfrissítési hiba miatt túlmelegedett a Microsoft adatközpontjának az a része, mely ezeket a szolgáltatásokat biztosította. A meghibásodás érintette a SkyDrive-ot is.


vps, cloud és cloudhosting kedvező áron!

felhő, cloud, iaas, vps, akció, kedvező, olcsó, konfiguráció


Egy incidensjelentés szerint, mely az Outlook.com blogján jelent meg „A hőmérsékletnövekedés olyan gyorsan zajlott le, hogy a Microsoft automatizált hibaelhárító megoldása képtelen volt átmozgatni a terhelést az infrastruktúra sértetlen részére.

A Microsoft elmondása szerint a probléma egyetlen adatközpontra koncentrálódott, ahol a szoftvermenedzselő részleg fizikai kiszolgálóin végeztek egy firmware frissítést. Az eddigi frissítések problémamentesen lezajlottak, viszont ez a frissítés „váratlan hibát okozott”élve Arthur de Haan szavaival.

„E hiba eredménye egy gyors és jelentős hőmérsékletnövekedés az adatközpontban, melyet az automatizált rendszer tétlensége miatt oly sokáig tartott elhárítani, hogy a védelmi rendszerek vették át a szolgáltatások helyét, meggátolva a fiókokhoz való hozzáférést, illetve azt is, hogy az infrastruktúránk sértetlen szerverei átvegyék a szolgáltatást.”- írta de Haan.

Magasabb hőmérséklet, kisebb fogyasztás

A jelentés nem szolgáltat részleteket az érintett szoftvereket illetve a felszereléseket illetően, de az tisztázott, hogy az adatközpont hűtő rendszere meghibásodott, és a hőmérsékletnövekedés nagyon gyorsan következett be. A Microsoft amúgy is úttörő ezen a téren, az adatközpontjaikat viszonylag magas hőmérsékleten működtetik. Ez egy stratégiai lépés, melynek köszönhetően kevesebb energiával üzemeltethetik az amúgy is energiaéhes hűtőrendszereket és ventillátorokat. Ennek hátránya, hogy az adatközpontok gyors hőmérsékletnövekedésénél kisebb a hőmérsékleti beavatkozási réteg, hiba esetén gyorsabb reakciót és intézkedést igényel, ráadásul kevesebb idő van a szerver belső hőmérsékletének normalizálásához is. Ez igencsak kényes terület, főleg a nagy sűrűségű adatközpontok esetében, amilyeneket a Microsoft is üzemeltet.

Ismeretlen okból kifolyólag a meghibásodást kezelő rendszerek képtelenek voltak reagálni a helyzetre. „A meghibásodást orvosolandó szükség volt szoftveres, infrastrukturális és emberi beavatkozásra is, hogy újra online legyen minden rendszer. Ez a fajta emberi beavatkozás nem a norma szerinti követelmény szolgáltatásainknál, nem számítottunk rá, ez okozta a leállás időtartamának indokolatlan hosszát.” – írta de Haan.

Adatközpontok jövője - a felhő térnyerése

A web méretű infrastruktúrák térnyerésével azon cégek, melyek hatalmas adatközpontokat üzemeltetnek, másként kell, hogy gondoljanak a redundanciára. A múltban a redundancia azt jelentette, hogy volt egy biztonsági másolat, melyhez szükséges volt vásárolni eszközöket, szünetmentes tápegységet, generátorokat, szervert. Ma már a felhő alapú szolgáltatásokkal, a redundancia új jelentést nyert. Jelenünkben ez a szó azt jelenti, hogy a terhelés mozgatható, átirányítható az adatközpontok között, megkerülve ezzel a leállt központokat, hely függetlenítve a szolgáltatást.

A Microsoft dolgozik azon, hogy szoftvereit felvértezze, automatizálja és probléma esetén önműködően kapcsoljon be szervereket a szolgáltatásba a terheléstől függően, ezzel is növelve a megbízhatóságot. Ez lehetővé teszi, hogy a terhelés függvényében változzon a szolgáltatott erőforrás mértéke. Kisebb terhelés esetén elég csak a helyi egységeket bevonni, nagyobbak esetében azonban az is előfordulhat, hogy más földrajzi helyen lévő adatközpont is bekapcsolódik a szolgáltatásba.

Mindenesetre, az adatközpontok eléggé összetettek ahhoz, hogy előre fel lehessen készülni minden meghibásodásra, azonban ezzel a felhő alapú redundancia gondolkodással a problémák többsége áthidalható, egyszerűen más adatközpont veszi át a helyét a szolgáltatásban, míg a probléma elhárításra nem kerül. Ezek a tartalék erőforrások hagynak némi mozgásteret, és remélhetőleg kevesebb kimaradás várható a szolgáltatásokban a jövőben. 

 
Támogatott rendszereink