- 2024-06-12
”Vansinniga” mängder data sporrar ny lagringsteknik
11 juni 2024Av Ben Morris, redaktör, BBC Technology of BusinessBBCIan Crawford övervakar arkiveringen av Imperial War Museum media. År 2039 kan tyckas vara långt borta, men Ian Crawford planerar redan för det. Det kommer att markera 100-årsdagen av utbrottet av Andra världskriget – ett stort år för hans arbetsgivare, Imperial War Museum. Mr Crawford är informationschef på museet och övervakar ett projekt för att digitalisera dess enorma samling av bilder, ljud och film. Med en samling på cirka 24 000 timmar film och video och 11 miljoner fotografier är det en enorm uppgift. Och under upptakten till 2039 kommer material från andra världskriget att vara en prioritet. Att göra digitala kopior av dessa historiska källor är avgörande eftersom originalkopiorna försämras med tiden och kommer en dag att gå förlorade för alltid. ”När du har den enda kopian vill du ha förtroende för att ditt lagringssystem är tillförlitligt”, säger Ian Crawford. Mängden data som behövs för sådan långtidslagring växer hela tiden, eftersom de senaste skannrarna kan spela in dokument och filmer i detalj.” Potentialen att växa är enorm, säger Crawford.” Vi tittar nu på själva objekten och skannar i 3D – som kan generera mycket stora filer.” Band som dessa är det vanligaste sättet att hålla data under långa tidsperioder.Den här störtfloden av data drabbar inte bara museer – den öser ner överallt. Företag köper mer utrymme för säkerhetskopiering, sjukhus behöver någonstans att lagra journaler, myndigheter behöver en plats för att lagra allt större mängder information. ”Vi fortsätter att skapa vansinniga mängder data”, säger Simon Robinson, huvudanalytiker på analysföretaget Enterprise Strategy Group. ”För de flesta organisationer – det varierar mycket – fördubblas deras datavolym vart fjärde till femte år. Och i vissa branscher det växer mycket snabbare än så, säger han. Data som behöver lagras under lång tid lagras inte i traditionella datacenter, dessa stora lager, med servrar och blinkande lampor. Dessa operationer är utformade för data som behöver nås och uppdateras ofta. Istället är det mest populära sättet att lagra data på lång sikt på band. I synnerhet ett format som kallas LTO (Linear Tape Open), den senaste versionen heter LTO-9. Banden i sig är inte olik gamla VHS-band, utan lite mindre och mer fyrkantiga. Inuti kassetten finns en kilometer magnetband, som kan lagra 18 terabyte data. Det är mycket – bara ett band kan innehålla samma mängd data som nästan 300 vanliga smartphones. Imperial War Museum i Duxford använder ett bandsystem från Spectra Logic. Maskinen, ungefär lika stor som en stor garderob, rymmer upp till 1 500 LTO-band. Sådana LTO-system dominerar marknaden för långtidsförvaring. De har funnits i decennier och har visat sig vara pålitliga. Det är också ganska billigt, vilket är viktigt eftersom kunder i allmänhet vill betala så lite som möjligt för långtidslagring. HoloMemAt HoloMem-data lagras i hologram skapade i polymer av lasrar Ändå är vissa övertygade om att det kan göras bättre.I en före detta tapetfabrik i Chiswick, västra London, har ett nystartat företag utvecklat ett långsiktigt lagringssystem som använder lasrar för att bränna små hologram till en ljuskänslig polymer.Chief verkställande direktören Charlie Gale påpekar att med magnetband kan data bara lagras på ytan, medan hologram kan lagra data i flera lager.” Du kan göra saker som kallas multiplexering, där du kan lagra flera uppsättningar information i ett utrymme. Det är verkligen typ av superkraften i det vi gör. Och vi tror att vi kan placera mer information på mindre utrymme än någonsin, säger han. HoloMems polymerblock kan hantera extrema temperaturer, utan att data blir korrupta – mellan -14C till 160C. HoloMemCharlie Gale på HoloMem är övertygad om att hans system kan slå befintlig lagringsteknik. Som jämförelse måste magnetband hållas mellan 16C och 25C, vilket innebär betydande uppvärmnings- och kylkostnader, särskilt i länder med extrema temperaturer.Tejpen behöver också bytas ut efter cirka 15 år, medan polymeren är bra i minst 50 år. Herr Gale noterar att eftersom lasern kemiskt förändrar polymeren kan data inte manipuleras när de väl har skrivits. Holomems prototypsystem, som kommer att kunna lagra och hämta data, kommer att vara klar senare i år. Herr Gale säger att kostnaden för systemet har hållits nere genom att använda vanliga, allmänt tillgängliga komponenter, inklusive lasern – så han är övertygad om att HoloMem kommer att kunna matcha eller slå kostnaderna av magnetband.Microsoft ResearchEtt system som utvecklats av Microsoft Research lagrar data på glaspaneler.HoloMem måste vara konkurrenskraftigt, eftersom det är en formidabel konkurrent som hotar marknaden. Genom sin forskningsarm utvecklar Microsoft sitt eget långsiktiga datalagringssystem. HoloMem har beslutat att det är dags att gå vidare från magnetband, men Microsoft har valt glas som lagringsmaterial. Systemet kallas Project Silica och använder kraftfulla lasrar för att skapa små strukturella förändringar i glaset, så kallade voxels som kan användas för att lagra data. Voxlarna är otroligt små och kan packas i lager. Microsoft säger att en 2 mm tjock glasbit ungefär lika stor som en DVD skulle kunna lagra mer än sju terabyte data. Systemet lagrar glasrutorna på ställ där de kan nås av små krabbaliknande robotar som glider längs skenor. Glas är billigt och hållbart, och är ett attraktivt lagringsmedium, säger Richard Black, som leder Project Silica. säger Mr Black. Det skulle potentiellt kunna bevara data i hundratals och kanske tusentals år. Ett sådant system skulle en dag kunna integreras i Microsofts enorma cloud computing-verksamhet, Azure. Men det är en bit bort eftersom systemet har många år av utveckling framför sig av it.gettyIWM testar om AI kan skilja mellan Spitfire-modeller. Tillbaka i Duxford har Imperial War Museum, liksom många organisationer, experimenterat med artificiell intelligens. De testade nyligen om AI kunde identifiera olika modeller av Spitfire i bilder från dess bildkatalog. Mr Crawford tror att AI kan vara otroligt användbar för att katalogisera dess digitala bibliotek, arbete som skulle ta människor hundratals år. AI:s förmåga att tråla igenom enorma mängder data har gjort det ännu viktigare att behålla den datan – det kan finnas något värdefullt som lurar där.” Tidigare arkiverade verksamheten data ifall de behövde det. Nu finns det en verklig affärsanledning till varför de kanske vill gå tillbaka och göra lite analyser, säger Robinson.