Alexandriától Alexáig

A web nem felejt

Vértes János, 2001. december 27. 15:10
Lehet zsörtölődni azon, hogy sokan a weben felejtenek (olykor még dátummal sem megjelölt) régi dokumentumokat, amelyeket egy kereső kidobhat találatként, és azután az elavult információkra épülve tanulmányok készülnek, ám most nem erről, hanem épp az ellenkezőjéről szeretnénk írni: megőrzi-e valaki vagy valami a világháló múltját, az évekkel ezelőtti honlapkezdeményeket, a www hőskorát?
Nos meg.

Nem kisebb célt tűzött ki maga elé a San Franciscó-i Alexa Internet (a cég egyébként 1999 óta az Amazon.com tulajdona), mint amit annak idején az alexandriai könyvtár: ahogyan az utóbbi a kor minden könyvéből őrzött egy példányt (a nagy tűzvészig), úgy az előbbi a World Wide Web minden oldalát szeretné megőrizni az utókornak 1996 óta.

Természetesen a ma már naponta frissülő oldalak mindegyikét nem lelhetjük fel, az archívumban bóklászva és egy régi weboldal kapcsolódási pontjai keresve sokszor vetődünk árnyékra, de ennek ellenére tanulságos visszalépni az időben, és bóklászni a múltban.

Sajnos az InterNet Kalauz legelső, 1996-os oldalai nincsenek fenn, de 1997-ből, amikor még a lap online vetülete önállóan (és nem a Prím Online részként) élt, találunk egy karácsonyi számot.

1996-97-ben a Prím-magazinok online kiadásait más cégek gondozták (a VGA Monitort az Eurotrend, az InterNet Kalauzt a Hungary Network, a Business Online-t a Webtime), és például a legrégibb online Monitor esetében (www.vgamonitor.hu) akár 1996 decemberéig szaladhatunk vissza az időben, ráadásul abban is olvashatunk az InterNet Kalauzról, hiszen ott is meghirdette a kiadó testvérlapjának webrecenzió-pályázatát.

Sokunknak jelenti a magyar web hőskorát a régi, "Nyírő-féle" Internettó, amelyből sajnos nem sok szirmot préseltek le a webarchívumba. Kicsit több eséllyel keresgél az, aki emlékszik, hogy a kezdet kezdetén az oldalt nem önálló domain alatt, hanem a www.idg.hu/internetto/ címen lehetett elérni, az IDG egyetlen 1997-ből megőrzött oldaláról az augusztus 6-i Internettóhoz ugorhatunk, és ez még az régi "puttós" Internettó, amelynek helyébe utána már se az index, se az Internettó-utódok nem tudtak lépni...

Hogy érdemes-e építgetni egy ilyen webmúzeumot, ahol a dinamikusan változó online világ messze nem őrizhető meg olyan módon, ahogy az alexandriai könyvtár őrizte a könyveket, ezen lehet vitatkozni, ám végül is Gorsiumban vagy akár Athénben járva is csak körvonalait látjuk az ókor településeinek, épületeinek, mégis ez az egyetlen lehetőségünk, hogy visszarepüljünk a múltba, letűnt idők embereinek bőrébe képzeljük magunkat. És ha már régi korok romjainál tartunk, hadd idézzük Weiner Tibort (a híres fizikus testvérét), Dunaújváros egykori főépítészét, aki a hatvanas években egy tanácsülésen így vitatkozott az új lakótelepek építésének gyorsítása érdekében felszólaló elvtársnővel: "Ön gyorsítás érdekében le akarja állítani a római városrész feltáró ásatásait? Asszonyom, vegye tudomásul, hogy aki leszarja a múltját, az leszarja a jövőjét is!"

Úgyhogy miközben építjük az új weboldalakat, illő leásnunk a romokig. Az 1996 júniusától telítődő weboldalgyűjteményben egyre szaporodnak a terabyte-ok, 2001 októberében már ebből is a századikat mentette el az Alexa Internet, és azóta is pásztázzák a világhálót a robotok, havi 12 terabyte-ot téve az archívumhoz. Csak összehasonlításképp: ha archiválnák a teljes Kongresszusi Könyvtár minden könyvét, az 20 terabyte-ot igényelne.

Átlagosan kéthavonta tapogatnak le egy-egy site-ot, ami a naponta változó oldalak világában nem jelenti a digitális tartalmak valódi archiválását, de a forma- és kultúrtörténeti emlékek megőrzéséhez elég, hiszen amúgy a site-ok többsége nem változik sűrűn, egy oldal átlagos élettartamát az archívum készítői száz napra teszik. Ha valaki nem akarja, hogy mások őrizzék meg a múltját, akkor a http://www.archive.org/robotexclusion.html oldal útmutatásait követve kizárhatja site-járól a letapogató robotokat, vagyis az oldal alkotói ilyetén módon ügyelnek arra, hogy szerzői jogi támadások ellen védve legyenek.

Persze butaság lenne nem hagyni, hogy bekerüljünk az archívumba, ugyanis ez a nonprofit vállalkozás nem csak a nosztalgikus múltba révedést, hanem a kutatási tevékenységet is szolgálja. A nyilvánosság számára csupán az elmúlt év végén megnyílt "Wayback Machine" a Marylandi Egyetem egyik professzorának például egy olyan kutatáshoz nyújtott támpontot, hogy felmérje: az angol nyelv dominanciája mennyire öli meg a weben a kis népek nyelvét. A kísérleti nyúl éppen a magyar nyelv volt, és az eredmény, amit e nélkül az archívum nélkül nehezen mondana meg bárki: 1,5 millió magyar nyelvű oldal. Ráadásul (s ezt már mi tesszük hozzá, akik tudjuk, hogy mondjuk a Prím Online cca. huszonöt-harmincezer weboldalából 1539 került be az archívumba) ez a magyar webnek alig 5-10 százaléka, a magyar nyelvű weboldalak számát tehát nem túlzás tízmilliós nagyságrendre taksálni. Ugyanez a kutatás azt is megmutatta, hogy a magyaron kívül még 201 nyelvet érint ez az időgép, vagyis ha dominál is az angol, a web megőrzi a nyelveket is.

Más kutatásokat is említettek a tavalyi világpremieren a fejlesztők: például végigkövethetjük, hogyan változott a Microsoft viszonya a személyiségi jogokhoz 1996 és 2001 között.

Érdekesség, hogy ezt az archívumot egy volt katonai épületben őrzik, egy 300 PC-ből álló hálózaton. Többségük asztali kategória egy 1,5 gigahertzes processzorral, de mindegyiknek a házában van 4 darab 80 gigabyte-os winchester. A gépekből 20 áll a frontvonalban, s vagy ezek egyikén van a keresett információ, vagy ezek valamelyike tudja, hogy honnan bányássza elő.

Az egyes site-ok múltja mellett egy-egy nap, egy-egy esemény virtuális tükörképét is megkísérlik az oldal üzemeltetői archiválni, ilyen kiemelkedő esemény eddig kettő akadt: a 2000-es amerikai elnökválasztás, és a tragikus szeptember 11.

Ma még ezek az oldalak nem tartoznak a web kultúrtörténetébe, de ha a site fennmarad, tíz év múlva bizonyos, hogy ezeket is úgy fogja bújni a világ, ahogy mi ma a régi Internettót.

A cikk előzetes az INK jövő évi számából

Kövess minket a Facebookon!

Cikkgyűjtő

További fontos híreink

Itt a világ első, Swarovski kristályba ágyazott autós kijelzője

2024. április 10. 14:55

A csevegőprogramokat vizsgálta az NMHH

2024. április 2. 13:14

Megvannak az IAB 2023-as Legjobb szakdolgozat pályázatának nyertesei

2024. március 25. 15:50

A 2024-es év fordulópont lehet az IT munkaerőpiacon?

2024. március 20. 10:09