Eltűnt az internet egyharmada pár év alatt: ez a magyarázat

Diósi Szilvia
GettyImages-156917005
Olvasási idő kb. 4 perc

Sokszor hallani, hogy ami egyszer az internetre felkerült, az ott is marad. Egy új tanulmány szerint azonban ez nincs így, az internet egy jelentős része veszett el néhány év alatt.

Egy új tanulmány szerint az internet egy része eltűnőben van, a weboldalak és az online tartalmak elvesznek az oldalak törlésével vagy áthelyezésével. A 2013-ban létező weboldalak 38 százaléka például mára elveszett. Sőt, újabb oldalak is tűnnek el, a 2023-ban létrehozott oldalak 8 százaléka már nem elérhető.

Sorra tűnnek el a tartalmak az internetről

Ezek az oldalak általában akkor tűnnek el, amikor törlik vagy áthelyezik őket. Ez azt jelenti, hogy hatalmas mennyiségű hír és fontos referenciatartalom tűnik el. A híroldalak mintegy 23 százaléka tartalmaz legalább egy törölt linket, illetve a kormányzati honlapok 21 százaléka – olvasható a tanulmányban. A nagy forgalommal rendelkező híroldalak és a kisebb forgalmú híroldalak is tartalmaznak hibás linkeket, ezeknek a valószínűsége nagyjából azonos. A helyi önkormányzati weboldalakon különösen nagy a valószínűsége annak, hogy hibás hivatkozások találhatók. A kormányzati oldalak esetén a hivatkozások túlnyomó többsége (86 százalék) belső link volt, a belső és külső hivatkozások hasonló arányban nem működtek.

Rengeteg tartalom tűnt el az internetről 10 év alatt
Rengeteg tartalom tűnt el az internetről 10 év alattAnastasiia Yanishevska / Getty Images Hungary

A Wikipédia-oldalak 54 százaléka tartalmaz olyan hivatkozást, amely már nem létezik. Nagyjából ugyanez a hatás érvényesül a közösségi médiában is. Az X-et (korábban Twittert) három hónapig figyelték a kutatók, és arra jutottak, hogy a tweetek ötöde hónapokon belül eltűnik az oldalról. Az esetek 60 százalékában a tweetet eredetileg közzétevő fiókot priváttá tették, felfüggesztették vagy teljesen törölték. A másik 40 százalékban a konkrét tweetet törölte az írója, de maga a fiók továbbra is létezett. Bizonyos típusú tweetek gyakrabban tűnnek el, mint mások, például a török vagy arab nyelven írt tweetek. Ezeknek több mint 40 százaléka már nem látható az oldalon a közzétételt követő három hónapon belül.

10 év alatt az oldalak 25 százaléka tűnt el az internetről

A tanulmányt közel egymillió weboldal véletlenszerű mintájának összegyűjtésével végezték el, amelyet a Common Crawl nevű archiváló szolgáltatásból vettek, amely bizonyos időszakonként pillanatfelvételeket készít az internetről. A kutatók ezután azt vizsgálták, hogy ezek az oldalak 2013 és 2023 között továbbra is léteznek-e. Megállapították, hogy a 2013 és 2023 között összegyűjtött oldalaknak átlagosan a 25 százaléka már nem elérhető. Ezek közül az oldalak 16 százaléka olyan weboldalról származott, amely továbbra is létezik, míg 9 százalékuk olyan weboldalakon található, amelyek már egyáltalán nem léteznek.

Nem meglepő módon a régebbi pillanatképeknél volt a legnagyobb az elérhetetlen linkek aránya. A 2013-as pillanatfelvételből gyűjtött oldalak 38 százaléka 2023-ban már nem volt elérhető. De körülbelül minden ötödik oldal hasonlóan járt a 2021-es pillanatfelvételen gyűjtött oldalak esetében két évvel később.

Törölt vagy megváltozott tartalmú oldalak

Töröltté vagy ma már elérhetetlenné sokféleképpen válhatnak az oldalak. Például, ha az oldal már nem létezik a szerverén vagy maga a szerver nincs már. Az ilyen típusú oldalt meglátogató személy a keresett tartalom helyett általában a „404 Not Found” szerverhiba egyik változatát kapja.

Másik lehetőség, hogy az oldal címe létezik, de a tartalma − néha drámaian − megváltozott az eredetihez képest. Az is előfordulhat, hogy az oldal létezik, de egyes felhasználók − például a látássérültek − nehezen vagy egyáltalán nem tudják elolvasni. Azonban ez a kutatás nem az akadálymentességre koncentrált, hanem az oldalak tényleges létezésére, vagyis, hogy valami online elérhető-e vagy sem.

A 2013-ban létező weboldalak 38 százaléka mára eltűnt
A 2013-ban létező weboldalak 38 százaléka mára eltűntJuan Algar / Getty Images Hungary

Azonban a helyzet még így sem egyszerű, ugyanis több tucatnyi státuszkód esetén nem egyértelműen megállapítható, hogy az oldal véglegesen megszűnt, vagy csak átmenetileg nem elérhető. Más részről biztonsági okokból sok webhely aktívan igyekszik megakadályozni azt a fajta automatikus adatgyűjtést, amellyel a kutatás készült. Így csak azokat az oldalakat tekintették elérhetetlennek, amelyek azon kilenc hibakód valamelyikét adták ki, amelyek egyértelműen jelzik, hogy az oldal és/vagy az azt fogadó szerver már nem létezik.

Nem is gondolnád, de a TikTok és a Facebook akkor is nyomon követhetnek, ha nincs fiókod náluk. Az alábbi cikkünkből kiderül, hogy hogyan.

DOGZ Fesztivál a Városligetben!

Szeptember 7-én kutyás bemutatókkal, falkasétával, izgalmas előadásokkal, tanácsadással és gyerekprogramokkal vár mindenkit az év legnagyobb kutyás rendezvénye.

Regisztrálj az ingyenes rendezvényre!

hirdetés

Oszd meg másokkal is!
Érdekességek