Feeds:
Entrades
Comentaris

Vinton Cerf, un dels pares d’Internet, va alertar fa uns anys del “Black digital hole” (o “Forat negre digital”). Vivim en una societat digital construïda de manera efímera. El coneixement que generem avui, segons Cerf, difícilment arribarà als nostres descendents del segle 22. Per què?

“Perquè no s’ha trobat la manera de preservar-lo. El problema no està a conservar molts bits, sinó en poder interpretar-los”, explica Cerf. “Si l’any 3.000, li diem al Google de torn que ens cerqui un arxiu del passat i ens torna un PDF creat l’any 2007, el sistema operatiu del futur no l’interpretarà. Quina maquinària serà capaç de llegir aquests bits?”, es pregunta el científic.

Confiar en la nostra capacitat

Què serà de les generacions futures quan no puguin aprendre dels errors del passat? Tampoc sabem si tota la informació que tenim al nostre abast avui perdurarà molts més segles. És de preveure que si nosaltres hem recuperat el que s’havia deixat escrit (en diferents materials) fa milers d’anys, bona part d’aquesta informació serà accessible cent o dos-cents anys més. O no?

Si no es poden llegir o interpretar els bits que avui emetem, la Història del segle 21 serà un forat temporal? Les fotografies, els vídeos, els àudios, els textos digitals que formen part del nostre dia a dia no hauran existit mai? Aboquem tot al núvol i confiem que les grans multinacionals ho conservaran per sempre. Però, quant de temps és ‘per sempre’?  25 anys, 50, 100?

Aquesta és la segona part de l’article titulat: “Futur sense Història?, publicat en aquest mateix blog a mitjans d’agost. La lectura va generar un interessant debat a Twitter, amb aportacions d’experts de diferents àmbits professionals. Una de les conclusions generalitzades va ser que el pessimisme de Vinton Cerf no ens podia col·lapsar i que calia confiar més en la superació de l’ésser humà amb la tecnologia. 

Flotant entre la incertesa i el pessimisme

D’entrada sorprèn que algú com Cerf plantegi el neguit i no aporti solucions possibles. Algú que va ser capaç, fa més de 50 anys de dissenyar una infraestructura tan potent com Internet, i que ha viscut la seva evolució durant el darrer quart de segle, com pot ser que no tingui respostes a un problema majúscul com aquest?

Vinton Cerf va liderar el projecte de la Internet Interplanetària durant anys

Cerf també va liderar durant una dècada un grup de científics per desenvolupar el que havia de ser la Internet Interplanetària, un projecte global de dimensions gegants, objectiu del qual consisteix a assegurar una xarxa de nodes a l’espai per comunicar-se entre ells.

Per aquests i altres motius, alguns com en Joan Soler, president de l’Associació d’Arxivers i Documentalistes de Catalunya, recela de les seves paraules: “A part de l’evident raó sobre els riscos de pèrdua digital, hi ha també l’oportunitat del negoci de la preservació. I de negocis, Google en sap molt”. Potser no va desencertat. Cerf és des del 2005, vicepresident honorífic de la multinacional, i d’aquí a uns anys ens podria sorprendre amb algun projecte lucratiu en aquest sentit.

En la conversa van sortir també neguits com el del consultor tecnològic Josep M. Ganyet: “Rellegir 1984 amb aquesta perspectiva fa molta por. En un món digital no hi ha originals. Ningú no pot garantir que l’edició digital de 1984 que estàs llegint sigui l’original”.

El repte: la sostenibilitat

“Es pot calcular per a quan està programada l’obsolescència de la nostra història recent?”, preguntava G! iCamps-. Aquesta és la pregunta del milió. “Segur que tenint en compte els canvis en els estàndards dels formats i els suports d’emmagatzematge es pot saber quan ‘caducarà’ un document o un conjunt de dades”, afegia.

Francine Berman és una pionera de la preservació digital

Des de fa anys, científics i experts de tot el món estudien de quina manera s’hauria d’abordar el problema. A banda dels noms que ja vaig citar en l’article anterior, cal mencionar les investigacions de la científica informàtica Francine Berman, líder en la preservació de dades digitals.

El 2008, va publicar la primera part de l’informe: “Sustaining the Digital Investment, per emmarcar el context i el seu sosteniment econòmic. La segona part: “Sustanaible Economics for a Digital Planet: Ensuring Long-Term Accesto Digital Information” (2009) posava en relleu la discussió sobre el cost de la preservació digital, a més de fer sostenible l’accés al coneixement del passat. Els dos informes van comptar amb nombrosos experts de diferents disciplines i el finançament de diferents fundacions públiques i privades dels Estats Units.

Segons Berman, les decisions sempre es prenen sota condicions d’incertesa: tecnologies, entorns polítics, prioritats d’inversió i preocupacions socials al llarg del cicle de la vida digital. “Però podem i cal desenvolupar pràctiques que anticipin o resolguin les incerteses, que aprofitin els recursos existents per tal que el coneixement perduri en el futur”.

L’informe final també assenyala que “hi ha una necessitat urgent en tots els sectors de la creació digital – públics i privats, científics i culturals- per donar suport a curt termini a les estratègies més robustes”. Segons apunten aquests experts, és una qüestió que s’ha d’abordar amb la mateixa urgència que el canvi climàtic o l’energia sostenible. “Són desafiaments socials pels quals s’ha de ferun acte d’equilibri, valorant les necessitats del present amb les del futur. La preservació depèn de la cooperació de les generacions per administrar l’actiu més preuat a través del temps: el coneixement”.

Discrepàncies sobre què conservar

És obvi que no tot el que produïm s’ha de mantenir eternament. No ha estat així en el passat, ni tindria sentit fer-ho ara. Però llavors què serà i no serà important per a les generacions futures? Qui té el criteri definitiu per decidir-ho? Basant-se en què? I qui s’ha d’ocupar d’aquesta preservació digital?

El científic del CERN David Enterria expressava que no tenir tot el que es produeix a Twitter d’aquí a uns segles tampoc seria tan greu. “És el mateix que no tenir les converses “de cafè” dels nostres avantpassats. La informació important s’arxiva a diaris, revistes, diaris de sessions, etc., que sí passen a la posteritat”.

Discrepo. No poder llegir totes les converses de TW d’aquí 50,100 o 1.000 anys és tanta pèrdua d’info històrica com la de no tenir avui les converses “de cafè” dels nostres avantpassats. La info important s’arxiva a diaris, revistes, diaris de sessions..que passen a la posteritat

— David d’Enterria #JoSócCDR (@denterd) 19 d’agost de 2018

Vicenç Ruiz, vocal de recerca de l’Associació D’Arxivers de Catalunya, matisa que “no es tracta de preservar-ho tot”. “L’avaluació arxivística indica què preservar i què no. És més important que mai en un context de dades massives. I fer-la de forma horitzontal, amb participació dels productors, clau per alfabetitzar digitalment la ciutadania”.

I va recordar que el biaix dels arxius avui dia és brutal justament perquè només es conserven les fonts oficials i la premsa. “Pensa quines evidències tindríem de l’1-O tindríem només amb registres “oficials”.

Possibles solucions…

Llavors va sorgir al debat el blockchain, com la tecnologia que ha de donar la solució al gran problema que arrosseguem. Però tal com s’explica en aquest interessant article del consultor tecnològic Larry Arton ( We need to stop glorifying innovation. Here’s why), potser és el moment de “deixar de glorificar la innovació”.

El científic de dades Ricardo Baeza-Yates – director durant anys el YahooLabs a Barcelona i ara és director de tecnologia a NTENT, una empresa californiana dedicada a la cerca semàntica- discrepa sobre el blockchain. “Dubto que resolgui el problema. I si ho fes, seria ineficient, ja que el càlcul necessari seria molt costós”. I em remet a un article on s’explica la inversió energètica que actualment s’està fent servir per operar amb la criptomoneda estrella, el bitcoin. A partir d’un índex, s’estima que la mineria del bitcoin necessita tanta energia com el consum energètic de tota Àustria. 

A la conversa entra el desenvolupador Web Pol Maresma: “I mentre arriba el blockchain, continguts amb MD5 incorporat”. Segons Baeza-Yates, l’MD5 és un algoritme que rep un munt de dades i retorna un nombre sencer de 128 bits. La Viquipèdia explica que va ser dissenyat MD5 per professor del Massachusetts Institute of Technology (MIT) Ronald Rivest el 1991. Però es van descobrir alguns problemes de seguretat i el seu futur és una mica dubtós. “Està bé per verificar si un document s’ha alterat”, continua el científic de NTENT. “Per exemple: si guardo un document amb MD5 i vull saber si s’ha modificat, calculo l’algoritme inicial i puc comprovar la diferència. Però no serveix per a la preservació digital”.

L’arxiver Aniol Maria també rebat la idea de Maresma: “Però quin criteri tècnic us fa pensar que afegir una capa de xifratge als continguts i distribuir-los per P2P n’assegurarà la preservació? Certa seguretat de la integritat sí, però et falten la resta de requisits: autenticitat, fiabilitat…”. L’actual director de desenvolupament tecnològic del govern de les Illes Balears i històric d’Internet, Benjamí Villoslada, hi afegeix que “la resposta a tot (conservar el coneixement actual) és el software”.

La resposta a tot és el software. L’important és al meu blog i publicat amb programari lliure perquè em permet guardar i migrar.

— Benjamí Villoslada 💛 (@benjami) 19 d’agost de 2018

Una tasca de llarg termini

Després de tot el que s’ha dit, cal tornar a la científica informàtica Francine Berman que lidera una de les investigacions més pioneres sobre la preservació digital. Uns anys més tard d’haver presentat els dos informes esmentats, va insistir-hi en la urgent necessitat de comptar amb plans nacionals per conservar el coneixement actual.

“La preservació digital és un problema tècnic però també econòmic. Qualsevol solució que no sigui sostenible durant un llarg període de temps, no serveix”, diu Berman, una de les directores del The Blue Ribbon Task Force on Sustainable Digital Preservation and Access, aliança d’economistes, científics informàtics,acadèmics, arxivers, representants de la indústria i dels governs nord-americà i britànic.

Per tant, el problema l’hem d’entendre com un work in progress. Des del punt de vista polític, s’ha de considerar una prioritat. No serveix que un determinat govern hi inverteixi una quantitat de diners i el següent no ho consideri transcendent. És una inversió per ser gaudida en el futur i no en el present, un llegat pensant en els nostres néts. Com intentar que la Terra continuiï sent un planeta en el qual es pugui viure en pròxims segles.

Caldria preguntar-se si aquesta és una prioritat dels països més avançats en govern electrònic, com ara Estònia, on el 99% dels tràmits oficials amb els ciutadans es fan a través d’Internet. Aquesta república de només 1.280.000 habitants va impulsar la identitat digital el 2002, el vot electrònic tres anys més tard, el blockchain el 2008 i la residència electrònica el 2014. ‘Impulsar’, en aquest cas, significa trobar la manera d’aplicar totes aquestes tecnologies amb la ciutadania i aprendre’n dels errors i els encerts. L’Arxiu Nacional participa des del 2014 en el projecte Comunitat com a Oportunitat- Xarxa d’arxius i usuaris creatius (CO: OP), cofinançat pel Programa Europa Creativa de la UE i compta amb 17 institucions d’11 països. L’objectiu és recuperar fotos històriques i altres documents de particulars digitalment. És aquest un començament?

Catalunya, estat digital

Fa uns dies el conseller de Polítiques Digitals i Administració Pública Jordi Puigneró promovia que “Catalunya havia de ser un estat digital en forma de república”, des del qual es potenciés la capacitació digital dels ciutadans, la ciberseguretat, la fibra òptica, la innovació tecnològica i la transformació interna cap a un govern obert. I Estònia és un model a seguir, segons les paraules del conseller.

I ara faig la pregunta: En aquest nou estat digital, serà una prioritat la preservació digital? Fa anys que la Biblioteca de Catalunya té en marxa els programes PADICAT (Patrimoni digital de Catalunya) i COFRE (COnservem per al Futur Recursos Electrònics). Però és suficient o ens calen més accions?

Des de l’Associació d’Arxivers de Catalunya reclamen un Pla Nacional de Preservació Digital, per aplicar una arxivística activa i recuperar també molt del material que corre per les xarxes socials, com ara Twitter, que fins ara no s’havia tingut en compte. 

En els darrers anys, Twitter s’ha convertit en l’àgora de sectors socials enfront de problemàtiques que afecten a grans col·lectius. “Cal anar cap a un model participatiu d’arxiu de dades massives”, expliquen en un article on detallen la metodologia emprada per capturar les veus del #Cuéntalo, el relat de milers de dones de diferents països que van patir abusos sexuals. I reclamen els arxivers: “Cal allunyar-se de procediments reglats i necessitats de negoci”.  

En aquest sentit, Joan Soler està convençut que darrera de Facebook, Twitter, Google, o Amazon l’estratègia està més que definida i marcada, atenent que és la base del seu negoci, la preservació de dades digital, per a la seva venda. “El problema està en la preservació digital de la informació pública i si les administracions tenen estratègies a llarg termini no sotmeses als designis del mercat”.

“Innecesàriament pessimistes”

Carme Callés, professional de l’administració digital i entusiasta de la innovació al sector públic afegia al debat que començaria per triar el que és important del superflu.

Jo començaria separant el gra de la palla, després seleccionaria el gra de + qualitat i amb ell faria un bon pa que ens pogués alimentar un parell de generacions, no +. Al segle 22 qui sap què els convindrà: millorar la recepta o deixar de fer pa!

— Carme Callés (@carmecalles) 20 d’agost de 2018

El físic David d’Enterria considera que “l’article de Vinton Cerf és innecessàriament pessimista, perquè si hi ha voluntat de preservar la informació, no hi ha forat negre. I existeixen les eines tècniques per fer-ho”.

De la mateixa opinió és el científic tecnològic Ricardo Baeza-Yates. “L’HTML serà fàcil d’interpretar sempre, perquè està basat en XML, que és al mateix temps ‘machine readable’ i ‘human readable’ (les dades són llegides tant per màquines com per persones). Word pot fer servir XML. El problema seran els formats propietaris. La solució seria traspassar tot a text i imatges en formats senzills (sense comprimir) per ser interpretats en el futur. Però ningú s’està preocupant de fer això. A excepció dels arxius de la Web (un als EUA i altre a Europa) que guarden les dades però no simplifiquen el format”.

En els pròxims anys, els éssers humans generarem més dades i informació que mai abans. Els ordinadors de gran potència, el big data, els algoritmes, la intel·ligència artificial, les ciutats intel·ligents, la robòtica, la indústria 4.0 o la internet de les coses potenciaran i dimensionaran el moment actual. Si bona part d’aquesta informació es processa, obtindrem coneixement. Un coneixement que no podem mesurar ni pesar avui, però que hi existeix.  

Ens enfrontem al repte del segle 21. D’acord amb els informes esmentats, preservar el contingut digital exigeix un gran compromís i pressupost per part dels governs. Qui estigui al càrrec d’aquesta missió haurà de decidir (simplificant molt) quin coneixement conserva, responsabilitzar-se de migrar-lo, normalitzar-lo a cada canvi tecnològic i disseminar-lo als usuaris del moment. Com aquesta és una tasca de llarga durada, no hi poden haver restriccions ni encriptacions possibles que impedeixin el seu accés d’aquí a un segle. S’hauran de tenir en compte les normatives de drets d’autor i, potser, crear drets no exclusius per a la preservació. “Per descomptat”- reclama The Blue Ribbon Task Force- “també cal més formació i capacitació digital per donar a les generacions futures habilitats i consciència per continuar amb la tasca començada avui”.

** Voldria agrair a tots aquells que van entrar al debat de la primera part d’aquest article: “Un futur sense Història?” i que ha permès escriure aquesta continuació.  Per a comentaris o suggeriments de millora, kpeiro@gmail.com. 

———————-

Enllaços relacionats:


“Si no en fem alguna cosa, molt em temo que el segle 21 no haurà existit per a les generacions futures”, Vinton Cerf (2015).

La periodista i escriptora nord-americana Doris Kearns va reproduir les converses mantingudes entre el president Lincoln i els seus contrincants a les eleccions presidencials de 1861, en el llibre “Equip de rivals” (2005). Per documentar-se va recórrer a les cartes conservades durant 150 anys, a més d’un centenar de biblioteques dels Estats Units. El guionista Tony Kushner es va basar en l’obra de Kearns per escriure la pel·lícula “Lincoln” (2012) dirigida per Steven Spielberg, i ha estat llibre de capçalera de presidents, com ara Barack Obama.

Imaginem ara per un moment que som al segle 22 i que volem recuperar les converses mantingudes entre diferents líders polítics aquest 2018. “Houston, tenim un problema!”, que diríem parafrasejant la frase que suposadament va pronunciar l’astronauta Jack Swigert durant l’accidentat viatge de l’Apol·lo 13 a la Lluna. Tenim un problema perquè els debats i missatges en aquest inici de segle 21 són efímers.

El llibre de Doris Kearns va servir de guió per al film ‘Lincoln’ d’Steven Spielberg

Les piulades de Twitter que després es reprodueixen per Whatsapp o per correu electrònic desapareixeran en mesos. Amb una mica de sort, si algun mitjà ha capturat el tuit d’un polític i l’ha reproduït en una de les seves notícies, el comentari durarà tant com aquella pàgina a la Web. Podem concedir-li uns deu anys, perquè els dissenys canvien i els navegadors també.

Però cal preservar tot el que produïm? Com i qui fa la tria del contingut que serà d’interès en el pròxim segle?

Tornem al present. Segons Internet Live Statistics, avui publiquem en només un segon 8.146 tuits; pugem 862 fotos a Instagram; realitzem 3.292 trucades d’Skype; 68.729 cerques a Google; mirem 74.997 vídeos de YouTube i enviem 2.717.211 emails. Tot això en només un segon! La majoria d’aquest contingut no s’ha creat des d’un ordinador de sobretaula, ni des d’un portàtil. S’ha creat i es consumeix des d’un telèfon mòbil. Un aparell que desapareixerà en menys de tres anys a conseqüència de l’obsolescència programada o de la dèria personal per posseir l’última innovació del mercat. “El núvol ens salvarà”, diran molts. “Tot es conserva allà”, afegiran convençuts. Sí?, deixeu-me que ho posi en dubte.

El forat fosc digital

Vinton Cerf, un dels pares d’Internet, ja va alertar el 2015 sobre el “Digital Black hole” (Forat negre digital). “Tenim un gran problema i no hi ha cap pista de com solucionar-lo”, va advertir qui és actualment també vicepresident de Google.

“El problema no està a conservar molts bits, sinó en poder interpretar-los. Anem a l’any 3.000. Imaginem que li diem al Google de torn que ens cerqui un arxiu del passat i ens torna un PDF creat en 1997. Amb moltíssima probabilitat, el sistema operatiu del moment no l’interpretarà. Com fer perquè aquest programari funcioni cent anys més tard després de la seva creació? Amb quina maquinària s’aconsegueix això? El mateix passa amb els videojocs”, puntualitza Cerf. “Molts dels que van aparèixer en la dècada dels 90 ja han desaparegut”.

       

 

Fins ara, ens hem ocupat de conservar la història i el suport que servia per llegir-la (pedra, argila, papir o pergamí) en biblioteques, museus i centres culturals. Però en el terreny digital, la qüestió es complica.

Els continguts que avui produïm són, en realitat, bits. Aquests bits es poden interpretar perquè un programari concret els sap llegir (en text, àudio, vídeo, interactiu). I aquest programari funciona perquè un determinat sistema operatiu d’un aparell (ordinador de sobretaula, portàtil, tauleta o mòbil) està adaptat perquè hi funcioni. Però d’aquí a un segle, “qui ens assegura que el contingut que avui generem els més de 4.000 milions de persones connectades a Internet es podrà interpretar?

Continua llegint »

Alan Turing

El concepte d’intel·ligència artificial és de fa molt. Els experts es remunten a la fi del segle XIX, però va ser el matemàtic i científic computacional Alan Turing, a mitjans dels anys 50, qui va aconseguir aplicacions d’interès. Com la que va realitzar durant la segona Guerra Mundial desxifrant els codis de la màquina alemanya de criptografia Enigma, creada pels nazis. “The imitation game” és un bon film que relata de quina manera Turing va aconseguir trencar la codificació alemanya. El matemàtic és conegut també pel test de Turing, segons el qual pot jutjar-se la intel·ligència d’una màquina si les seves respostes som molt difícils de distingir de les d’un humà.

Segons l’estudi: “Reshaping Business with Artificial Intelligence” -del prestigiós Institut de Tecnologia de Massachusets- moltes empreses volen aplicar la intel·ligència artificial però no totes estan preparades.

També destaca que el 85% de les quals han fracassat en la seva aplicació és perquè simplement la van introduir sense tenir en compte el problema a resoldre o el nou objectiu a guanyar. Simplement perquè tocava, perquè la competència la tenia o perquè ‘venia’ molt dir que treballaven amb IA. I, el camí correcte, segons els experts, hauria de ser el contrari: detectar un problema i intentar resoldre-ho. L’estudi va entrevistar en 3.000 directius, d’empreses de tots els sectors, de 122 països.

Avantatges i inconvenients de l’AI

Aquesta tarda (12/7/2018) es presenta a Barcelona, l’estudi de l‘Anuari de la Comunicació elaborat per l’organització Dircom. Serà a les 18.30h, a Foment de Treball, de Barcelona. Moderaré una taula rodona dedicada a la intel·ligència artificial aplicada a l’àmbit de la comunicació amb els experts: Lali Soler, cap de producte d’analítica de dades del centre tecnològic Eurecat;  Jordi Torras fundador i CEO d’Inbenta, una empresa especialitzada en el processament del llenguatge natural i David Llorente, físic i enginyer informàtic que parlarà de ‘Gabrielle’ el robot de l’empresa Narrativa que elabora notícies per ser publicades en mitjans de tot el món. 

Amb tots tres abordarem les qüestions més destacades com ara avantatges i inconvenients de l’aplicació de la IA en les empreses, la pèrdua de llocs de treball, l’ètica i com afecten les regulacions europees o com afecta la recent normativa de protecció de dades (GDPR), entre altres temes. 

Segons l’Anuari de la Comunicació de Dircom bona part dels professionals de la comunicació encara ignoren les possibilitats que ofereix la robòtica i els algorismes per al seu treball. I és molt normal! Per això, intentarem posar una mica de llum a aquestes qüestions.