Feeds:
Entrades
Comentaris

Posts Tagged ‘dades’

(Article publicat a NacióDigital.cat,  el 13/09/15)
El 1993, el dibuixant de còmic Peter Steiner es va fer mundialment conegut per publicar a la revista The New Yorker una vinyeta que va córrer per Internet fins a la sacietat. Aquesta mostrava un gos, davant d’un ordinador, que li deia a un altre:”A Internet ningú pot saber que ets un gos”. La il·lustració reflectia d’alguna manera la meravellosa sensació dels primers usuaris d’aquella Internet primitiva al poder moure’s per un entorn virtual d’incògnit. Dues dècades més tard… l’acudit ja no té sentit. Ser anònim a Internet és impossible.

La vinyeta m’ha vingut al cap al repassar el cas Ashley Madison (AM) que aquest estiu ens ha tingut ben entretinguts. Al costat de les notícies del procés català hem compartit sobretaula amb les infidelitats de milions de persones que mantenien relacions sexuals amb desconeguts a través d’aquesta web. I ara, fa només dos dies, mentre nosaltres encetàvem la campanya del 27-S i somiàvem amb la celebració de la Diada, un altre grup de hackers va anunciar que té en el seu poder 11 milions de contrasenyes dels infidels. De moment, no pensa fer-les públiques però ha deixat ben explicat els detalls de com aconseguir-les.

Pels que hagin desconnectat del tot durant l’agost i sigui la primera vegada que llegeixen sobre el tema, cal apuntar que tot va començar el 20 de juliol quan el grup de pirates informàtics, Impact Team, va enviar un missatge a la companyia Avi Media Life (propietària de la plataforma d’Ashley Madison), assegurant que havia robat la base de dades dels seus clients. I que la faria pública perquè l’empresa no era legal al prometre que eliminaria els rastres dels seus clients si aquests pagaven una tarifa de 19 dòlars. Impact Team volia demostrar que AM mentia i com a prova tenia un fitxer de gairebé 10 gigabytes a les seves mans.

(més…)

Anuncis

Read Full Post »

K15 acull durant quatre dies una Hackathon de dades sobre la fam a Catalunya i a Espanya.

La Hackathon es una col·laboració entre l’Open Knowledge Foundation Spain i el Centre de Cultura Contemporània de Barcelonaraa (CCCB), Diari Ara.catInfogr.am i Wolfram Research.

Per a participar consulta les bases i premis. Registra’t aquí.

white-strokeLa Hackathon compta amb un programa molt complet, on experts de diferents professions compartiran coneixement amb els participants. A tots ells, moltes gràcies per la seva col·laboració desinteressada.

Aquí va el Programa final:

 

(més…)

Read Full Post »

Joan Soler, director de l'Arxiu Històric de Terrassa. (Font: CCCB. Miquel Taverna)

Joan Soler, director de l’Arxiu Històric de Terrassa. (Font: Flickr CCCB. Autor: Miquel Taverna)

Vaig tenir l’oportunitat de conèixer al director de l’Arxiu Històric de Terrassa (AHT)Joan Soler, el passat més d’abril, a les II Jornades de Periodisme de Dades i Open Data (JPD14), celebrades a Barcelona el passat mes d’abril.

En el seu discurs va esmentar l’arxivística de les dades i em vaig quedar encuriosida per saber alguna cosa més del tema. Al cap d’uns mesos, vam quedar de nou per seguir parlant del tema.

L’actual AHT, creat el 1932, està en el seu procés més fort de digitalització. Joan Soler explica que només a la web es pot trobar documentació antiga, en format PDF, des del 1400 i fins al 1994. Físicament no pot quantificar el nombre de documents en paper que conté l’Arxiu però són uns 5.500 metres de prestatges. D’aquests, digitalitzats més de 340 mil documents. La xifra sembla enorme però segons Soler només estan en el començament de la conversió del paper al digital.

Ple de l'Ajuntament de Terrassa amb caràcter extraordinari tras la mort de Francisco Franco (Font: Web de l'Arxiu Històric de Terrassa. 20/11/1975)

Ple de l’Ajuntament de Terrassa amb caràcter extraordinari tras la mort de Francisco Franco (Font: Web de l’Arxiu Històric de Terrassa. 20/11/1975)

Tens algun referent de l’arxivística de dades?
Estem en una fase molt iniciàtica del problema. Hem d’anar cap a una arxivística de dades perquè la professió va una mica lenta.

Per què el planteja com un problema i per què van molt lents?
Perquè tenim molt clar que hi ha un repte i una responsabilitat molt gran en la gestió de documents electrònics i bases de dades però ens falta recorregut. Les iniciatives que surten des de la professió són puntuals, estan en fase laboratori, per anar a provar. Anem amb el fre de mà posat perquè hi ha molts pocs recursos.

Per què és complicada la gestió de documents electrònics?
Pels volums, perquè no ho pots controlar tot. D’altra banda, s’està generant molt de soroll.

Què vol dir ‘soroll’?
Documentació en excés, no necessària. Hi ha la creença que un cop passes a la fase digital, no tens problemes d’espai i això provoca que s’estiguin generant més documents digitals que en paper. En molts casos, es fa una còpia de tot el que ja tenim. Estem duplicant la feina més que resoldre-la. Tot allò que s’ha volgut fer de cara a millorar l’eficiència administrativa i de les empreses, és bona voluntat però no és real. El que proposen els arxivers és determinar i seleccionar els documents que són realment útils i eliminar el soroll.

S’hauran de crear nous criteris per establir el què és i el què no és realment útil
Sí, i també eines que permetin seleccionar tot el sobrer i facin més eficients els repositoris als servidors.

Doncs es planteja una etapa de transició molt emocionant 
Ho és i també té una tasca titànica.

La Història ha demostrat que el paper es conserva però els formats digitals, per l’obsolescència dels lectors, es perden. No us espanta aquest fet ara que esteu digitalitzant tot l’antic?
Anem a un ritme frenètic de migració constant de formats i d’aplicacions que permetin continuar llegint-los o visionar-los.

En costos, això deu ser immens..
Insostenible. Et posaré un exemple: tinc pergamins del segle X. El pergamí no és només paper sinó també pell d’animal tractada perquè s’hi pugui escriure a sobre. Han durat 1.000 anys. És un suport bo per a la preservació. Abans hi havia el papir. Tot el papir de l’Àfrica abans del S.X s’ha conservat pel clima sec. Però tot el que va haver-hi fins a Europa es va perdre. El papir no va suportar la prova del temps. Es diu que als segles VIII o IX la gent era analfabeta perquè no ens consten documents: Però no és cert, va ser un problema de preservació de documents. En canvi, tot el que es va poder passar a pergamí es va conservar.

Em recorda al llibre d’Umberto Eco, ‘El nom de la rosa’, amb aquells monjos que copiaven llibres..
Exacte. Ara tenim un problema semblant. Eco parla d’una nova Edat Mitjana de la preservació. Tenim el mateix problema que llavors.

 El paper reciclat és ecològic i es fa servir molt al moment actual, però és paper reutilitzat. Què quedarà d’aquests documents?
Res. Són fatal per a la conservació.

Internet recupera molt poc ja de la seva primera dècada de vida, les URLs es perden i amb elles tot el que s’ha escrit en pàgines web. Quin paper poden jugar els arxivers en aquest sentit?
El nostre col·lectiu professional ja s’ha dedicat a resoldre aquest assumpte en el món analògic. Ara hem de ser capaços de proposar polítiques per garantir aquesta preservació també en el digital.

Quin és el pas més urgent a fer en l’arxivística de les dades?
A mi m’agradaria extreure dades significatives dels documents manuscrits o digitalitzats, passar-los a bases de dades, i a partir d’aquí fer estudis, càlculs o visualitzacions de coneixement.

I per què no ho fan?
És un procés molt innovador que s’està provant en molts pocs llocs encara. A Catalunya el fa el Centre de la Visió per Computador (CVC) de la Universitat Autònoma. El que sí fem des de l’Arxiu Històric de Terrassa és formació a estudiants perquè entenguin bé la documentació antiga i sàpiguen veure la informació significativa que es podria extreure de manera automatitzada.

P: Encara que no es pugui fer per ara…
El CVC ha aplicat tecnologia de reconeixement de caràcters sobre documentació escrita, han extret aquests caràcters i els han passat a bases de dades obertes, que després qualsevol se les pot descarregar. Així, a la visió clàssica del treball dels arxius se li suma un coneixement tecnològic que poca gent té ara. Aquest ha de ser el camí cap a la transició digital moderna. Altrament, els arxius històrics acaben sent museus de paper, cementiris o espais de contemplació.

——————————-

Recomanat:
Archivos, contexto y datos. El potencial de los archivos en las II Jornadas de Periodismo de datos y Open Data“, por Joan Soler.
Interessant reflexió entorn de les dades, al Big Data, i a les simbiosis que pot haver-hi entre periodistes i arxivers. Si volen treballar amb dades, totes dues professions es necessiten.

 

Read Full Post »

Deixo aquí els vídeos que va enregistrar el CCCB amb motiu de la IV Sessió de Periodisme de Dades que va organitzar la OKFN-Spain en col·laboració amb l’equip del CCCBLab, el passat 16 de desembre.

Per tancar l’any, vam tenir dos convidats de luxe que ens van ensenyar molt.

De la banda dels continguts, estava l’editor multimedia del The New York Times, l’Aron Pilhofer, que dirigeix un equip de desenes de periodistes, programadors, experts en xarxes socials i marquèting online. Durant la seva intervenció, va parlar de multimèdia, però també de dades, de com interactuar amb les audiències i de com gaudir del periodisme amb totes les eines digitals i possiblitats que tenim actualment al nostre abast.

Aquesta és una mini entrevista que l’equip del CCCBLab li va fer.

I aquí la presentació que va fer durant la sessió:

I ara ve el taller d’scraping que el programador Michael Bauer ens va oferir durant una hora llarga. Amb ell podem entendre de quina manera funcionen les pàgines HTML i com portar les dades a un full de càlcul per treballar amb elles.

Tots dos es van oferir a respondre dubtes i consultes i van deixar les seves dades de contacte.

La propera cita de Periodisme de Dades al CCCB, anoteu… serà el 22 de gener del 2014.

¡Ens veiem!

Read Full Post »

bg-bodyTornem a tenir sessió de periodisme de dades al CCCB.

Aquestes trobades són organitzades pel capítol espanyol de l’Open Knowledge Foundation i, a partir d’ara, també amb el recolzament de l’Ajuntament de Barcelona. Així que el primer que fem és preparar una sessió monogràfica per conèixer, de primera mà, el camí fet per part de l’administració local en transparència i accés de la informació.

Ara fa més de dos anys, l’Ajuntament de Barcelona va iniciar el projecte Open Data Barcelona per posar a l’abast de tothom les dades administratives generades en l’activitat municipal. En Sergio Jerez, director de Mobile, eGovernment&Data, ens donarà més informació al respecte. L’Open Data Barcelona forma part de l’estratègia d’Open Government de l’Ajuntament, que ens explicarà en Carles Agustí, Comissionat Municipal de Participació Ciutadana i Associacionisme.

Després d’aquestes explicacions per posar-nos en context, passarem a la part més pràctica.

En Lluís Sanz, director d’Informació de Base i Cartografia, de l’Institut Municipal d’Informàtica i Isaac Aparicio, responsable de Gestió de la Informació de Base a l’IMI mostraran de quina manera treballar amb les dasdes que hi ha en obert en els diferents portals de l’administració local. 

La sessió també vol propiciar el debat i la crítica cap a les dades que tenim actualment per treballar. Així que aquesta és una oportunitat per saber els criteris alhora d’obrir unes determinades dades i no altres i també per preguntar de quina manera els ciutadans (periodistes o no) podem sol·licitar que es publiquin nous fitxers.

DIA: Divendres 22 de novembre de 2013

HORA: De 16.30 a 19.30

LLOC: Centre de Cultura Contemporània de Barcelona. C/Montalegre, 6.

Ens veiem!

Pd: Us deixo aquí els vídeos de la Sessió II, on Eli Vivas i Francisco Moya van explicar el projecte Fuga2.

I el taller de Google Fusion Tables que va impartir l’Eduard Martin-Borregón.

CCCB LAB // Periodisme Dades. Sessió de treball (II). Projecte Fuga2 (VO Es) from CCCB on Vimeo.


CCCB LAB // Periodisme Dades. Sessió de treball (II). Taller de Google Fusion Tables (VO Es) from CCCB on Vimeo.

Read Full Post »

« Newer Posts - Older Posts »