Anàlisi de textos sobre salut
Mètodes per a investigar continguts dels mitjans de comunicació
Normalment, els investigadors socials analitzen els missatges en els mitjans a través de la lectura i codificació. Aquest mètode comporta molt de temps i restringeix molts estudis a mostres petites. Avui dia es troben disponibles ingents quantitats de text en format electrònic, per la qual cosa és fàcil recopilar molta informació sobre la comunicació de la salut. No obstant això, pot ser aclaparador per a un analista amb recursos limitats que utilitze mètodes convencionals. En aquest article explicaré i il·lustraré mètodes per a l’anàlisi de textos dels mitjans de comunicació mitjançant programari especialitzat (Wordsmith Tools i Wordstat). Aquests programes aporten un resum estadístic de les característiques clau dels textos per a comparar-los (observant, per exemple, els canvis al llarg del temps) i seleccionar cites il·lustratives que exemplifiquen les tendències detectades.
Paraules clau: textos dels mitjans de comunicació, anàlisi de dades, anàlisi assistida per ordinador, anàlisi de paraules clau, mineria de textos.
L’anàlisi dels missatges sobre salut dels mitjans de comunicació de masses és un aspecte important per a la promoció de la salut. Aquests missatges solen estar immersos en un mar de text. Gran part d’aquests textos estan disponibles per als especialistes en comunicació, a vegades mitjançant una simple descàrrega d’Internet. Hi ha bases de dades d’articles de periòdics i revistes que faciliten l’obtenció de grans mostres de material rellevant per a temes de salut. Per exemple, Nexis ofereix una base de dades indexada d’articles de mitjans impresos d’arreu el món en diversos idiomes. És tan fàcil com buscar articles relacionats amb un tema en particular i descarregar-los. El repte, per tant, és com analitzar quantitats tan extenses de material.
«L’anàlisi dels missatges sobre salut dels mitjans de comunicació de masses és un aspecte important per a la promoció de la salut»
L’enfocament tradicional era arreplegar els materials, llegir-los i dissenyar un esquema de codificació per a identificar temes recurrents. Hi ha programes com NVivo que faciliten aquest tipus d’anàlisi. Això es veu en un estudi que vaig realitzar amb Hannah Parke sobre la imatge en els mitjans britànics de les mesures polítiques que incentiven la gent –amb diners, per exemple– a adoptar comportaments més saludables (Parke, Ashcroft, Brown, Marteau i Seale, 2013). Volíem comprovar si la cobertura mediàtica abonava o no aquestes mesures, quin tipus d’arguments es presentaven a favor i en contra i si aquests diferien depenent del problema de salut que es tractara. Per fer-ho vam dissenyar un esquema de codificació. Tot seguit, es mostren alguns exemples dels arguments que vam codificar.
Arguments «en contra»:
• Millor inversió
Els diners despesos en plans d’incentius es podrien gastar millor en altres coses. S’hi inclouen mencions al cost dels plans i referències als diners del contribuent.
«Es destinaran els diners de l’NHS [National Health Service] a pagar sessions de ball als grossets quan la gent necessita medicaments contra el càncer i millors cures pal·liatives?» (Street-Porter, 2008).
• Suborn
Els incentius forcen els pacients a prendre decisions que no prendrien en condicions normals.
«L’opció de rebre diners per sotmetre’s a un tractament amb un medicament podria influir en les decisions personals en relació a quins tractaments són bons per a la gent» (Eaton, 2009).
Arguments «a favor»:
• Beneficia la societat
Beneficia tothom, no sols qui rep l’incentiu.
«Si tenir la gent en tractament funciona, hi hauria beneficis considerables per al públic» (Hall, 2007).
• És el millor per a ells
Els incentius ajuden la gent a fer el que més els convé. S’hi inclouen mencions dels beneficis per a la salut de l’individu.
«S’intenta que aquest pagament únic ajude les mares embarassades a mantenir-se en forma i sanes abans del part» (South Wales Echo, 2009).
Entre altres coses, observem que una política que donava diners a les embarassades per a gastar en menjar saludable era més popular que una política que premiava la gent per perdre pes amb èxit. Com que havíem codificat els arguments a favor i en contra que s’oferien en cada cas, podíem recuperar els més rellevants per a l’anàlisi.
Tot això va costar una gran quantitat de temps. Els dos vam haver de llegir cada article, dissenyar codis, acordar com s’aplicarien i modificar-los quan trobàvem exemples en què discrepàvem o que no s’ajustaven als codis triats. Però només s’incloïen uns cent articles en l’estudi, així que era manejable.
La majoria d’anàlisis d’aquest tipus es fan amb mostres petites per la quantitat de temps que requereix fer-ne l’anàlisi. Això restringeix l’abast de l’estudi i, ara que és fàcil obtenir grans quantitats de textos dels mitjans de comunicació, és interessant dur a terme estudis molt més grans. Però, què fem quan un estudi implica milers d’articles i milions de paraules?
Analitzar mostres grans
Em vaig enfrontar a aquest problema quan vaig voler analitzar les publicacions en fòrums d’internet de gent amb càncer de mama o de pròstata, i el programari Wordsmith Tools va mostrar-se ser molt útil (Seale, 2005; 2006). Hi havia més d’un milió i mig de paraules per a analitzar. No pretenia llegir-les totes! Però sí que volia analitzar-les totes, no sols una submostra.
Wordsmith Tools permet comparar la freqüència de paraules en dos textos. Per exemple, les paraules més comunes en el text sobre càncer de pròstata eren PSA (test d’antigen prostàtic específic [“Prostate Specific Antigen”, per les seues sigles en anglès]) i brachytherapy (“braquiteràpia”, un tractament per al càncer de pròstata). En el text sobre càncer de mama, paraules com breast (“pit”) i tamoxifen (“tamoxifè”) eren més comunes. Tot això era bastant previsible i poc sorprenent.
Però algunes altres paraules apuntaven a diferències entre homes i dones en els aspectes de la seua experiència que consideraven importants a l’hora d’enfrontar-se a una malaltia greu. Els homes mostraven una major contenció emocional al final dels seus missatges. Per exemple, usaven més regards (“atentament”) en compte de X (representant un bes). Les dones es referien molt més sovint a una altra gent a més de fer-ho a si mateixes en els seus missatges, amb paraules com I (“jo”), me (“mi”), her (“a ella”), I’m (“jo sóc”), women (“dones”), mum (“mamà”), they (“ells”) i my (“el meu”).
En aquest tipus d’anàlisi és important, per descomptat, investigar paraules concretes i assegurar-se que signifiquen el que un creu (en un procés conegut com desambiguació). El problema no es dóna amb paraules com mastectomy (“mastectomia”) o brachytherapy (“braquiteràpia”), però què ocorre amb X? Es refereix a un petó o és part de X-ray (“raigs X”)?
El programari permet veure el context real de cada paraula de manera individual (mitjançant les visualitzacions «Keyword in Context» [KWIC per les seues sigles en anglès]). Generalment convé excloure paraules amb múltiples significats. En aquesta col·lecció de textos (o corpus, com se li coneix de vegades), la paraula X s’usava quasi de manera exclusiva per a referir-se a petons, no a raigs X.
En un assaig anterior (Seale i Charteris-Black, 2010) vaig explicar com passar de les visualitzacions quantitatives a la selecció d’exemples qualitatius que il·lustren les diferències clau entre els textos, i com es poden fer comparacions més interessants que simplement mostrar que les dones són més emocionals i se centren més en la gent que no els homes. També he mostrat la utilitat d’aquest procediment simple de Wordsmith Tools per generar resultats en tota una sèrie de temes relacionats amb la salut, alguns dels quals impliquen l’anàlisi de textos dels mitjans de comunicació (Seale, 2008; Seale, Boden, Lowe, Steinberg i Williams, 2007; Seale i Charteris-Black, 2008a, b; Seale, Charteris-Black, Dumelow, Locock i Ziebland, 2008; Seale, Charteris-Black i Ziebland, 2006; Shepherd i Seale, 2010).
En compte de repetir-ho, vull centrar-me ara en un enfocament més sofisticat per a l’anàlisi de textos assistida per ordinador. Per a això, m’agradaria parlar d’un estudi no publicat en el qual estic treballant. Descriu la cobertura en la premsa britànica dels debats sobre la mort assistida (per exemple l’eutanàsia o el suïcidi assistit) al llarg del temps, des de començament del segle xx. Per fer-ho, vaig utilitzar un programa anomenat Wordstat. També vaig usar Nexis per descarregar els textos electrònics de cinc periòdics nacionals (The Guardian, The Times, The Daily Mail, The Mail on Sunday i The Observer), així com del British Medical Journal. Els termes de cerca van ser els següents (! és un comodí per a qualsevol terminació, OR significa “o”): euthanasia OR assist! dying OR mercy killing OR right to die OR assist! suicide.
Els estudis existents de la cobertura mediàtica de la mort assistida es basen en mostres curtes de text, a causa de la gran quantitat de temps que requereix el tipus d’anàlisi que trien (normalment un enfocament de codificació). Wordstat em va permetre realitzar una anàlisi de tota la cobertura d’aquest tema (uns 4.340 articles) en els periòdics i revistes científiques interessats des que va començar el debat al voltant d’aquest tema.
La cobertura ha augmentat amb el temps (excepte una disminució temporal durant la Segona Guerra Mundial). Els debats moderns van començar prop de 1935, amb la formació de la Voluntary Euthanasia Legalisation Society (“Societat per a la Legalització de l’Eutanàsia Voluntària”) i el primer intent del parlament del Regne Unit d’aprovar una llei que permetera l’eutanàsia en certs casos.
L’anàlisi en Wordstat implica la creació d’un diccionari que identifica els temes que interessen a l’analista. Les categories del diccionari contenen paraules i sintagmes que es poden assignar sense ambigüitats a la categoria després d’investigar cada paraula o frase en el seu context, si fóra necessari. Es poden descriure els passos de la manera següent:
- Les paraules i sintagmes utilitzats en els documents s’enumeren en ordre descendent per la seua puntuació tf-idf [freqüència del terme – freqüència inversa del document, mesura utilitzada per a avaluar la importància d’una paraula en un corpus de text]; és a dir, una mesura que indica quins termes són especialment importants per distingir documents.
- S’examinen les tres-centes paraules o sintagmes més importants en context i se seleccionen les que tenen un significat únic més consistent per a incloure-les en un diccionari definit per l’usuari les categories del qual agrupen termes amb similitud semàntica.
- S’afegeixen al diccionari altres paraules i sintagmes que apareixen en els textos basant-se en la similitud semàntica i en una inspecció més detallada del context.
- S’examina la distribució de les categories del diccionari amb la comparació de grups.
En aquest estudi, el sintagma amb la puntuació tf-idf més alta va ser assisted suïcide (“suïcidi assistit”). Aquesta és la nova terminologia usada en els debats sobre la mort assistida. Anteriorment es parlava de voluntary euthanasia (“eutanàsia voluntària”), expressió que podem trobar en moltes més ocasions en textos anteriors i, per tant, també tenia una puntuació tf-idf alta. La puntuació identifica les paraules o sintagmes en què s’ha de centrar l’analista, perquè proporcionen la clau per a entendre les diferències entre periòdics, o les tendències al llarg del temps, o qualsevol comparació en què estiga interessat l’analista.
El programari també utilitza un tesaurus incorporat per a identificar sinònims (paraules amb un significat semblant). Els sinònims de la paraula assisted (“assistida”), per exemple, inclouen aided, helped, supported i abetted. S’ha de revisar cada sinònim suggerit en context (desambiguació) abans de decidir si incloure’l o no en el diccionari. Podria ser, per exemple, que molts dels usos de la paraula helped no estiguen relacionats amb el fet d’ajudar algú a morir, sinó d’ajudar algú en alguna altra cosa, així doncs, no té sentit incloure aquesta paraula en una categoria del diccionari relacionada amb ajudar a morir. Els sintagmes de dues o tres paraules són més útils que les paraules soltes, perquè no solen necessitar desambiguació tan sovint.
Es poden consultar alguns exemples de categories de diccionari utilitzades en el projecte en la figura 1. El diccionari complet contenia moltes més categories (es poden consultar algunes més en la taula 1), pel que resulta una eina útil per a comparar grups de textos. En aquest cas, podem comparar diferents periòdics o realitzar un seguiment dels canvis en la popularitat dels temes al llarg del temps. També podem usar categories per seleccionar exemples paradigmàtics dels periòdics.
La importància d’alguns temes ha disminuït amb el temps. Les perspectives cristianes, per exemple, apareixen menys en les discussions dels periòdics, i els arguments eugenèsics ja no són moda. Alguns van créixer en popularitat i després la van perdre, com per exemple nazi. Sembla que els records sobre l’eutanàsia en el règim nazi es van esvaint.
Avui dia, altres temes com les cures pal·liatives, els drets humans i el suïcidi assistit emmarquen el debat sobre la mort assistida més comunament. Els arguments han canviat, s’han oblidat els vells, o es consideren irrellevants, i uns altres de nous han aparegut de la mà tant dels partidaris de la legalització com dels qui s’hi oposen. En aquest punt, el programa informàtic ofereix un resum estadístic d’aquests canvis.
Però com que aquestes visualitzacions estadístiques estan connectades en tot moment amb el text subjacent, aquest es pot recuperar per a oferir cites il·lustratives i permetre un escrutini més detallat i qualitatiu dels arguments clau. Tot seguit, mostraré un d’aquests arguments al llarg del temps: els arguments eugenèsics.
The Guardian va informar el 5 de setembre de 1935 d’unes declaracions del doctor T. W. Hill, subconseller de sanitat de West Ham, qui, en una intervenció en l’escola d’estiu de la New Health Society en Margte (Regne Unit), va preguntar què fer amb els milers «d’imbècils profunds de les nostres institucions», i va continuar:
Quan veiem els horribles monstres que mantenim vius sota les cures de gent capacitada… ens veiem obligats a preguntar-nos: No pot trobar la nostra civilització una manera d’ocupar-se’n? No estem estenent molt la nostra humanitat? Aquestes criatures estarien millor fora del nostre camí. Estem fent tot el que es pot per assegurar la supervivència del menys apte. Si volem engendrar una raça vigorosa hem de revocar les nostres falses nocions sobre la sacralitat de la vida humana. No cal tornar al cruel codi de la selecció natural, però podem aconseguir els mateixos resultats sense dolor, ràpidament i sense crueltat, mitjançant l’eutanàsia científica.
(The Guardian, 1935)
Ací es pot observar que el doctor Hill no té cap problema a descriure la gent amb discapacitats cognitives o d’un altre tipus com «imbècils» i «monstres» i a matar-los en benefici de la societat en el seu conjunt. En la dècada de 1930, la gent partidària de l’eutanàsia voluntària solia defensar també l’eugenèsia com a forma de millorar la societat. L’experiència dels nazis va canviar tot això, per la qual cosa, després de la guerra, arguments d’aquest tipus van prendre formes molt més suaus, i l’oposició va ser arreplegada pels periodistes. Per exemple, el 30 d’abril de 1969 The Guardian va publicar una notícia sobre el doctor Kenneth Vickery, conseller de salut d’Eastbourne (Regne Unit), que parlava de la necessitat de començar a pensar ara en la creixent quantitat de gent major en la societat, que ja començaven a saturar els serveis de salut i benestar en zones com la seua. No defensava l’eutanàsia, però sí que suggeria que «les persones de més d’una certa edat no haurien de mantenir-se vives gràcies a ginys mèdics, sinó rebre atenció infermera fins al dia que muiren» (Shearer, 1969). Un portaveu de Help the Aged (“Ajudem els ancians”) va dir haver reaccionat a aquestes paraules amb horror i repulsió.
I avui dia, les úniques persones que s’atreveixen a proposar idees tan impopulars públicament són gent que busca notorietat, com el novel·lista Martin Amis. Es va publicar el 2010 que havia suggerit implantar «cabines d’eutanàsia» als carrers perquè la gent gran que s’havia convertit en una càrrega per a la societat poguera posar fi a la seua vida amb «un martini i una medalla», per tal de conservar els escassos recursos actuals i evitar una guerra civil entre els vells i els joves. Dignity in Dying (“Morir amb dignitat”, nou nom de la Societat per la Legalització de l’Eutanàsia Voluntària) s’ha distanciat clarament d’aquesta posició en els mitjans de comunicació.
«Els mètodes assistits per ordinador proporcionen un resum estadístic de les diferències entre textos»
Mètodes assistits per ordinador
En definitiva, aquests mètodes, que fan bon ús de la potència dels ordinadors i del programari especialitzat, ens permeten analitzar grans quantitats de text minimitzant la influència de les preferències de l’analista, en comparació amb l’enfocament de la codificació, que comporta molt més temps. Proporcionen un resum estadístic de les diferències entre textos, la qual cosa permet realitzar tot tipus de comparacions interessants. S’ajusten a les condicions actuals, ja que ara és molt senzill recol·lectar grans col·leccions de text electrònic en Internet però és molt difícil analitzar-les mitjançant els mètodes convencionals que depenen de la lectura del text.
Referències
Eaton, L. (2009, 12 d’octubre). Trial that pays patients to take antipsychotic drugs comes under attack. British Medical Journal, 339, b4202. doi: 10.1136/bmj.b4202
Hall, C. (2007, 27 de gener). NICE wants incentives for addicts days after refusing cancer drug. The Daily Telegraph, p. 8.
Parke, H., Ashcroft, R., Brown, R., Marteau, T. M., & Seale, C. (2013). Financial incentives to encourage healthy behaviour: An analysis of UK media coverage. Health Expectations, 16(3), 292–304. doi: 10.1111/j.1369-7625.2011.00719.x
Seale, C. (2005). Portrayals of treatment decision-making on popular breast and prostate cancer web sites. European Journal of Cancer Care, 14(2), 171–174. doi: 10.1111/j.1365-2354.2005.00544.x
Seale, C. (2006). Gender accommodation in online cancer support groups. Health, 10(3), 345–360. doi: 10.1177/1363459306064495
Seale, C. (2008). Mapping the field of medical sociology: A comparative analysis of journals. Sociology of Health and Illness, 30(5), 677–695. doi: 10.1111/j.1467-9566.2008.01090.x
Seale, C., Boden, S., Lowe, P., Steinberg, D., & Williams, S. (2007). Media constructions of sleep and sleep disorders: A study of UK national newspapers. Social Science and Medicine, 65(3), 418–430.
Seale, C., & Charteris-Black, J. (2008a). The interaction of class and gender in illness narratives. Sociology, 42(3), 453–469. doi: 10.1177/0038038508088835
Seale, C., & Charteris-Black, J. (2008b). The interaction of age and gender in illness narratives. Ageing and Society, 28(7), 1025–1043. doi: 10.1017/S0144686X0800737X
Seale, C., & Charteris-Black, J. (2010). Keyword analysis: A new tool for qualitative research. En I. L. Bourgeault, R. DeVries, & R. Dingwall (Eds.), The SAGE handbook of qualitative methods in health research (pp. 536–556). Londres: SAGE.
Seale, C., Charteris-Black, J., Dumelow, C., Locock, J., & Ziebland, S. (2008). The effect of joint interviewing on the performance of gender. Field Methods, 20, 107–128. doi: 10.1177/1525822X07313837
Seale, C., Charteris-Black, J., & Ziebland, S. (2006). Gender, cancer experience and internet use: A comparative keyword analysis of interviews and online cancer support groups. Social Science and Medicine, 62(10), 2577–2590. doi: 10.1016/j.socscimed.2005.11.016
Shearer, A. (1969, 30 d’abril). Elderly should be «allowed to die». The Guardian, p. 5.
Shepherd, E., & Seale, C. (2010). Eating disorders in the media: The changing nature of newspaper reports. European Eating Disorders Review, 18(6), 486–495. Reimprès en K. Eli, & S. Ulijaszek (Eds.). (2014), Obesity, eating disorders and the media (pp. 91–106). Farnham: Ashgate.
South Wales Echo. (2009, 4 d’abril). New grant for mums-to-be. South Wales Echo, p. 9.
Street-Porter, J. (2008, 13 de novembre). What we really need to solve our obesity epidemic. Belfast Telegraph, p. 36.
The Guardian. (1935, 5 de setembre). Problem of human suffering: Scientific euthanasia. Doctor urges its adoption. The Guardian, p. 6.