Un problema d’interpolació d’imatges

Figura 2: Com podem reconstruir la part que manca a partir de la informació exterior a la taca de manera que tinguem la sensació d’estar davant d’una imatge natural, sense cap alteració aparent?

A problem of image interpolation. We discuss the problem of perceptual amodal completion as an interpolation problem. A proposed solution is minimising the energy functional associated to the geometric configuration of image data.

Tots sabem que Stalin feia desaparèixer els seus enemics polítics dels documents escrits i de les fotografies. Avui en dia hagués tingut al seu abast la tecnologia digital. Sense entrar en propostes tan truculentes, el problema del que voldríem parlar és fàcil de descriure. Suposem que en una fotografia o imatge hem perdut o destruït una part (vegeu les Figures 2 i 3). Com podem reconstruir la part que manca a partir de la informació exterior a la taca de manera que tinguem la sensació d’estar davant d’una imatge natural, sense cap alteració aparent? En certa mesura, hem d’imitar l’art del restaurador. Ja podem imaginar les aplicacions possibles, entre elles la restauració de pel·lícules antigues.

Podem plantejar aquest problema com un problema d’interpolació dintre de la taca (la regió mancant), coneguda la informació exterior. En el contexte més general de la psico-física, aquest problema està lligat al procès de completació amodal, el qual és un procès fonamental de la percepció visual. En una escena natural, rara vegada un objecte és completament visible, normalment està parcialment ocult, ja que sempre hi ha altres objectes devant que impedeixen la seva visió completa. Malgrat això, el nostre sistema visual es capaç, sota certes condicions geomètriques, de reconstruir o imaginar la part oculta perllongant artificialment els contorns dels objectes: és el que s’anomena completació amodal. Aquest procès l’hem il·lustrat a la Figura 1, on el nostre sistema visual reconstrueix una bola que, a priori, no existeix.

La capacitat del sistema visual per reconstruir la informació que manca ha estat estudiada dintre del camp de la psico-física i de la psicologia de la Gestalt, en particular per Gaetano Kanizsa. És important destacar que tant per Kanizsa com per l’escola de psicologia de la Gestalt aquesta reconstrucció visual es fa de manera independent de tot coneixement a priori sobre el contingut semàntic de la imatge. Està basada únicament en les estructures geomètriques del camp d’intensitat lluminosa (més, eventualment, el color) que dóna lloc a la imatge: és a dir, en les formes presents a la imatge.

Els psicòlegs de la Gestalt han demostrat experimentalment el paper de certs principis organitzadors de la percepció a l’hora de constituir la percepció de les formes geomètriques, en particular, la forta influència dels indexos d’oclusió tals com la presència en la frontera de l’oclusió d’elements localitzats anomenats Juncions en T. Les Juncions en T són punts de la frontera d’oclusió on la configuració dels contorns dels objectes és semblant a una T (vegeu els punts de la Figura 1 on conflueixen el blanc, el gris i el negre). Els investigadors de la percepció han mostrat com la presència de juncions en T permet al nostre sistema visual la reconstrucció de la part mancant. Es tracta de crear artificialment contorns que unèixen les juncions en T. Aquí intervé un altre dels principis organitzadors de la psicologia de la Gestalt: el principi de la bona continuació. Segons aquest principi, els contorns o línies artificials que uneixen les juncions en T han de ser continuació dels contorns existents a l’exterior de la taca, perllongant-se de manera regular, sense canvi de direcció. Aquest principi de bona continuació admet una interpretació matemàtica variacional, és a dir, la solució adoptada minimitza una certa energia associada a la configuració geomètrica proposada. A la dreta de la Figura 2 veiem la solució obtinguda corresponent a la part esquerra de la Figura, en consonància amb els principis que hem explicat. A la Figures 3 (original) i 4 (reconstruïda) mostrem un exemple d’aplicació d’aquesta metodologia a un problema, diguem-ne, més pràctic.

Aquesta filosofia ha estat duta a la pràctica per diversos grups de recerca i és inspiradora d’una filosofia a l’hora de plantejar els problemes dintre de l’àrea de processament d’imatges i visió per ordinador: incorporar els principis organitzadors de la percepció per a formular matemàticament els problemes de processament d’imatges i dissenyar algoritmes el més universals possibles per a cada problema específic.

Vicent Caselles. Departament de Tecnologia, Universitat Pompeu Fabra.
© Mètode 24, Hivern 1999/00.

Figura 1: El nostre sistema visual reconstrueix una bola que, a priori, no existeix.

 

Figures 3 i 4: Exemple d’aplicació de la metodologia d’interpolació d’imatges a un problema pràctic.

© Mètode 2000 - 24. Temps de matemàtiques - Número 24. Hivern 2000

Departament de Tecnologia, Universitat Pompeu Fabra.