Reti Neurali Ricorsive

Riconoscitore basato su reti neurali ricorsive

Il tipo di preelaborazione utilizzato nei due approcci precedenti produce una notevole perdita di informazione e si riesce a costruire un riconoscitore con buone prestazioni solo perchè il problema della discriminazione fra le quattro classi rimane, nonostante tutto, semplice. Un tipo di preeelaborazione più complessa, ma che produce delle descrizioni più accurate degli esempi, può eliminare molto del carico affidato all'apprendimento come accade nei casi precedenti. In particolare una preelaborazione opportuna può introdurre una conoscenza a priori sulle tipologie di rumore che possono corrompere le immagini. In particolare se si estraggono caratteristiche indipendenti da rotazione e traslazione non si dovrà più richiedere al sistema di apprendere il concetto di logo traslatoo logo ruotato. Questo approccio complica ovviamente l'estrazione della rappresentazione da usare come ingresso al classificatore, ma semplifica la fase di apprendimento e aumenta la discriminazione fra le classi dal momento che utilizza una rappresentazione più ricca.

 

Figura 7 - Estrazione di strutture dati dai logo con l'algoritmo dell'albero dei contorni.
La figura mostra 3 diverse condizioni con e senza rumore a striscia.

L'idea è quella di rappresentare le immagine con dei grafi estratti dalle immagine con la tecnica degli alberi dei contorni (contour tree ): nell'immagine vengono individuati i contorni; ciascun contorno corrisponde ad un nodo nel grafo utilizzato per la rappresentazione dell'immagine; per ogni contorno sono estratti 12 parametri che lo descrivono (numero di pixel contenuti nel contorno, la lunghezza del perimetro in pixel, il numero di pixel neri all'interno del contorno, la distanza fra il contorno e i baricentri dell'immagine, la massima curvatura per i lati convessi e per quelli concavi, il numero di pixel per i quali la curvatura è superiore ad una data soglia - picchi - sia per le regioni concave che per quelle convesse, la distanza minima fra il contorno in esame e l'altro più vicino, le tre distanze minime fra il contorno in esame e i te contorni a perimetro massimo - tutti i prametri sono normalizzati); il vettore dei parametri rappresenta l'etichetta memorizzata nel nodo corrispondente; gli archi del grafo rappresentano le relazioni di inclusione fra i contorni.

Il classificatore utilizzato con questo tipo di rappresentazione è una rete neurale ricorsiva. La rete prende in ingresso grafi etichettati non ciclici, elabora i nodi a partire dalle foglie verso la radice ed in corripondenza della radice produce l'uscita utilizzabile per la classificazione. Come nel caso dell'MLP la rete ha quattro uscite che codificano in modo esclusivo le classi da riconoscere. L'archietttura della rete può essere scelta fra varie tipologie. In ogni caso il numero massimo figli di un nodo (outdegree ) deve essere fissato a priori e in particolare l'algoritmo di estrazione dei grafi dalle immagini può essere configurato in modo da rispettare il vincolo imposto.

 

Figura 8 - Classificazione basata su reti neurali ricorsive.

Il sistema può essere realizzato con software custom di cui sono disponibili gli eseguibili per Linux.

Possibili temi da affrontare in questo caso:

  1. Determinare l'architettura ottimale (numero di neuroni di stato)
  2. Confrontare il numero di esempi richiesti per l'apprendimento in questo caso con quello dei casi precedenti
  3. Valutare la modularità di questo approccio
[Home] [Scuola Dottorato del GII] [Calcolatori Elettronici] [Fondamenti di Informatica II] [Tesi di Laurea]