Un des objectifs de la vision par ordinateur consiste à extraire à partir d'un important volume de données brutes issues des images, celles qui s'avéreront pertinentes pour une exploitation ultérieure. Les primitives extraites de l'image sont communément de type contour, correspondant à des zones de transition objectivement visibles, et de type région, correspondant à des regroupements de pixels de l'image avec des caractéristiques d'homogénéité communes. Une nécessaire gestion de l'information est obtenue par la répartition de la tâche de segmentation au sein d'entités indépendantes, localisées de façon précise dans l'image, possédant chacune une primitive particulière à segmenter de type contour ou région, et construisant ces objets de manière incrémentale, c'est-à-dire pixel par pixel. L'originalité de l'approche réside dans la coopération instaurée entre la construction des contours et des régions. Les deux types de segmenteurs fonctionnent conjointement à l'étiquetage des pixels de l'image, sous une forme pseudo-parallèle, en tirant avantage de leurs atouts réciproques. Un détecteur de contour instancie de nouveaux détecteurs de régions de part et d'autre de son extrémité en construction, afin de valider son existence, tandis qu'un détecteur de régions instancie des détecteurs de contours à sa frontière, afin de borner son expansion. L'ensemble constitue un arbre d'entités de segmentation coopérantes, dépendant chacune les unes des autres, par filiation. Une telle approche permet une forte adaptation locale, puisque chaque primitive est détectée par une instance d'un détecteur générique, pouvant modifier ses paramètres internes indépendamment des autres instances. La coopération est réelle, puisqu'elle est intégrée au mécanisme de décision. L'implantation d'un séquenceur de tâches anonymes, permet enfin de simuler le pseudo-parallélisme, et repose grandement sur des mécanismes classiques réservés généralement au domaine des systèmes d'exploitation.