2. Revue des concepts et technologies

Table des matières

Dans section 2.2. nous présentons les concepts théoriques sur lesquels nous avons basé notre recherche, notamment la généralisation cartographique et la représentation multiple, l’objectif principal de notre recherche étant de proposer un modèle de données à représentation multiple pour une base de données géographiques qui permettra d’attaquer la problématique de génération de cartes dans un contexte Web. Dans la section 2.3. nous présentons plusieurs technologies qui ont attiré notre attention et qui, en ce moment, sont de plus en plus utilisées dans des projets qui ont comme objectif d’offrir des services cartographiques sur le Web : GML et SVG. C’est sur ces deux standards et les autres technologies Web les entourant que notre solution se base.

Afin de mieux saisir les notions de généralisation cartographique et de représentation multiple, nous devons d’abord définir quelques concepts gravitant autour de ces notions : échelle, niveau de détail, résolution et granularité.

Les objets représentés sur une carte sont de taille inférieure à leur taille réelle d’un facteur qui est celui de l’échelle de la carte. L’échelle est le «« facteur d’homothétie entre la taille sur le terrain des entités et la taille de leur représentation sur une carte . Taille-carte = Taille-terrain × Echelle  »» (Ruas et al. , 2002a). Plus l’échelle est petite, plus les objets sont petits jusqu’à se confondre avec un point. L’office québécois de la langue française nous offre une définition un peu plus complète de l’échelle : l’échelle est le «  «rapport moyen entre la distance mesurée sur une carte et la distance réelle mesurée sur la surface terrestre sans tenir compte des distorsions attribuables au facteur d’échelle et à l’altitude»  » (OLF, 1999).

Une autre caractéristique importante pour les cartes est la résolution du support de dessin qui est «  «la taille de la plus petite unité dessinable (comptée en points par millimètre ou en dpi – dot per inch)»  » (Ruas et al. , 2002a).

Mais en réalité, les cartographes sont obligés de rendre visibles sur la carte des objets qui ont parfois une taille plus petite que le seuil de perception ou de rendre interprétables des signes qui sont importants pour le but de la carte. Dans ces cas, des amplifications sont nécessaires. Par exemple, la majorité des routes et des bâtiments sont dilatés à partir d’une échelle de 1 : 25 000. Les conflits d’espace qui proviennent de la dilatation et du déplacement sont résolus en éliminant certaines informations.

Pour les bases de données, nous avons tendance à dire qu’elles ne possèdent pas d’échelle parce qu’il n’y a aucun problème de place pour représenter l’information. En effet, le problème de l’échelle se transforme plutôt en problème de niveau de détail sémantique et niveau de détail géométrique. Le niveau de détail sémantique se traduit par le schéma de données et les règles de sélection associées au schéma et permet de dire ce que l’on retient du monde réel et avec quelle résolution sémantique on décrit ce qu’on retient. Le niveau de détail géométrique est généralement décrit par la résolution. «« La résolution géométrique d’une base devrait être comprise comme un ordre de grandeur qui renvoie aux ordres de grandeur décrits par Y. Lacoste.» [1] « »» (Ruas et al. , 2002a), mais pour décrire le niveau de détail géométrique d’une base de données, à cette résolution il faut ajouter les notions de précision géométrique et de granularité . «« La précision géométrique qualifie l’écart entre la position réelle et la position représentée... La granularité décrit la taille des plus petites formes géométriques décrites dans la base. » » «(»Ruas et al. , 2002a).

D’un autre point de vue, les bases de données sont en effet faites pour une gamme d’échelles et elles peuvent être facilement cartographiées lorsque l’échelle de la carte requise est proche de l’échelle de saisie de la base de données.

La généralisation cartographique est l’ «« action de simplifier les éléments cartographiques et leur représentation, en fonction d'un besoin particulier et selon des règles précises. La généralisation cartographique fait appel à la simplification des formes, à la modification de la position des entités spatiales, et à la suppression ou au regroupement d'entités spatiales. Elle est utilisée notamment pour le passage à une échelle cartographique inférieure. »» (OLF, 1999). Dans sa thèse de doctorat (Ruas, 1999) Anne Ruas définit la généralisation comme étant «« un processus de transformation de données géographiques utilisé pour produire des données qui répondent à des besoins précis »» . Elle précise encore que «« Toute dérivation de données est une généralisation de l’espace géographique »» .

Plusieurs approches sont utilisées afin de réaliser le processus de généralisation. Nous retrouvons la description de trois de ces approches dans Han-Sze-Chuen (2002) :

  • l’approche algorithmique  est une approche qui consiste à décrire les algorithmes à utiliser et choisir l’ordre d’application de ces algorithmes ;

  • l’approche à base de règles consiste à formaliser les connaissances des cartographes sous forme de règles et ensuite à automatiser le processus de généralisation à l’aide d’un système à base de règles ;

  • l’approche à base de contraintes consiste à traduire les spécifications de généralisation en contraintes et ensuite à essayer de faire la généralisation en respectant ces contraintes.

Les recherches sur la généralisation cartographique se poursuivent depuis plus de 30 ans et présentement il y a des logiciels spécialisés qui réalisent une certaine automatisation de la généralisation (DYNAGEN d’Intergraph, LAMPS2 et Clarity de Laser Scan, etc.), mais la performance de ces logiciels est encore limitée et le processus nécessite encore l’intervention des spécialistes. Dans un contexte de production de données géographiques à partir de données à une plus grande échelle, la généralisation fonctionne et beaucoup d’organismes producteurs de données géographiques et de cartes papier l’utilisent. Par contre, lorsque le contexte change et si on a besoin de réaliser des cartes à la volée ou à la demande, le facteur temps de réponse est beaucoup plus important et la généralisation s’avère trop lente. De plus, les processus de généralisation nécessitent encore l’intervention des spécialistes en cartographie, ce qui n’est pas acceptable dans le contexte de génération automatique de cartes. Une des solutions à ce problème qui a été étudié par les chercheurs impliqués dans le domaine est l’utilisation de l’approche de représentation multiple, et de sa combinaison avec la généralisation cartographique.

La représentation multiple consiste à «« conserver, au sein d’une même base de données, différentes représentations d’un même objet »» (Bernier, 2002).

Si on regarde plus en détail ce concept, on met en évidence trois volets de la représentation d’un objet géographique : le volet sémantique , le volet géométrique et le volet graphique . Ainsi, la multiplicité de représentation se décompose en : multiplicité sémantique , multiplicité géométrique et multiplicité graphique (Martel, 1999).

La Figure 3 montre des exemples de multiplicité (Bernier, 2002). Pour la géométrie, nous pouvons avoir une multiplicité uniéchelle ou une multiplicité multiéchelle. La multiplicité géométrique uniéchelle intervient lorsqu’un objet géographique possède plusieurs représentations géométriques à une même échelle (par exemple une géométrie montrant la toiture d’un bâtiment et une autre géométrie décrivant les fondations). Dans le cas où un objet géographique possède plusieurs géométries différentes à des échelles différentes, on parle de multiplicité géométrique multiéchelle. La partie graphique de la représentation d’un objet géographique est composée d’éléments graphiques comme des symboles attachés aux objets ou des couleurs et textures utilisées pour dessiner la géométrie. Dans le cas des symboles, les spécialistes en cartographie les classifient en : symboles figuratifs, symboles évocateurs et symboles conventionnels (Weger, 1999). Les couleurs et les textures utilisées pour dessiner les géométries sont différentes pour un même objet en fonction de plusieurs critères comme la thématique, le contexte d’utilisation, etc. La sémantique associée à un objet géographique peut être aussi diversifiée que l’utilisation de l’objet. Si on prend le cas des bâtiments, un même bâtiment peut réunir plusieurs services : un restaurant, un hôtel et un café, par exemple. Du point de vue de la municipalité et pour le service des taxes, il peut avoir un propriétaire particulier ou être propriété de l’État. Ainsi, en fonction du contexte d’utilisation des données, différentes ontologies peuvent être utilisées pour l’enregistrement des sémantiques attachées à un objet géographique. Dans chaque ontologie qu’on définit, les sémantiques sont différenciées par les niveaux de détail sémantique.

Figure 3 : Multiplicité géométrique, graphique et sémantique

La recherche que nous avons entreprise nous a amenés à étudier ces deux concepts, la généralisation cartographique et la représentation multiple, afin d’avoir les moyens d’attaquer la problématique de la livraison des informations géographiques à la volée et à la demande. La solution que nous proposons est un modèle de données qui supporte la représentation multiple et qui permet l’utilisation des données par un système multiagent qui utilisera les multiples représentations et la généralisation cartographique afin de réaliser des cartes de bonne qualité dans un contexte de livraison d’information géographique sur Internet. Ce contexte se traduit notamment par des délais de réponse très courts pour la création des cartes et par l’impossibilité de l’intervention humaine dans le processus de création.

Lorsque nous envisageons l’utilisation des données spatiales dans un environnement Web, l’utilisation d’un dialecte du XML ( eXtensible Markup Language ) s’avère incontournable. «« Jour après jour, XML prend une place significative au coeur des architectures des systèmes d’information. Élargissant sa traditionnelle filiation aux systèmes de publication, XML s’impose aujourd’hui comme le format pivot des processus d’intégration, d’ouverture et d’échanges des systèmes d’information. » » (Duperrier, 2003)

XML [2] a été conçu pour améliorer la fonctionnalité du Web en fournissant une identification plus flexible et plus adaptable de l’information. Il représente un « métalangage » permettant de marquer la structure de documents textuels de manière arborescente en insérant des « balises » dans le corps des documents. XML a été mis au point par le XML Working Group sous l’égide du World Wide Web Consortium (W3C) dès 1996. Depuis le 10 février 1998, les spécifications XML version 1.0 ont été reconnues comme recommandations par le W3C, ce qui en fait un langage reconnu.

XML est un langage qui sépare le contenu de la présentation. Ainsi, une source de données unique permet une variété de présentations à partir d’un même contenu grâce à des langages de mise en page spécialisés. Parmi les langages de mise en page les plus utilisés, on retrouve : le CSS [3] ( Cascading Style Sheets ), standard qui a fait déjà ses preuves avec HTML [4] ( HyperText Markup Language ), le XSL [5] ( eXtensible Stylesheet Language ), un langage de feuilles de style extensible développé spécialement pour XML, et la technologie de transformation associée à des feuilles de style (XSLT [6] pour eXtensible Stylesheet Language Transformation ). À partir d’un document XML, il est possible de produire un autre document dans un langage utilisant des balises (XML, XHTML [7] , HTML, WML> [8] , etc.) ou dans un format à vocation de publication (Word, PDF, texte, etc.).

Pour utiliser le XML afin de stocker des données il faut décrire la façon d’enregistrer ces données dans le fichier XML, ce qui se traduit par la structure (ou la syntaxe) du document XML. Il y a deux approches pour la description de cette structure, soit le DTD [9] ( Document Type Definition ), soit le XML Schema (World Wide Web Consortium, 2001). XML Schema est un standard plus récent qui est beaucoup plus complet que le DTD et qui a apporté beaucoup de flexibilité à la définition des structures des documents XML. Contrairement au DTD, lorsqu’on utilise le XML Schema, les données enregistrées dans les fichiers XML ne sont plus de simples textes, mais on peut leur attribuer un type (par exemple : string , integer , decimal , boolean , time , etc.). Ceci permet de définir des structures de données beaucoup plus complexes.

Les grands changements apportés dans le domaine de la technologie Internet et la technologie de l’information en général par l’apparition de XML se sont fait sentir dans le domaine de l’information géographique aussi. Au départ, pour offrir de l’information géographique sur Internet on utilisait un moteur SIG ( Système d’Information Géographique ) sur un serveur pour générer des images de carte (GIF ou JPEG [10] ) qu’on incorporait après dans les pages HTML envoyées au navigateur Web de l’utilisateur. L’apparition en 2000 de la première version de GML ( Geography Markup Language ) a offert une nouvelle possibilité : fournir l’information géographique sous forme d’entités distinctes et contrôler la façon dont ces entités sont affichées. Cette nouvelle approche donne la possibilité de visualiser les cartes résultantes dans un navigateur standard, ce qui élimine la nécessité d’acquérir des logiciels SIG du côté client.

GML (OpenGIS, 2003) est un standard basé sur XML qui a été conçu pour la modélisation, le transport et le stockage de l’information géographique. La version 3.0 de ce standard développé par Open GIS Consortium publiée en janvier 2003 représente un grand pas en avant en raison de l’introduction avec cette version de plusieurs éléments importants : le support pour les géométries complexes, la possibilité de décrire des systèmes à référence spatiale et temporelle, la topologie, les unités de mesure, les méta données et les styles par défaut pour la visualisation des entités et des couvertures. (OpenGIS, 2003)

La création d’une base de données géographiques en GML commence par la modélisation des données en GML, c’est-à-dire la création d’un schéma d’application (en XML Schema) qui décrit la structure des données. Ensuite, les données sont stockées dans des fichiers GML respectant la structure de données qui a été décrite et ces fichiers sont stockés dans une base de données. Les données ainsi stockées sont ensuite prêtes à être utilisées pour différentes fins. Une des possibilités est de créer des cartes à l'aide des informations géographiques obtenues et pour réaliser cette tâche, un autre standard basé sur le XML peut être utilisé, le SVG.

Le SVG ( Scalable Vector Graphics ) (World Wide Web Consortium, 2003) est une grammaire basée sur XML pour la description d’objets graphiques en deux dimensions. Le SVG permet de gérer trois types d’objets graphiques : les formes vectorielles (courbes, lignes, polygones, etc.), les textes et les images raster. Le standard SVG donne beaucoup de possibilités pour la création des cartes à publier sur Internet et sur des terminaux mobiles. On peut grouper et transformer les objets graphiques ainsi que leur appliquer des styles. Le SVG gère également les évènements de type onclick (clic de la souris), onmouseover (survol de la souris), etc., et ce, pour chaque objet graphique ce qui donne la possibilité de réaliser des animations (par exemple l’apparition d’une info bulle lors du survol d’un objet) à l’aide d’un langage de scripts (JavaScript, ECMAScript, etc.).

Les fichiers SVG sont visualisables dans les navigateurs Web auxquels on ajoute un plugiciel (plug-in) spécialisé, par exemple celui développé par la compagnie Adobe qu’on peut télécharger gratuitement à partir de leur site Internet : http://www.adobe.com/svg/main.html.

Afin de présenter des données géographiques stockées dans des fichiers GML à l’aide de SVG, une transformation à l’aide de XSLT est nécessaire. Pour réaliser une telle transformation, on utilise un processeur XSLT, c’est-à-dire un programme écrit dans un langage de programmation et qui implémente le standard XSLT. En fonction de la technologie et du langage de programmation choisi pour la création de l’application cartographique, le processeur XSLT correspondant est utilisé.

La Figure 4 présente par des exemples la façon de structurer les données à l’aide des technologies que nous avons présentées. Dans un premier temps, des informations sur un bâtiment sont enregistrées dans un fichier XML. La visualisation dans le navigateur peut se réaliser soit à l’aide d’une feuille de style CSS (la solution la plus simple), soit à l’aide d’un fichier de style XSL (une solution plus complexe, mais qui donne des possibilités plus intéressantes, comme la mise en forme dans des tableaux). Aux données descriptives qu’on a pu modéliser dans le fichier XML on peut ajouter des données spatiales. Pour ce faire, nous avons utilisé le standard GML. Par manque d’espace, dans la figure nous avons remplacé les coordonnées à l’aide desquelles on construit les géométries en GML par des points de suspension. À partir de ce fichier GML et en utilisant une transformation XSLT nous avons créé un fichier SVG qui est visualisable dans le navigateur Web muni d’un plugiciel de visualisation pour SVG.

Figure 4 : Exemple de stockage et visualisation de données à l’aide des standards de la famille XML

L’étude des technologies Web de la famille XML (XML, XSL, XSLT, GML, SVG) nous a permis de trouver une façon de tirer profit de ces technologies pour atteindre l’objectif de notre recherche. La solution que nous proposons au problème de livraison de cartes de bonne qualité dans un environnement Web se base sur la modélisation et le stockage des données dans une structure de fichiers GML, le nouveau standard émergeant dans le domaine des systèmes d’information géographique.

Dans ce chapitre, nous avons présenté une revue des concepts et technologies qui forment le fondement théorique de notre recherche. Dans la première section, les notions de représentation multiple et généralisation cartographique ont été présentées. La combinaison de ces deux techniques représente l’approche envisagée par l’équipe du projet GEMURE pour résoudre le problème de la livraison de services cartographiques de qualité dans un environnement Web. Les technologies Web utilisées dans cette recherche ont été présentées dans la deuxième section de ce chapitre. L’implantation de l’approche de combinaison de la représentation multiple avec la généralisation cartographique a été beaucoup facilitée par l’utilisation de ces technologies, tenant compte du contexte dans lequel la recherche se situe, l’environnement Internet.



[1] « L’auteur (Y. Lacoste - n. a.) distingue six ordres de grandeur qui correspondent aux zones mesurées : 1) en dizaines de milliers de kilomètres – le monde du 1/10 M au 1/100 M –, 2) en milliers de kilomètres – les continents du 1/1 M au 1/10 M –, 3) 3n centaines de kilomètres – les états du 1/500 K au 1/1 M –, 4) en dizaines de kilomètres – les régions du 1/50 K au 1/200 K, 5)en kilomètres – une agglomération, une vallée du 1/20 K au 1/50 K –, 6) en dizaines de mètres – un quartier, des petites localités, un terroir du 1/1 K au 1/10 K. » (Ruas et al. , 2002a)

[2] XML – eXtensible Markup Language , http://www.w3.org/TR/REC-xml

[3] CSS – Cascading Style Sheet http://www.w3.org/Style/CSS/

[4] HTML – HyperText Markup Language , http://www.w3.org/MarkUp/

[5] XSL – eXtensible Stylesheet Language , http://www.w3.org/TR/xsl/

[6] XSLT – eXtensible Stylesheet Language Transformations , http://www.w3.org/TR/xslt

[7] XHTML – eXtensible HyperText Markup Language , http://www.w3.org/TR/xhtml1/

[8] WML – Wireless Markup Language , http://www.wapforum.org/

[9] DTD – Document Type Definition , dans la spécification de XML http://www.w3.org/TR/REC-xml

[10] GIF – Graphic Interchange Format ; JPEG – Joint Photographic Experts Group