Au fur et à mesure de votre lecture de cette spécification, il vous sera utile de vous rappeler des principes suivants ayant guidé la mise en uvre de l'HTML 4.0.
Bien qu'il existe un accord quasi unanime pour dire que des documents HTML devraient être lisibles par tous les navigateurs sur toutes les plates-formes, l'intéropérabilité induit des coûts de production et d'hébergement plus importants dans la mesure où il est nécessaire de produire plusieurs version du même document. Si cet effort n'est pas fait, le risque est grand que le Web tende vers une juxtaposition d'environnements propriétaires aux formats incompatibles, réduisant son potentiel commercial pour tous ses utilisateurs.
Chaque version de l'HTML tente d'obtenir un consensus entre tous les acteurs industriels afin que l'investissement fait par les fournisseurs de contenu ne soit pas dévalorisé et que les documents de ces derniers ne deviennent pas illisibles à court terme.
L'HTML a été développé dans le sens que chaque machine puisse être capable d'exploiter l'information présente sur le Web: les PCs dotés d'écrans de résolutions et systèmes de couleurs distincts, téléphones cellulaires, portables, appareils à interface vocale, ordinateurs bas débits, etc.
Cette version de l'HTML a été conçue avec l'aide d'experts des problèmes d'internationalisation, de sorte que les documents puissent être écrits dans tous les langage et puissent être transmis dans le monde entier. Ceci a été obtenu par l'incorporation de la [RFC2070], qui traite de l'internationalisation de l'HTML.
Une des étapes importantes a été l'adoption de la norme ISO/IEC:10646 (voir [ISO10646]) définissant le codage de caractères pour les documents HTML. Il s'agit du standard le mondial le plus généraliste intégrant la représentation des caractères internationaux, les notions de direction de texte, la ponctuation, et autres contraintes de l'édition internationale.
HTML offre aujourd'hui un meilleur support pour les diverses langues humaines dans un document. Ceci permet une indexation plus efficace des documents par les moteurs de recherche, l'usage d'une typographie de meilleure qualité, une meilleure conversion texte-parole, une hyphénation correcte, etc.
Comme la communauté Web grandit et que ses membres se diversifient dans leurs aptitudes et leur niveau de maîtrise, il est crucial que les technologies sous-jacentes soient appropriées à leurs besoins spécifiques. HTML a été conçu pour rendre les pages Web plus accessible aux personnes subissant certaines déficiences physiques. Les développements de l'HTML 4.0 dans les domaines de l'accessibilité :
NdT : Cette rubrique concerne les ordinateurs équipés de systèmes de conversion sonore pour les personnes non voyantes.
Les auteurs éditant des pages recourant à ces outils d'accessibilité recevront non seulement les applaudissements de la communauté handicapée, mais en tireront de plus un double avantage : des documents HTML correctement conçus distingant structure et présentation seront beaucoup plus faciles à maintenir et à adapter à de futures technologies.
Le nouveau modèle des tableaux HTML s'appuie sur le document [RFC1942]. Les auteurs en tireront un contrôle accru sur leur structure et leur mise en forme (ex., groupage de colonnes). Le fait que les concepteur de pages puissent maintenant recommander une largeur de colonne permet aux agents utilisateurs d'afficher la table par incréments (au fur et à mesure que les données arrivent) plutôt que d'être contraints à attendre que toute la description de la table ne soit arrivée avant de commencer la visualisation.
Le HTML dispose désormais d'un mécanisme standard pour inclure des objets multimédia génériques ainsi que des applications dans des documents HTML. L'élément OBJECT (conjointement à ses ancètres plus spécialisés IMG et APPLET) procurent un mécanisme pour inclure dans un document des images, de la vidéo, du son, des formules mathématiques, des applications spécialisées, et d'autres objets. Il permet de plus de hiérarchiser les diverses représentations d'un même objet à destination d'agents utilisateurs de nature et de capacités différentes.
Les feuilles de style simplifient notablement l'encodage HTML des documents et réduisent le rôle de HTML dans la présentation. Elles permettent de donnéer le contrôle de la présentation tant aux auteurs qu'aux agents utilisateurs --- informations sur les polices, alignments, couleurs, etc.
Les informations concernant le style seront :
Le mécanisme associant une feuille de style à un document est indépendent de la langue utilisée dans la feuille de style.
Par les scripts, des auteurs pourront écrire des "formulaires interactifs" qui réagissent aux actions des utilisateurs. Les techniques de script permettent aux créateurs de concevoir des pages Web dynamiques, et d'utiliser le HTML comme langage de base d'applications en réseau. Les mécanismes qui associent des documents HTML aux code des scripts est indépendant du langage de programmation utilisé.
Les fonctionnalités HTML permettent aux agents utilisateurs d'imprimer une collection de documents d'une façon "intelligente", se basant sur des descriptions des relations existant entre les divers documents composant une "unité" plus large.
ette version de HTML a été conçue de sorte qu'il reste facile à apprendre et suffisant pour la majorité des publications courantes. Le langage offre cependant des constructions plus complexes (ex., formulaires, scripts) destinées à des tâches plus sophistiquées, mais même ces constructions plus opaque deviennent facile à utiliser grâce à la floraison d'éditeurs de plus en plus "intuitifs".
Attention - à l'heure où ce document a été écrit, certains outils d'édition HTML s'appuient extensivement sur les tableaux pour la mise en page des documents ce qui pourra à terme provoquer des problèmes d'accessibilité.