Axiome d'extensionnalité

L’axiome d’extensionnalité, ou axiome d’extension, intervient en logique, en mathématiques, et en informatique. C’est l’un des axiomes-clés de toute théorie axiomatique des ensembles et, en particulier, le premier axiome de la théorie ZF (théorie des ensembles de Zermelo-Fraenkel).

L’axiome d’extensionnalité est intimement lié à la notion d’égalité de deux ensembles. Il existe en effet au moins cinq façons différentes de définir cette notion, et cet axiome permet de les unifier. Il sert aussi à imposer l’unicité d’ensembles définis par la donnée de leurs éléments, tels l’ensemble vide, les singletons, les paires, ou les ensembles des parties.

Sommaire

Présentation de l’axiome

Du fait de la variété des définitions de l’égalité, il existe plusieurs formulations possibles de cet axiome, mais elles peuvent toutes se ramener à l’énoncé suivant :

si deux ensembles ont les mêmes éléments, alors ce sont les mêmes.

Néanmoins, s’il est possible de rester dans le flou en ce qui concerne la notion d’égalité utilisée dans la formulation ci-dessus, il faut la préciser quand on veut exprimer l’axiome dans un langage formel. C’est pourquoi nous allons examiner de plus près les différentes notions d’égalité.

Les diverses notions d’égalité

Les différentes théories des ensembles ne définissent pas toujours de la même manière la notion d’égalité de deux ensembles. Nous récapitulons ici les définitions rencontrées :

Egalité par les éléments

C’est l’égalité telle qu’elle est définie dans la théorie naïve des ensembles par Cantor; elle sera notée ici « =e ». Elle se définit formellement par :

\forall E , \forall F , ( E =_{e} F ) \Leftrightarrow [ \forall x , ( x \in E ) \Leftrightarrow ( x \in F ) ] \,
Deux ensembles sont égaux par les éléments si et seulement s’ils ont les mêmes éléments.

Egalité par inclusion réciproque

C’est une variante de la définition précédente; elle sera notée ici « =i ». Elle fait appel à la notion d’inclusion, dont la définition (il n’y en a qu’une, heureusement) est :

\forall E , \forall F , ( E \subseteq F ) \Leftrightarrow [ \forall x , ( x \in E ) \Rightarrow ( x \in F ) ] \,
Un ensemble E est inclus dans un ensemble F si et seulement si tout élément de E appartient à F.

L’égalité par inclusion réciproque se définit alors formellement par :

\forall E , \forall F , ( E =_{i} F ) \Leftrightarrow [ ( E \subseteq F ) \wedge ( F \subseteq E ) ] \,
Deux ensembles sont égaux par inclusion réciproque si et seulement s’ils ont inclus l’un dans l’autre.

Ces deux premières définitions de l’égalité sont évidemment équivalentes; il suffit de remplacer l’inclusion par sa définition et de se rappeler que :

P, ∀ Q, [PQ] ⇔ [(PQ) ∧ (QP)]

Egalité par les propriétés

C'est l'égalité définie par Leibniz sous le nom d’identité logique, et notée autrefois « ≡ » car considérée comme plus « forte » que l’égalité au sens de Cantor pour une raison que nous verrons un peu plus loin; elle sera notée ici « =P ». Elle se définit formellement par :

\forall E , \forall F , ( E =_{P} F ) \Leftrightarrow [ \forall P , P ( E ) \Leftrightarrow P ( F ) ] \,
Deux ensembles sont égaux par les propriétés si et seulement s’ils vérifient les mêmes propriétés.

En fait, on se retrouve dans ce cas avec le même objet sous deux noms différents (le nom d'un objet n'est pas une propriété propre à cet objet; c'est une étiquette qui lui est apposée).

Cette définition qui parait naturelle au premier abord cache en fait une difficulté : les propriétés y sont quantifiées (« ∀ P »). Or, les propriétés sont des prédicats, et seule la quantification des variables, pas celle des prédicats est autorisée dans la logique habituelle (logique des prédicats du premier ordre).

Trois solutions sont possibles :

Egalité par les classes

C’est l’égalité telle qu’elle est définie dans la théorie NBG ; elle sera notée ici « =C ». Elle se définit formellement par :

\forall E , \forall F , ( E =_{C} F ) \Leftrightarrow [ \forall C , ( E \in C ) \Leftrightarrow ( F \in C ) ] \,
Deux ensembles sont égaux par les classes si et seulement s’ils appartiennent aux mêmes classes.

La notion de classe généralise celle d’ensemble. Une classe est un ensemble si et seulement si elle est élément d’une autre classe; sinon, c’est un univers.

Cette définition est équivalente à celle par les propriétés :

- comme à toute propriété peut être associée une classe, celle des ensembles qui vérifient cette propriété, l’égalité par les classes implique celle par les propriétés;
- inversement, comme toute classe a une propriété caractéristique, l’égalité par les propriétés implique celle par les classes.

Mais elle ne comporte pas de quantification de prédicat. À la place, ce sont les variables de classe qui sont quantifiées, ce qui est licite dans le cadre d’une logique du premier ordre.

Egalité par définition indirecte

Elle sera notée ici « =D ». Dans la théorie ZF, l’égalité n’est pas directement définie, mais considérée comme terme primitif de la logique sous-jacente (logique dite « avec égalité »), qui comporte alors les axiomes nécessaires pour définir un comportement de ce terme équivalent à celui de l’égalité par les propriétés.

Axiome d’extensionnalité et égalité

On constate que les définitions précédentes se répartissent en deux groupes à l’intérieur desquelles elles sont équivalentes entre elles :

- les deux premières définitions d’une part (groupe I),
- et les trois dernières d’autre part (groupe II).

En résumé, nous avons :

( E =_{e} F ) \Leftrightarrow ( E =_{i} F ) \,
( E =_{P} F ) \Leftrightarrow ( E =_{C} F ) \Leftrightarrow ( E =_{D} F ) \,

De plus, on peut montrer que l’égalité par les éléments est un cas particulier de l’égalité par les propriétés, en considérant la propriété P(E) définie comme x ∈ E. L’égalité par les propriétés implique donc l’égalité par les éléments. C’est en ce sens que, comme indiqué plus haut, l’égalité par les propriétés est plus forte que l’égalité par les éléments. Nous en déduisons le schéma suivant d’implication du groupe II vers le groupe I :

\left.\begin{matrix} E =_{P} F \\ \Updownarrow \\ E =_{C} F \\ \Updownarrow \\ E =_{D} F \end{matrix}\right\} \Rightarrow \left\{\begin{matrix} E =_{e} F \\ \Updownarrow \\ E =_{i} F \end{matrix}\right. \,

Pour obtenir l’équivalence de toutes ces définitions, il ne reste donc plus qu’à démontrer l’implication inverse, du groupe I vers le groupe II. Mais cette dernière implication n’est autre que l’axiome d’extensionnalité !

Au passage, nous pouvons enfin exprimer cet axiome de façon formelle; nous représenterons ses différents énoncés possibles de manière compacte sous la forme suivante :

\forall E , \forall F , \left\{\begin{matrix} \forall x , ( x \in E ) \Leftrightarrow ( x \in F ) \\ ( E \subseteq F ) \wedge ( F \subseteq E ) \end{matrix}\right\} \Rightarrow \left\{\begin{matrix} \forall P , P ( E ) \Leftrightarrow P ( F ) \\ \forall C , ( E \in C ) \Leftrightarrow ( F \in C ) \\ E = F \end{matrix}\right. \,

Il est possible de rencontrer des formulations de l’axiome où l’implication est remplacée par une équivalence, mais, sauf cas particulier, cette équivalence est superflue.

Chaque théorie choisit l’une des définitions précédentes comme définition de l’égalité, représentée par le symbole « = », et les autres définitions, du moins celles compatibles avec cette théorie, en deviennent des théorèmes.

Autre rôle de cet axiome

L’axiome d’extensionnalité a pour corollaire que:

un ensemble est complètement déterminé par ses éléments, et uniquement ses éléments.

L’axiome d’extensionnalité peut être employé avec n’importe quelle proposition P de la forme:

\exists A /\, \forall C , ( C \in A ) \Leftrightarrow \, P ( C ) \,
P représente un prédicat unaire quelconque qui ne mentionne pas A.

Cela permet d’assurer l’unicité de l’ensemble A dont les éléments sont exactement les ensembles satisfaisant le prédicat P. Nous pouvons alors introduire un nouveau symbole pour A. C’est de cette façon que de nouvelles définitions sont introduites dans les mathématiques ordinaires; les propositions des définitions sont réduites à des formulations en termes de la théorie des ensembles.

Variantes de l’axiome d’extensionnalité

L’axiome d’extensionnalité est généralement considéré comme indiscutable, et lui ou l’un de ses équivalents apparaît dans toute les axiomatiques alternatives de la théorie des ensembles. Cependant, elle peut subir des modifications pour satisfaire certaines exigences, comme dans l’exemple suivant.

Dans une théorie des ensembles avec des ur-éléments

La notion d’ur-élément, ou élément primitif, résulte de la formalisation de la notion d’élément de la théorie cantorienne. Cantor se souciait peu de la nature précise de ses éléments; tout ce qui lui importait, c’était qu’on puisse les mettre ensemble. Mais, avec les premiers efforts de formalisation (Zermelo), il est apparu nécessaire de distinguer les éléments qui étaient eux-mêmes des ensembles de ceux qui n’en étaient pas : un élément était donc soit un ensemble, soit un élément primitif. Un élément primitif, ou ur-élément est donc un élément, c’est-à-dire un objet susceptible d’appartenir à un ensemble, mais qui n’est pas lui-même un ensemble, et qui ne comporte donc aucun élément.

Dans la théorie de Zermelo-Fraenkel actuelle, « tout est ensemble », et il n’y a plus d’ur-élément, mais les premières versions de Zermelo, inspirées par la théorie naïve, en comportaient; certaines axiomatiques alternatives de la théorie des ensembles en ont encore. Les ur-éléments peuvent être considérés comme logiquement différents des ensembles; dans le cas où A est un ur-élément, « xA » n’a aucun sens; ainsi, l’axiome d’extensionnalité ne s’applique qu’aux ensembles (sinon, comme un ur-élément n’a pas d’élément, il se confondrait avec l’ensemble vide).

Alternativement, dans une logique non typée, nous pouvons avoir besoin de donner un sens à « xA » ; cette expression est alors considérée comme fausse toutes les fois où A est un ur-élément. Dans ce cas, l’application de l’axiome habituel d’extensionnalité impliquerait, comme nous venons de le voir, que tout ur-élément se confond avec l’ensemble vide. Pour éviter cela, nous devons modifier l’axiome d’extensionnalité afin qu’il ne puisse s’appliquer qu’aux ensembles non-vides. Il s’énonce alors par exemple:

axiome d’extensionnalité restreint :
\forall A , \forall B , [ ( \exists C /\, C \in A ) \wedge ( \forall x , ( x \in A ) \Leftrightarrow ( x \in B ) ) ] \Rightarrow [ A = B ]  \,

C'est-à-dire :

étant donnés des ensembles A et B quelconques, si A est un ensemble non vide (c'est-à-dire s'il existe au moins un élément C dans A ), et si A et B ont exactement les mêmes éléments, alors ils sont égaux.

Voir aussi

See also: Axiome d'extensionnalité, Axiome, Cantor, Classe, Classe (mathématiques), Définition, Ensemble, Ensemble vide, Gödel, Informatique