Wednesday, November 28, 2012

Groupes cycliques et modes de Messiaen


Un peu de musique sur ce blog : cela adoucit les mœurs – quoique... Récemment je me retrouvais à travailler Thème et Variations d’Olivier Messiaen pour piano et violon et ce qui longtemps me rebuta autour de cette œuvre, c’est la bonne compréhension du langage musical si particulier du compositeur. Notamment, on sait qu’il avait pour habitude d’utiliser des modes, dits « modes 1 à 7 », correspondant à des divisions arithmétiques de la gamme. Ah ! Il n’en fallait pas plus pour que je me penche sur la question : pourquoi 7 modes ? pourquoi ceux-là ? etc. Tout ce qui va suivre ne m'a pas complètement aidé à tout comprendre, loin de là, mais cela m'a paru valoir le coup d'être développé un minimum.

Pour commencer, la gamme chromatique est composée de 12 sons placés de ½ ton en ½ ton, si bien que la gamme est une division « régulière » (en termes de tons) de l’octave Do-Do – n’en déplaise à nos amis violonistes : nous oublierons ici les quarts de ton et autres micro-tons propres à leur art. Donc, la gamme, c’est Z/12Z, un demi-ton, c’est +1 et un ton c’est +2. Trêve de plaisanteries : on passe aux maths et si je vous dis « La bémol », en fait c’est 8.

Si bien qu’un mode, en tant que sélection de notes parmi les 12 sons de la gamme, c’est en fait une partie de Z/12Z. Ainsi, parmi ces modes, il y en a des triviaux : Z/12Z lui-même qui n’est autre que l’ensemble de la gamme chromatique, et les singletons {Do}, {Do#}, …, {Si} (ou {0},…,{11}) qui sont les gammes les plus dépouillées qui soient, puisqu’elles sont composées d’une seule note.

Pour aller un peu plus loin vers les modes de Messiaen, on va parler de modes équivalents, ou modes « transposés ». En fait, en musique classique, la « gamme » (1) de Do majeur et la « gamme » de Ré majeur sont en fait une transposition l’une de l’autre : dans notre analogie avec Z/12Z, on remarque que la notion de « transposition » correspond à l’existence d’un entier k de Z/12Z telle que (Ré Majeur) = (Do Majeur) + k (en l’occurrence, k = 2 ici). En revanche, Do Majeur et do mineur ne sont pas transposés l’un de l’autre. Bref, la relation « est transposé de » est, au sens mathématique du terme, une relation d’équivalence parmi les modes : dorénavant nous parlerons de « modes équivalents ». Autrement dit, un mode A est équivalent à (ou transposé de) un mode B s’il existe k dans Z/12Z (ou, en musique, un intervalle fixe) tel que A = B + k. Ainsi, à équivalence près, il n’existe que deux modes triviaux : Z/12Z entier ou le singleton {Do}. De même, à équivalence près, on peut considérer que tous les modes commencent à Do – ou {0}.

De la même manière, on peut introduire la notion de « mode périodique » et examiner la musique à travers cela. Nous appelons « mode périodique » un mode A tel qu’il existe k dans Z/12Z – {0} tel que A = A + k (2). Ainsi la période est le plus petit entier k (non nul) tel que A = A + k. A contrario, un mode est dit apériodique s’il ne présente aucune période et on voit que c’est le cas des modes « classiques » majeur {0,2,4,5,7,9,11} et mineur {0,2,3,5,7,8,11} – faites l’exercice, vous verrez que c’est bien le cas. De même, le mode pentatonique de Debussy {Ré b, Mi b, Sol b, La b, Si b}, dit « mode chinois » et basé sur les touches noires d’un piano, est également apériodique.

Une propriété à peu près immédiate est qu’un mode périodique non trivial ne peut avoir une période première avec 12. En effet, si un mode A présente une période T première avec 12 et si n est une note de A, alors n+kT (pour k entier naturel quelconque) est aussi dans A ; or il existe k dans N tel que kT = 1 [12] d’après le théorème de Bezout, donc A finit par contenir toutes les notes de la gamme.

Ainsi, un mode périodique non trivial a forcément pour période 2, 3, 4, 6, 8, 9, 10. Remarquons d’entrée qu’un mode de période 10 (septième mineure) est aussi de période 2 (seconde majeure) (A = A+10 = A+50 = A+2) – de même un mode de période 8 (sixte mineure) est de période 4 (tierce majeure) et un mode de période 9 (sixte majeure) est en fait de période 3 (tierce mineure). En gros, 8, 9 ou 10 ne peuvent être des « périodes » à proprement parler car la période est censée être le plus petit intervalle d’ « auto-transposition ». Ainsi, les seules périodes possibles sont 2, 3, 4 ou 6.

Examinons maintenant les modes de Messiaen :

Mode 1

Mode 2
Mode 3
Modes 4 à 7
(source : Wikipedia)

Le mode 1 est un mode de période 2 : c’est en fait le seul mode non trivial, à équivalence près, de période 2. En effet, si on commence à intercaler les demi-tons, alors on obtient toute la gamme chromatique.

De même, le mode 2 est de période 3 et c’est presque le seul, à équivalence près, à être non trivial. Le mode suivant n’est pas réprésenté par Messiaen : {Do, Mi b, Fa#, La} ou {0,3,6,9}, représentant l’accord de septième diminuée. A ce stade, nous faisons remarquer que les gammes de 4 sons ou moins ne sont pas à proprement parler considérées comme des « modes » en Musique : un mode doit être au minimum pentatonique (comme par exemple le mode "chinois" évoqué plus haut, utilisé dans la musique de Debussy au début du XXème siècle). (3).

Le mode 3 est de période 4 mais ce n’est pas le seul possible : cette fois, il en existe deux autres, à équivalence près, non représentés par Messiaen.
-          le premier qui itère le schéma ½ ton + tierce mineure – dans Z/12Z : {0,1,4,5,8,9}, en musique : {Do, Ré b, Mi, Fa, Sol #, La}
-          le second, qui décrit l’accord de quinte augmentée – {Do, Mi, Sol#} ou {0,4,8}.

Les modes 4 à 7 sont, quant à eux, de période 6. Manquent à l’appel 5 modes 6-périodiques non triviaux :
-          {Do, Fa#} = {0,6} : la quinte diminuée qui partage la gamme chromatique en deux
-          {Do, Fa, Fa#, Si} = {0,5,6,11}
-          {Do, Mi, Fa#, La#} = {0,4,6,10}
-          {Do, Réb, Mib, Fa#, Sol, La} = {0,1,3,6,7,9}
-          {Do, Mib, Fa, Fa#, La, Si} = {0,3,5,6,9,11}

Au total, si on élimine les modes présentant 4 notes ou moins, non considérées en musique comme des « modes » à proprement parler, alors on a le résultat suivant :
Les modes de Messiaen composent 7 des 10 classes d’équivalence de modes qui présentent la propriété d’être périodiques et non triviales.

Pour conclure, on ignore aujourd’hui si Olivier Messiaen avait cette arithmétique en tête. Toutefois, sa classification des modes laisse fortement supposer qu’il avait l’intuition de la notion de période et sa musique ne laisse aucun doute quant à sa maîtrise de l’équivalence des modes. Chapeau, l’artiste !

Notes
(1)    En fait ce qu’on nomme classiquement « gamme » de Do majeur ou « gamme » de Ré majeur etc. est dans notre terminologie ce que nous appelons un « mode », étant donné que c’est un sous-ensemble de la gamme chromatique.
(2)    Il est évidemment important d’enlever k=0 sans quoi tout mode est périodique – à cause de la réflexivité de la relation d’équivalence entre modes.
(3)    Du fait de ce postulat d’origine purement musicale, nous avons donc exclu les modes suivants de l’analyse :
Période 3 : {Do, Mi, Fa#, La} (septième diminuée)
Période 4 : {Do, Mi, Sol#} (quinte augmentée, qui partage la gamme chromatique en deux parties égales)
Période 6 : {Do, Fa#} (la quinte augmentée sans la tierce), {Do, Fa, Fa#, Si}, {Do, Mi, Fa#, La#}
Cela dit, notons que ces 5 modes, ainsi que les 3 modes non décrits par le compositeur, sont tous « inclus » (au sens ensembliste du terme) dans des modes de Messiaen. Cela dit, parmi les 7 modes décrits par le compositeur, par exemple, le mode 5 est un résumé du mode 6 ; de même le mode 7 est un développement du mode 1, etc.

Thursday, September 13, 2012

Jamais trois pour deux carrés !

Le théorème des deux carrés de Fermat est un théorème d'arithmétique, dont on donne ainsi l'énoncé général :

Théorème des deux carrés de Fermat : Un entier s'écrit comme somme de deux carrés si et seulement si les nombres premiers de sa décomposition en facteurs premiers qui s'écrivent sous la forme 4n + 3 interviennent à des puissances paires.

Pour en venir à bout, des mathématiciens de tous temps (Fermat, Lagrange, Gauss, ...) ont permis de trouver des méthodes assez variées, proposant ainsi un panorama de ce que la mathématique pouvait faire en arithmétique. La plus belle preuve à mon goût est celle qui utilise les entiers de Gauss, comme un moyen d'élargir le concept de division euclidienne.

Il existe une preuve plus fondamentale mettant en évidence les carrés d'un corps fini $F_q$, pour $q$ impair, par la suite exacte suivante, entre groupes multiplicatifs :
$1\rightarrow F_q^{*2} \rightarrow F_q^* \rightarrow \{-1,1\} \rightarrow 1$
(la flèche de gauche est l'injection identité et celle de droite, la surjection d'élévation à la puissance $(q-1)/2$).
 C'est le point de vue développé dans le Cours d'arithmétique de J.P. Serre.

Le théorème des deux carrés vu sur les nombres premiers

Tout d'abord, l'idée est de se "restreindre" aux nombres premiers, en démontrant qu'un nombre premier s'écrit comme somme de deux carrés si et seulement s'il est congru à 1 modulo 4. Ce résultat est d'ailleurs lui aussi appelé Théorème des deux carrés de Fermat.

Dans un sens, il est bien évident que si p est somme de deux carrés, alors, suivant la parité des deux carrés en question, p ne peut être congru qu'à 1 ou 2 modulo 4. Le cas 2 n'est possible que pour, justement, p = 2 car en général, aucun nombre premier n'est pair.

Dans l'autre sens, il faut faire intervenir l'anneau des nombres de Gauss, qui n'est rien d'autre que Z[i], c'est-à-dire le réseau des nombres complexes qui s'écrivent comme a + b.i avec a et b entiers de Z. C'est bien un anneau pour les opérations classiques (+ et .) et on le munit d'une valuation N, c'est-à-dire une application de Z[i] dans N qui vérifie N(u.v) = N(u).N(v). En l'occurrence, la valuation qu'on va considérer ici est le module complexe classique, élevé au carré : en effet, N(z) sera alors simplement la somme des carrés de ses composantes. Quoi de plus naturel pour étudier des sommes de deux carrés ?

Ainsi, la valuation permet d'introduire une division euclidienne dans Z[i], c'est-à-dire que pour tout couple (a,b) de Z[i], il existe un couple (d,r) tel que a = b.d + r avec N(r) < N(b). Attention, ce couple (d,r) n'est en général pas unique, contrairement à ce qu'on présente classiquement de la division euclidienne. L'introduction de cette division euclidienne nous a toutefois permis de définir pour Z[i] une structure d'anneau euclidien.

Munis de ce cadre, nous pouvons encore avancer un peu : un anneau euclidien est en fait factoriel, c'est-à-dire que chacun de ses éléments peut se décomposer en un produit de facteurs premiers, unique à un inversible près.

Prenons justement un nombre premier p congru à 1 modulo 4. Le théorème du résidu quadratique (1) nous dit justement qu'il existe m et k entiers tels que m²+1 = k.p = (m+i).(m-i). Du coup, on en déduit que p n'est pas premier en tant qu'entier de Gauss puisqu'il ne divise ni (m+i), ni (m-i). (2)  Ainsi, il existe u et v entiers de Gauss différents de +/-1 ou +/-i (qui sont inversibles dans Z[i]) tels que p = u.v, ceci impliquant p² = N(u).N(v). Cette fois, on est revenu parmi les entiers naturels et étant donné le caractère premier de p, alors nécessairement N(u) ou N(v) vaut p, ce qui démontre l'implication qui nous manquait.

Cas général

Donc : tout nombre premier (>2) est somme de deux carrés si et seulement s'il est congru à 1 modulo 4.

De cela, le cas général vient moyennant un dernier petit résultat : si p premier est congru à 3 modulo 4 et si p divise x² + y², alors p divise x et y. Pourquoi cela ? Simplement, si p ne divise pas x, alors il est premier avec lui et donc x est inversible dans Z/pZ. Ainsi, y.x-1 est racine du polynôme X²+1 dans Z/pZ, ce qui est impossible quand on examine les congruences modulo 4. Alors, p divise x, donc y, et alors divise x²+y². Autrement dit, si un diviseur premier congru à 3 modulo 4 intervient dans la décomposition d'un entier somme de deux carrés, c'est forcément à une puissance paire.

Ainsi, reprenons le théorème dans sa forme générale. D'après le dernier résultat que nous venons de démontrer, si n s'écrit comme somme de deux carrés et si p congru à 3 modulo 4 intervient dans sa décomposition en facteurs premiers, alors nécessairement  divise n et chacun des deux carrés. Ainsi, p ne peut intervenir à une puissance impaire, sans quoi on pourrait se ramener à un entier m décomposable en somme de deux carrés et que diviserait p et non . Ceci est rigoureusement impossible et le sens direct est ainsi démontré.

Supposant maintenant que les p congrus à 3 modulo 4 interviennent à une puissance paire, on peut les supprimer de la décomposition de n et se ramener à un entier m produit de facteurs premiers tous congrus à 1 modulo 4 (éliminons le cas de la présence de 2, qui se règle de manière très similaire). Dans ce cas, on a vu plus haut que tous ces premiers pouvaient chacun se décomposer en somme de carrés. C'est alors l'identité de Lagrange qui permet de conclure :
(a² + b²) . (c² + d²) = (ac + bd)² + (ad - bc
et de faire de ce grand produit une somme de deux carrés.

Comme l'indiquait le titre, jamais de congruence modulo 3 pour une décomposition en deux carrés... ou bien à une puissance paire, seulement !

Pour en savoir plus ...

J.P. SERRE. 1970. Cours d'Arithmétique. Presses Universitaires de France. (Chapitre 1)


(1) Le résultat du résidu quadratique stipule justement que si p est congru à 1 modulo 4, alors le polynôme X² + 1 admet une racine dans Z/pZ. En effet, le petit théorème de Fermat nous dit que tout élément non nul a de Z/pZ vérifie ap-1 = 1 dans Z/pZ. Autrement dit, injectant la congruence particulière de p, le polynôme (X2n - 1)(X2n + 1) est simplement scindé sur Z/pZ. Or, le polynôme (X2n - 1), non nul, admet au maximum 2n racines sur le corps Z/pZ, donc il existe b non nul tel que (b2n - 1) est inversible. Alors pour cet élément on a b2n + 1 = 0, ce qui établit le résultat du résidu quadratique - bn étant une racine de X² + 1 dans Z/pZ. Le résultat du résidu quadratique est en fait un corollaire du théorème plus général de la loi de réciprocité quadratique.
(2) en fait, c'est là où le caractère factoriel de l'anneau joue, c'est-à-dire l'idée selon laquelle tout élément est décomposable en produit de facteurs premiers de manière unique à multiplication par inversible près. Un anneau factoriel en effet vérifie le lemme d'Euclide : si p premier divise le produit a.b, alors p divise a ou p divise b. Notre affirmation au sujet de p et de (m + i).(m - i) n'est que la contraposée du lemme d'Euclide.

Thursday, September 6, 2012

Une règle et un compas

Une règle, un compas et des polygones : c'est notre sujet du jour, pour ce grand classique qu'est la question de la constructibilité des polygones réguliers, uniquement à l'aide d'une règle non graduée et d'un compas. Ce problème géométrique très visuel va nous emmener très vite dans le monde des structures algébriques. En effet, savoir construire un polygone régulier, c'est savoir "construire un nombre" - notion que nous allons préciser par des exemples simples, ci-après - en l'occurence, savoir construire le polygone régulier à n côtés, c'est savoir construire la n-ième racine de l'unité dans le plan complexe. Toute la beauté des résultats auxquels nous aboutirons - le Théorème de Wantzel pour la constructibilité d'un nombre et le Théorème de Gauss-Wantzel pour ce qui est du cas des polygones réguliers - est ni plus ni moins de caractériser l'ensemble des nombres qu'on peut construire à la règle et au compas.

Mais d'abord, commençons par quelques exercices d'échauffement, très simples, qui vont nous permettre de préciser la notion de constructibilité et, accessoirement, de rendre un hommage à certains fondateurs Grecs de la géométrie

Le "1", les entiers et l'addition

En réalité, la question qu'on se pose ici est invariante par changement d'échelle : quelle que soit la figure tracée à la règle et au compas, le problème de la constructibilité reste invariant par dilatation. C'est pourquoi on définit le "1", l'unité de longueur, d'une manière arbitraire, par deux points placés sur le plan. Euclide nous dit : "par ces deux points passe une seule droite" et nous ajoutons à cela qu'il suffit de reporter au compas sur cette droite cette distance unitaire pour construire tous les entiers - les entiers relatifs.

D'une manière plus générale, si on suppose construits p et q, il suffit de reporter q en se plaçant sur p pour construire (p + q).

La multiplication, la division et les rationnels

Pour construire 1/p à partir de p, c'est le théorème de Thalès qui nous sauve, comme le montre la figure suivante

Fig.1. Construction de 1/p

Le tracé à la règle et au compas d'une parallèle passant par un point précis n'est pas un problème, comme le montre la figure ci-dessous :

Fig.2. Construction de la parallèle à une droite passant par un point donné.

La figure 1 s'adapte pour la construction du produit p.q à partir de p et q donnés.

Fig.3. Construction de p.q.

Ainsi, on réussit la construction de tous les nombres rationnels (ou, plus précisément, tous les multiples rationnels de l'unité donnée). Mais ce n'est pas tout.

La racine carrée et les extensions quadratiques : le Théorème de Wantzel

Construire la racine carrée de p donné nous est possible grâce au troisième grec de la bande : Pythagore. En effet, comme le montre la figure ci-dessous, c'est l'identité (p + 1/4)² - (p - 1/4)² = p qui nous permet d'utiliser Pythagore et de tracer racine de p.

Fig.4. Construction de racine de p

Au final, c'est tous les rationnels "et un peu plus", qu'on a construit à la règle et au compas. Cet "un peu plus" s'exprime mathématiquement de la manière suivante : si un corps (1) d'éléments est constructible (2), alors toute extension quadratique de ce corps est constructible. comme le montre la définition suivante :

Extension quadratique d'un corps : une extension quadratique L d'un corps K est un sur-corps de K qui est un K-espace vectoriel de dimension 2.
Autrement dit, il existe un élément a de L-K tel que L = K[a], où K[a] l'ensemble des x + a.yx et y sont dans K (3)
On dit de cet élément a qu'il est de degré 2 sur K, c'est-à-dire que tout polynôme de K[X] non nul de degré minimal qui l'annule est de degré 2.

Schématiquement parlant, l'adjonction d'une racine carrée (non présente dans le corps de base) à un corps de constructibles permet de définir formellement une extension de corps dont tous les éléments sont constructibles : c'est la dernière étape que nous avons mentionnée ci-dessus avec Pythagore, qui le montre.


Ce que dit alors le Théorème de Wantzel, l'énoncé général, c'est qu'étant donné un corps K de constructibles (en général, le corps des rationnels), un élément x quelconque est constructible si et seulement s'il existe une suite finie croissante K(n) d'extensions de K, de longueur N, telle que K(0) = K, telle que  K(n+1) est une extension quadratique de K(n) et telle que x est dans K(N).

Autrement dit, intuitivement : les constructibles s'obtiennent par extensions quadratiques finies successives du corps des rationnels.

Un corollaire à cela est qu'il existe des éléments non constructibles, qu'il en existe beaucoup, même une infinité, une infinité indénombrable, une infinité dense dans ℝ et même dans ℂ, une infinité, enfin, qui a la puissance du continu. Témoins de cela, les nombres transcendants ne sont par définition pas constructibles, puisque racines d'aucun polynôme à coefficients rationnels. On retrouve ainsi l'impossibilité de la quadrature du cercle (4).

De même, la racine cubique de 2 n'est pas constructible, puisqu'il s'agit d'un élément de degré 3 sur ℚ (son polynôme minimal est le polynôme $X^3-2$). Ainsi, il est impossible de résoudre à la règle et au compas le problème de la duplication du cube - qui consiste à construire à partir d'un cube donné, un cube de volume double.

C'est là où nous en venons aux polygones constructibles : la caractérisation de Wantzel et les travaux de Gauss sur les polynômes cyclotomiques vont permettre de caractériser exactement les polygones réguliers constructibles.

Constructibilité des polygones réguliers

Quelques résultats sur les polynomes cyclotomiques (5) montrent que la racine n-ième de l'unité, z(n) = exp (2.i.π /n), est de degré φ(n) sur ℚ au sens des extensions algébriques. Ainsi, d'après le théorème de Wantzel ci-dessus, la supposer constructible impose que son degré soit une puissance de 2, donc φ(n) doit être une puissance de 2. C'est même une condition suffisante (6).

Ainsi, en décomposant n en facteurs premiers, on s'aperçoit que :
- la valuation p-adique de chacun des nombres premiers différents de 2 doit être égale à 1 ;
- chaque nombre premier p > 2 de la décomposition doit être consécutif à une puissance de 2 - autrement dit, que p - 1 doit être une puissance de 2.

De plus, l'exposant m de cette puissance de 2 ne peut être quelconque : le caractère premier de p impose nécessairement que m lui-même soit une puissance de 2. Pour montrer cela il suffit d'écrire m comme produit d'une puissance de 2 et d'un nombre impair, puis de s'appuyer sur l'identité remarquable selon laquelle (a + 1) divise strictement (ar+1) dès que r est supérieur ou égal à 3. Ceci impose alors r = 1 ce qui achève la preuve.

Si on résume, une condition nécessaire et suffisante de la constructibilité du polygone régulier à n côtés réside dans la décomposition en facteurs premiers de n : il doit être le produit d'une puissance de 2 et de nombres de Fermat, premiers, distincts. C'est le Théorème de Gauss-Wantzel.

Ainsi, le triangle (3), le pentagone (5), le pentadécagone (15), l'heptadécagone (17) sont constructibles - reste à savoir comment ! En revanche, l'heptagone (7) et l'ennéagone (9) ne le sont pas.

D'ailleurs, si l'ennéagone était constructible, alors l'angle π/3 serait trissectable. Or ce n'est pas le cas, et c'est encore Gauss-Wantzel qui permet de le voir. Je vous laisse trouver comment...


Vers la preuve du Théorème de Gauss-Wantzel

Nous reprendrons la démonstration de ce théorème dans un post ultérieur au sujet de la Théorie de Galois (cf. section "Théorie des Nombres"). En effet, montrer que est de la forme voulue supposant le polygône régulier à n côtés est constructible se fait en montrant que le polynôme cyclotomique d'ordre n est irréductible. Ceci s'obtient d'une manière quasiment élémentaire.

En revanche, partant de la forme de n, la tour quadratique de $e^{2i\pi/n}$ se met en évidence en exhibant une suite résoluble du groupe de Galois $Gal(\mathbb{Q}(n)/\mathbb{Q})$ où $\mathbb{Q}(n)$ est l'extension cyclotomique d'ordre n de $\mathbb{Q}$. Dans cette décomposition résoluble
${1}\lhd G_1\lhd \cdots\lhd G_N=Gal(\mathbb{Q}(n)/\mathbb{Q}$
avec pour tout $i$, $(G_i:G_{i+1})=2$ ($G_i $ est d'indice $2$ dans $G_{i+1}$).

La correspondance de Galois met alors un sur-corps de $\mathbb{Q}$ "en face" de chacun des sous-groupes distingués ainsi construits :
$\mathbb{Q}\subset K_1\subset\cdots\subset K_N=Q(n)$
avec pour tout $i$, $[K_{i+1}:K_i]=2$. L'application du théorème de Wantzel permet alors de conclure quant à la constructibilité de $e^{2i\pi/n}$.

-------------------------------------------------------------
(1)  Un corps est une structure algébrique présentant deux lois de composition interne (addition et produit) définissant chacune une structure de groupe - toutefois, pour la multiplication la structure de groupe est définie pour le corps privé de 0, c'est-à-dire que tout élément non nul d'un corps admet un inverse pour la multiplication. A noter que l'addition est commutative mais la multiplication ne l'est pas forcément. L'exemple le plus direct de corps est ℚ, l'ensemble des rationnels. En revanche, ℤ n'est pas un corps car ses seuls éléments qui admettent des inverses pour la multiplication sont -1 et 1. En cela, ℚ constitue corps des fractions de ℤ, sorte de "plus petit corps" contenant ℤ.
(2) Tout au long de cet article, par "constructible", on sous-entend bien sûr "constructible à la règle et au compas".
(3) C'est une manière déguisée de dire que (1, a, a²) est liée dans L comme K-espace vectoriel, avec un coefficient non nul pour a² - comme a n'appartient pas à K. On comprend alors la phrase qui suit, définissant le degré de a sur K.
(4) ... qui n'est autre que l'inconstructibilité de π.
(5) Entre autres, que le polynome cyclotomique d'ordre n est à coefficients entiers.
(6) φ désigne l'indicatrice d'Euler, c'est-à-dire le nombre d'entiers compris entre 0 et n qui sont premiers avec n. Si φ(n) est une puissance de 2, c'est parce que dans une extension algébrique finie, le degré d'un élément sur le corps de base divise le degré de l'extension toute entière. C'est une propriété élémentaire des extensions algébriques.

Tuesday, July 17, 2012

Complété d'un espace : une construction bien réelle !

Le dernier post de ce blog parle de construction, d'extension, d'artifice mathématique poussant à créer des ensembles aux propriétés plus fortes que les ensembles de base.

Ainsi, nous avons parlé de la construction générale d'un ensemble métrique complet à partir d'un espace métrique quelconque, celui-ci étant dense dans son extension. Un exemple de densité ne vous vient-il pas à l'esprit ? Le plus souvent, on parle de densité avec l'ensemble des rationnels dans l'ensemble des réels, n'est-ce pas ? Cela va être notre propos ici, comme une application du complété d'un espace : nous allons parler de la construction de l'ensemble des réels.

Petit rappel d'abord sur la construction des ensembles connus : admettant la construction de l'ensemble des entiers naturels (1), de sa loi de composition interne, l'addition, on a alors, par définition, un monoïde. Une extension naturelle de cet ensemble est de le munir de symétriques pour l'addition, ainsi on adjoint aux entiers naturels les entiers négatifs pour former l'ensemble des entiers relatifs. Cette fois, on a même une structure de groupe pour la l.c.i. addition, c'est-à-dire que tout élément admet un inversible de telle sorte que composés ensemble, ils reviennent à l'élément neutre : 0.

Plus que de groupe, on a même une structure d'anneau si on adjoint la multiplication entre entiers relatifs - on aurait même pu munir les entiers naturels de la multiplication, faisant de l'ensemble un "double monoïde". Cette fois, l'ensemble des entiers relatifs n'admet que 1 et -1 comme inversibles pour la multiplication ; ainsi, comme dans le cas des entiers naturels, il paraît "naturel", justement, d'ajouter à l'ensemble des relatifs, les inversibles tels que l'ensemble ainsi créé (2) soit également muni d'une structure de groupe pour la multiplication. Ainsi, on se retrouve avec l'ensemble des nombres rationnels.

Parlons topologie désormais (3). Autant sur les entiers naturels et sur les entiers relatifs, les topologies induites pouvaient rester triviales - puisqu'essentiellement des topologies discrètes - autant sur les rationnels, on voit apparaître une topologie plus élaborée en introduisant la métrique canonique consistant à mesurer la distance entre deux fractions comme la valeur absolue de leur différence. Sous cette métrique, on construit par exemple des suites convergentes non constantes ; ainsi considérant 1/n pour n tendant vers l'infini, la suite converge vers 0.

Or, l'ensemble des rationnels muni de cette métrique n'est pas complet (à noter que muni de la métrique discrète, il l'est). Pourtant, prenant un coup d'avance, on sait que l'ensemble des rationnels se plonge dans celui des réels et que ce dernier est complet. Donc, où est le problème ? Et bien, le problème tient dans le fait suivant : si toute suite de Cauchy de ℚ converge dans ℝ comme suite de réels, sa limite, elle, n'est pas forcément dans ℚ. Bien au contraire, il existe énormément de suites de Cauchy de ℚ non convergentes dans ℚ, par exemple considérant les développements décimaux tronqués de tous les nombres irrationnels (racines de nombre entiers non carrés parfaits, nombres transcendants, etc.).

Justement, retournons le problème et regardons la question suivante : que se passe-t-il si on considère le complété de ℚ comme construit dans la publication précédente ? Et bien, tout simplement, on tombe sur l'ensemble des réels ℝ. En d'autres termes, si on construit l'extension de ℚ qui contient les suites de Cauchy d'éléments de ℚ - regroupées par classes d'équivalence (4) - on tombe sur tous les nombres réels : algébriques, transcendants, ... tous. En conséquence, on tient là une construction de l'ensemble des réels par complétion de l'ensemble des rationnels pour sa métrique naturelle.

Cette construction de ℝ est appelée "construction de Cauchy" en héritage des suites du même nom qui permettent d'identifier ℝ comme le complété de ℚ. A noter que cette construction est aussi valable partant d'une extension algébrique de ℚ d'ordre fini, c'est-à-dire de tout corps résultant de l'adjonction d'un nombre fini de nombres réels algébriques à ℚ.

En résumé, c'est la théorie des ensembles qui construit ℕ, c'est l'algèbre qui nous apporte ℤ puis ℚ, et pour finir, c'est la topologie qui nous donne ℝ. Ainsi, c'est grâce à une belle série de théories mathématiques qu'on parvient à construire les ensembles les plus courants.

Ici encore, nous donnerons dans un post ultérieur de Théorie des Nombres comment une telle idée permet de construire les corps locaux $p$-adiques comme des complétés de $\mathbb{Q}$ pour d'autres métriques que celle de la valeur absolue. Ces "frères" de $\mathbb{R}$ sont à la base de toute la théorie moderne des nombres et travaux de recherche les plus poussés sur le sujet.


(1) Cette construction, dite de Peano, fait appel aux notions d'ordinal et de successeur, que nous aurons sans doute l'occasion d'aborder ici.
(2) ... hormis l'élément zéro pour des questions de gestion de l'horizon infini. Nous aurons également l'occasion de revenir sur l'exclusion du zéro dans les corps dans une publication future.
(3) Oui, encore de la topologie..
(4) A considérer toutes les suites de Cauchy sans les regrouper, on risque de compter deux fois la même pour un même nombre réel. Par exemple, prenons Pi : 3.14926535... considérant la suite (xn) de rationnels composée des développements décimaux jusqu'à la décimale n (n entier naturel) et considérant la suite (yn) de rationnels composée des développements décimaux jusqu'à la décimale 2n (n entier naturel), on obtient deux suites différentes (même si (y) est en fait une suite extraite de (x)) qui tendent vers la même limite. Ainsi, on a besoin de regrouper (x) et (y) dans la même "catégorie", c'est pourquoi on munit l'extension de ℚ de la relation d'équivalence entre suites de Cauchy qui regroupe les suites dont la distance élément à élément tend vers 0. C'est ainsi le cas de nos exemples (x) et (y), dont la différence élément par élément peut être majorée par 10-(n-1).

Tuesday, July 10, 2012

De quoi s'arracher les cheveux, avec leurs extensions...

A l'image d'un corps possédant une extension algébriquement close, peut-on étendre des espaces topologiques généraux en des espaces possédant des propriétés plus agréables ? La réponse est oui, évidemment, et nous proposons ici d'approcher une des composantes du travail du mathématicien, à savoir celle qui consiste à fabriquer des extensions artificielles sur lesquelles tout un jeu de propriétés devient accessible, à partir d'ensembles a priori "généraux".

Examinons cela, par le biais de la complétion d'espaces métriques.

En effet, un espace métrique X se complète, en considérant l'espace des suites de Cauchy d'éléments de X sur lequel on définit une relation d'équivalence : deux suites de Cauchy sont équivalentes si la distance entre les deux suites tend vers 0. Ainsi, dans cette extension qu'est l'espace des suites de Cauchy quotienté par la relation d'équivalence définie, l'espace de départ peut s'identifier à l'ensemble des suites constantes. Par ailleurs, par complétude de l'ensemble des réels, la distance (au sens de la métrique de X) entre les éléments de deux suites de Cauchy converge vers une limite, ainsi on peut définir une métrique sur l'extension par ce moyen (2). Définir une extension constituée d'objets (ici, des suites de Cauchy) a priori de nature différente des éléments de l'espace d'origine, puis identifier l'espace d'origine à un sous-ensemble de l'extension par une relation injective (ici, celle qui à un élément de X associe la suite constante égale à cet élément) est un des principaux procédés utilisés en mathématiques pour construire des extensions.

Pour la métrique de l'extension, l'application qui à un élément de X associe la (classe de la) suite constante dans l'extension est bien une isométrie. Par ailleurs, le plongement est dense dans l'extension et ce point précis demande une certaine gymnastique intellectuelle. Considérant un élément de l'extension, c'est-à-dire une (classe d'équivalence d'une) suite de Cauchy de l'espace de départ, suite qu'on appelle x, il s'agit de construire une suite d'éléments de X, en tant que partie de l'extension, qui s'approche indéfiniment de la suite choisie x. Autrement dit, il suffit de trouver une suite de suite constantes qui s'approche indéfiniment de la suite choisie x, pour une métrique qui mesure la distance entre deux suites de Cauchy par leur distance en l'infini (3). Une fois qu'on a bien remis ses neurones à l'endroit suite à une telle bourrasque, on s'aperçoit que la suite des suites constantes égales à chacun des termes de la suite x convient - et cela provient directement du caractère de Cauchy de toutes ces suites.

Si on résume, on vient de construire une extension de X, de la munir d'une métrique et de montrer que X y est dense. Mais il nous manque l'essentiel : la complétude de l'extension. Pour cela, il va falloir encore faire une belle pirouette entre X, son plongement dans l'extension et les éléments de l'extension - qui sont, on le rappelle, des classes d'équivalence de suites. En effet, considérant une suite de Cauchy y dans l'extension, c'est-à-dire une suite de suites d'éléments de X, à n'importe quel rang y(n) de cette suite on peut trouver un élément x(n) du plongement de X - x(n) est à la fois un élément de X et une suite constante dans l'extension - qui soit proche de y(n) à 1/n près, au sens de la métrique de l'extension.

1er artifice : dans cette affaire, x(n) - en tant qu'élément de l'extension - est une suite constante, contrairement à y(n) - en tant qu'élément de l'extension toujours - qui ne l'est pas a priori. 2ème artifice : certes, la suite des x(n) - où x(n) est cette fois considéré comme un élément de X - ne converge pas dans X, mais comme elle est de Cauchy, elle a sa classe d'équivalence dans l'extension. Alors, il se trouve que cette classe d'équivalence est la limite que l'on cherche pour la suite y, ce qui s'établit sans difficulté majeure.

Si le raisonnement a de quoi désorienter, on ne doit pas perdre de vue ce magnifique procédé qui consiste à étendre un ensemble dit "général" en définissant une extension composée d'objets de nature élaborée puis à considérer que l'espace d'origine se plonge "naturellement" dans son extension par une application injective. Une série d'artifices telle que les deux que nous venons d'exposer permet alors d'aboutir à des conclusions a priori miraculeuses. C'est ce mode de raisonnement que je trouve personnellement très instructif que je tenais à partager.

Le prolongement ci-dessous propose un examen du cas de compactification. Ce cas est analogue puisqu'il propose d'adjoindre à l'espace de départ un "corps étranger" qui rend l'espace compact. C'est alors un procédé d'extension moins abstrait, mais de même nature que celui que nous venons d'exposer. La construction d'une extension de corps algébriquement close est du même acabit.

Prolongement : le compactifié d'Alexandrov

Partant d'un espace X non compact mais localement compact, il est possible de définir une extension compacte, "simplement" en adjoignant l'infini à l'espace de départ. Joli, n'est-ce pas ? C'est ainsi qu'on définit, dans le cas du plan réel, la sphère de Riemann, en adjoignant l'infiniment lointain au plan, comme si on repliait un planisphère en mappemonde.. Cette image permet sans doute de mieux saisir la notion de compactifié d'Alexandrov.

En fait, le procédé comprend également une redéfinition de la topologie adaptée à l'extension, en considérant comme ouverts les parties engendrées par les ouverts de X et les complémentaires de compacts dans X auxquels on adjoint l'infini.

Pour la petite histoire, la raison pour laquelle une telle extension est compacte tient dans le fait que l'infini se sépare de tout élément de X (4a) et que dans tout recouvrement ouvert de l'extension, on trouve un ouvert qui contient l'infini (4b).


(1) ... pour peu qu'il soit localement compact, c'est-à-dire que tout point admette un voisinage compact.
(2) On vérifie plus ou moins aisément qu'il s'agit bien d'une métrique ; en tout cas c'est un bon exercice.
(3) ... distance à l'infini qui existe bien, car on est dans l'ensemble des réels, qui est complet.
(4a) Merci à la compacité locale !
(4b) Le complémentaire est alors compact, il est recouvert par tous les autres ouverts du recouvrement, et on peut alors extraire un nombre fini pour remplir la même fonction de recouvrement.

Thursday, July 5, 2012

Si on ne métrise pas Bolzano-Weierstrass...

La topologie n'est pas vraiment le domaine de la mathématique le plus simple à partager notamment dans le cadre d'un blog. Toutefois, ce que j'y trouve de fascinant c'est, comme je tentais de l'expliquer dans le billet précédent, cet aller-retour constant qu'on est obligé de faire entre des notions a priori extrêmement générales d'une part, à tel point que certains théorèmes sont adjoignables à la théorie de Zermelo-Fraenkel, et des efforts de représentation pour sa compréhension propre, dans des cadres connus mais élaborés. Ainsi, il n'est pas rare d'en appeler à des espaces vectoriels de dimension finie pour comprendre la notion d'ouvert alors qu'en fait l'ouvert n'a besoin que de concepts très basiques pour se définir.

Bref. Ici, ce qui éveille ma curiosité, c'est la compacité et plus précisément le théorème de caractérisation de Bolzano-Weierstrass. Pour rappel, un compact est une notion topologique (c'est-à-dire qu'aucune métrique et a fortiori aucune norme n'est nécessaire pour sa définition) qui se définit par deux caractéristiques :

1/ un compact est séparé (i.e. deux éléments distincts peuvent être chacun mis dans un ouvert, les deux ouverts ne présentant aucune intersection)
2/ un compact vérifie la propriété dite de Borel-Lebesgue : de tout recouvrement a priori infini du compact par des ouverts il est possible d'extraire un recouvrement fini.(1)

Parfois, dans les livres de topologie, on trouve en guise de définition d'un compact la caractérisation suivante, dite de Bolzano-Weierstrass :

Dans un espace métrique, un compact est un ensemble dans lequel il est possible d'extraire de toute suite d'éléments une sous-suite convergente.

Vous l'aurez peut-être remarqué : la différence entre les deux énoncés c'est la métrique. Dans Borel-Lebesgue, on parle d'ouverts, dans Bolzano-Weierstrass on parle d'espace métrique, donc de distance.

Or, en soi, la notion de sous-suite convergente n'a pas besoin de la métrique pour être définie. En effet, une suite tend vers une limite donnée lim si pour tout voisinage de lim il existe un rang N (si ce n'avait été l'ensemble des entiers naturels, on aurait parlé d'un voisinage de l'infini) à partir duquel tous les éléments de la suite sont dans ledit voisinage. Or un voisinage d'un élément c'est un ensemble qui contient un ouvert contenant lui-même l'élément : il n'est nul besoin de métrique dans cette affaire. Toutefois, je vous l'accorde : pour bien se représenter la définition de la limite que je viens de transcrire, on a bien besoin de se placer dans un espace métrique, pour sentir qu'on n'exprime rien d'autre que l'idée selon laquelle un suite convergente se rapproche indéfiniment de sa limite, et de manière irréversible à partir d'un certain rang. C'est encore une illustration de l'idée que j'évoquais en tête de ce texte et que j'ai tenté de développer dans le précédent.

Donc, si on a besoin du cadre métrique dans Bolzano-Weierstrass, c'est que sans cela, il y a de fortes chances que le théorème soit faux : ce serait donc une hypothèse nécessaire et / ou suffisante.

Le fait est qu'un espace compact au sens général ne vérifie pas toujours la propriété de Bolzano-Weierstrass. En commençant par considérer la famille (dénombrable) des fermés définis par l'adhérence des termes de la suite à partir du rang n (n indexant la famille de fermés), on remarque que toute sous-famille finie de cette famille de fermés est d'intersection non vide, pour conclure que l'intersection de tous ces ensembles fermés est non vide, ce qui signifie l'existence d'au moins une valeur d'adhérence. On croit qu'on a fini, mais en fait non : l'existence d'une sous-suite qui converge vers cette valeur d'adhérence n'est valable que dans un espace métrique.

Il existe donc en toute généralité des espaces compacts qui ne sont pas séquentiellement compacts, par exemple l'ensemble des applications de [0;1] dans [0;1] muni de la topologie produit. Cet espace est compact par le théorème de Tykhonov (voir précédent article) mais on peut construire une suite qui n'admet aucune valeur d'adhérence, par exemple en posant f[n](x) = cos(nx). Cela permet même d'en déduire que l'espace des applications de [0;1] dans [0;1] n'est pas métrisable

Dans l'autre sens, on ne peut également pas se passer de la métrisabilité. En effet, dans un espace métrique vérifiant la propriété de Bolzano-Weierstrass (on dit aussi séquentiellement compact), deux étapes permettent de conclure :

1 - le lemme dit des "nombres de Lebesgue" : pour tout recouvrement d'ouverts, il existe un rayon r > 0 tel que pour tout élément x, la boule centrée sur x et de rayon r est contenue dans un des ouverts du recouvrement. En d'autres termes, si on se donne un recouvrement d'ouverts, on sait déjà que tout élément de l'espace est forcément dans un des ouverts. Ce qu'ajoute le lemme des nombres de Lebesgue, c'est qu'il existe un rayon tel que ce n'est pas seulement x mais toute une boule ouverte centrée sur x qui est incluse dans un des ouverts. (D1)

2 - la précompacité d'un espace séquentiellement compact : un espace séquentiellement compact est recouvrable par un nombre fini de boules, et ce pour tout rayon > 0. (D2)
Pour conclure, il suffit d'appliquer le lemme des nombres de Lebesgue en profitant de la précompacité de l'espace séquentiellement compact. (prise seule, cette phrase peut faire sourire)

On voit dans cette esquisse de démonstration que la notion de métrique nous aide bien à construire des boules et à raisonner ainsi pour conclure. Certes, mais n'existait-il pas un moyen de s'en sortir sans faire appel à la métrique ?

Et bien, la réponse est encore non. Il existe en effet des espaces séquentiellement compacts qui sont non compacts, mais ça commence à devenir franchement pathologique. Voir ici pour un exemple très instructif faisant appel à la construction du permier ordinal non dénombrable.
La conclusion de tout ça est que compacité et compacité séquentielle sont deux notions bien distinctes en toute généralité, qui deviennent équivalentes dès que l'espace est muni d'une métrique. Sans métrique il faut donc se méfier du statut de quasi-définition qui est donné à la caractérisation de Bolzano-Weierstrass quant aux compacts.

En d'autres termes, si on ne métrise pas Bolzano-Weierstrass, compacité et compacité séquentielle se dissocient - mais ne s'excluent pas, car il est possible d'être compact, séquentiellement compact, mais non métrisable (2)...

Finalement, la métrique nous arrange bien !

Démonstrations
(D1) La propriété se démontre par l'absurde, en écrivant méthodiquement le contraire de l'assertion comme suit : pour tout rayon r, il existe un x tel que la boule centrée sur x et de rayon r n'est pas complètement incluse dans aucun ouvert de l'union. A ce moment là, on pose r[n] = exp(-n), on choisit alors un x[n] en relation, suite de laquelle on peut extraire une sous-suite convergente x[f(n)] qui tend vers x. D'autre part, x est dans un des ouverts du recouvrement, ce qui implique par définition d'un ouvert dans un métrique que toute une boule centrée sur lui est dans l'ouvert. Or pour un n suffisamment grand, le rayon r[f(n)] est tellement petit, x[f(n)] est si proche de x que toute la boule centrée sur x[f(n)] et de rayon r[f(n)] est incluse dans l'ouvert du recouvrement qui contient x. La construction de la suite x[n] l'interdit, d'où le résultat.
(D2) De la même manière, ce second résultat s'établit par l'absurde. S'il existe un rayon r > 0 pour lequel l'espace n'est jamais recouvrable par un nombre fini de boules de ce rayon, alors on construit par récurrence une suite x[n] telle que x[n+1] n'est pas dans l'union des boules de rayon r centrées sur x[k] pour k inférieur à n. Comme les éléments de cette suite sont distants les uns des autres d'au moins r > 0, alors il est impossible d'extraire une sous-suite convergente, d'où la contradiction.

Notes
(1) un recouvrement du compact par des ouverts, c'est un ensemble d'ouverts dont la réunion contient le compact.
(2) cf. par exemple ici, avec utilisation du difficile théorème d'Eberlein-Smulian

Monday, July 2, 2012

Zorn versus Tykhonov : Zermelo-Frankel pris à revers par la topologie.

Lors du dernier billet, nous avons brièvement évoqué la notion de théorie, permettant l'établissement de la véracité ou non d'un énoncé. Nous disions alors qu'il existe des axiomes sous lesquels une énoncé devient vrai et hors desquels il devient faux. C'est, grosso modo, l'extrapolation en mathématiques du vieil adage "question de point de vue..."

Ainsi, il est un axiome qu'on questionne souvent : l'axiome du choix. Comme son nom le rappelle, cet axiome affirme que le produit d'ensembles non vides est non vide, autrement dit : quel que soit le nombre d'ensembles (non vides) qu'on se donne, il est possible de construire un élément en piochant dans chaque ensemble, c'est-à-dire en choisissant dans chaque ensemble (1). Comme application principale de cet axiome, on peut citer surtout le théorème de la base incomplète, montrant l'existence d'une base dans un espace vectoriel quelconque. Cet axiome est le 10ème de la théorie de Zermelo-Fraenkel, qui fonde les mathématiques modernes, mais nous aurons peut-être l'occasion d'y revenir à l'occasion d'un autre billet.

En fait, mon objet ici c'est cette magnifique équivalence que j'ai eu l'occasion de rencontrer, entre l'axiome du choix et un théorème de topologie, le théorème de Tykhonov - équivalence c'est-à-dire que si on assortissait la théorie de Zermelo-Fraenkel (hors axiome du choix) du théorème de Tykhonov, on fonderait la même chose que la théorie ZF avec axiome du choix. Pourtant, le théorème de Tykhonov est, à la base, un théorème de topologie, dont l'énoncé appelle des notions plus élaborées que celle qu'on rencontre classiquement dans les axiomes qui fonderaient la base d'une théorie comme Zermelo-Fraenkel. Voyez plutôt.

Théorème (Tykhonov, 1930) : Tout produit d'espaces topologiques compacts est compact.

(N.B. : la réciproque est également vraie)

Revenons, comme lors du billet précédent, sur les notions évoquées par chacun des termes. Espace topologique, tout d'abord : si, comme dans le cas de l'espace métrique (lien), le terme d'espace désigne un ensemble en toute généralité, le fait qu'il soit topologique signifie qu'on y a particularisé une catégorie de sous-ensembles qu'on appelle les ouverts, qui doit être stable par réunion quelconque ainsi que par intersection finie, et qui doit contenir l'ensemble tout entier ainsi que l'ensemble vide (le néant). Cette catégorie d'ouverts s'appelle une "topologie".

Par exemple, si on considère l'ensemble des nombres réels, la topologie la plus "naturelle" est celle qui se base sur les intervalles ouverts (qui portent ainsi bien leur qualificatif d'ouvert) et qui se compose alors d'assemblages (réunions) possiblement infinis d'intervalles ouverts, d'intersections finies d'intervalles ouverts, je dirais même plus : des réunions quelconques et des intersections finies d'ensembles ainsi formés. Vous me direz : c'est immense, en fait on doit couvrir à peu près tous les sous-ensembles des réels avec des combinaisons aussi riches. Et bien non : je vous défie de construire l'ensemble constitué du nombre 1 - le singleton 1 - de cette manière.  C'est impossible.

Une autre façon de s'imaginer les ouverts tels qu'ils sont dans l'ensemble des réels, dans les espaces réels de dimension finie (le plan, l'espace tridimensionnel, etc.), ou plus généralement dans les espaces métriques (lien) c'est d'imaginer des ensembles tels qu'aucun élément n'est jamais pile sur le bord. En d'autres termes, tout éléments d'un ouvert peut être entouré d'une mini-boule, d'un mini-intervalle, en maths on dit d'un "voisinage" qui serait toujours dans l'ouvert., comme si on pouvait indéfiniment s'approcher du bord sans jamais le toucher (à moins de carrément basculer de l'autre côté, dans le complémentaire). Cette intution-là suppose toutefois la mise en place d'une métrique, d'une distance permettant de mesurer la proximité or ce n'est pas le cas de tous les espaces topologiques, loin de là. D'ailleurs, les espaces topologiques tels que ceux qui établissent le pont entre Zorn et Tykhonov sont bien loin d'être métriques !

Retenons donc qu'un espace topologique est un ensemble pour lequel on a caractérisé un ensemble d'ouverts.  Par ailleurs, un produit d'espaces, c'est simple : par exemple un produit de deux espaces, c'est l'ensemble des paires d'éléments dont le premier est dans l'ensemble 1, le second est dans l'ensemble 2 - 1 et 2 constituant l'indexation des ensembles du produit. Un produit infini dénombrable (1,2,3,... ) s'imagine bien, par extension. Plus généralement, un produit infini quelconque d'ensembles peut se conceptualiser : il se rattache alors à un ensemble général d'indexation (des nombres, des réels, des fonctions, etc.) qui constituera la numérotation de cet "ensemble d'ensembles".

Reste, donc, la notion non triviale de compact. La définition plus abordable quand on commence la topologie selon moi, c'est celle dite de Bolzano-Weierstrass, qui dit qu'un espace compact est un espace dans lequel toute suite admet une suite extraite convergente. Ou encore, que toute suite admet au moins une valeur d'adhérence (lien). La définition dite de Borel-Lebesgue dit, elle, qu'un compact c'est un ensemble qui, quand on le recouvre d'une famille d'ouverts, peut toujours être recouvert par une sous-famille finie de ces ouverts. Exemple, par rapport à la définition de Bolzano-Weierstrass : la suite des nombres entiers prise comme sous-ensemble de l'ensemble des nombres réels. Cette suite ne converge pas, elle n'a même aucune valeur d'adhérence, puisqu'elle tend vers l'infini. Ainsi, on voit alors que l'ensemble des nombres entiers n'a aucune chance d'être compact. En fait, d'une manière plus générale, on sait bien caractériser les compacts dans l'ensemble des réels : ce sont les ensembles fermés (c'est-à-dire de complémentaire ouvert) et bornés. On voit bien que l'ensemble des entiers, non borné, n'a aucune chance d'être compact.

Ainsi, ce que dit l'axiome du choix c'est que si chaque ensemble est non vide, alors leur produit est également non vide.

Ce que dit le théorème de Tykhonov, c'est que si chacun d'entre eux est compact, alors le produit est compact.

On voit bien que ce qui est curieux dans cette histoire, c'est que le théorème de Tykhonov en appelle à la notion de compact, donc à la définition d'une topologie, alors que l'axiome du choix en reste à des notions ensemblistes basiques comme le produit d'ensembles. En fait, quand on suppose Tykhonov vrai pour démontrer qu'on vérifie l'axiome du choix, il y a une étape de la démonstration qui munit chaque ensemble du produit d'une topologie de définition élémentaire : cette topologie considère comme ouvert tout ensemble dont le complémentaire est fini. C'est donc dans cette topologie particulière, purement ensembliste, sans considération de métrique ou de norme, qu'on va identifier des ensembles comme étant compacts, leur produit comme compact et c'est de cette compacité qu'on va alors déduire le caractère non vide du produit des ensembles de départ.

Voici donc une démonstration (2) qui nous aura montré que la topologie servait ici de concept pour naviguer au milieu des axiomes ensemblistes. C'est plutôt désorientant dans le sens où, pour se construire une intuition sur les notions abstraites introduites en topologie, on en appelle souvent à la métrique, qui suppose intrisèquement la construction de l'ensemble des réels par exemple, elle-même basée sur le socle de la théorie de Zermelo-Fraenkel alors qu'en fait la notion générale de topologie, via le théorème de Tykhonov, nous permet de revenir sur l'axiome du choix, donc de "prendre à revers" la théorie ZF et les constructions usuelles que nous venons d'évoquer (métrique, réels, etc.). Comme quoi...


(1) une version équivalente dit : tout ensemble ordonné inductif admet un élément maximal. C'est le Lemme de Zorn (paragraphe "Ensemble inductif") L'équivalence avec l'axiome du choix se démontre, mais c'est délicat (lien)...

(2) voir par exemple ici au paragraphe "Equivalence avec l'axiome du choix".

Thursday, June 28, 2012

De la maçonnerie en mathématiques

En mathématique, certains énoncés sont parfois terriblement agressifs. Pas plus tard que ce matin, je lisais l'énoncé suivant :

Dans un espace métrique, les valeurs d'adhérence d'une suite sont exactement les limites de suites extraites.

Rien que ça.

Devant une telle juxtaposition de termes dont chacun avait causé en moi, à un moment ou à un autre de ma vie, une intense gymnastique dans l'abstraction, m'est venue une réflexion, puis l'idée de ce blog.

Un espace métrique, dites-vous ? Un espace, en mathématique, cela peut représenter un nombre considérable d'objets. Dans espace métrique, le terme d'espace désigne simplement un ensemble, un amas d'éléments. Concrètement, un amas constitué d'un chou, d'une carotte, de votre vélo, de la PlayStation de votre petit frère, d'un billet de 10 euros et de votre passe de transport, c'est un ensemble, susceptible, donc, de devenir un espace métrique.

Ce qui lui manque, pour cela, c'est la métrique, c'est-à-dire la distance, un critère qui permet de mesurer la distance entre les éléments qui le compose. En reprenant le fourre-tout énoncé plus haut, qu'est-ce qui pourrait bien constituer une métrique ? .. Et bien, prenons par exemple leur valeur, leur prix. Le chou a un prix, la carotte, le vélo, la PlayStation, le billet de 10 euros, le passe de transport.. à la limite, tous ces éléments ont un prix et la distance entre eux pourrait être la différence entre ces prix. Ainsi la distance entre le chou et le vélo serait d'environ 300 euros, celle entre la console et le billet, d'environ 200 euros. Soit. Et si on ajoute à votre ensemble, disons, l'amour de votre mère ? ou bien votre envie de partir en vacances ? On a bien dit que l'espace pouvait inclure n'importe quoi. Cette fois, bien malin qui pourra donner un prix à l'amour de sa mère ou à son envie de partir en vacances.. Il est donc difficile de trouver un critère de mesure dans un ensemble aussi hétérogène ; autrement dit : des espaces non métriques, ça existe - il y en a même de très concrets, autour de nous, quand on cherche bien.

Ainsi, si on revient à l'énoncé mathématique, le fait qu'il commence par "Dans un espace métrique" n'a rien d'anodin : c'est une hypothèse, un postulat qui n'est pas dispensable et sans lequel la véracité de la phrase est remise en cause. Poursuivons et plaçons-nous en espace métrique : supposons qu'avec les objets qu'on a, tout se mesure, tout se pèse, tout s'évalue.

Une suite, sous-entendu d'éléments de l'espace métrique, c'est une ribambelle infinie d'éléments qu'on numérote. 1. carotte 2. chou 3. vélo 4. playstation etc. jusqu'à l'infini. Cela peut boucler, se répéter, pas de règle ici c'est une suite sous-entendu : quelconque. 1. vélo 2. vélo 3. carotte 4. chou 5. playstation encore.. pourquoi pas ? Dans la même veine, la suite extraite, c'est une sous-suite extraite d'une suite de base, conservant l'ordre : on n'a pas le droit de prendre le n°3 puis le n°1, puis le n°5 etc., on doit conserver l'ordre des éléments. Le lien avec la suite originale est ainsi plus fort que le simple fait de reprendre certains de ces éléments : on doit les piocher dans l'ordre. Dans l'exemple ci-dessus, 1. vélo 2. chou 3. playstation pourrait marquer le début d'une suite extraite, puisqu'on a pioché les éléments 1, 4 et 5.

Valeur d'adhérence ... hum les mathématiciens sont tordus mais en général ils aiment donner une terminologie qui correspond à une certaine intuition, une certaine mnémotechnie. Une valeur d'adhérence d'une suite (car la notion de valeur d'adhérence se rattache à une suite donnée) c'est un élément duquel la suite va revenir aussi près qu'on veut, comme un vieux démon auquel la suite irait se coller encore et encore : elle le quitterait, elle s'en éloignerait, mais elle finirait toujours par y revenir à un moment où à un autre, sans forcément le toucher, mais en s'en approchant infiniment près.

Poursuivons sur l'exemple entamé plus haut et considérons la suite 1. vélo 2. carotte 3. vélo 4. carotte etc. pair = vélo, impair = carotte. Et bien ici, le vélo et la carotte sont des valeurs d'adhérence. Car on y revient toujours : même au bout de 1 000 000 000 de termes dans votre suite, vous savez que vous prendrez encore et toujours la valeur "vélo" ou la valeur "carotte".

Autre exemple. Agrandissons notre panier, disons que la carotte nous a coûté 5 euros et ajoutons-y des carottes qu'on a acheté un peu plus cher, des carottes à 6 euros, à 5.5 euros, à 5.2 euros, à 5.01 euros, à 5.0000001 euros - supposant que c'est possible, qu'on peut diviser les centimes d'euros - à 5.000000000001 euros, etc. En maths on dit "supposons que le panier contienne des carottes dont le prix est aussi près de 5 euros qu'on veut". Cela signifie que si vous regardez n'importe quelle somme supérieure à 5 euros, même de peu, il va exister une carotte dans votre sac dont le prix va s'intercaler entre 5 euros et cete somme. 5.05 euros ? pas de souci j'ai une carotte à 5.04 euros. 5.0001 ? pas de souci, j'ai 5.00000001. Bref vous avez compris : supposons cela.
Alors considérons la suite suivante : 1. carotte 5.10€ 2. vélo 3. carotte 5.01€ 4. vélo 5. carotte 5.001€ 6. vélo 7. carotte 5.0001€ 8. vélo etc. Bref : pair = vélo , impair = carotte de plus en plus près de 5€ mais jamais exactement égale à 5€. Et bien dans cet exemple, la carotte 5€ est une valeur d'adhérence ! Vous me direz : "je ne comprends pas, elle n'est pas dans la suite, on l'atteint jamais". Certes, mais on s'en rapproche indéfiniment près, quel que soit le point de la suite auquel on se place, il existera toujours, plus loin, une valeur de carotte qui se situera encore plus près de la carotte à 5€. Valeur d'adhérence.. on y revient toujours, on y adhère indéfiniment.

Reste une notion encore obscure.. : la limite. La limite, c'est un peu la même idée que la valeur d'adhérence : à commencer par le fait que la notion de limite ici se rattache à une suite. On parle ainsi de "limite d'une suite". Sauf que c'est plus contraignant qu'une valeur d'adhérence : là où une suite peut se montrer infidèle à une valeur d'adhérence - en allant papillonner vers d'autres valeurs d'adhérence encore et toujours, comme notre premier exemple qui faisait alternativement vélo / carotte / vélo / carotte / etc. - la limite, elle, est exclusive. On ne papillonne pas avec la limite : on tend vers elle ou bien on ne tend vers rien et à la limite (sans mauvais jeu de mots), on parle de valeurs d'adhérence. Ainsi, par exemple, la suite constante 1. vélo 2. vélo 3. vélo 4. vélo etc. a une limite évidente : le vélo. C'est constant, ça tend vers le vélo puisque ça vaut tout le temps "vélo". D'ailleurs, on remarque que vélo est aussi une valeur d'adhérence, c'est même la seule.
Autre exemple, avec nos divisions de centimes d'euros, avec la suite 1. carotte 5.10€ 2. carotte 5.01€ 3. carotte 5.001€ 4. carotte 5.0001€ etc. Cette suite admet une limite, c'est la carotte 5€ - sans jamais l'atteindre, elle s'en rapproche indéfiniment. Encore une fois, la carotte 5€ est une valeur d'adhérence, et c'est la seule.
Vous me direz : pour une suite qui n'admet qu'une seule d'adhérence, cette valeur d'adhérence c'est alors sa limite ? Oui, c'est bien le cas (sous certaines conditions qui dépassent le cadre de ce billet).

Espace métrique, suite, suite extraite, valeur d'adhérence, limite... Ces notions, que nous nous sommes "seulement" acharnés à définir jusqu'à présent, se retrouvent réunies sous le même énoncé. Et c'est là qu'intervient l'idée de démonstration en mathématiques : il s'agit d'établir pourquoi cet énoncé est vrai (1), comment les propriétés des uns viennent entrer en résonance avec les propriétés des autres pour faire que tout ceci se tient.

Je ne souhaite pas ici détailler la démonstration, juste en venir à la réflexion que je me suis faite, comme un point de vue : finalement, la mathématique définit moult objets, les manipule, les met en relation et ces relations sont cimentées dans des énoncés qu'on démontre afin d'établir leur véracité, afin de pouvoir s'appuyer sur eux pour créer d'autres objets, démontrer d'autres énoncés.. En fait, le mathématicien oscille sans cesse entre la fabrication d'objets, dont il a l'intuition en en manipulant d'autres, et le façonnage du ciment entre ces objets, par la conception d'énoncés les reliant, par la démonstration établissant leur véracité. La brique espace métrique se pose à côté de celle de la suite, dessus on pose celle de la valeur d'adhérence, de la suite extraite et de la limite puis la démonstration vient jointoyer le tout : ça tient.

Finalement, le mathématicien est comme un maçon de l'abstraction.


(1) La notion de véracité en mathématique est elle aussi relative, elle s'établit dans une certaine théorie (voir par exemple ici pour un petit voyage dans la génèse des mathématiques modernes), théorie définissant des postulats de base (des axiomes) comme des fondations sur lesquelles s'établit toute construction. En d'autres termes, ce qui est vrai (c'est-à-dire établi logiquement) dans une certaine théorie peut être faux dans une autre.