Thursday, September 13, 2012

Jamais trois pour deux carrés !

Le théorème des deux carrés de Fermat est un théorème d'arithmétique, dont on donne ainsi l'énoncé général :

Théorème des deux carrés de Fermat : Un entier s'écrit comme somme de deux carrés si et seulement si les nombres premiers de sa décomposition en facteurs premiers qui s'écrivent sous la forme 4n + 3 interviennent à des puissances paires.

Pour en venir à bout, des mathématiciens de tous temps (Fermat, Lagrange, Gauss, ...) ont permis de trouver des méthodes assez variées, proposant ainsi un panorama de ce que la mathématique pouvait faire en arithmétique. La plus belle preuve à mon goût est celle qui utilise les entiers de Gauss, comme un moyen d'élargir le concept de division euclidienne.

Il existe une preuve plus fondamentale mettant en évidence les carrés d'un corps fini $F_q$, pour $q$ impair, par la suite exacte suivante, entre groupes multiplicatifs :
$1\rightarrow F_q^{*2} \rightarrow F_q^* \rightarrow \{-1,1\} \rightarrow 1$
(la flèche de gauche est l'injection identité et celle de droite, la surjection d'élévation à la puissance $(q-1)/2$).
 C'est le point de vue développé dans le Cours d'arithmétique de J.P. Serre.

Le théorème des deux carrés vu sur les nombres premiers

Tout d'abord, l'idée est de se "restreindre" aux nombres premiers, en démontrant qu'un nombre premier s'écrit comme somme de deux carrés si et seulement s'il est congru à 1 modulo 4. Ce résultat est d'ailleurs lui aussi appelé Théorème des deux carrés de Fermat.

Dans un sens, il est bien évident que si p est somme de deux carrés, alors, suivant la parité des deux carrés en question, p ne peut être congru qu'à 1 ou 2 modulo 4. Le cas 2 n'est possible que pour, justement, p = 2 car en général, aucun nombre premier n'est pair.

Dans l'autre sens, il faut faire intervenir l'anneau des nombres de Gauss, qui n'est rien d'autre que Z[i], c'est-à-dire le réseau des nombres complexes qui s'écrivent comme a + b.i avec a et b entiers de Z. C'est bien un anneau pour les opérations classiques (+ et .) et on le munit d'une valuation N, c'est-à-dire une application de Z[i] dans N qui vérifie N(u.v) = N(u).N(v). En l'occurrence, la valuation qu'on va considérer ici est le module complexe classique, élevé au carré : en effet, N(z) sera alors simplement la somme des carrés de ses composantes. Quoi de plus naturel pour étudier des sommes de deux carrés ?

Ainsi, la valuation permet d'introduire une division euclidienne dans Z[i], c'est-à-dire que pour tout couple (a,b) de Z[i], il existe un couple (d,r) tel que a = b.d + r avec N(r) < N(b). Attention, ce couple (d,r) n'est en général pas unique, contrairement à ce qu'on présente classiquement de la division euclidienne. L'introduction de cette division euclidienne nous a toutefois permis de définir pour Z[i] une structure d'anneau euclidien.

Munis de ce cadre, nous pouvons encore avancer un peu : un anneau euclidien est en fait factoriel, c'est-à-dire que chacun de ses éléments peut se décomposer en un produit de facteurs premiers, unique à un inversible près.

Prenons justement un nombre premier p congru à 1 modulo 4. Le théorème du résidu quadratique (1) nous dit justement qu'il existe m et k entiers tels que m²+1 = k.p = (m+i).(m-i). Du coup, on en déduit que p n'est pas premier en tant qu'entier de Gauss puisqu'il ne divise ni (m+i), ni (m-i). (2)  Ainsi, il existe u et v entiers de Gauss différents de +/-1 ou +/-i (qui sont inversibles dans Z[i]) tels que p = u.v, ceci impliquant p² = N(u).N(v). Cette fois, on est revenu parmi les entiers naturels et étant donné le caractère premier de p, alors nécessairement N(u) ou N(v) vaut p, ce qui démontre l'implication qui nous manquait.

Cas général

Donc : tout nombre premier (>2) est somme de deux carrés si et seulement s'il est congru à 1 modulo 4.

De cela, le cas général vient moyennant un dernier petit résultat : si p premier est congru à 3 modulo 4 et si p divise x² + y², alors p divise x et y. Pourquoi cela ? Simplement, si p ne divise pas x, alors il est premier avec lui et donc x est inversible dans Z/pZ. Ainsi, y.x-1 est racine du polynôme X²+1 dans Z/pZ, ce qui est impossible quand on examine les congruences modulo 4. Alors, p divise x, donc y, et alors divise x²+y². Autrement dit, si un diviseur premier congru à 3 modulo 4 intervient dans la décomposition d'un entier somme de deux carrés, c'est forcément à une puissance paire.

Ainsi, reprenons le théorème dans sa forme générale. D'après le dernier résultat que nous venons de démontrer, si n s'écrit comme somme de deux carrés et si p congru à 3 modulo 4 intervient dans sa décomposition en facteurs premiers, alors nécessairement  divise n et chacun des deux carrés. Ainsi, p ne peut intervenir à une puissance impaire, sans quoi on pourrait se ramener à un entier m décomposable en somme de deux carrés et que diviserait p et non . Ceci est rigoureusement impossible et le sens direct est ainsi démontré.

Supposant maintenant que les p congrus à 3 modulo 4 interviennent à une puissance paire, on peut les supprimer de la décomposition de n et se ramener à un entier m produit de facteurs premiers tous congrus à 1 modulo 4 (éliminons le cas de la présence de 2, qui se règle de manière très similaire). Dans ce cas, on a vu plus haut que tous ces premiers pouvaient chacun se décomposer en somme de carrés. C'est alors l'identité de Lagrange qui permet de conclure :
(a² + b²) . (c² + d²) = (ac + bd)² + (ad - bc
et de faire de ce grand produit une somme de deux carrés.

Comme l'indiquait le titre, jamais de congruence modulo 3 pour une décomposition en deux carrés... ou bien à une puissance paire, seulement !

Pour en savoir plus ...

J.P. SERRE. 1970. Cours d'Arithmétique. Presses Universitaires de France. (Chapitre 1)


(1) Le résultat du résidu quadratique stipule justement que si p est congru à 1 modulo 4, alors le polynôme X² + 1 admet une racine dans Z/pZ. En effet, le petit théorème de Fermat nous dit que tout élément non nul a de Z/pZ vérifie ap-1 = 1 dans Z/pZ. Autrement dit, injectant la congruence particulière de p, le polynôme (X2n - 1)(X2n + 1) est simplement scindé sur Z/pZ. Or, le polynôme (X2n - 1), non nul, admet au maximum 2n racines sur le corps Z/pZ, donc il existe b non nul tel que (b2n - 1) est inversible. Alors pour cet élément on a b2n + 1 = 0, ce qui établit le résultat du résidu quadratique - bn étant une racine de X² + 1 dans Z/pZ. Le résultat du résidu quadratique est en fait un corollaire du théorème plus général de la loi de réciprocité quadratique.
(2) en fait, c'est là où le caractère factoriel de l'anneau joue, c'est-à-dire l'idée selon laquelle tout élément est décomposable en produit de facteurs premiers de manière unique à multiplication par inversible près. Un anneau factoriel en effet vérifie le lemme d'Euclide : si p premier divise le produit a.b, alors p divise a ou p divise b. Notre affirmation au sujet de p et de (m + i).(m - i) n'est que la contraposée du lemme d'Euclide.

Thursday, September 6, 2012

Une règle et un compas

Une règle, un compas et des polygones : c'est notre sujet du jour, pour ce grand classique qu'est la question de la constructibilité des polygones réguliers, uniquement à l'aide d'une règle non graduée et d'un compas. Ce problème géométrique très visuel va nous emmener très vite dans le monde des structures algébriques. En effet, savoir construire un polygone régulier, c'est savoir "construire un nombre" - notion que nous allons préciser par des exemples simples, ci-après - en l'occurence, savoir construire le polygone régulier à n côtés, c'est savoir construire la n-ième racine de l'unité dans le plan complexe. Toute la beauté des résultats auxquels nous aboutirons - le Théorème de Wantzel pour la constructibilité d'un nombre et le Théorème de Gauss-Wantzel pour ce qui est du cas des polygones réguliers - est ni plus ni moins de caractériser l'ensemble des nombres qu'on peut construire à la règle et au compas.

Mais d'abord, commençons par quelques exercices d'échauffement, très simples, qui vont nous permettre de préciser la notion de constructibilité et, accessoirement, de rendre un hommage à certains fondateurs Grecs de la géométrie

Le "1", les entiers et l'addition

En réalité, la question qu'on se pose ici est invariante par changement d'échelle : quelle que soit la figure tracée à la règle et au compas, le problème de la constructibilité reste invariant par dilatation. C'est pourquoi on définit le "1", l'unité de longueur, d'une manière arbitraire, par deux points placés sur le plan. Euclide nous dit : "par ces deux points passe une seule droite" et nous ajoutons à cela qu'il suffit de reporter au compas sur cette droite cette distance unitaire pour construire tous les entiers - les entiers relatifs.

D'une manière plus générale, si on suppose construits p et q, il suffit de reporter q en se plaçant sur p pour construire (p + q).

La multiplication, la division et les rationnels

Pour construire 1/p à partir de p, c'est le théorème de Thalès qui nous sauve, comme le montre la figure suivante

Fig.1. Construction de 1/p

Le tracé à la règle et au compas d'une parallèle passant par un point précis n'est pas un problème, comme le montre la figure ci-dessous :

Fig.2. Construction de la parallèle à une droite passant par un point donné.

La figure 1 s'adapte pour la construction du produit p.q à partir de p et q donnés.

Fig.3. Construction de p.q.

Ainsi, on réussit la construction de tous les nombres rationnels (ou, plus précisément, tous les multiples rationnels de l'unité donnée). Mais ce n'est pas tout.

La racine carrée et les extensions quadratiques : le Théorème de Wantzel

Construire la racine carrée de p donné nous est possible grâce au troisième grec de la bande : Pythagore. En effet, comme le montre la figure ci-dessous, c'est l'identité (p + 1/4)² - (p - 1/4)² = p qui nous permet d'utiliser Pythagore et de tracer racine de p.

Fig.4. Construction de racine de p

Au final, c'est tous les rationnels "et un peu plus", qu'on a construit à la règle et au compas. Cet "un peu plus" s'exprime mathématiquement de la manière suivante : si un corps (1) d'éléments est constructible (2), alors toute extension quadratique de ce corps est constructible. comme le montre la définition suivante :

Extension quadratique d'un corps : une extension quadratique L d'un corps K est un sur-corps de K qui est un K-espace vectoriel de dimension 2.
Autrement dit, il existe un élément a de L-K tel que L = K[a], où K[a] l'ensemble des x + a.yx et y sont dans K (3)
On dit de cet élément a qu'il est de degré 2 sur K, c'est-à-dire que tout polynôme de K[X] non nul de degré minimal qui l'annule est de degré 2.

Schématiquement parlant, l'adjonction d'une racine carrée (non présente dans le corps de base) à un corps de constructibles permet de définir formellement une extension de corps dont tous les éléments sont constructibles : c'est la dernière étape que nous avons mentionnée ci-dessus avec Pythagore, qui le montre.


Ce que dit alors le Théorème de Wantzel, l'énoncé général, c'est qu'étant donné un corps K de constructibles (en général, le corps des rationnels), un élément x quelconque est constructible si et seulement s'il existe une suite finie croissante K(n) d'extensions de K, de longueur N, telle que K(0) = K, telle que  K(n+1) est une extension quadratique de K(n) et telle que x est dans K(N).

Autrement dit, intuitivement : les constructibles s'obtiennent par extensions quadratiques finies successives du corps des rationnels.

Un corollaire à cela est qu'il existe des éléments non constructibles, qu'il en existe beaucoup, même une infinité, une infinité indénombrable, une infinité dense dans ℝ et même dans ℂ, une infinité, enfin, qui a la puissance du continu. Témoins de cela, les nombres transcendants ne sont par définition pas constructibles, puisque racines d'aucun polynôme à coefficients rationnels. On retrouve ainsi l'impossibilité de la quadrature du cercle (4).

De même, la racine cubique de 2 n'est pas constructible, puisqu'il s'agit d'un élément de degré 3 sur ℚ (son polynôme minimal est le polynôme $X^3-2$). Ainsi, il est impossible de résoudre à la règle et au compas le problème de la duplication du cube - qui consiste à construire à partir d'un cube donné, un cube de volume double.

C'est là où nous en venons aux polygones constructibles : la caractérisation de Wantzel et les travaux de Gauss sur les polynômes cyclotomiques vont permettre de caractériser exactement les polygones réguliers constructibles.

Constructibilité des polygones réguliers

Quelques résultats sur les polynomes cyclotomiques (5) montrent que la racine n-ième de l'unité, z(n) = exp (2.i.π /n), est de degré φ(n) sur ℚ au sens des extensions algébriques. Ainsi, d'après le théorème de Wantzel ci-dessus, la supposer constructible impose que son degré soit une puissance de 2, donc φ(n) doit être une puissance de 2. C'est même une condition suffisante (6).

Ainsi, en décomposant n en facteurs premiers, on s'aperçoit que :
- la valuation p-adique de chacun des nombres premiers différents de 2 doit être égale à 1 ;
- chaque nombre premier p > 2 de la décomposition doit être consécutif à une puissance de 2 - autrement dit, que p - 1 doit être une puissance de 2.

De plus, l'exposant m de cette puissance de 2 ne peut être quelconque : le caractère premier de p impose nécessairement que m lui-même soit une puissance de 2. Pour montrer cela il suffit d'écrire m comme produit d'une puissance de 2 et d'un nombre impair, puis de s'appuyer sur l'identité remarquable selon laquelle (a + 1) divise strictement (ar+1) dès que r est supérieur ou égal à 3. Ceci impose alors r = 1 ce qui achève la preuve.

Si on résume, une condition nécessaire et suffisante de la constructibilité du polygone régulier à n côtés réside dans la décomposition en facteurs premiers de n : il doit être le produit d'une puissance de 2 et de nombres de Fermat, premiers, distincts. C'est le Théorème de Gauss-Wantzel.

Ainsi, le triangle (3), le pentagone (5), le pentadécagone (15), l'heptadécagone (17) sont constructibles - reste à savoir comment ! En revanche, l'heptagone (7) et l'ennéagone (9) ne le sont pas.

D'ailleurs, si l'ennéagone était constructible, alors l'angle π/3 serait trissectable. Or ce n'est pas le cas, et c'est encore Gauss-Wantzel qui permet de le voir. Je vous laisse trouver comment...


Vers la preuve du Théorème de Gauss-Wantzel

Nous reprendrons la démonstration de ce théorème dans un post ultérieur au sujet de la Théorie de Galois (cf. section "Théorie des Nombres"). En effet, montrer que est de la forme voulue supposant le polygône régulier à n côtés est constructible se fait en montrant que le polynôme cyclotomique d'ordre n est irréductible. Ceci s'obtient d'une manière quasiment élémentaire.

En revanche, partant de la forme de n, la tour quadratique de $e^{2i\pi/n}$ se met en évidence en exhibant une suite résoluble du groupe de Galois $Gal(\mathbb{Q}(n)/\mathbb{Q})$ où $\mathbb{Q}(n)$ est l'extension cyclotomique d'ordre n de $\mathbb{Q}$. Dans cette décomposition résoluble
${1}\lhd G_1\lhd \cdots\lhd G_N=Gal(\mathbb{Q}(n)/\mathbb{Q}$
avec pour tout $i$, $(G_i:G_{i+1})=2$ ($G_i $ est d'indice $2$ dans $G_{i+1}$).

La correspondance de Galois met alors un sur-corps de $\mathbb{Q}$ "en face" de chacun des sous-groupes distingués ainsi construits :
$\mathbb{Q}\subset K_1\subset\cdots\subset K_N=Q(n)$
avec pour tout $i$, $[K_{i+1}:K_i]=2$. L'application du théorème de Wantzel permet alors de conclure quant à la constructibilité de $e^{2i\pi/n}$.

-------------------------------------------------------------
(1)  Un corps est une structure algébrique présentant deux lois de composition interne (addition et produit) définissant chacune une structure de groupe - toutefois, pour la multiplication la structure de groupe est définie pour le corps privé de 0, c'est-à-dire que tout élément non nul d'un corps admet un inverse pour la multiplication. A noter que l'addition est commutative mais la multiplication ne l'est pas forcément. L'exemple le plus direct de corps est ℚ, l'ensemble des rationnels. En revanche, ℤ n'est pas un corps car ses seuls éléments qui admettent des inverses pour la multiplication sont -1 et 1. En cela, ℚ constitue corps des fractions de ℤ, sorte de "plus petit corps" contenant ℤ.
(2) Tout au long de cet article, par "constructible", on sous-entend bien sûr "constructible à la règle et au compas".
(3) C'est une manière déguisée de dire que (1, a, a²) est liée dans L comme K-espace vectoriel, avec un coefficient non nul pour a² - comme a n'appartient pas à K. On comprend alors la phrase qui suit, définissant le degré de a sur K.
(4) ... qui n'est autre que l'inconstructibilité de π.
(5) Entre autres, que le polynome cyclotomique d'ordre n est à coefficients entiers.
(6) φ désigne l'indicatrice d'Euler, c'est-à-dire le nombre d'entiers compris entre 0 et n qui sont premiers avec n. Si φ(n) est une puissance de 2, c'est parce que dans une extension algébrique finie, le degré d'un élément sur le corps de base divise le degré de l'extension toute entière. C'est une propriété élémentaire des extensions algébriques.