Lettre de février 2016 1000000000000000000000000000000Retour à Journal

La Mécanique Quantique Matricielle de Heisenberg

10En 1925 le jeune Heisenberg propose une nouvelle approche de la question quantique.


En 1925, la Physique des Quanta se résumait encore à la théorie de Bohr pour les atomes (de 1913) et à l'article d'Einstein pour leur interaction avec la lumière (de 1917). Malgré un grand nombre de travaux autour de ces résultats, ce stade n'était pas vraiment dépassé. Il manquait toujours une véritable méthode pour poser les problèmes et les résoudre, comparable à la Physique Classique.

L'hypothèse de de Broglie pour les ondes de matière (de 1923) n'avait pas encore conduit à l'avènement de la Mécanique Quantique Ondulatoire, qui verra le jour avec l'équation de Schrödinger en 1926. Or en 1925, soit un an avant, un jeune homme de 24 ans proposa une solution révolutionnaire, certes embryonnaire, qui allait débloquer la situation.

Werner Heisenberg

Werner Heisenberg (photo), né en 1901, était un étudiant si brillant qu'il fut envoyé, à 21 ans, par l'université de Munich à Göttingen pour assister à un cycle de conférences données par Niels Bohr. Au cours d'un exposé le jeune homme posa une question embarrassante au grand physicien. Intrigué, ce dernier lui proposa de l'accompagner pour une promenade dans les forêts avoisinantes. La discussion enthousiasma le jeune étudiant. Il en retiendra surtout son étonnement devant les hésitations de Bohr, qui semblait douter de ses propres travaux. Il décida de tout faire pour lui apporter une réponse convaincante.

Helgoland

Heisenberg se lança alors avec fougue dans la recherche, travaillant entre Göttingen, avec Max Born et Pascual Jordan, et Copenhague, avec Niels Bohr. Durant l'été 1925, pour soulager une crise d'allergie, il se réfugia dix jours sur l’île d'Helgoland, spectaculaire rocher perdu dans la Mer du Nord (image). C'est là qu'il connut l'illumination. Une nuit, comprenant qu'il venait de trouver la solution, incapable de dormir, il sortit et escalada un rocher. Assis sur une crête il attendit patiemment le lever du jour sur l'océan. On peut imaginer son exaltation!


1. Rappel: les différences entre la Physique Classique et le modèle de Bohr

Rappelons ces différences, en résumant la lettre L'atome de Bohr.

Selon la Physique Classique, les électrons gravitant autour du noyau de l'atome devraient émettre un rayonnement électromagnétique. Celui-ci épuiserait leur énergie et les contraindrait à chuter sur le noyau. Ce n'est évidemment pas ce qu'on observe, la matière autour de nous étant constituée d'atomes stables.

Cependant, en chauffant les atomes ils se mettent bien à émettre un rayonnement électromagnétique, mais constitué de certaines fréquences seulement. Réciproquement, ces atomes peuvent absorber ces mêmes fréquences si on les illumine.

Le modèle de Bohr consiste d'abord à prendre en compte cette réalité, puis à émettre une hypothèse. On peut énoncer sa théorie ainsi.

1) Les électrons des atomes sont répartis dans des états stables, d'énergie précise. Ces états sont distincts, bien qu'en nombre infini.

2) Lorsqu'un électron passe d'un état d'énergie E à un état d'énergie E' inférieure, il émet un photon (soit un rayonnement électromagnétique élémentaire) de fréquence ν telle que
10h ν = E – E' 100000000000000000000000000000000000000000000000000(1)
h est la constante de Planck. Réciproquement, si l'électron se trouve dans l'état E' et reçoit un photon de fréquence ν, il peut l'absorber et grimper à l'état d'énergie supérieure E.

3) Dans le cas de l'atome d'hydrogène, Bohr fait l'hypothèse que les états stables sont tels que leur moment cinétique Ln est donné par la formule
10Ln = n h / 2π 10000000000000000000000000000000000000000000000000(2)
n est un entier quelconque. Les états peuvent donc être numérotés. L'état n=1 est l'état fondamental, d'énergie minimale et de moment cinétique L1 = h / 2π. Puis il y a les états n=2, n=3, etc... d'énergie et de moment cinétique croissants. A la limite où n atteint l'infini l'électron n'est plus lié et peut quitter l'atome.

L'intérêt de ce modèle tient dans son accord avec les expériences. Dans le cas de l'atome d'hydrogène, en admettant que les orbites de l'électron sont circulaires, la formule (2) permet de calculer l'énergie de chaque état. En mettant les différences de ces énergies dans la formule (1) on obtient par un calcul les fréquences observées expérimentalement, regroupées dans la formule de Rydberg.

Le modèle de Bohr s'est trouvé conforté par un article d'Einstein de 1917, qui l'utilisa pour en déduire la formule de Planck, par une développement simple. Cependant ce travail supposait l'existence d'un nouveau phénomène, l'émission induite, qui a effectivement été observé par la suite et nous a conduit au rayon laser (voir la lettre L'émission induite et le rayon laser).

Comme on le constate aisément, les deux conceptions, classique et quantique, diffèrent complètement. D'abord on observe la transition du continu (classique) au discontinu (quantique). De plus le processus d'émission lumineuse est tout autre: classiquement il a lieu quelque soit l'état, quantiquement il ne se produit que lors de changement d'états. Enfin, classiquement la fréquence de l'onde émise est égale à la fréquence du mouvement de l'électron sur son orbite. Quantiquement la fréquence émise est donnée par la formule (1), sans rapport avec le mouvement de l'électron.

Bohr était très embarrassé par ces différences. Manifestement il ne pouvait pas concevoir une nouvelle physique sans connexion avec la Physique Classique, qui fonctionne si bien à notre échelle. Or, à force de chercher, il finit par trouver un lien entre les deux physiques, sans quitter l'échelle atomique. Il l'appela le Principe de Correspondance. Sa première version, de 1918, s'énonce comme suit:
Dans le cadre de l'atome d'hydrogène, dont les orbites permises se déduisent de la formule (2), le calcul montre que lorsque n tend vers l'infini, les fréquences quantiques se rapprochent des fréquences classiques.

Or lorsque n tend vers l'infini, les fréquences deviennent très faibles. D'où la version plus générale du Principe de Correspondance proposée plus tard par Bohr:
Lorsque les nombres quantiques deviennent très grands ou les fréquences très petites, la Physique Quantique se rapproche de la Physique Classique.


2. Comment passer d'une physique à l'autre?

Le Principe de Correspondance offrait une articulation inespérée entre les deux théories. Mais cela ne suffisait pas pour déduire la Physique Quantique de la Physique Classique. D'ailleurs devait-il y avoir une telle déduction? Il n'y a aucune raison pour que le monde atomique ait les mêmes lois que le nôtre! On pouvait tout aussi bien s'attendre à l'inverse, que la Physique Classique se déduise de la Physique Quantique, en passant de l'échelle atomique à la nôtre!

Pour trouver une physique plus générale, on ne peut qu'essayer de deviner! Utiliser sa fantaisie pour chercher une construction plus vaste, mais qui respecte le Principe de Correspondance. C'est ce que tentaient les physiciens entre 1917 et 1925. Ils essayaient d'établir une formule décrivant le champ électromagnétique émis ou absorbé par les atomes, dite formule de dispersion, qui puisse satisfaire à la fois les expériences et l'Electrodynamique Classique.

Pour produire ce champ, l'atome était vu comme une assemblée d'objets en mouvements circulaires, dont les fréquences valaient celles des rayonnements émis ou absorbés. Ces objets auraient la charge électrique d'un électron et interagiraient avec un rayonnement électromagnétique extérieur selon la Physique Classique. Le but de cette démarche était d'arriver à une formulation permettant de calculer les probabilités d'émission ou d'absorption figurant dans l'article d'Einstein.

Or ce programme multipliait les faiblesses. D'abord les fréquences émises n'étaient pas celles du mouvement des électrons, sauf dans la limite prévue par le Principe de Correspondance. D'autre part l'atome d'hydrogène, avec un seul électron, ne peut pas être vu comme un ensemble d'objets de même charge! On admettait alors que ces objets étaient virtuels. Ce qui ne clarifiait pas le débat!

La formule de dispersion obtenue se présentait sous diverses formes, suivant les auteurs. La dernière en date était celle de Thomas et Kuhn, de mai 1925.

L'approche de Heisenberg était tout autre. Dans son fameux article du 29 juillet 1925 "Über quantentheoretische Umdeutung kinematischer und mechanischer Beziehungen", qu'on peut traduire par "Réinterprétation quantique théorique de la relation entre Cinématique et Mécanique" il ne cherchait pas à changer les lois de la physique, mais à changer les méthodes de calcul. Selon ses propres mots, il ne faut pas changer la Mécanique, mais la Cinématique. Il pensait pouvoir rester ainsi proche de l'esprit du Principe de Correspondance.

Puisque les phénomènes ne se produisent que lors de changement d'états, les grandeurs physiques correspondantes doivent le mentionner. Ainsi on ne considérera plus le champ électrique E, la fréquence ν ou la probabilité d'émission A, mais les grandeurs En,m, νn,m et An,m où les nombres n, m indiquent les états initial et final. Ainsi les grandeurs physiques deviennent des tableaux de nombres. Par exemple la fréquence ν s'écrit

Matrice des fréquences

où le symbole "ν" représente maintenant une double infinité de nombres. Le problème qui se pose alors est de savoir comment manipuler ces tableaux pour effectuer des calculs. Il faut donc établir de nouvelles règles, qui ne se déduisent pas de la Physique Classique. Par exemple, en passant successivement des états n → m → p la formule (1) impose pour les fréquences la règle suivante, dite règle d'addition des fréquences:
10νn,m + νm,p = (En - Em + Em - Ep) / h = (En - Ep) / h = νn,p 10000000000000 (4)
Une telle loi n'existe pas en Physique Classique. Pour les autres grandeurs, ne disposant pas de formules analogue à (1), il faut deviner des règles de calcul. Le problème se complique par le fait que les lois de la physique font intervenir des produits. Par exemple, le moment cinétique utilisé par l'hypothèse de Bohr est le produit de la position et de l'impulsion. Que comprendre par un produit de tableaux?

Or il existe une branche des mathématiques qui utilise des tableaux, leur donnant même une interprétation géométrique, dont on déduit très naturellement une notion de produit. C'est l'algèbre matricielle.


3. L'algèbre matricielle

C'est l'étude des transformations d'un espace de vecteurs satisfaisant quelques propriétés simples. Donnons d'abord comme exemple l'espace à deux dimensions (le plan muni d'un point origine O).

Décomposition d'un vecteur

L'algèbre des vecteurs a été présentée dans la lettre La physique du spin. On y rappelle ce qu'on entend par "vecteurs" et comment on les additionne. Choisissons deux axes dans le plan, passant par O, que l'on désignera par 1 et 2. Tout vecteur (en rouge sur l'image) se décompose en une somme de deux vecteurs le long des axes (en bleu), et cette décomposition est unique.

Les transformations du plan qui nous intéressent ici sont les transformations linéaires. Elles sont données en indiquant seulement comment les vecteurs unité (soit de longueur 1) le long des axes (en bleu dans l'image ci-dessous) se transforment (en vert). Elles sont donc définies par 4 nombres: a1,1 , a1,2 , a2,1 , a2,2 (voir l'image).

Transformation des
               vecteurs unités de base

Si un vecteur initial (en bleu) n'est pas unité, mais de longueur disons x, son vecteur transformé (vert) doit encore avoir sa longueur multipliée par x.

Indiquons comment se transforme n'importe quel vecteur du plan lors d'une transformation linéaire.

Transformation d'un vecteur

Un vecteur quelconque se transforme ainsi: on le décompose en vecteurs le long des axes, puis on effectue la transformation sur ces vecteurs (en adaptant leur longueur si nécessaire), enfin on additionne les vecteurs transformés. En récapitulant ces opérations on obtient, selon l'image ci-contre: le vecteur initial (rouge) est décomposé en vecteurs sur les axes (bleus), qui sont transformés (verts) et les résultats additionnés pour donner le vecteur final (orange).

La transformation linéaire obtenue se caractérise donc bien par quatre nombres qu'on écrit conventionnellement sous forme d'un tableau:

Matrice de la transformation A

Désignons par A le tableau lui-même ou la transformation qu'il représente. Un tel tableau est alors appelé une matrice.

Si l'algèbre matricielle nous intéresse ici, c'est qu'elle permet de donner un sens à un produit de matrices. A priori, un produit de tableaux comme (3) ou (5) n'a pas de sens. Mais l'interprétation géométrique en propose un tout naturel: la succession de transformations! Soit B une autre transformation, de matrice:

Matrice de la transformation B

Alors on peut définir le produit AB comme l'application de A effectuée sur le résultat de l'application B. Le calcul donne une nouvelle matrice:

Matrice du produit de transformations AB

C'est un peu fastidieux, mais cela a un sens, assuré par l'interprétation géométrique.

Notons, ce qui sera utile pour la suite, la forme particulière des éléments du tableau "produit": l'élément (ab)n,p s'écrit
10(ab)n,p = an,1b1,p + an,2b2,p 1000000000000000000000000000000000000000 (7)
Regardons bien cette formule: on additionne tous les termes an,mbm,p de mêmes indices "extérieurs" n, p mais en variant les indices "intérieurs" identiques m, m.

Notons une curiosité du produit ainsi défini. Dans le résultat (6), les nombres an,m et bn,m ne jouent pas les mêmes rôles. Si on les échange, on n'obtient pas les mêmes formules. En bref, le produit de matrices AB n'est pas égal au produit BA, sauf cas particuliers!


4. La nouvelle Cinématique de Heisenberg

La Cinématique décrit les grandeurs physiques qu'on va utiliser. Elle se distingue de la Dynamique, qui traite des lois reliant ces grandeurs. Pour Heisenberg les grandeurs physiques sont de deux catégories: celles définissant les états comme l'énergie En ou le moment cinétique Ln, repérés par un nombre entier positif n (qui numérote les états), et celles participant aux phénomènes observés, comme le champ électrique émis ou absorbé En,m, sa fréquence νn,m et la probabilité d'émission An,m, dépendant de deux nombres entiers n et m, puisque ces phénomènes n'apparaissent que lors de changement d'états n → m.

Curieusement, Heisenberg n'invoque pas le calcul matriciel dans son article. L'ignorait-il vraiment? C'est étrange, car l'algèbre matricielle figurait dans les mathématiques de base à la fin du XIXe siècle. Il est cependant parvenu à la bonne formule du produit de tableaux, en s'inspirant de la loi d'addition des fréquences (4), elle-même issue de la loi de Bohr (1).

Montrons comment il s'y est pris. Le raisonnement qui va suivre se base sur deux formules de mathématique. Si cela vous gêne, vous pouvez sauter au paragraphe 5. On utilise
10la formule d'Euler: cos x = ℜ eix ,
10le produit d'exponentielles: ea eb = ea+b

L'amplitude du champ électrique émis ou absorbé par un atome s'écrit comme une somme de termes de type (en utilisant la formule d'Euler):
10an,m ei2πνn,mt ,
Or les coefficients de probabilité d'émission ou d'absorption d'Einstein s'expriment en terme du carré du champ. Il faut donc effectuer le produit de deux sommes infinies:
10(...+ an,m ei2πνn,mt + ... + ao,p ei2πνo,pt + ...) (...+ aq,r ei2πνq,rt + ... + as,u ei2πνs,ut + ...).
Ce produit s'écrit comme une somme de termes de type (en utilisant le produit d'exponentielles):
10an,m ao,p ei2π(νn,mo,p)t.
Parmi tous ces termes, Heisenberg ne retient que ceux qui ont mêmes indices "intérieurs" m et o, c'est-à-dire ceux du type an,m am,p ei2π(νn,mm,p)t. Pourquoi seulement ces termes? Parce que l'exponentielle contient le membre de gauche de la loi d'addition des fréquences (4)! En appliquant cette loi ce terme devient an,m am,p ei2πνn,pt où l'indice m ne figure plus dans l'exponentielle! On peut donc la mettre en évidence et écrire l'ensemble de tous ces termes sous la forme:
10ei2πνn,pt (an,1 a1,p + an,2 a2,p + ... + an,m am,p + ... ).
où on reconnaît entre les parenthèses la forme du produit matriciel (7)!


5. Quantification

Il ne suffit pas de modifier la Cinématique, encore faut-il introduire l'hypothèse quantique (plus concrètement: il faut bien introduire quelque part la constante de Planck h !). Pour Heisenberg c'est le rôle de la deuxième relation de Bohr (2), qu'il faut modifier pour la rendre plus générale. D'abord pour un mouvement circulaire le moment cinétique s'écrit L = r p, où r est le rayon du cercle et p l'impulsion. En multipliant (2) par 2π on obtient:
102π r p = n h.
Or 2πr est la circonférence du cercle. Ainsi la formule peut être remplacée par l'évaluation de p le long de la trajectoire (dans le jargon mathématique, il s'agit une "intégrale curviligne"). Ceci permet de généraliser l'équation à n'importe quelle trajectoire.

Or Heisenberg n'en reste pas là. Il va effectuer toute une série de transformations de cette formule. D'abord il l'évalue dans le cas où l'électron est traité classiquement, en invoquant le Principe de Correspondance. Toujours grâce à ce principe il effectue le produit r p dans la formule sans utiliser le calcul matriciel, pourtant introduit précédemment! C'est dans le résultat du produit obtenu classiquement qu'il introduit les grandeurs matricielles, passant du continu au discontinu. Enfin, grâce à une identification hardie (qu'il n'énonce même pas), sa formule devient... la formule de dispersion de Thomas et Kuhn!

Selon Heisenberg, c'est la formule de dispersion qui introduit la quantification dans un système physique soumis aux lois de la Dynamique Classique évaluées avec la nouvelle Cinématique!

Remarque curieuse: Heisenberg déduit la formule de dispersion de la relation (2) de Bohr, alors que les travaux avant lui la déduisaient de la relation (1)!


6. Récapitulation: comment traiter quantiquement un problème classique

L'article de Heisenberg se termine par un exemple. Il traite le problème classique du mouvement d'un ressort légèrement perturbé, par sa méthode de quantification. Les valeurs de l'énergie qu'il obtient ne sont pas continues mais se répartissent en une suite de valeurs disjointes. De plus l'énergie la plus basse n'est pas nulle, contrairement au cas classique (ressort au repos). Ces résultats sont de bonne augure pour traiter ultérieurement l'atome d'hydrogène!

En résumé, selon Heisenberg, la méthode de quantification d'un problème classique consiste en trois étapes.

1) Les expériences nous enseignent qu'à l'échelle atomique les états possibles d'un système forment un ensemble discontinu et que les phénomènes concernent des changements d'états. En conséquence la cinématique doit être modifiée. Les grandeurs physiques décrivant les états, comme l'énergie En, doivent dépendre d'un entier n indiquant l'état, et les grandeurs physiques décrivant un phénomène, comme le champ électrique émis ou absorbé En,m, doivent dépendre de deux entiers n, m, qui dénotent l'état initial et l'état final. Ces dernières grandeurs prennent donc la forme de tableaux, dont la manipulation mathématique est celle du calcul matriciel.

2) Les lois de la dynamique ne sont pas changées (lois de Newton, de Maxwell, etc...) mais s'expriment en terme des grandeurs cinématiques comme décrites en 1).

3) La quantification (soit l'introduction de la constante de Planck) s'obtient par la formule de dispersion de Thomas et Kuhn, correctement interprétée.


7. L'influence de l'article de Heisenberg

Il faut avouer que l'article de Heisenberg manque de clarté. Il saute des étapes sans le dire, utilise des suppositions qu'il n'énonce pas et contient même des contradictions. C'est l’œuvre exaltée et bouillonnante d'un tout jeune physicien convaincu d'avoir résolu le plus grand problème du moment! Certaines idées de son article étaient déjà connues, comme l'usage de tableaux pour représenter les grandeurs physiques ou la nécessité de n'utiliser que des grandeurs mesurables. Par contre, les idées nouvelles suivantes lui sont attribuées:

1) les lois de la Dynamique Classique doivent être conservées et c'est la Cinématique qui doit être modifiée,

2) la manipulation des tableaux se fait par le calcul matriciel (même s'il ne le nomme pas ainsi),

3) la quantification se fait par la formule de dispersion.

Enfin il donne un exemple explicite, le premier dans l'histoire de la jeune Physique Quantique, montrant comment traiter quantiquement un problème classique (mouvement du ressort perturbé).

Notons que le point 2) impose un ordre dans le produit des grandeurs physiques. Dans le calcul matriciel AB n'est pas égal à BA. Ce fait, appelé la non-commutativité des grandeurs physiques, sera considéré plus tard comme le changement le plus radical entre les deux physiques, classique et quantique.

L'article de Heisenberg a produit une effervescence extraordinaire parmi la communauté des physiciens. Une avalanche d'articles paraissent dans la même année 1925, pour culminer en janvier 1926 par deux grands travaux, l'un de Wolfgang Pauli et l'autre de P. A. M. Dirac, traitant enfin l'atome d'hydrogène. Le spectre d'énergie de l'atome est complètement déduit de la nouvelle physique, obtenant par la théorie la formule de Rydberg. La jeune Mécanique Quantique se tenait debout et faisait ses premiers pas.

Werner Heisenberg reçut le prix Nobel en 1932.


8. Références

Sources of Quantum Mechanics, B. L. van der Waerden, Editor Gerald Holton, Dover Publications, New York, 1967.
Ce livre rassemble les 17 principaux articles qui ont fondé la Mécanique Quantique Matricielle, couvrant la période de 1917 à 1926. Les articles en allemand sont traduit en anglais. Ils sont précédés d'une importante introduction (59 pages) de van der Waerden, qui commente chacun de ces articles, en donnant des éclairages indispensables à leur compréhension.


Retour à Journal