Saltar a contenido

Capítulo 7 Interacciones y la matriz S — Cómo mezclar los campos

Resumen de los capítulos anteriores:

En el Cap. 6, abordamos la cuantización del campo electromagnético. Nos enfrentamos a una nueva dificultad —los grados de libertad de gauge— y, tras aplicar la receta de fijación de gauge, confirmamos que el fotón se cuantiza como una onda transversal con 2 grados de libertad de polarización física. Con esto, completamos la cuantización de los campos libres: campo escalar, campo de Dirac y campo electromagnético.

Objetivos de este capítulo

  • Abandonar el mundo de los campos libres e introducir las "interacciones" —donde las partículas se dispersan entre sí— en la teoría cuántica de campos
  • Adquirir las herramientas: representación de interacción, matriz S, serie de Dyson y teorema de Wick, y ser capaz de calcular concretamente la amplitud de dispersión 2→2 al orden más bajo en la teoría \(\phi^4\)

7.1 Por qué necesitamos interacciones — El aburrido mundo de los campos libres

🟡 Lina: Desde el Cap. 4 hasta el Cap. 6, hemos cuantizado el campo escalar, el campo de Dirac y el campo electromagnético. Pero la teoría que tenemos hasta ahora tiene un defecto grave. ¿Cuál crees que es?

🔵 Kai: Hmm... ¿que las partículas no chocan?

🟡 Lina: Exacto. Recuerda el hamiltoniano del campo libre. En el caso del campo escalar es

\[ \hat{H}_0 = \int \frac{d^3p}{(2\pi)^3}\, \omega_{\mathbf{p}}\, \hat{a}_{\mathbf{p}}^\dagger \hat{a}_{\mathbf{p}} \]

🟡 Lina: (con \(\omega_{\mathbf{p}} = \sqrt{|\mathbf{p}|^2 + m^2}\), ya en orden normal). Este \(\hat{H}_0\) conmuta con el operador número de partículas \(\hat{N} \propto \int d^3p\, \hat{a}_{\mathbf{p}}^\dagger \hat{a}_{\mathbf{p}}\):

\[ [\hat{H}_0,\, \hat{N}] = 0 \]

Como ambos son sumas (ponderadas) del operador número de partículas \(\hat{a}_{\mathbf{p}}^\dagger \hat{a}_{\mathbf{p}}\) de cada modo de momento, intuitivamente se entiende que conmutan entre sí.

⚪ Mei: Es decir, el número de partículas no cambia aunque el sistema evolucione en el tiempo.

🟡 Lina: Así es. Como el número de partículas se conserva, no hay dispersión ni desintegración. En el mundo de los campos libres, las partículas simplemente viajan en línea recta. Aunque un electrón se acerque a otro electrón, se atraviesan mutuamente sin interactuar. Pero en el mundo real, si colisionamos protones en un acelerador, salen cientos de partículas, y los núcleos radiactivos se desintegran. Para describir estos fenómenos, necesitamos añadir un término de interacción al lagrangiano. He ilustrado esta diferencia en la Fig. 7.1「Comparación de la evolución temporal entre campo libre y campo con interacción」.

Evolución temporal de campos libres e interactuantes

Fig. 7.1: Comparación de la evolución temporal entre campo libre y campo con interacción. En el campo libre, cada modo oscila independientemente y el número de partículas se conserva; en el campo con interacción, la energía se transfiere entre modos y el número de partículas puede cambiar.


Descomposición del lagrangiano — Parte libre y parte de interacción

🟡 Lina: Escribimos la densidad lagrangiana que describe el campo dividiéndola en dos partes:

\[ \mathcal{L} = \mathcal{L}_0 + \mathcal{L}_{\text{int}} \]
  • \(\mathcal{L}_0\): la parte del campo libre. Son los términos que hemos tratado en los capítulos 3 a 6, con productos de campos de a lo sumo dos (para el campo escalar hasta \(\phi^2\), para el campo de Dirac hasta \(\bar{\psi}\psi\)). Se puede resolver exactamente mediante cuantización canónica.
  • \(\mathcal{L}_{\text{int}}\): la parte de interacción. Describe las fuerzas entre partículas. Cuando está presente, ya no es posible obtener soluciones exactas.

✅ Verificación de comprensión: El hecho de que el número de partículas se conserve bajo el hamiltoniano libre \(\hat{H}_0\) (no hay dispersión), ¿con qué condición matemática se expresa?

Respuesta

Se expresa mediante \([\hat{H}_0,\, \hat{N}] = 0\), es decir, que el hamiltoniano libre y el operador número de partículas conmutan. Mientras se cumpla esta relación de conmutación, el número de partículas no cambia con la evolución temporal.

🔵 Kai: ¿Y concretamente qué forma tiene?

🟡 Lina: Como ejemplo más sencillo, consideremos la teoría \(\phi^4\) (teoría "fi cuatro") del campo escalar real.

\[ \mathcal{L} = \underbrace{\frac{1}{2}\partial_\mu \phi\,\partial^\mu \phi - \frac{1}{2}m^2\phi^2}_{\mathcal{L}_0} \underbrace{- \frac{\lambda}{4!}\phi^4}_{\mathcal{L}_{\text{int}}} \tag{7.1} \]

Aquí \(\lambda\) es un parámetro llamado constante de acoplamiento (coupling constant), que determina la "intensidad" de la interacción. En unidades naturales (\(\hbar = c = 1\)), la acción \(S = \int d^4x\, \mathcal{L}\) debe ser adimensional. A partir de esta condición se determina la dimensión de \(\lambda\), pero primero déjame organizar cómo contar las "dimensiones".

En unidades naturales ponemos \(\hbar = c = 1\), así que el exponente \(S/\hbar\) que aparece en la amplitud de probabilidad cuántica \(e^{iS/\hbar}\) debe ser adimensional —el argumento de una función exponencial debe ser un "número puro" (¡no puedes escribir \(e^{3\text{kg}}\)!). Como \(\hbar = 1\), la propia acción \(S\) es adimensional (\([S] = 0\)). Por cierto, \(e^{iS/\hbar}\) aparece como el "peso" de cada trayectoria en la formulación de integrales de camino, pero eso lo trataremos en capítulos posteriores. Por ahora, solo usaremos la conclusión de que "la acción \(S\) debe ser adimensional".

🔵 Kai: Ya veo, como está en el exponente de \(e\), tiene que ser adimensional.

🟡 Lina: Así es. A continuación, de la relación de dispersión \(E^2 = p^2 + m^2\) (con \(c = 1\)) se tiene \([E] = [p] = [m]\). Además, de \(p = \hbar k\) (con \(\hbar = 1\)) se tiene \([p] = [k]\). Como el número de onda \(k\) es el inverso de la longitud de onda \(\lambda\) (\(k = 2\pi/\lambda\)), tiene dimensión de inverso de longitud, es decir \([k] = [1/\text{longitud}]\). Que esto sea igual a \([m]\) significa que la dimensión de longitud es el inverso de la masa: \([\text{longitud}] = [m]^{-1}\). Similarmente, de \(c = 1\) (\(c = \text{longitud}/\text{tiempo}\)) se obtiene \([\text{tiempo}] = [\text{longitud}] = [m]^{-1}\). Es decir, energía, momento y masa tienen todos la misma dimensión, y la longitud y el tiempo tienen dimensión de inverso de la masa. Por eso podemos expresar la dimensión de cualquier cantidad usando solo la masa como referencia.

Así que introduzco una notación conveniente. Cuando escribo \([A]\), significa "la dimensión de masa de \(A\)" — es decir, el entero (o número racional) que indica "a qué potencia de la masa está \(A\)". Por ejemplo, escribir \([x^\mu] = -1\) significa "la dimensión de \(x^\mu\) es masa a la potencia \(-1\) (= inverso de la masa)".

⚪ Mei: En términos de programación, es como representar todas las magnitudes físicas en un solo tipo: "a qué potencia de la masa está".

🟡 Lina: Buena analogía. La dimensión de masa de un producto es la suma de las dimensiones de masa de cada factor\([AB] = [A] + [B]\). Quizás pienses "¿un producto pero una suma?", pero es lo mismo que la ley de exponentes que aprendiste en secundaria: \(m^a \times m^b = m^{a+b}\). Como \([\cdot]\) representa el número del "exponente (potencia)" de la masa, cuando multiplicas cantidades los "exponentes" se suman. Por ejemplo, si \([A] = 2\) (la dimensión de \(A\) es masa\(^2\)) y \([B] = 1\) (la dimensión de \(B\) es masa\(^1\)), entonces la dimensión de \(AB\) es masa\(^2 \times\) masa\(^1\) = masa\(^{2+1}\) = masa\(^3\), así que \([AB] = 2 + 1 = 3\). Inversamente, para cocientes se resta: \([A/B] = [A] - [B] = 2 - 1 = 1\).

Usando esto, vayamos obteniendo paso a paso: - \(d^4x = dx^0\,dx^1\,dx^2\,dx^3\) es el producto de las cantidades infinitesimales de 4 coordenadas. Cada \(dx^\mu\) tiene la misma dimensión que la coordenada \(x^\mu\), así que \([dx^\mu] = [x^\mu] = -1\). Usando la regla del producto \([AB] = [A] + [B]\) cuatro veces: \([d^4x] = [dx^0] + [dx^1] + [dx^2] + [dx^3] = 4 \times (-1) = -4\) - Para que la acción \(S\) sea adimensional (\([S] = 0\)) necesitamos \([\mathcal{L}] + [d^4x] = 0\), es decir \([\mathcal{L}] = 4\) - La derivada es el inverso de la longitud: \([\partial_\mu] = 1\) - La dimensión del término cinético del campo libre \(\frac{1}{2}\partial_\mu\phi\,\partial^\mu\phi\) es \([\partial_\mu\phi\,\partial^\mu\phi] = 2(1 + [\phi]) = 4\), de donde \([\phi] = 1\) - \([\lambda \phi^4] = [\lambda] + 4[\phi] = [\lambda] + 4 = 4\), de donde \([\lambda] = 0\) — es decir, \(\lambda\) es adimensional

🔵 Kai: Vaya, \(\lambda\) no tiene unidades. Entonces es realmente un número puro que solo representa la "intensidad".

🟡 Lina: Exacto. Dividir por \(4!\) es una convención para que los factores combinatorios salgan limpios en los cálculos posteriores. Concretamente, cuando calculemos la dispersión 2→2 más adelante en este capítulo, las \(4! = 24\) combinaciones que surgen de expandir \(\hat{\phi}^4\) se cancelarán exactamente con el \(4!\) del denominador — ahí dirás "¡ajá!".

⚪ Mei: Si \(\lambda\) es pequeño, el efecto de la interacción también es pequeño, así que se puede tratar de forma aproximada.

🟡 Lina: Exactamente. Cuando \(\lambda \ll 1\), expandimos sistemáticamente la "desviación" del campo libre en potencias de \(\lambda\) — esto es la teoría de perturbaciones (perturbation theory).

✅ Verificación de comprensión: Cuando descomponemos la densidad lagrangiana como \(\mathcal{L} = \mathcal{L}_0 + \mathcal{L}_{\text{int}}\), ¿qué papel desempeña cada parte?

Respuesta

\(\mathcal{L}_0\) es la parte del campo libre, compuesta por términos hasta segundo orden en los campos, y se puede resolver exactamente mediante cuantización canónica. \(\mathcal{L}_{\text{int}}\) es la parte de interacción, que describe las fuerzas entre partículas. Cuando \(\mathcal{L}_{\text{int}}\) está presente no se pueden obtener soluciones exactas, por lo que cuando la constante de acoplamiento es pequeña se trata aproximadamente con teoría de perturbaciones.


¿Qué hace la interacción \(\phi^4\)?

🔵 Kai: \(\phi^4\) es simplemente multiplicar el campo cuatro veces. ¿Eso se convierte en "partículas que chocan"?

🟡 Lina: Buena pregunta. Si expandimos el campo \(\hat{\phi}\) en operadores de creación y aniquilación, esquemáticamente \(\hat{\phi} \sim \hat{a} + \hat{a}^\dagger\). Entonces \(\hat{\phi}^4\) contiene términos como

\[ \hat{a}^\dagger \hat{a}^\dagger \hat{a}\, \hat{a}, \quad \hat{a}^\dagger \hat{a}^\dagger \hat{a}^\dagger \hat{a}, \quad \hat{a}^\dagger \hat{a}^\dagger \hat{a}^\dagger \hat{a}^\dagger, \quad \ldots \]

En realidad cada operador lleva una etiqueta de momento diferente; por ejemplo, \(\hat{a}_{\mathbf{p}_3}^\dagger \hat{a}_{\mathbf{p}_4}^\dagger \hat{a}_{\mathbf{p}_1}\, \hat{a}_{\mathbf{p}_2}\) "aniquila partículas con momentos \(\mathbf{p}_1, \mathbf{p}_2\) y crea partículas con momentos \(\mathbf{p}_3, \mathbf{p}_4\)" — es decir, describe una dispersión de 2 partículas. He resumido las combinaciones representativas y sus procesos físicos correspondientes en la Tabla 7.1「Combinaciones representativas de operadores contenidas en \(\hat{\phi}^4\) y sus procesos físicos correspondientes」.

Tabla 7.1: Combinaciones representativas de operadores contenidas en \(\hat{\phi}^4\) y sus procesos físicos correspondientes

Tipo de operador Proceso físico Cambio en número de partículas
\(\hat{a}^\dagger\hat{a}^\dagger\hat{a}\,\hat{a}\) Dispersión 2→2 \(\Delta N = 0\)
\(\hat{a}^\dagger\hat{a}^\dagger\hat{a}^\dagger\hat{a}\) División 1→3 \(\Delta N = +2\)
\(\hat{a}^\dagger\hat{a}\,\hat{a}\,\hat{a}\) Fusión 3→1 \(\Delta N = -2\)
\(\hat{a}^\dagger\hat{a}^\dagger\hat{a}^\dagger\hat{a}^\dagger\) Creación de 4 partículas desde el vacío 0→4 \(\Delta N = +4\)
\(\hat{a}\,\hat{a}\,\hat{a}\,\hat{a}\) Aniquilación de 4 partículas al vacío 4→0 \(\Delta N = -4\)

🔵 Kai: Ya veo, las combinaciones de operadores de creación y aniquilación representan la entrada y salida de partículas. Pero también hay términos como \(\hat{a}^\dagger\hat{a}^\dagger\hat{a}^\dagger\hat{a}\), "crear 3 y aniquilar 1", ¿verdad? ¿Eso significa que una partícula se divide en 3? Pero que una partícula se convierta repentinamente en 3 parece violar la conservación de la energía...

🟡 Lina: Así es, en principio tales procesos están contenidos en \(\hat{H}_{\text{int}}\). Sin embargo, si realmente ocurren o no está restringido por la conservación de energía y momento. Por ejemplo, para que una partícula de masa \(m\) se divida en 3 partículas de masa \(m\), se necesita al menos energía \(3m\), pero una partícula en reposo solo tiene energía \(m\) — por eso no ocurre en el espacio libre. Sin embargo, como proceso virtual (estado intermedio) puede estar permitido en ciertos casos. Hoy nos concentraremos en la dispersión 2→2, pero el permitir procesos que cambian el número de partículas es una característica esencial de la teoría cuántica de campos.

🔵 Kai: Pero espera. Si los términos que cambian el número de partículas están en el hamiltoniano, entonces \([\hat{H}_0, \hat{N}] = 0\) que vimos al principio ya no se cumple, ¿verdad...?

🟡 Lina: Exactamente. Como \(\hat{H}_{\text{int}}\) contiene operadores que cambian el número de partículas, \([\hat{H}, \hat{N}] \neq 0\). Los procesos que cambian el número de partículas quedan permitidos. Pero hay un problema: el hamiltoniano con interacción \(\hat{H} = \hat{H}_0 + \hat{H}'\) ya no se puede diagonalizar. Es decir, no se obtienen soluciones exactas.

🔵 Kai: Como no se puede resolver exactamente, no queda más que aproximar... pero ¿qué tan pequeño debe ser \(\lambda\) concretamente para que la aproximación sea confiable? ¿Hay algún criterio como "\(\lambda = 0.1\) está bien pero \(\lambda = 0.5\) no"?

🟡 Lina: Buena pregunta. El criterio estricto depende del problema, pero la regla básica es que "la corrección de orden \(n\) debe ser suficientemente pequeña comparada con la de orden \((n-1)\)". En la teoría \(\phi^4\), como \(\lambda\) es adimensional, si \(\lambda \ll 1\) los términos de orden superior decrecen rápidamente como \(\lambda^n\), y con los primeros órdenes se obtiene una buena aproximación. Por el contrario, si \(\lambda \gg 1\) la teoría de perturbaciones falla — el régimen de baja energía de QCD es exactamente ese caso, y se necesitan otros métodos (como cálculos en retículo).

⚪ Mei: Es decir, la condición para que funcione la teoría de perturbaciones es "que \(\lambda\) sea pequeño" — concretamente, que los términos de orden superior sean despreciablemente pequeños comparados con el orden anterior.

🟡 Lina: Así es. Pero hoy concentrémonos primero en el caso \(\lambda \ll 1\). Vamos a construir ahora el método para calcular aproximadamente usando teoría de perturbaciones. Para ello, primero introduciré un nuevo marco llamado representación de interacción — dentro del cual también derivaremos la forma concreta del hamiltoniano de interacción \(\hat{H}'\) (en particular la relación de signo con el lagrangiano \(\hat{H}' = -\int d^3x\,\mathcal{L}_{\text{int}}\)).

✅ Verificación de comprensión: ¿Cuál es la dimensión de masa de la constante de acoplamiento \(\lambda\) en la teoría \(\phi^4\)? (Pista: usa \([\mathcal{L}] = 4\), \([\phi] = 1\) en unidades naturales)

Respuesta

\([\lambda/4! \cdot \phi^4] = [\lambda] + 4[\phi] = [\lambda] + 4 = 4\), de donde \([\lambda] = 0\). Es decir, \(\lambda\) es adimensional. A este tipo de interacción se le llama marginal.


7.2 Representación de interacción — La "división de tareas" entre operadores y estados

🟡 Lina: Para avanzar con los cálculos perturbativos, voy a introducir una nueva "representación". ¿Recuerdas la discusión sobre representaciones que estudiamos en el Mecánica Cuántica Cap. 13?

🔵 Kai: La representación de Schrödinger es donde el estado evoluciona en el tiempo y los operadores son fijos, la de Heisenberg es al revés... ¿verdad? La ecuación de Schrödinger \(i\frac{d}{dt}|\psi\rangle = \hat{H}|\psi\rangle\) mueve el estado en la representación de Schrödinger, y "como el valor esperado \(\langle\psi|\hat{O}|\psi\rangle\) es el mismo, si fijamos el estado y en su lugar hacemos que el operador varíe en el tiempo, la física no debería cambiar" — pensando así, trasladar la evolución temporal al lado de los operadores da la representación de Heisenberg. La tercera, la "representación de interacción", la estudiamos en el Mecánica Cuántica Cap. 13, pero en aquella ocasión solo fue una introducción conceptual y no la usamos para cálculos concretos.

🟡 Lina: Así es. Aquí vamos a usar en serio esa tercera opción — la representación de interacción (interaction picture), también llamada representación de Dirac. Vamos a aplicar el concepto introducido en el Mecánica Cuántica Cap. 13 al problema de dispersión en teoría cuántica de campos.

Descomposición del hamiltoniano y definición de la representación

🟡 Lina: El punto de partida es dividir el hamiltoniano en dos:

\[ \hat{H} = \hat{H}_0 + \hat{H}' \]

Aquí \(\hat{H}' = -\int d^3x\, \mathcal{L}_{\text{int}}\) es el hamiltoniano de interacción (el origen del signo lo derivaré enseguida). Es importante notar que \(\hat{H}'\) es el hamiltoniano de interacción en la representación de Schrödinger. En la representación de Schrödinger los operadores (incluyendo los campos) no dependen del tiempo y son constantes, así que \(\hat{H}'\) tampoco depende del tiempo. El \(\hat{H}_I(t) = e^{i\hat{H}_0 t}\hat{H}'e^{-i\hat{H}_0 t}\) que aparecerá después es ese mismo operador trasladado a la representación de interacción — es decir, "rotado" por \(\hat{H}_0\) para darle dependencia temporal.

🔵 Kai: ¿Por qué aparece el signo menos? ¿Es que el lagrangiano y el hamiltoniano tienen signos opuestos?

🟡 Lina: Como aprendimos en el Cap. 3, la densidad hamiltoniana se define mediante la transformada de Legendre — una operación que cambia la variable independiente de la "velocidad" \(\dot{\phi}\) al "momento" \(\pi\) — como \(\mathcal{H} = \pi\dot{\phi} - \mathcal{L}\). Aquí \(\pi = \partial\mathcal{L}/\partial\dot{\phi}\) es la densidad de momento canónico — una cantidad que mide la respuesta del lagrangiano a la "velocidad" del campo \(\dot{\phi}\), y es la versión para teoría de campos de \(p = \partial L/\partial\dot{q}\) de la mecánica de partículas. Que los signos de \(L\) y \(H\) sean opuestos viene de la estructura de la transformada de Legendre: \(H = p\dot{q} - L\). Sustituyendo aquí \(\mathcal{L} = \mathcal{L}_0 + \mathcal{L}_{\text{int}}\):

\[ \mathcal{H} = \pi\dot{\phi} - \mathcal{L}_0 - \mathcal{L}_{\text{int}} = \underbrace{(\pi\dot{\phi} - \mathcal{L}_0)}_{\mathcal{H}_0} - \mathcal{L}_{\text{int}} \]

Aquí podemos escribir \(\pi\dot{\phi} - \mathcal{L}_0 = \mathcal{H}_0\) porque, cuando \(\mathcal{L}_{\text{int}}\) no contiene \(\dot{\phi}\), el momento canónico se determina solo con el campo libre como \(\pi = \partial\mathcal{L}_0/\partial\dot{\phi}\).

🔵 Kai: ¡Ah, como \(\mathcal{L}_{\text{int}} = -\frac{\lambda}{4!}\phi^4\) no contiene la derivada temporal \(\dot{\phi}\), no afecta al momento canónico!

🟡 Lina: Exacto. Verifiquémoslo concretamente. Como \(\mathcal{L}_{\text{int}} = -\frac{\lambda}{4!}\phi^4\) de la teoría \(\phi^4\) no contiene \(\dot{\phi}\), se tiene \(\pi = \partial\mathcal{L}/\partial\dot{\phi} = \partial(\mathcal{L}_0 + \mathcal{L}_{\text{int}})/\partial\dot{\phi} = \partial\mathcal{L}_0/\partial\dot{\phi} = \dot{\phi}\). Es decir, la relación entre \(\pi\) y \(\dot{\phi}\) no cambia con o sin interacción, así que \(\pi\dot{\phi} - \mathcal{L}_0\) es exactamente la densidad hamiltoniana del campo libre \(\mathcal{H}_0\).

Por lo tanto \(\mathcal{H}_{\text{int}} = -\mathcal{L}_{\text{int}}\). Como el hamiltoniano es la integral espacial de la densidad hamiltoniana: \(\hat{H}' = \int d^3x\, \mathcal{H}_{\text{int}} = -\int d^3x\, \mathcal{L}_{\text{int}}\). Si \(\mathcal{L}_{\text{int}}\) contuviera \(\dot{\phi}\), esta separación no funcionaría limpiamente, pero el término de interacción \(-\frac{\lambda}{4!}\phi^4\) de la teoría \(\phi^4\) no contiene \(\dot{\phi}\), así que satisface esta condición.

⚪ Mei: Entiendo, \(\hat{H}'\) es \(\mathcal{L}_{\text{int}}\) con signo opuesto e integrado sobre el espacio.

🟡 Lina: Así es. Ahora enuncio la definición de la representación de interacción. En esta representación:

  • Los operadores evolucionan temporalmente con el hamiltoniano libre \(\hat{H}_0\)
  • Los estados evolucionan temporalmente con el hamiltoniano de interacción \(\hat{H}_I(t)\)

Concretamente, los operadores en la representación de interacción se definen como

\[ \hat{O}_I(t) = e^{i\hat{H}_0 t}\, \hat{O}_S\, e^{-i\hat{H}_0 t} \tag{7.2} \]

(\(\hat{O}_S\) es el operador en la representación de Schrödinger, un operador constante que no depende del tiempo. Usamos unidades naturales \(\hbar = 1\)).

⚪ Mei: En la representación de Heisenberg era \(\hat{O}_H(t) = e^{i\hat{H} t}\, \hat{O}_S\, e^{-i\hat{H} t}\), así que en lugar del hamiltoniano completo \(\hat{H}\) estamos evolucionando solo con la parte libre \(\hat{H}_0\).

🟡 Lina: Exacto.


Ecuación de movimiento de los operadores

✅ Verificación de comprensión: La definición (7.2) del operador en la representación de interacción \(\hat{O}_I(t)\), ¿en qué difiere de la definición del operador en la representación de Heisenberg?

Respuesta

En la representación de Heisenberg se evoluciona el operador con el hamiltoniano completo \(\hat{H} = \hat{H}_0 + \hat{H}'\) (\(\hat{O}_H(t) = e^{i\hat{H}t}\hat{O}_S e^{-i\hat{H}t}\)), mientras que en la representación de interacción se evoluciona solo con la parte libre \(\hat{H}_0\) (\(\hat{O}_I(t) = e^{i\hat{H}_0 t}\hat{O}_S e^{-i\hat{H}_0 t}\)).

🟡 Lina: Derivemos la ecuación (7.2) respecto al tiempo.

\[ \frac{d\hat{O}_I}{dt} = i\hat{H}_0\, e^{i\hat{H}_0 t}\, \hat{O}_S\, e^{-i\hat{H}_0 t} + e^{i\hat{H}_0 t}\, \hat{O}_S\, (-i\hat{H}_0)\, e^{-i\hat{H}_0 t} \]
\[ = i[\hat{H}_0,\, \hat{O}_I(t)] \]

Es decir:

\[ \frac{d\hat{O}_I}{dt} = i[\hat{H}_0,\, \hat{O}_I(t)] \tag{7.3} \]

🔵 Kai: ¿Eh? En el lado derecho solo aparece \(\hat{H}_0\). ¿Adónde fue la interacción \(\hat{H}'\)?

🟡 Lina: Buena pregunta. El efecto de la interacción se traslada al estado. Lo que significa la ecuación (7.3) es que el operador de campo en la representación de interacción \(\hat{\phi}_I(x)\) obedece la ecuación de movimiento del campo libre. Por eso, la expansión en modos que aprendimos en el Cap. 4

\[ \hat{\phi}_I(x) = \int \frac{d^3p}{(2\pi)^3}\, \frac{1}{\sqrt{2\omega_{\mathbf{p}}}} \left( \hat{a}_{\mathbf{p}}\, e^{-ip \cdot x} + \hat{a}_{\mathbf{p}}^\dagger\, e^{ip \cdot x} \right) \tag{7.4} \]

Quiero que noten que a partir de este capítulo cambiamos la convención de la expansión en modos. En el capítulo 4 poníamos \((2\pi)^{3/2}\) en el denominador con \([\hat{a}_{\mathbf{p}},\, \hat{a}_{\mathbf{q}}^\dagger] = \delta^{(3)}(\mathbf{p}-\mathbf{q})\), pero para problemas de dispersión es más estándar poner \((2\pi)^3\) en el denominador y

\[ [\hat{a}_{\mathbf{p}},\, \hat{a}_{\mathbf{q}}^\dagger] = (2\pi)^3\,\delta^{(3)}(\mathbf{p}-\mathbf{q}) \tag{7.4a} \]

Esta convención tiene mejor compatibilidad con la normalización covariante. La diferencia es solo si el factor \((2\pi)^3\) se absorbe en el denominador de la expansión en modos o aparece en la relación de conmutación; los resultados físicos no cambian. Usaré esta convención de ahora en adelante.

Esta expansión en modos se puede usar tal cual. Las relaciones de conmutación, los propagadores, todo de campo libre se reutiliza directamente.

⚪ Mei: Es decir, en cuanto a los operadores, todo lo que hemos aprendido hasta ahora se aplica directamente. Tremendamente conveniente.

🔵 Kai: Oye, dijiste que cambias la convención, pero ¿cuál se usa en los cálculos de aquí en adelante? Me preocupa confundirme...

🟡 Lina: Perdona, déjame dejarlo claro. De este capítulo en adelante usamos consistentemente la convención de las ecuaciones (7.4) y (7.4a) — denominador \((2\pi)^3\) en la expansión en modos, relación de conmutación \([\hat{a}_{\mathbf{p}}, \hat{a}_{\mathbf{q}}^\dagger] = (2\pi)^3\delta^{(3)}(\mathbf{p}-\mathbf{q})\). La convención del capítulo 4 (denominador \((2\pi)^{3/2}\), sin \((2\pi)^3\) en la relación de conmutación) ya no se usa, así que puedes estar tranquilo.

✅ Verificación de comprensión: ¿Por qué el operador de campo en la representación de interacción \(\hat{\phi}_I(x)\) puede usar directamente la expansión en modos del campo libre?

Respuesta

Como en el lado derecho de la ecuación de movimiento (7.3) del operador en la representación de interacción solo aparece \(\hat{H}_0\), \(\hat{\phi}_I(x)\) obedece la ecuación de movimiento del campo libre (ecuación de Klein-Gordon). Por lo tanto, la expansión en modos, relaciones de conmutación y propagadores derivados para el campo libre se aplican directamente.


Evolución temporal del estado — impulsado por \(\hat{H}_I(t)\)

🟡 Lina: Entonces, ¿dónde aparece el efecto de la interacción? Definimos el estado en la representación de interacción \(|\psi_I(t)\rangle\) como

\[ |\psi_I(t)\rangle = e^{i\hat{H}_0 t}\, |\psi(t)\rangle_S \tag{7.5} \]

(\(|\psi(t)\rangle_S\) es el estado en la representación de Schrödinger). Vamos a derivar la ecuación de movimiento de este estado. Derivando (7.5) respecto al tiempo:

\[ i\frac{d}{dt}|\psi_I(t)\rangle = i\frac{d}{dt}\left(e^{i\hat{H}_0 t}\, |\psi(t)\rangle_S\right) \]

Expandimos el lado derecho usando la regla del producto. Como \(\hat{H}_0\) no depende del tiempo, \(\frac{d}{dt}e^{i\hat{H}_0 t} = i\hat{H}_0\, e^{i\hat{H}_0 t}\). Multiplicando por el \(i\) del lado izquierdo: \(i \times i\hat{H}_0 = -\hat{H}_0\), así que

\[ = -\hat{H}_0\, e^{i\hat{H}_0 t}\, |\psi(t)\rangle_S + e^{i\hat{H}_0 t}\, \left(i\frac{d}{dt}|\psi(t)\rangle_S\right) \]

Sustituyendo la ecuación de Schrödinger \(i\frac{d}{dt}|\psi(t)\rangle_S = \hat{H}\, |\psi(t)\rangle_S = (\hat{H}_0 + \hat{H}')\, |\psi(t)\rangle_S\):

\[ = -\hat{H}_0\, e^{i\hat{H}_0 t}\, |\psi(t)\rangle_S + e^{i\hat{H}_0 t}\, (\hat{H}_0 + \hat{H}')\, |\psi(t)\rangle_S \]
\[ = e^{i\hat{H}_0 t}\, \hat{H}'\, |\psi(t)\rangle_S \]

Sustituyendo \(|\psi(t)\rangle_S = e^{-i\hat{H}_0 t}\, |\psi_I(t)\rangle\):

\[ \boxed{i\frac{d}{dt}|\psi_I(t)\rangle = \hat{H}_I(t)\, |\psi_I(t)\rangle} \tag{7.6} \]

donde

\[ \hat{H}_I(t) = e^{i\hat{H}_0 t}\, \hat{H}'\, e^{-i\hat{H}_0 t} \tag{7.7} \]

🔵 Kai: ¡La evolución temporal del estado está determinada solo por el hamiltoniano de interacción \(\hat{H}_I(t)\)! Si no hay interacción (si \(\hat{H}' = 0\)), el estado no cambia.

🟡 Lina: Exacto. Resumo las tres representaciones en una tabla.

Tabla 7.2: Comparación de las representaciones de Schrödinger, Heisenberg e interacción

Representación Evolución temporal de operadores Evolución temporal de estados
Schrödinger Ninguna Evoluciona con \(\hat{H} = \hat{H}_0 + \hat{H}'\)
Heisenberg Evoluciona con \(\hat{H}\) Ninguna
Interacción Evoluciona con \(\hat{H}_0\) Evoluciona con \(\hat{H}_I(t)\)

⚪ Mei: Los operadores se tratan como campo libre, y el cambio de estado lo impulsa solo la interacción. Es decir, si no hay interacción el estado no cambia en absoluto — una formulación perfecta para tratar problemas de dispersión.

✅ Verificación de comprensión: En la representación de interacción, ¿qué gobierna la evolución temporal de los operadores? ¿Y qué gobierna la evolución temporal de los estados?

Respuesta

Los operadores evolucionan con el hamiltoniano libre \(\hat{H}_0\). Los estados evolucionan con el hamiltoniano de interacción \(\hat{H}_I(t) = e^{i\hat{H}_0 t}\hat{H}'e^{-i\hat{H}_0 t}\).

📝 Ejercicios:


7.3 Definición de la matriz S — Conectando la "entrada" y la "salida" de la dispersión

🟡 Lina: A continuación, formulemos el experimento de dispersión. Un experimento de dispersión típico se divide en 3 etapas:

  1. \(t \to -\infty\): Las partículas están suficientemente separadas y se pueden describir como partículas libres (estado inicial \(|i\rangle\))
  2. Tiempo finito: Las partículas colisionan y la interacción \(\hat{H}_I\) actúa
  3. \(t \to +\infty\): Las partículas resultantes se separan de nuevo y se pueden describir como partículas libres (estado final \(|f\rangle\))

🔵 Kai: Tanto el estado inicial como el final son partículas libres. La interacción solo actúa "en el medio".

🟡 Lina: Así es. He ilustrado la estructura de estas 3 etapas en la Fig. 7.2「Las 3 etapas del experimento de dispersión y la matriz S」 (los \(\hat{U}_I\) y \(\hat{S}\) en la figura los definiré enseguida). En la representación de interacción, el estado evoluciona con \(\hat{H}_I\). Intuitivamente, si en \(t \to \pm\infty\) las partículas están suficientemente separadas, el efecto de la interacción es despreciable y el estado se "congela". Este estado congelado es exactamente el estado de partículas libres — autoestado de \(\hat{H}_0\).

Las 3 etapas del experimento de dispersión y la matriz S

Fig. 7.2: Las 3 etapas del experimento de dispersión y la matriz S. En el pasado lejano (\(t \to -\infty\)) y el futuro lejano (\(t \to +\infty\)) las partículas son libres (autoestados de \(\hat{H}_0\)), y durante un tiempo finito actúa la interacción \(\hat{H}_I(t)\). El operador S \(\hat{S} = \hat{U}_I(+\infty, -\infty)\) conecta el estado inicial con el estado final.

🔵 Kai: Pero mirando la expresión de \(\hat{H}_I(t)\), no parece que se anule automáticamente cuando \(t \to \pm\infty\)...

🟡 Lina: Observación aguda. Estrictamente, se asume una operación de "apagar" lentamente la interacción en el pasado y futuro infinitos como \(e^{-\varepsilon|t|}\hat{H}_I(t)\) (\(\varepsilon > 0\) es una cantidad infinitesimal) — llamada encendido adiabático (adiabatic switching). \(e^{-\varepsilon|t|}\) es cercano a 1 alrededor de \(t = 0\), pero decae a cero cuando \(|t| \to \infty\) — expresa matemáticamente que la interacción "desaparece" en el pasado y futuro lejanos.

🔵 Kai: Lo de "lentamente" es el punto clave, ¿verdad? Si se enciende y apaga bruscamente hay problemas porque...

🟡 Lina: Así es, "lentamente" es el punto clave; si encendemos y apagamos la interacción bruscamente surge un problema. Recuerda las propiedades de la transformada de Fourier — cuanto más corto es un pulso de luz, más ancho es el rango de frecuencias que contiene (@chapter:qm/appendix_c). Por el mismo principio, cuanto más bruscamente se enciende/apaga la interacción (duración \(\Delta t\) más corta), mayor es el ancho de energía \(\Delta E\) inyectado al sistema. Esto viene de la relación de ancho de banda de la transformada de Fourier — la propiedad que aprendimos en el @chapter:qm/appendix_c de que "cuanto menor es la duración del pulso \(\Delta t\), mayor es el ancho de frecuencias \(\Delta\omega\)" (\(\Delta\omega \cdot \Delta t \gtrsim 1\)). En unidades naturales (\(\hbar = 1\)) como \(E = \hbar\omega = \omega\), esto se escribe directamente como \(\Delta E \cdot \Delta t \gtrsim 1\). Si \(\Delta E\) supera la masa \(m\) de la partícula (recuerda que en unidades naturales \(E = m\) es la energía mínima necesaria para crear una partícula), esa energía sobrante puede generar nuevas partículas. Si el cambio es suficientemente lento (adiabático), \(\Delta E \approx 0\) y el sistema transiciona suavemente del estado de partículas libres al estado con interacción. Finalmente se toma el límite \(\varepsilon \to 0\). Gracias a esta prescripción, podemos tratar los estados en \(t \to \pm\infty\) como partículas libres. La justificación rigurosa es un tema avanzado; por ahora acepta que "existe ese convenio".


Operador de evolución temporal \(\hat{U}_I\)

🟡 Lina: Escribimos la evolución temporal del estado en la representación de interacción mediante el operador \(\hat{U}_I(t, t_0)\):

\[ |\psi_I(t)\rangle = \hat{U}_I(t, t_0)\, |\psi_I(t_0)\rangle \tag{7.8} \]

Sustituyendo en (7.6), \(\hat{U}_I\) satisface

\[ i\frac{\partial}{\partial t}\hat{U}_I(t, t_0) = \hat{H}_I(t)\, \hat{U}_I(t, t_0), \qquad \hat{U}_I(t_0, t_0) = 1 \tag{7.9} \]

Definición del operador S

🟡 Lina: La S de la matriz S (S-matrix) es la inicial de "scattering" (dispersión). El operador S \(\hat{S}\) se define como el operador de evolución temporal en el límite \(t_0 \to -\infty\), \(t \to +\infty\):

\[ \hat{S} = \hat{U}_I(+\infty, -\infty) \tag{7.10} \]

La amplitud de dispersión viene dada por

\[ \langle f|\hat{S}|i\rangle \tag{7.11} \]

Aquí \(|i\rangle\), \(|f\rangle\) son estados de partículas libres — autoestados de \(\hat{H}_0\).

🔵 Kai: \(|\langle f|\hat{S}|i\rangle|^2\) es la probabilidad de transición. ¿Es como una generalización de la regla de oro de Fermi que aprendimos en mecánica cuántica?

🟡 Lina: Exactamente. La regla de oro de Fermi se deriva de la aproximación de orden más bajo de la matriz S. En teoría cuántica de campos, todo —incluyendo procesos que cambian el número de partículas— se concentra en \(\hat{S}\).

🔵 Kai: Oye, ¿qué pasa si el estado inicial \(|i\rangle\) y el estado final \(|f\rangle\) son iguales — es decir, no hay dispersión? Con \(|\langle f|\hat{S}|i\rangle|^2\) se incluiría también la probabilidad de que "no pase nada", ¿no?

🟡 Lina: Buena pregunta. Para separar la parte donde no hay dispersión, es común escribir \(\hat{S}\) como

\[ \hat{S} = \mathbb{1} + i\hat{T} \tag{7.12} \]

\(\mathbb{1}\) es la parte de "no pasa nada", e \(i\hat{T}\) es la parte que describe la transición debida a la interacción. El \(i\) es convención; con esto, cuando luego definamos la amplitud invariante \(\mathcal{M}\), podemos escribir \(\langle f|i\hat{T}|i\rangle = i\mathcal{M} \times (\text{delta de Dirac})\), y del resultado \(\hat{S}^{(1)}\) que da \(-i\lambda \times (\text{delta de Dirac})\) se lee directamente \(\mathcal{M} = -\lambda\) — lo verificaremos al final de este capítulo. Las secciones eficaces que se miden experimentalmente se calculan a partir de los elementos de matriz de \(\hat{T}\).

✅ Verificación de comprensión: ¿Cuál es la razón de descomponer el operador S como \(\hat{S} = \mathbb{1} + i\hat{T}\)?

Respuesta

\(\mathbb{1}\) representa la parte donde no hay dispersión (estado inicial y final iguales), e \(i\hat{T}\) describe las transiciones reales debidas a la interacción. Como las cantidades medidas experimentalmente, como la sección eficaz, se calculan a partir de los elementos de matriz de \(\hat{T}\), es conveniente separar la contribución de "no pasa nada".

✅ Verificación de comprensión: En la definición del operador S \(\hat{S} = \hat{U}_I(+\infty, -\infty)\), ¿\(|i\rangle\) y \(|f\rangle\) son autoestados de qué hamiltoniano?

Respuesta

Son autoestados del hamiltoniano libre \(\hat{H}_0\). Antes y después de la dispersión, las partículas están suficientemente separadas para que la interacción no actúe, por lo que se pueden describir como partículas libres.


7.4 Serie de Dyson — Expandiendo la matriz S perturbativamente

🟡 Lina: Obtengamos \(\hat{U}_I(t, t_0)\) concretamente. Reescribiendo (7.9): \(\frac{\partial}{\partial t}\hat{U}_I(t, t_0) = -i\hat{H}_I(t)\hat{U}_I(t, t_0)\). Integrando ambos lados de \(t_0\) a \(t\):

\[ \hat{U}_I(t, t_0) - \hat{U}_I(t_0, t_0) = -i\int_{t_0}^{t} dt_1\, \hat{H}_I(t_1)\, \hat{U}_I(t_1, t_0) \]

Usando la condición inicial \(\hat{U}_I(t_0, t_0) = 1\):

\[ \hat{U}_I(t, t_0) = 1 - i\int_{t_0}^{t} dt_1\, \hat{H}_I(t_1)\, \hat{U}_I(t_1, t_0) \tag{7.13} \]

En el lado derecho aún queda \(\hat{U}_I\) — es decir, la cantidad que queremos encontrar está dentro de la integral. A este tipo de ecuación se le llama ecuación integral. Si fuera una ecuación algebraica como \(x = 1 + 0.1x\), podríamos despejar \(x = 1/0.9\), pero cuando la función incógnita está atrapada dentro del signo integral como "\(f(t) = 1 + \int(\cdots f \cdots)\)", no podemos "despejar" \(f\) sacándola — por eso aproximamos mediante sustitución iterativa.

🔵 Kai: En teoría de perturbaciones de mecánica cuántica vi ecuaciones similares. Se expande por sustitución iterativa, ¿verdad? Pero si sustituimos infinitamente, ¿converge?

🟡 Lina: Buena pregunta. Como \(\hat{H}_I\) es proporcional a la constante de acoplamiento \(\lambda\), el término tras \(n\) sustituciones es proporcional a \(\lambda^n\). Si \(\lambda \ll 1\), los términos de orden superior se hacen cada vez más pequeños, así que truncando a un orden finito se obtiene una buena aproximación. Esta es la idea básica de la teoría de perturbaciones. Veamos concretamente cómo sustituimos iterativamente (7.13) en sí misma.

Orden 0: \(\hat{U}_I^{(0)} = 1\)

Orden 1: Sustituimos el orden 0 en \(\hat{U}_I\) del lado derecho

\[ \hat{U}_I^{(1)} = 1 + (-i)\int_{t_0}^{t} dt_1\, \hat{H}_I(t_1) \]

Orden 2: Sustituimos el orden 1 en \(\hat{U}_I\) del lado derecho

\[ \hat{U}_I^{(2)} = 1 + (-i)\int_{t_0}^{t} dt_1\, \hat{H}_I(t_1) + (-i)^2 \int_{t_0}^{t} dt_1 \int_{t_0}^{t_1} dt_2\, \hat{H}_I(t_1)\, \hat{H}_I(t_2) \]

🔵 Kai: En el término de segundo orden, ¿por qué el límite superior de la integral es \(t_1\) y no \(t\)?

🟡 Lina: Viene de la estructura de la sustitución iterativa. Como estamos sustituyendo otra interacción en \(t_2\) "dentro" de la interacción en \(t_1\), se garantiza automáticamente que \(t_2\) es anterior a \(t_1\) — es decir, el orden temporal \(t_2 < t_1\).

⚪ Mei: Entiendo, el "orden causal" de que "primero ocurre la interacción en \(t_2\) y después la interacción en \(t_1\)" se refleja en el límite superior de la integral.

🟡 Lina: Bien visto, Mei. Aquí usamos un truco importante. En vez de restringir la región de integración a \(t_0 \le t_2 \le t_1 \le t\), introducimos el producto ordenado temporalmente \(T\) para liberar los límites de integración.


Definición del producto ordenado temporalmente \(T\)

🟡 Lina: Defino el producto ordenado temporalmente (time-ordered product) \(T\) para operadores de campos bosónicos:

\[ T\hat{A}(t_1)\hat{B}(t_2) = \begin{cases} \hat{A}(t_1)\hat{B}(t_2) & (t_1 > t_2) \\ \hat{B}(t_2)\hat{A}(t_1) & (t_2 > t_1) \end{cases} \tag{7.14} \]

Es decir, siempre se coloca a la izquierda el operador de tiempo más tardío. Para el caso \(t_1 = t_2\), en campos bosónicos los campos a igual tiempo en diferentes puntos espaciales conmutan (relación de conmutación a tiempos iguales \([\hat{\phi}(t,\mathbf{x}),\, \hat{\phi}(t,\mathbf{y})] = 0\) que aprendimos en el Cap. 4), así que el resultado es el mismo independientemente del orden.

🔵 Kai: ¿Por qué el lado derecho es "primero"?

🟡 Lina: Como aprendimos en el Mecánica Cuántica Cap. 13, los operadores actúan sobre el estado desde la derecha. Cuando escribimos \(\hat{A}(t_1)\hat{B}(t_2)|i\rangle\), primero actúa \(\hat{B}(t_2)\) (el de la derecha) sobre \(|i\rangle\), y luego \(\hat{A}(t_1)\) actúa sobre el resultado. Por lo tanto, para "aplicar primero lo que ocurrió primero (\(t_2\) antes)", necesitamos colocar el operador que ocurrió antes a la derecha. El producto ordenado temporalmente incorpora automáticamente este orden causal — la causa va primero y el efecto después.

🔵 Kai: ¿Y en el caso de fermiones? Como tienen relaciones de anticonmutación, algo debe cambiar...

🟡 Lina: Buena intuición. Como aprendimos en el Cap. 5, los campos fermiónicos satisfacen relaciones de anticonmutación \(\{\hat{\psi}, \hat{\psi}\} \neq 0\), así que cada vez que intercambiamos operadores aparece un signo menos. Por eso en el producto ordenado temporal también aparece un \((-1)\) por cada intercambio. La definición formal del producto ordenado temporal para fermiones la daré a partir del Cap. 8 cuando calculemos dispersión en QED. Ahora nos concentramos en campos escalares bosónicos, así que no hay que preocuparse por signos.

✅ Verificación de comprensión: En el producto ordenado temporal \(T\), ¿por qué se coloca "el operador de tiempo más tardío a la izquierda"? Explica el significado físico.

Respuesta

Como los operadores actúan sobre el estado desde la derecha, el operador que está a la derecha actúa primero. En el producto ordenado temporal, al ordenar de modo que "la interacción que ocurrió primero se aplique primero", se incorpora naturalmente la causalidad — la causa precede al efecto.


Serie de Dyson usando el producto ordenado temporal

🟡 Lina: Usando el producto ordenado temporal, el término de segundo orden se puede reescribir de la siguiente manera.

Consideremos la región de integración de \((t_1, t_2)\) en el cuadrado \([t_0, t] \times [t_0, t]\). Lo que obtuvimos por sustitución iterativa es solo la región \(t_2 \le t_1\) (el triángulo superior del cuadrado). ¿Qué pasa en el triángulo inferior (\(t_1 \le t_2\))? En esta región \(T[\hat{H}_I(t_1)\hat{H}_I(t_2)] = \hat{H}_I(t_2)\hat{H}_I(t_1)\) (se coloca a la izquierda el de tiempo más tardío). Es decir, la integral del triángulo inferior es

\[ \int_{t_0}^{t} dt_1 \int_{t_1}^{t} dt_2\, \hat{H}_I(t_2)\hat{H}_I(t_1) \]

Ahora renombro las variables de integración intercambiando \(t_1 \leftrightarrow t_2\). Esto es una operación donde, en la integral doble \(\int\int dt_1\,dt_2\, (\cdots)\), "lo que llamábamos \(t_1\) pasa a llamarse \(t_2\), y lo que llamábamos \(t_2\) pasa a llamarse \(t_1\)" simultáneamente. Las variables de integración son variables mudas — igual que \(\int_0^1 dx\, f(x)\) y \(\int_0^1 dy\, f(y)\) tienen el mismo valor — así que intercambiar dos variables simultáneamente no cambia el valor de la integral.

🔵 Kai: Eh, ¿eso es lo mismo que reescribir una expresión en \(x\) usando \(y\)?

🟡 Lina: Sí. Veámoslo concretamente. La región de integración original del triángulo inferior era "\(t_0 \le t_1 \le t\) y \(t_1 \le t_2 \le t\)". Al intercambiar los nombres, el \(t_1\) original se convierte en el nuevo \(t_2\), y el \(t_2\) original en el nuevo \(t_1\), así que las condiciones se transforman en "\(t_0 \le t_2 \le t\) y \(t_2 \le t_1 \le t\)" — es decir, \(t_0 \le t_2 \le t_1 \le t\) (triángulo superior). El integrando también cambia de \(\hat{H}_I(t_2)\hat{H}_I(t_1)\) a \(\hat{H}_I(t_1)\hat{H}_I(t_2)\) (¡solo se intercambiaron los nombres!).

🔵 Kai: Un momento. El orden de los operadores cambió de \(\hat{H}_I(t_2)\hat{H}_I(t_1)\) a \(\hat{H}_I(t_1)\hat{H}_I(t_2)\). Los operadores no conmutan, ¿se pueden intercambiar así?

🟡 Lina: Buena pregunta. Aquí no "intercambiamos" el orden de los operadores, solo renombramos las variables. Primero tomemos intuición con números ordinarios. Puedes escribir \(\int_0^1 dx\, f(x) = \int_0^1 dy\, f(y)\) — como la variable de integración es "muda", cambiar el nombre no cambia el valor. Con dos variables es igual: considera \(\int_0^1 dx\int_0^1 dy\, x^2 y\). Si renombramos \(x \leftrightarrow y\) obtenemos \(\int_0^1 dy\int_0^1 dx\, y^2 x\), pero tiene el mismo valor que la integral original (ambas dan \(1/6\)). La "forma" del integrando parece cambiar de \(x^2 y\) a \(y^2 x\), pero como los nombres de las variables de integración también cambiaron simultáneamente, en conjunto no ha cambiado nada.

Con operadores es igual. En la expresión original "la interacción que ocurre al tiempo \(t_2\) está a la izquierda, la que ocurre al tiempo \(t_1\) está a la derecha"; después del renombramiento "la interacción que ocurre al nuevo \(t_1\) (= antiguo \(t_2\)) está a la izquierda, la que ocurre al nuevo \(t_2\) (= antiguo \(t_1\)) está a la derecha" — el contenido físico no ha cambiado en nada.

⚪ Mei: Es decir, solo "cambiamos las etiquetas de los nombres", el orden físico de los operadores no cambió.

🟡 Lina: Exacto. Como resultado del renombramiento, la integral del triángulo inferior se convierte en "integrar \(\hat{H}_I(t_1)\hat{H}_I(t_2)\) en la región \(t_0 \le t_2 \le t_1 \le t\)" — que tiene exactamente la misma forma que la integral del triángulo superior. Entonces la integral del cuadrado completo es el doble del triángulo superior. Dicho al revés, si integramos sobre todo el cuadrado y dividimos por \(1/2\), obtenemos la integral original del triángulo superior.

\[ \int_{t_0}^{t} dt_1 \int_{t_0}^{t_1} dt_2\, \hat{H}_I(t_1)\hat{H}_I(t_2) = \frac{1}{2}\int_{t_0}^{t} dt_1 \int_{t_0}^{t} dt_2\, T\!\left[\hat{H}_I(t_1)\hat{H}_I(t_2)\right] \tag{7.15} \]

🔵 Kai: ¿Por qué aparece el \(1/2\)?

🟡 Lina: Buena pregunta. La integral doble del lado derecho incluye ambas regiones: \(t_1 > t_2\) y \(t_2 > t_1\). Pero gracias al producto ordenado temporal, en ambas regiones el resultado es el mismo — si \(t_1 > t_2\) sale directamente \(\hat{H}_I(t_1)\hat{H}_I(t_2)\), y si \(t_2 > t_1\) se intercambian para dar la misma forma. Entonces la integral sobre toda la región es el doble de la región restringida. Dividimos entre 2 para recuperar el original.

🔵 Kai: Entonces en tercer orden se divide por \(3! = 6\)... ¿y en orden \(n\) por \(n!\)?

🟡 Lina: Exacto. Como hay \(n!\) permutaciones de las \(n\) variables temporales, al extender a toda la región se multiplica por \(n!\). El \(1/n!\) corrige eso. Lo que se obtiene así es la serie de Dyson (Dyson series):

\[ \boxed{\hat{U}_I(t, t_0) = T\exp\!\left[-i\int_{t_0}^{t} dt'\, \hat{H}_I(t')\right] = \sum_{n=0}^{\infty} \frac{(-i)^n}{n!}\int_{t_0}^{t} dt_1 \cdots \int_{t_0}^{t} dt_n\, T\!\left[\hat{H}_I(t_1)\cdots\hat{H}_I(t_n)\right]} \tag{7.16} \]

🔵 Kai: ¿\(T\exp\) es diferente de la exponencial ordinaria?

🟡 Lina: Cuando se expande como en el lado derecho, cada término lleva el producto ordenado temporal \(T\) — esa es la definición de \(T\exp\). Como los operadores en general no conmutan, el resultado difiere de la \(\exp\) ordinaria. He ilustrado la estructura de la serie de Dyson en la Fig. 7.3「Serie de Dyson」.

Estructura de la serie de Dyson

Fig. 7.3: Serie de Dyson — expansión perturbativa de la matriz S. El término de orden \(n\) corresponde a un proceso donde la interacción ocurre \(n\) veces, con coeficiente \((-i)^n/n!\) y producto ordenado temporal \(T\) en cada término. A mayor orden, mayor precisión.

🟡 Lina: Y el operador S se obtiene tomando los límites \(t_0 \to -\infty\), \(t \to +\infty\):

\[ \hat{S} = T\exp\!\left[-i\int_{-\infty}^{+\infty} dt'\, \hat{H}_I(t')\right] \tag{7.17} \]

En forma Lorentz invariante, usando \(\hat{H}_I(t) = -\int d^3x\, \mathcal{L}_{\text{int}}(\hat{\phi}_I(x))\):

\[ -i\int dt'\, \hat{H}_I(t') = -i\int dt'\left(-\int d^3x\, \mathcal{L}_{\text{int}}\right) = +i\int d^4x\, \mathcal{L}_{\text{int}} \]

por lo tanto

\[ \hat{S} = T\exp\!\left[i\int d^4x\, \mathcal{L}_{\text{int}}(\hat{\phi}_I(x))\right] \tag{7.18} \]

⚪ Mei: La ecuación (7.18) es una integral en 4 dimensiones, y como \(\mathcal{L}_{\text{int}}\) es un escalar y \(d^4x\) es una medida invariante Lorentz, el conjunto tiene forma Lorentz invariante.

✅ Verificación de comprensión: Explica, usando las propiedades del producto ordenado temporal, por qué el término de orden \(n\) en la serie de Dyson lleva un factor \(1/n!\).

Respuesta

Cuando integramos las \(n\) variables temporales \(t_1, \ldots, t_n\) sobre toda la región \([t_0, t]^n\), gracias al producto ordenado temporal las \(n!\) permutaciones posibles dan todas el mismo valor. Por lo tanto, la integral sobre toda la región es \(n!\) veces la integral sobre la región restringida (\(t_1 > t_2 > \cdots > t_n\)). Como la sustitución iterativa original da la integral sobre la región restringida, al extender a toda la región hay que dividir por \(n!\).


7.5 Teorema de Wick — Descomponiendo el producto ordenado temporal en "contracciones"

🟡 Lina: En cada término de la serie de Dyson aparecen productos ordenados temporalmente de operadores de campo. Por ejemplo, en el orden más bajo (\(n=1\)) de la teoría \(\phi^4\) necesitamos calcular cosas como

\[ T\!\left[\hat{\phi}_I(x_1)\hat{\phi}_I(x_2)\hat{\phi}_I(x_3)\hat{\phi}_I(x_4)\right] \]

Pero como cada operador de campo es suma de operadores de creación y aniquilación, expandirlo directamente genera un número enorme de términos. La herramienta que los organiza sistemáticamente es el teorema de Wick (Wick's theorem).


Repaso del producto en orden normal \(:\!:\)

🟡 Lina: Primero recordemos el producto en orden normal (normal ordering) \(:\!\hat{A}\hat{B}\!:\). Lo introdujimos en el Cap. 4 para resolver el problema de la energía del vacío. "Colocar todos los operadores de creación \(\hat{a}^\dagger\) a la izquierda y todos los de aniquilación \(\hat{a}\) a la derecha" — por ejemplo \(:\!\hat{a}_k \hat{a}_{k'}^\dagger\!: \;= \hat{a}_{k'}^\dagger \hat{a}_k\), solo se cambia el orden (para bosones no cambia el signo).

La propiedad importante del orden normal es

\[ \langle 0|:\!\hat{A}\hat{B}\cdots\!:|0\rangle = 0 \tag{7.19} \]

Porque en el extremo derecho siempre hay un operador de aniquilación, con \(\hat{a}|0\rangle = 0\) destruye el vacío por la derecha, o en el extremo izquierdo siempre hay un operador de creación, con \(\langle 0|\hat{a}^\dagger = 0\) destruye el vacío por la izquierda — una de las dos cosas siempre ocurre.

🔵 Kai: El valor esperado en el vacío del producto en orden normal es cero. Simple.


Definición de contracción

🟡 Lina: A continuación, defino la contracción (contraction) de dos operadores de campo. Se define como la "diferencia" entre el producto ordenado temporal y el producto en orden normal:

\[ \text{contracción}\!\left(\hat{\phi}(x)\hat{\phi}(y)\right) \equiv T\!\left[\hat{\phi}(x)\hat{\phi}(y)\right] - :\!\hat{\phi}(x)\hat{\phi}(y)\!: \tag{7.20} \]

🔵 Kai: ¿Restar el orden normal del producto ordenado temporal...? ¿Qué resulta?

🟡 Lina: Toma el valor esperado en el vacío de ambos lados. Por (7.19) el valor esperado en el vacío del orden normal es cero:

\[ \langle 0|\text{contracción}\!\left(\hat{\phi}(x)\hat{\phi}(y)\right)|0\rangle = \langle 0|T\!\left[\hat{\phi}(x)\hat{\phi}(y)\right]|0\rangle \]

El lado derecho es precisamente el propagador de Feynman (Feynman propagator) \(D_F(x - y)\) que calculamos en el Cap. 4. Hasta aquí solo hemos dicho que "el valor esperado en el vacío es igual a \(D_F\)", pero de hecho la contracción misma no es un operador sino un c-número (número ordinario) igual a \(D_F(x-y)\). Enseguida mostraré por qué, pero primero escribo la conclusión:

\[ \text{contracción}\!\left(\hat{\phi}(x)\hat{\phi}(y)\right) = D_F(x - y) = \langle 0|T\hat{\phi}(x)\hat{\phi}(y)|0\rangle \tag{7.21} \]

En el espacio de momentos:

\[ D_F(x - y) = \int \frac{d^4p}{(2\pi)^4}\, \frac{i}{p^2 - m^2 + i\varepsilon}\, e^{-ip\cdot(x-y)} \tag{7.22} \]

⚪ Mei: Entiendo: al tomar el valor esperado en el vacío de la contracción, el orden normal desaparece y solo queda el valor esperado en el vacío del producto ordenado temporal — que es el propagador que vimos en el capítulo 4.

🔵 Kai: ¡Oh! Contracción = propagador de Feynman. Es fácil de recordar. Pero ¿por qué la contracción es solo un "número" y no un operador? Es una diferencia entre operadores de campo.

🟡 Lina: Buena pregunta. Separemos el campo en parte de frecuencia positiva y parte de frecuencia negativa:

\[ \hat{\phi}(x) = \hat{\phi}^+(x) + \hat{\phi}^-(x) \]

Mirando la expansión en modos (7.4), hay dos tipos de términos: los con \(e^{-ip\cdot x}\) (que contienen \(\hat{a}\)) y los con \(e^{+ip\cdot x}\) (que contienen \(\hat{a}^\dagger\)). Al primero lo llamamos \(\hat{\phi}^+(x)\) y al segundo \(\hat{\phi}^-(x)\). Concretamente:

\[ \hat{\phi}^+(x) = \int \frac{d^3k}{(2\pi)^3}\, \frac{1}{\sqrt{2\omega_k}}\, \hat{a}_k\, e^{-ik\cdot x}, \qquad \hat{\phi}^-(x) = \int \frac{d^3k}{(2\pi)^3}\, \frac{1}{\sqrt{2\omega_k}}\, \hat{a}_k^\dagger\, e^{+ik\cdot x} \]

Es la misma notación que cuando en el Cap. 6 separamos el campo del fotón en \(A^{\mu(+)}\) (parte de frecuencia positiva con operador de aniquilación) y \(A^{\mu(-)}\) (parte de frecuencia negativa con operador de creación). La notación puede parecer contraintuitiva, así que organizo cómo recordarla:

Símbolo Operador que contiene Forma de onda plana Origen del nombre
\(\hat{\phi}^+(x)\) Aniquilación \(\hat{a}\) \(e^{-i\omega t}\) (frecuencia positiva) Parte de frecuencia positiva
\(\hat{\phi}^-(x)\) Creación \(\hat{a}^\dagger\) \(e^{+i\omega t}\) (frecuencia negativa) Parte de frecuencia negativa

Es decir, "\(+/-\) no se refiere a creación/aniquilación, sino al signo de \(E\) cuando escribimos la onda plana como \(e^{-iEt}\)" — \(e^{-i\omega t}\) es una onda de energía positiva \(E = \omega > 0\) por eso \(\hat{\phi}^+\), y \(e^{+i\omega t}\) es formalmente una onda de energía negativa por eso \(\hat{\phi}^-\). Esta descomposición también la usaremos más adelante en el "cálculo de elementos de matriz".

🔵 Kai: Ya veo, es difícil recordar que \(+\) es aniquilación y \(-\) es creación, pero si piensas en "el signo del exponente de \(e\)" tiene sentido.

🟡 Lina: Así es. Veamos concretamente el caso \(t_1 > t_2\). El producto ordenado temporal es por definición \(T[\hat{\phi}(x_1)\hat{\phi}(x_2)] = \hat{\phi}(x_1)\hat{\phi}(x_2)\), y expandiendo:

\[ \hat{\phi}(x_1)\hat{\phi}(x_2) = (\hat{\phi}^+ + \hat{\phi}^-)(x_1)\,(\hat{\phi}^+ + \hat{\phi}^-)(x_2) = \hat{\phi}^+_1\hat{\phi}^+_2 + \hat{\phi}^+_1\hat{\phi}^-_2 + \hat{\phi}^-_1\hat{\phi}^+_2 + \hat{\phi}^-_1\hat{\phi}^-_2 \]

Por otro lado, el orden normal mueve todos los operadores de creación (\(\hat{\phi}^-\)) a la izquierda; veamos término por término: - \(\hat{\phi}^+_1\hat{\phi}^+_2\): aniquilación×aniquilación → queda igual - \(\hat{\phi}^+_1\hat{\phi}^-_2\): aniquilación×creación → movemos creación a la izquierda: \(\hat{\phi}^-_2\hat{\phi}^+_1\) - \(\hat{\phi}^-_1\hat{\phi}^+_2\): creación×aniquilación → ya está creación a la izquierda → queda igual - \(\hat{\phi}^-_1\hat{\phi}^-_2\): creación×creación → queda igual

Por lo tanto:

\[ :\!\hat{\phi}(x_1)\hat{\phi}(x_2)\!: \;= \hat{\phi}^+_1\hat{\phi}^+_2 + \hat{\phi}^-_2\hat{\phi}^+_1 + \hat{\phi}^-_1\hat{\phi}^+_2 + \hat{\phi}^-_1\hat{\phi}^-_2 \]

Tomando la diferencia, solo cambió el segundo término:

\[ T[\hat{\phi}_1\hat{\phi}_2] - :\!\hat{\phi}_1\hat{\phi}_2\!: \;= \hat{\phi}^+_1\hat{\phi}^-_2 - \hat{\phi}^-_2\hat{\phi}^+_1 = [\hat{\phi}^+(x_1),\, \hat{\phi}^-(x_2)] \]

⚪ Mei: La diferencia se reduce al conmutador \([\hat{\phi}^+(x_1), \hat{\phi}^-(x_2)]\). Y la razón de que esto sea un c-número es...

🟡 Lina: Así es, la relación de conmutación del campo libre \([\hat{a}_k, \hat{a}_{k'}^\dagger] = (2\pi)^3\delta^{(3)}(\mathbf{k} - \mathbf{k}')\) era una delta de Dirac (un número) (Cap. 4). \([\hat{\phi}^+(x_1), \hat{\phi}^-(x_2)]\) es esta relación de conmutación integrada sobre los momentos, así que el resultado también es un c-número. El caso \(t_2 > t_1\) da de forma análoga \([\hat{\phi}^+(x_2), \hat{\phi}^-(x_1)]\), y combinando ambos se obtiene el propagador de Feynman \(D_F(x_1 - x_2)\). Es decir, \(D_F(x-y) = \theta(x^0-y^0)[\hat{\phi}^+(x), \hat{\phi}^-(y)] + \theta(y^0-x^0)[\hat{\phi}^+(y), \hat{\phi}^-(x)]\). \(\theta\) es la función escalón, que selecciona qué conmutador usar según la relación temporal.

⚪ Mei: Entiendo, como la relación de conmutación misma es un c-número, al integrarla sigue siendo un c-número — por eso la contracción no es un operador sino un "número" que es el propagador de Feynman. Y la función \(\theta\) (función escalón: vale 1 si el argumento es positivo, 0 si es negativo) representa exactamente la "separación por casos" del producto ordenado temporal.

✅ Verificación de comprensión: ¿Por qué la "contracción" de dos operadores de campo es un c-número (número ordinario) y no un operador?

Respuesta

La contracción se define como la diferencia entre el producto ordenado temporal y el producto en orden normal. Al separar el campo como \(\hat{\phi} = \hat{\phi}^+ + \hat{\phi}^-\), esta diferencia se reduce al conmutador \([\hat{\phi}^+(x), \hat{\phi}^-(y)]\) de operadores de creación y aniquilación. Como la relación de conmutación del campo libre \([\hat{a}_k, \hat{a}_{k'}^\dagger] = (2\pi)^3\delta^{(3)}(\mathbf{k}-\mathbf{k}')\) es una delta de Dirac (un número), la contracción también es un c-número, igual al propagador de Feynman \(D_F(x-y)\).


Enunciado del teorema de Wick

🟡 Lina: Ahora sí, enuncio el teorema de Wick.

Teorema de Wick: El producto ordenado temporal de operadores de campo es igual al producto en orden normal más la suma de todas las contracciones posibles.

En forma de ecuación, el producto ordenado temporal de \(n\) campos es:

\[ T\!\left[\hat{\phi}(x_1)\cdots\hat{\phi}(x_n)\right] = :\!\hat{\phi}(x_1)\cdots\hat{\phi}(x_n)\!: + (\text{todos los términos con 1 contracción}) + (\text{todos los términos con 2 contracciones}) + \cdots \tag{7.23} \]

🔵 Kai: ¿"Todas las contracciones posibles" qué significa concretamente?

🟡 Lina: Te lo muestro concretamente con 4 campos. En adelante, abrevio \(\hat{\phi}_i \equiv \hat{\phi}(x_i)\). Primero mira la ecuación, luego explico cómo leerla:

\[ \begin{aligned} T[\hat{\phi}_1 \hat{\phi}_2 \hat{\phi}_3 \hat{\phi}_4] &= :\!\hat{\phi}_1 \hat{\phi}_2 \hat{\phi}_3 \hat{\phi}_4\!: \\ &\quad + \, D_F(x_1 - x_2)\, :\!\hat{\phi}_3 \hat{\phi}_4\!: \;+\; D_F(x_1 - x_3)\, :\!\hat{\phi}_2 \hat{\phi}_4\!: \;+\; D_F(x_1 - x_4)\, :\!\hat{\phi}_2 \hat{\phi}_3\!: \\ &\quad + \, D_F(x_2 - x_3)\, :\!\hat{\phi}_1 \hat{\phi}_4\!: \;+\; D_F(x_2 - x_4)\, :\!\hat{\phi}_1 \hat{\phi}_3\!: \;+\; D_F(x_3 - x_4)\, :\!\hat{\phi}_1 \hat{\phi}_2\!: \\ &\quad + \, D_F(x_1 - x_2)\, D_F(x_3 - x_4) \\ &\quad + \, D_F(x_1 - x_3)\, D_F(x_2 - x_4) \\ &\quad + \, D_F(x_1 - x_4)\, D_F(x_2 - x_3) \end{aligned} \tag{7.24} \]

Tabla 7.3: Estructura de la expansión de 4 campos en el teorema de Wick

Número de pares contraídos Número de términos Estructura Valor esperado en el vacío
0 pares 1 \(:\!\hat{\phi}_1\hat{\phi}_2\hat{\phi}_3\hat{\phi}_4\!:\) 0
1 par \(\binom{4}{2} = 6\) \(D_F \times :\!\hat{\phi}\hat{\phi}\!:\) 0
2 pares (contracción completa) 3 \(D_F \times D_F\) (c-número) Sobrevive

⚪ Mei: Organizando: - Línea 1: sin contracción (el orden normal mismo) - Líneas 2-3: 1 contracción (\(\binom{4}{2} = 6\) formas). Los campos no contraídos permanecen dentro del orden normal - Línea 4: 2 contracciones (3 formas). Todos los campos están contraídos, no quedan operadores

🟡 Lina: Y lo más importante es que al tomar el valor esperado en el vacío, solo sobreviven los términos donde todos los campos están contraídos (contracción completa).

\[ \langle 0|T[\hat{\phi}_1 \hat{\phi}_2 \hat{\phi}_3 \hat{\phi}_4]|0\rangle = D_F(x_1 - x_2)\, D_F(x_3 - x_4) + D_F(x_1 - x_3)\, D_F(x_2 - x_4) + D_F(x_1 - x_4)\, D_F(x_2 - x_3) \tag{7.25} \]

🔵 Kai: ¡Como el valor esperado en el vacío del orden normal es cero, también se anulan los términos con contracción incompleta! Solo quedan productos de propagadores.

🟡 Lina: Este es el poder del teorema de Wick. Un producto complicado de operadores se reduce a productos de propagadores de Feynman — simples "números". Los 3 términos de la ecuación (7.25) corresponden respectivamente a los emparejamientos "(1,2)(3,4)", "(1,3)(2,4)" y "(1,4)(2,3)". Verifícalo visualmente en la Fig. 7.4「Patrones de contracción de 4 campos en el teorema de Wick」.

Patrones de contracción de 4 campos en el teorema de Wick

Fig. 7.4: Patrones de contracción de 4 campos en el teorema de Wick. Las contracciones completas de 4 campos son 3. En el valor esperado en el vacío solo sobreviven las contracciones completas, reduciéndose a productos de propagadores de Feynman.

✅ Verificación de comprensión: ¿Cuántas contracciones completas contribuyen al valor esperado en el vacío del producto ordenado temporal de 6 campos \(\hat{\phi}(x_1)\cdots\hat{\phi}(x_6)\)?

Respuesta

Es el número de formas de dividir 6 campos en 3 pares. Para el primer campo hay 5 posibles parejas, luego 3, y finalmente 1. Es decir: \(5 \times 3 \times 1 = 15\) formas. En general, para \(2n\) campos son \((2n-1)!! = (2n-1)(2n-3)\cdots 3 \cdot 1\) formas.

📝 Ejercicios:


7.6 Dispersión 2→2 en la teoría \(\phi^4\) — Cálculo al orden más bajo

🟡 Lina: Usando todas las herramientas desarrolladas hasta aquí, vamos a calcular por fin una amplitud de dispersión concreta. Calculemos la amplitud al orden más bajo para el proceso de dispersión de 2 partículas en la teoría \(\phi^4\):

\[ \phi(p_1) + \phi(p_2) \to \phi(p_3) + \phi(p_4) \]

Término de primer orden de la matriz S

🟡 Lina: La densidad lagrangiana de interacción de la teoría \(\phi^4\) es \(\mathcal{L}_{\text{int}} = -\frac{\lambda}{4!}\phi^4\). Usando la serie de Dyson en forma Lorentz invariante (7.18), el término de primer orden es \(\hat{S}^{(1)} = i\int d^4x\, \mathcal{L}_{\text{int}}\):

\[ \hat{S}^{(1)} = i\int d^4x\, \mathcal{L}_{\text{int}} = i\int d^4x\left(-\frac{\lambda}{4!}\phi^4\right) = -\frac{i\lambda}{4!}\int d^4x\, \hat{\phi}_I(x)^4 \tag{7.26} \]

(Partiendo del formalismo hamiltoniano (7.17) se obtiene el mismo resultado: \(\hat{H}_I(t) = -\int d^3x\,\mathcal{L}_{\text{int}}(\hat{\phi}_I) = +\frac{\lambda}{4!}\int d^3x\,\hat{\phi}_I^4\), así que \(-i\int dt\,\hat{H}_I(t) = -\frac{i\lambda}{4!}\int d^4x\,\hat{\phi}_I^4\), que coincide)

(El término de primer orden de la serie de Dyson (7.18) originalmente lleva \(T\), pero aquí los 4 campos están todos en el mismo punto espacio-temporal \(x\). Como campos bosónicos a igual tiempo y punto conmutan entre sí, \(T\) no cambia el resultado al reordenar — se puede omitir. Hay cuestiones sutiles sobre el orden de operadores para productos de campos en el mismo punto, pero no afectan al cálculo a tree-level como el que hacemos ahora)

🔵 Kai: Esta es la contribución de "la interacción ocurre solo una vez".

🟡 Lina: Así es. La amplitud de dispersión es:

\[ \langle f|\hat{S}^{(1)}|i\rangle = -\frac{i\lambda}{4!}\int d^4x\, \langle p_3, p_4|\hat{\phi}_I(x)^4|p_1, p_2\rangle \tag{7.27} \]

Cálculo del elemento de matriz

🟡 Lina: Hay que sustituir la expansión en modos (7.4) del operador de campo \(\hat{\phi}_I(x)\) y extraer de \(\hat{\phi}_I(x)^4\) los términos de "2 aniquilaciones + 2 creaciones".

🔵 Kai: Expandir todo parece muy complicado...

🟡 Lina: Pero gracias al teorema de Wick se puede hacer sistemáticamente. Sin embargo, como aquí hay líneas externas (partículas en los estados inicial y final), procedamos con un poco más de cuidado.

Separamos \(\hat{\phi}_I(x)\) en la parte de frecuencia positiva \(\hat{\phi}^+(x)\) (que contiene el operador de aniquilación \(\hat{a}_k\) y \(e^{-ik\cdot x}\)) y la parte de frecuencia negativa \(\hat{\phi}^-(x)\) (que contiene el operador de creación \(\hat{a}_k^\dagger\) y \(e^{+ik\cdot x}\)), como se introdujo en 「Definición de contracción」.

\(\hat{\phi}^+(x)\) "absorbe" las partículas del estado inicial, y \(\hat{\phi}^-(x)\) "emite" las partículas del estado final. Al expandir \(\hat{\phi}^4 = (\hat{\phi}^+ + \hat{\phi}^-)^4\), los términos que aniquilan las 2 partículas incidentes y crean las 2 partículas dispersadas tienen la forma \((\hat{\phi}^-)^2 (\hat{\phi}^+)^2\).

🔵 Kai: Elegir 2 de 4 campos para aniquilación y 2 para creación... ¿cuántas formas hay?

🟡 Lina: Las formas de elegir 2 de 4 para \(\hat{\phi}^+\) (aniquilación) son \(\binom{4}{2} = 6\). Además, de los 2 \(\hat{\phi}^+\) elegidos, "cuál absorbe \(p_1\) y cuál absorbe \(p_2\)" da \(2! = 2\) formas. Igualmente, de los 2 \(\hat{\phi}^-\), "cuál emite \(p_3\) y cuál emite \(p_4\)" da \(2! = 2\) formas. En total: \(\binom{4}{2} \times 2! \times 2! = 6 \times 2 \times 2 = 24 = 4!\) formas.

⚪ Mei: \(4!\) formas — que se cancelan exactamente con el denominador \(4!\).

🔵 Kai: ¡Ah, salieron \(4!\)! ¡Se cancelan exactamente con el \(4!\) del denominador!

🟡 Lina: ¡Exacto! Por eso se pone \(1/4!\) desde el principio.

🟡 Lina: Bien, antes de calcular el elemento de matriz de la ecuación (7.27), déjame organizar la normalización de los estados. En el capítulo 4 usábamos \(|\mathbf{p}\rangle = \hat{a}_{\mathbf{p}}^\dagger|0\rangle\), pero así en el cálculo de amplitudes de dispersión quedan factores \(\sqrt{2\omega}\) por todas partes, lo cual es engorroso. Además, si calculamos en un sistema inercial diferente (tras una transformación de Lorentz), la forma de las ecuaciones cambia — algo inconveniente para una teoría relativista. Por eso en problemas de dispersión es estándar usar la normalización covariante (Lorentz-invariant normalization). Definimos el estado como

\[ |p\rangle_{\text{cov}} = \sqrt{2\omega_{\mathbf{p}}}\,\hat{a}_{\mathbf{p}}^\dagger|0\rangle \]

(Aquí, la \(p\) en \(|p\rangle\) es el cuadrimomento, pero la etiqueta del operador de creación es el trimomento \(\mathbf{p}\). Como la condición de capa de masa \(p^0 = \omega_{\mathbf{p}}\) determina el cuadrimomento, \(|p\rangle\) y \(|\mathbf{p}\rangle\) se refieren al mismo estado).

🔵 Kai: Multiplicar por \(\sqrt{2\omega_p}\) a propósito debe tener alguna ventaja, ¿verdad?

🟡 Lina: Sí. Por qué \(\sqrt{2\omega_p}\) lo explico con dos razones en orden. Primero solo el resultado: con esto, el producto interno toma una forma Lorentz invariante. Calculando explícitamente, con la convención (7.4a) \([\hat{a}_{\mathbf{p}},\, \hat{a}_{\mathbf{q}}^\dagger] = (2\pi)^3\delta^{(3)}(\mathbf{p}-\mathbf{q})\):

\[ \langle p|q\rangle_{\text{cov}} = \sqrt{2\omega_p}\sqrt{2\omega_q}\,\langle 0|\hat{a}_p\hat{a}_q^\dagger|0\rangle = 2\omega_p\,(2\pi)^3\,\delta^{(3)}(\mathbf{p} - \mathbf{q}) \]

(la \(\delta^{(3)}\) impone \(\mathbf{p} = \mathbf{q}\) por lo que \(\omega_q = \omega_p\)).

Esta forma es la misma sin importar en qué sistema inercial se calcule. De aquí en adelante en este capítulo, cuando escriba \(|p\rangle\) sin aclarar, significa normalización covariante. Resumiendo el cambio de notación: frente al \(|\mathbf{p}\rangle = \hat{a}_{\mathbf{p}}^\dagger|0\rangle\) del capítulo 4, de este capítulo en adelante usamos \(|p\rangle = \sqrt{2\omega_p}\,\hat{a}_p^\dagger|0\rangle\) — la única diferencia es el factor \(\sqrt{2\omega_p}\).

🔵 Kai: ¿Por qué es conveniente la normalización covariante?

🟡 Lina: Hay dos razones.

Primero la razón física — esto es algo avanzado, así que por ahora basta con escuchar "esta es la motivación". Con la normalización ordinaria \(\langle p|q\rangle = (2\pi)^3\delta^{(3)}(\mathbf{p}-\mathbf{q})\), al hacer una transformación de Lorentz (cambiar de sistema inercial) la forma del producto interno cambia. Esto se debe a que, en relatividad, la condición de capa de masa \(E = \omega_p = \sqrt{|\mathbf{p}|^2 + m^2}\) hace que \(E\) y \(\mathbf{p}\) no sean independientes, así que al hacer una transformación de Lorentz el propio "elemento de volumen" \(d^3p\) del espacio de momentos tridimensional cambia.

🔵 Kai: ¿Eh, \(d^3p\) cambia? ¿No es solo un cambio de variable de integración?

🟡 Lina: Por ejemplo, en un sistema inercial considera una caja pequeña de ancho \(\Delta p_x\) en la dirección \(p_x\). Si haces un boost a otro sistema inercial, \(E\) y \(p_x\) se mezclan, así que el \(\Delta p_x'\) que ocupa el mismo conjunto de partículas es diferente del \(\Delta p_x\) original — como la condición de capa de masa ata \(E\) a \(\mathbf{p}\), el volumen solo de \(\mathbf{p}\) cambia. Es parecido a cómo al cambiar la proyección de un mapa las áreas se distorsionan. Concretamente, se puede demostrar que solo la combinación \(d^3p/(2\omega_p)\) es Lorentz invariante (la demostración la haremos en el Cap. 8).

⚪ Mei: La delta de Dirac \(\delta^{(3)}(\mathbf{p}-\mathbf{q})\) satisface \(\int d^3p\,\delta^{(3)} = 1\), así que está en relación "inversa" con \(d^3p\) — si \(d^3p/(2\omega_p)\) es invariante, entonces \(2\omega_p \cdot \delta^{(3)}\) también es una combinación invariante.

🟡 Lina: Exacto. Por eso, si normalizamos el estado multiplicando por \(\sqrt{2\omega_p}\), el producto interno automáticamente toma forma Lorentz invariante — recuerda que "en una teoría relativista, poner \(\sqrt{2\omega_p}\) es lo natural".

🔵 Kai: Ya veo, es un convenio para ser consistente con la relatividad.

🟡 Lina: Así es. Ahora la razón computacional — esta sí podemos verificarla concretamente. Hagamos actuar el operador de aniquilación sobre el estado con normalización covariante. Usando la relación de conmutación (7.4a) \([\hat{a}_k, \hat{a}_p^\dagger] = (2\pi)^3\delta^{(3)}(\mathbf{k}-\mathbf{p})\) y \(\hat{a}_k|0\rangle = 0\):

\[ \hat{a}_k|p\rangle_{\text{cov}} = \hat{a}_k \sqrt{2\omega_p}\,\hat{a}_p^\dagger|0\rangle = \sqrt{2\omega_p}\left(\hat{a}_p^\dagger\hat{a}_k + [\hat{a}_k, \hat{a}_p^\dagger]\right)|0\rangle = \sqrt{2\omega_p}(2\pi)^3\delta^{(3)}(\mathbf{k}-\mathbf{p})|0\rangle \]

aparecen \(\sqrt{2\omega_p}\) y \((2\pi)^3\). Por otro lado, \(\hat{\phi}^+(x)\) de la expansión en modos (7.4) contiene \(1/[(2\pi)^3\sqrt{2\omega_k}]\). Haciendo actuar \(\hat{\phi}^+(x)\) sobre \(|p\rangle_{\text{cov}}\): $$ \hat{\phi}^+(x)|p\rangle_{\text{cov}} = \int \frac{d^3k}{(2\pi)^3}\frac{1}{\sqrt{2\omega_k}}\, e^{-ik\cdot x}\, \hat{a}k|p\rangle|0\rangle $$}} = \int \frac{d^3k}{(2\pi)^3}\frac{\sqrt{2\omega_p}(2\pi)^3}{\sqrt{2\omega_k}}\, e^{-ik\cdot x}\,\delta^{(3)}(\mathbf{k}-\mathbf{p})|0\rangle = e^{-ip\cdot x

🔵 Kai: ¡Se cancelan limpiamente! Tanto \(\sqrt{2\omega}\) como \((2\pi)^3\) se anulan completamente, ¡y solo queda la fase \(e^{-ip\cdot x}\)!

🟡 Lina: Así es. Cuando la \(\delta^{(3)}\) fija \(k = p\), se tiene \(\sqrt{2\omega_p}/\sqrt{2\omega_k} = 1\), y los \((2\pi)^3\) se cancelan entre numerador y denominador, quedando limpiamente solo el factor de fase \(e^{-ip\cdot x}\). Análogamente, \({}_{{\text{cov}}}\langle p_3|\hat{\phi}^-(x) = \langle 0|\, e^{ip_3\cdot x}\). Como esta cancelación ocurre para cada uno de los 4 campos, el elemento de matriz — sumando las \(4! = 24\) combinaciones contadas antes — es:

\[ \langle p_3, p_4|\hat{\phi}_I(x)^4|p_1, p_2\rangle = 4!\, e^{i(p_3 + p_4 - p_1 - p_2)\cdot x} \]

y solo quedan factores de fase, con todos los factores de normalización cancelados. (La igualdad se cumple porque en la expansión de \(\hat{\phi}^4\) los términos distintos de "exactamente 2 aniquilaciones + 2 creaciones" — como el término donde las 4 son aniquilación — dan cero al intercalarlos entre \(\langle p_3, p_4|\) y \(|p_1, p_2\rangle\) por no coincidir el número de partículas)

⚪ Mei: Es decir, usando la normalización covariante los molestos factores \(\sqrt{2\omega}\) se cancelan automáticamente y el cálculo queda limpio.


Aparición de la conservación del cuadrimomento

🟡 Lina: Sustituyendo esto en (7.27) y realizando la integral en \(d^4x\):

\[ \int d^4x\, e^{i(p_3 + p_4 - p_1 - p_2)\cdot x} = (2\pi)^4\, \delta^{(4)}(p_1 + p_2 - p_3 - p_4) \tag{7.28} \]

Así que (7.27) da \(-\frac{i\lambda}{4!} \times 4! \times (2\pi)^4\delta^{(4)}(p_1+p_2-p_3-p_4) = -i\lambda\,(2\pi)^4\delta^{(4)}(p_1+p_2-p_3-p_4)\). El \(1/4!\) y el factor combinatorio \(4!\) se cancelan limpiamente.

🔵 Kai: ¡Apareció una delta de Dirac! Eso es...

🟡 Lina: Conservación del cuadrimomento. Se conservan tanto la energía como el momento. Como la interacción ocurre localmente en cada punto del espacio-tiempo — es decir, \(\mathcal{L}_{\text{int}}\) no depende explícitamente de las coordenadas espacio-temporales \(x\) — al integrar \(e^{i(\Delta p)\cdot x}\) sobre todo el espacio-tiempo aparece la delta de Dirac. La integral espacial \(\int d^3x\, e^{i\Delta\mathbf{p}\cdot\mathbf{x}}\) genera la conservación del momento tridimensional, y la integral temporal \(\int dt\, e^{i\Delta E\, t}\) genera la conservación de la energía.

⚪ Mei: Es decir, el teorema de Noether — la simetría de traslación espacio-temporal implica la conservación del momento — aparece concretamente como una delta de Dirac en la amplitud de dispersión.

🟡 Lina: Exactamente. Este es un ejemplo concreto de cómo el teorema de Noether — que aprendimos en el Cap. 3 — actúa en el cálculo de amplitudes de dispersión. Las 4 componentes de \(\delta^{(4)}\) corresponden una a una a las simetrías de traslación en las 4 direcciones espacio-temporales, y la simetría de la teoría se conecta directamente con la amplitud de dispersión medible experimentalmente. Es decir, las consecuencias de la simetría se manifiestan no solo como cantidades conservadas, sino también como reglas de selección que determinan "qué procesos de dispersión están permitidos". A la inversa, si hubiera un potencial externo que rompiera la homogeneidad espacial, la delta de Dirac correspondiente a esa dirección desaparecería y el momento ya no se conservaría.

🔵 Kai: Ya veo, el flujo simetría → ley de conservación → delta de Dirac se ve directamente en el resultado del cálculo.

✅ Verificación de comprensión: ¿Como resultado de qué operación matemática aparece la delta de Dirac de conservación del cuadrimomento \(\delta^{(4)}(p_1+p_2-p_3-p_4)\) en el cálculo de la amplitud de dispersión?

Respuesta

Como la interacción ocurre localmente en cada punto del espacio-tiempo, se integra el factor de fase \(e^{i(p_3+p_4-p_1-p_2)\cdot x}\) sobre todo el espacio-tiempo con \(d^4x\). Esta integral da \((2\pi)^4\delta^{(4)}(p_1+p_2-p_3-p_4)\), y la conservación del cuadrimomento aparece naturalmente.


Resultado final: amplitud de dispersión

🟡 Lina: Resumiendo todo, gracias a la normalización covariante todos los factores \(\sqrt{2\omega}\) se cancelan. Sustituyendo \(4! \times (2\pi)^4\delta^{(4)}\) en la ecuación (7.27) y cancelando con \(1/4!\), el elemento de la matriz S es:

\[ \langle p_3, p_4|\hat{S}^{(1)}|p_1, p_2\rangle = -i\lambda\, (2\pi)^4\, \delta^{(4)}(p_1 + p_2 - p_3 - p_4) \tag{7.29} \]

Usando la descomposición (7.12) \(\hat{S} = \mathbb{1} + i\hat{T}\), definimos la amplitud invariante \(\mathcal{M}\) extrayendo la delta de conservación del momento del elemento de matriz de \(\hat{T}\):

\[ \langle p_3, p_4|i\hat{T}|p_1, p_2\rangle \equiv i\mathcal{M}\, (2\pi)^4\, \delta^{(4)}(p_1 + p_2 - p_3 - p_4) \]

En (7.29), como estamos considerando un proceso de dispersión donde el estado inicial y final son diferentes (\((p_1, p_2) \neq (p_3, p_4)\)), se tiene \(\langle f|\mathbb{1}|i\rangle = 0\), así que \(\langle f|\hat{S}^{(1)}|i\rangle = \langle f|i\hat{T}^{(1)}|i\rangle\). Comparando:

\[ \boxed{\mathcal{M} = -\lambda} \tag{7.30} \]

🔵 Kai: ¡¿Eh, el resultado es tan simple?! ¿La amplitud de dispersión es solo una constante \(-\lambda\)? Pero eso significa que se dispersa con la misma probabilidad independientemente del ángulo de dispersión. ¿En experimentos reales también es así?

🟡 Lina: En el orden más bajo de la teoría \(\phi^4\), sí. No depende ni del momento ni del ángulo — es una dispersión isotrópica. Esto se debe a que el vértice \(\phi^4\) solo acopla 4 campos "en un punto", sin que aparezca un propagador (propagador) interno. Por cierto, la teoría \(\phi^4\) en sí no describe directamente partículas elementales reales; es un "modelo de práctica" (toy model) para aprender la estructura de la teoría cuántica de campos. En la dispersión real de electrones (QED) entra el propagador del fotón, así que ya al orden más bajo hay dependencia angular. Es decir, si al orden más bajo hay o no dependencia angular lo determina "si hay o no líneas internas". Eso lo veremos a partir del Cap. 8.

⚪ Mei: Entiendo, \(\phi^4\) se completa con un solo vértice sin líneas internas, dando la constante \(-\lambda\). En QED entran líneas internas y el ángulo importa — qué ganas de verlo en los próximos capítulos.

🔵 Kai: Si el resultado es tan simple, en el siguiente orden debe ser mucho más complejo. ...Ah, pero espera. En el siguiente orden entra un propagador interno y aparece dependencia angular, ¿verdad? Pero entonces, al integrar sobre el momento interno, tengo la sensación de que algo podría divergir... ¿está bien?

🟡 Lina: Buena intuición. De hecho, a partir del siguiente orden, al integrar sobre el momento interno aparecen divergencias ultravioletas (la integral se hace infinita). El método que trata esto sistemáticamente es la renormalización (renormalization), que abordaremos en capítulos posteriores. Por ahora recuerda que "las divergencias ocurren, pero existe una prescripción para extraer respuestas finitas con significado físico".

🟡 Lina: Bien, si dibujamos el resultado que obtuvimos, es un diagrama tipo "×" donde 4 líneas externas se encuentran en un punto (Fig. 7.5「Vértice de dispersión de 2 cuerpos al orden más bajo en la teoría φ⁴」). Este es uno de los diagramas de Feynman más simples. En el próximo Cap. 8 construiremos sistemáticamente las reglas de correspondencia entre el "dibujo" y las "fórmulas" del diagrama — las reglas de Feynman.

Vértice de dispersión de 2 cuerpos al orden más bajo en la teoría φ⁴

Fig. 7.5: Vértice de dispersión de 2 cuerpos al orden más bajo en la teoría φ⁴. Diagrama al orden más bajo de la teoría \(\phi^4\). 4 líneas externas se encuentran en un punto, y la amplitud de dispersión es la constante \(\mathcal{M} = -\lambda\).

✅ Verificación de comprensión: Explica físicamente por qué la amplitud al orden más bajo \(\mathcal{M} = -\lambda\) de la dispersión 2→2 en la teoría \(\phi^4\) no depende del momento.

Respuesta

Al orden más bajo la interacción ocurre una sola vez en un punto del espacio-tiempo (un solo vértice). Como no hay partículas virtuales propagándose internamente, no aparece el propagador \(i/(p^2 - m^2 + i\varepsilon)\) y no surge dependencia en la transferencia de momento. Solo la constante de acoplamiento \(\lambda\) determina la amplitud.

📝 Ejercicios:


7.7 Resumen del capítulo

🟡 Lina: Repasemos el contenido de hoy.

  1. Necesidad de las interacciones: En el campo libre el número de partículas se conserva y no hay dispersión ni desintegración. Solo al añadir \(\mathcal{L}_{\text{int}}\) podemos describir la física real.
  2. Representación de interacción: Los operadores evolucionan con \(\hat{H}_0\) (como campo libre), los estados evolucionan con \(\hat{H}_I(t)\). Las herramientas del campo libre se usan directamente.
  3. Matriz S y serie de Dyson: Toda la información de la dispersión se concentra en \(\hat{S} = T\exp\!\left[i\int d^4x\, \mathcal{L}_{\text{int}}\right]\) (forma Lorentz invariante). Expandiendo en potencias de la constante de acoplamiento (serie de Dyson) se calculan sistemáticamente las amplitudes de dispersión.
  4. Teorema de Wick: Descompone el producto ordenado temporal en orden normal + contracciones (= propagadores de Feynman). En el valor esperado en el vacío solo sobreviven las contracciones completas.
  5. Dispersión 2→2 en \(\phi^4\): Al orden más bajo \(\mathcal{M} = -\lambda\). La conservación del cuadrimomento aparece naturalmente como delta de Dirac.

🔵 Kai: Finalmente pasamos del mundo del campo libre al mundo donde las partículas chocan. Me impresionó cómo el teorema de Wick reduce ese cálculo complejo de operadores a "combinaciones de emparejamientos". Pero el número de emparejamientos explota cuando aumentan los campos, ¿no? En la verificación anterior, con 6 campos eran 15, pero con 8 serían más...

⚪ Mei: Con 8 campos serían \(7 \times 5 \times 3 \times 1 = 105\).

🔵 Kai: ¡Lo sabía! En los términos de orden superior de la serie de Dyson los campos aumentan cada vez más, así que escribirlo todo parece poco práctico. ¿Cómo se organiza en la práctica?

🟡 Lina: Exactamente ese problema lo resuelven los diagramas de Feynman que aprenderemos en el próximo capítulo. Al hacer corresponder los patrones de contracción con "dibujos", se ve de un vistazo qué términos dan la misma contribución física.

⚪ Mei: Controlar la explosión combinatoria mediante "clasificación de dibujos". Suena emocionante.


Adelanto del próximo capítulo

Cap. 8 Diagramas de Feynman — Traducción de dibujos a fórmulas

Visualizaremos los patrones de contracción obtenidos con el teorema de Wick como "diagramas", y construiremos sistemáticamente las reglas matemáticas correspondientes a vértices, líneas internas y líneas externas — las reglas de Feynman. Derivaremos las reglas de Feynman tanto para la teoría \(\phi^4\) como para QED, y experimentaremos la satisfacción de que el cálculo de amplitudes de dispersión se reduzca simplemente a "dibujar y traducir".

Referencias

  • Quantum Field Theory for the Gifted Amateur (Lancaster & Blundell) capítulos 16–17 "Propagators and Green's functions / Propagators and fields" (contexto del propagador de Feynman)
  • Quantum Field Theory for the Gifted Amateur (Lancaster & Blundell) capítulo 18 "The S-matrix"
  • Quantum Field Theory for the Gifted Amateur (Lancaster & Blundell) capítulo 19 "Expanding the S-matrix: Feynman diagrams"
  • Quantum Field Theory (David Tong, Cambridge lecture notes) capítulo 3 "Interacting Fields"
  • Quantum Field Theory and the Standard Model (Schwartz) capítulo 4 "Old-Fashioned Perturbation Theory"
  • 坂本眞人『場の量子論 II — ファインマングラフとくりこみを中心にして』 capítulo 2 "Campos con interacción y campos asintóticos"
  • 坂本眞人『場の量子論 II — ファインマングラフとくりこみを中心にして』 capítulo 9 "Expansión en fluctuaciones y teorema de Wick"