Saltar a contenido

Capítulo 4 ¿Por qué fracasan los modelos exitosos? — La crisis de la física clásica


Resumen de los capítulos anteriores: En los capítulos 1 a 3, vimos tres modelos exitosos: la mecánica de Newton (gravedad), el electromagnetismo de Maxwell (unificación de electricidad, magnetismo y luz), y la mecánica estadística de Boltzmann (entropía). Todos poseían un poder predictivo asombroso, y a finales del siglo XIX había quienes pensaban que «la física está casi completa».

Objetivo de este capítulo

  • Revivir cómo la física clásica, que se consideraba «casi completa» a finales del siglo XIX, se derrumbó ante tres hechos experimentales: la divergencia ultravioleta de la radiación del cuerpo negro, el efecto fotoeléctrico y la precesión del perihelio de Mercurio
  • Experimentar la esencia de la ciencia: «por muy exitoso que sea un modelo, si contradice los experimentos, se ve obligado a ser modificado», y obtener un mapa general de en qué capítulos de la Parte II en adelante se resuelve cada pregunta

4.1 ¿«La física está casi completa»?

🟡 Lina: A finales del siglo XIX, entre los físicos había quienes pensaban: «Todas las leyes fundamentales ya han sido descubiertas. Lo único que queda es mejorar la precisión en los decimales».

🔵 Kai: ¿Tenían tanta confianza?

🟡 Lina: La mecánica de Newton podía explicar desde los planetas hasta los proyectiles. El electromagnetismo de Maxwell unificó la electricidad, el magnetismo y la luz. La termodinámica explicaba los fenómenos térmicos con la entropía. Efectivamente, parecía que casi todos los fenómenos podían explicarse.

🔵 Kai: «Casi» significa que quedaban fenómenos sin explicar, ¿no?

🟡 Lina: Exacto. Se cuenta que el físico británico Lord Kelvin dijo alrededor de 1900: «Solo quedan dos nubes en el cielo de la física». Una era el problema de la velocidad de la luz (el experimento que intentó detectar el «éter», el medio que supuestamente transmitía la luz, fracasó, y no se podía explicar el mecanismo de la velocidad de la luz), y la otra era el problema de la radiación térmica (no se podía explicar el espectro de la radiación del cuerpo negro). Sin embargo, esas «solo dos nubes» resultaron ser el preludio de una enorme tormenta que reescribiría por completo el panorama de la física. El problema de la velocidad de la luz lo trataremos en el próximo Cap. 5, y en este capítulo veremos las tres crisis que enfrentó la física clásica, partiendo del problema de la radiación térmica.

🔵 Kai: Algo que parecía un problema menor resultó ser fatal... Pero, ¿por qué los físicos de la época no pudieron darse cuenta? Si los tres pilares funcionaban bien, ¿no es difícil tomar en serio «solo dos nubes»?

🟡 Lina: Buena pregunta. Ese es un punto muy importante desde la filosofía de la ciencia. Los modelos son todos hipótesis, y por muy exitosos que sean, un solo hecho experimental puede derribarlos. El que «pueda demostrarse que es erróneo mediante un experimento» se llama falsabilidad. La falsabilidad es tanto la fortaleza como la exigencia de la ciencia.

🔵 Kai: Es decir, ¿no se ha «demostrado que es correcto», sino que «simplemente aún no se ha encontrado un error»?

🟡 Lina: Exactamente. Por muy exitoso que sea, siempre existe la posibilidad de que el próximo experimento lo refute. Esa es la actitud de la ciencia.

Nota de filosofía de la ciencia: El optimismo de «la física está casi completa» fue resultado de confundir un modelo con «la verdad». Un modelo no es más que «la mejor hipótesis que aún no ha sido refutada por los experimentos». Si olvidas esta actitud, cuando llega una crisis, la respuesta se retrasa. Ten la capacidad de juzgar por ti mismo.

✅ Verificación de comprensión: ¿Cuáles son los tres modelos que constituían la base para pensar que «la física estaba casi completa» a finales del siglo XIX?

Respuesta

La mecánica de Newton, el electromagnetismo de Maxwell y la termodinámica (mecánica estadística).


4.2 La primera crisis: la divergencia ultravioleta de la radiación del cuerpo negro

Planteamiento del problema

🟡 Lina: Un objeto caliente emite luz. Si calientas hierro, brilla en rojo; si lo calientas más, brilla en blanco. Un objeto idealizado que «absorbe toda la luz que le llega y emite radiación determinada únicamente por su temperatura» se llama cuerpo negro (black body). Una buena aproximación es una cavidad completamente cerrada con un pequeño orificio — la luz que entra por el orificio se refleja muchas veces en las paredes de la cavidad y se absorbe casi por completo. Cuando intentamos calcular el espectro de la «radiación térmica» emitida por este cuerpo negro (cuánta luz de cada frecuencia se emite) usando la física clásica...

🔵 Kai: ¿Qué pasa?

🟡 Lina: A frecuencias altas (el lado ultravioleta) — que la frecuencia sea alta significa que la longitud de onda es corta (recuerda la relación \(c = \lambda\nu\)) — la energía radiada se vuelve infinita. Esto se llama catástrofe ultravioleta (ultraviolet catastrophe). Se llama catástrofe ultravioleta porque «diverge» en el lado «ultravioleta». Mira la Fig. 4.1「Diagrama conceptual del espectro de radiación del cuerpo negro」 — es evidente a simple vista cuánto difieren la predicción de la teoría clásica y los datos experimentales.

%%{init: {"theme": "default", "themeCSS": ".edgePath .path, .flowchart-link { stroke-width: 2px !important; }"}}%%
---
config:
  theme: base
  themeVariables:
    xyChart:
      plotColorPalette: "#e53935, #1e88e5"
---
xychart-beta
    title "Espectro de radiación del cuerpo negro (diagrama conceptual)"
    x-axis "Frecuencia ν →" [0, 1, 2, 3, 4, 5, 6, 7, 8]
    y-axis "Densidad de energía radiada u(ν) →"
    line "Experimento (Planck)" [0, 2, 5, 7, 6, 4, 2, 1, 0.5]
    line "Teoría clásica (Rayleigh-Jeans)" [0, 0.5, 2, 4.5, 8, 12.5, 18, 24.5, 32]

Fig. 4.1: Diagrama conceptual del espectro de radiación del cuerpo negro

La teoría clásica (Rayleigh-Jeans) crece sin límite a frecuencias altas (divergencia ultravioleta). Los datos experimentales disminuyen a frecuencias altas. Planck derivó un espectro que coincide con el experimento asumiendo la cuantización de la energía \(E = h\nu\).

Nota: La frecuencia \(\nu\) y la longitud de onda \(\lambda\) están relacionadas por \(c = \lambda\nu\). Frecuencia alta = longitud de onda corta. El nombre «catástrofe ultravioleta» proviene de que «diverge en el lado ultravioleta (longitud de onda corta = frecuencia alta)».

Derivación de la fórmula de Rayleigh-Jeans

🟡 Lina: Veamos con ecuaciones por qué falla la física clásica. Consideremos ondas electromagnéticas confinadas dentro de una caja cerrada (cavidad). Sea \(L\) la longitud de un lado de la caja. Usaremos las herramientas de la mecánica estadística que aprendimos en Cap. 3.

🔵 Kai: ¿La mecánica estadística aparece aquí?

🟡 Lina: Sí. Primero, Paso 1: Conteo de modos. Pensamos en qué formas puede tomar la onda electromagnética dentro de la caja. Las paredes de la caja son metálicas, así que el campo eléctrico debe ser cero en la posición de las paredes — en el metal hay muchos electrones que se mueven libremente, y si hubiera un campo eléctrico en la superficie de la pared, los electrones serían atraídos por ese campo y se moverían instantáneamente, redistribuyendo las cargas para cancelar el campo original. Por eso el campo eléctrico siempre se mantiene en cero en la superficie metálica. Esto es el reverso de que «el metal conduce electricidad» — precisamente porque los electrones pueden moverse libremente, mantienen el campo eléctrico en cero en la superficie. Que el campo eléctrico sea cero en las paredes significa que las paredes son «nodos» de la onda. Entonces, la onda «va y vuelve» entre las paredes, y la onda que avanza hacia la derecha y la que avanza hacia la izquierda se superponen formando una onda estacionaria (standing wave) — una onda que solo oscila en su lugar sin propagarse. Piensa en una cuerda de guitarra — ambos extremos de la cuerda están fijos (son nodos), así que solo pueden existir ondas que quepan un número entero de semilongitudes de onda en la longitud de la cuerda.

🔵 Kai: Vibración fundamental, segundo armónico, tercer armónico... ¿verdad?

🟡 Lina: Exacto. La condición de que exactamente \(n_x\) semilongitudes de onda \(\lambda_x/2\) quepan en la longitud \(L\) de un lado de la caja es:

\[\frac{L}{\lambda_x/2} = n_x, \quad \frac{L}{\lambda_y/2} = n_y, \quad \frac{L}{\lambda_z/2} = n_z\]

Aquí definimos el número de onda \(k\) como \(k = 2\pi/\lambda\). \(1/\lambda\) representa «cuántos ciclos de onda caben en un metro», y \(k\) es eso multiplicado por \(2\pi\). Es una cantidad que expresa la «finura» espacial de la onda. Sustituyendo \(\lambda_x = 2L/n_x\):

\[k_x = \frac{2\pi}{\lambda_x} = \frac{2\pi}{2L/n_x} = \frac{n_x \pi}{L}\]

De manera similar, \(k_y = n_y\pi/L\), \(k_z = n_z\pi/L\) (\(n_x, n_y, n_z\) son enteros positivos).

🔵 Kai: Es la versión tridimensional de las ondas estacionarias en la cuerda de guitarra.

Modos de ondas estacionarias en una caja y espacio de números de onda

Fig. 4.2: Modos de ondas estacionarias en una caja y espacio de números de onda. Los modos de ondas electromagnéticas permitidos dentro de una cavidad cúbica de lado \(L\) corresponden a puntos de una red en el espacio de números de onda. La forma detallada de contarlos (el factor \(1/8\) y el factor de polarización 2) se explica en el texto.

🟡 Lina: Exacto. Mira la Fig. 4.2「Modos de ondas estacionarias en una caja y espacio de números de onda」. La relación entre la magnitud del número de onda \(k = |\boldsymbol{k}|\) y la frecuencia \(\nu\) es \(k = 2\pi\nu/c\), así que queremos contar el número de modos en el rango de frecuencia de \(\nu\) a \(\nu + d\nu\).

La imagen es así. Consideramos un «espacio de números de onda» con \(k_x, k_y, k_z\) como tres ejes. Los modos permitidos corresponden a los puntos de la red \((k_x, k_y, k_z) = (n_x\pi/L,\; n_y\pi/L,\; n_z\pi/L)\). La separación entre puntos es \(\pi/L\) en cada dirección, así que el volumen que ocupa un punto de la red es \((\pi/L)^3\).

🔵 Kai: Es como un tablero de ajedrez tridimensional.

🟡 Lina: Así es. Las ondas estacionarias tienen la forma \(\sin(n_x\pi x/L)\), así que si cambias \(n_x\) por \(-n_x\), obtienes \(\sin(-n_x\pi x/L) = -\sin(n_x\pi x/L)\) — solo se invierte el signo global, la «forma» de la onda (dónde están los nodos y los antinodos) es la misma. El signo global de la amplitud no tiene significado físico (la intensidad de la onda está determinada por el cuadrado de la amplitud), así que \(n_x\) y \(-n_x\) representan el mismo modo. Por lo tanto, para contar modos independientes basta con tomar solo enteros positivos. Es decir, los puntos de la red solo existen en el «primer octante» del espacio de números de onda (la región donde \(k_x > 0,\; k_y > 0,\; k_z > 0\), uno de los 8 octantes en total). Así que solo contamos \(1/8\) del espacio total. El rango de números de onda correspondiente a frecuencias de \(\nu\) a \(\nu + d\nu\) es una cáscara esférica de radio \(k\) a \(k + dk\). El volumen de esta cáscara esférica es \(4\pi k^2\,dk\). El número de puntos de red en \(1/8\) de ella es:

\[dN = 2 \times \frac{1}{8} \times \frac{4\pi k^2 \, dk}{(\pi/L)^3}\]

Aquí el factor 2 refleja que la polarización de la onda electromagnética — la dirección de oscilación del campo eléctrico — tiene 2 opciones. Como aprendimos en Cap. 2, las ondas electromagnéticas son ondas transversales (ondas cuya dirección de oscilación es perpendicular a la dirección de propagación), y el campo eléctrico oscila en un plano perpendicular a la dirección de propagación. Por ejemplo, si la luz se propaga en la dirección \(z\), el campo eléctrico oscila en el plano \(xy\). En este plano solo hay 2 direcciones independientes: la dirección \(x\) y la dirección \(y\) — una oscilación a 45° se puede expresar como «la suma con igual intensidad de una oscilación en dirección \(x\) y una oscilación en dirección \(y\)», así que no es una nueva dirección independiente. Es igual que como cualquier vector en el plano se puede descomponer en componente \(x\) y componente \(y\). Es decir, para cada número de onda hay 2 modos que difieren por la polarización.

⚪ Mei: Es decir, \((\pi/L)^3\) es el volumen por punto de red en el espacio de números de onda, y se divide el volumen de la cáscara esférica entre eso para obtener el número de puntos. \(1/8\) es para contar solo enteros positivos, y \(\times 2\) es por los grados de libertad de polarización.

🟡 Lina: Así es. Sustituyendo \(k = 2\pi\nu/c\) y transformando con \(dk = (2\pi/c)\,d\nu\):

\[dN = 2 \times \frac{1}{8} \times \frac{4\pi (2\pi\nu/c)^2 \cdot (2\pi/c)\,d\nu}{(\pi/L)^3}\]

Organicemos paso a paso. Primero el factor delantero: \(2 \times \frac{1}{8} \times 4\pi = \pi\). Luego la parte de \(k^2\,dk\): \((2\pi\nu/c)^2 \cdot (2\pi/c)\,d\nu = \frac{4\pi^2\nu^2}{c^2} \cdot \frac{2\pi}{c}\,d\nu = \frac{8\pi^3\nu^2}{c^3}\,d\nu\). El denominador es \((\pi/L)^3 = \pi^3/L^3\). Juntando todo:

\[dN = \pi \times \frac{8\pi^3\nu^2}{c^3}\,d\nu \times \frac{L^3}{\pi^3} = \frac{8\pi\nu^2}{c^3} \cdot L^3 \, d\nu\]

(Verifica que \(\pi \times 8\pi^3 / \pi^3 = 8\pi\).)

Dividiendo entre el volumen de la caja \(V = L^3\), obtenemos la densidad de modos por unidad de volumen \(g(\nu)\):

\[g(\nu)\,d\nu = \frac{8\pi\nu^2}{c^3}\,d\nu\]

🔵 Kai: ¿Hasta aquí solo es un conteo geométrico, sin ninguna hipótesis física?

🟡 Lina: Prácticamente sí. Lo único que se ha usado es la condición de frontera «el campo eléctrico es cero en las paredes» y la propiedad «la onda electromagnética es transversal con 2 direcciones de polarización». Aún no hemos usado ninguna hipótesis de la mecánica estadística.

🔵 Kai: Entiendo que se multiplica por 2 por la polarización. Pero si la luz fuera una onda longitudinal, ¿no habría grados de libertad de polarización y no se pondría el factor 2?

🟡 Lina: Exacto. Para una onda longitudinal como el sonido, la dirección de oscilación es solo una (la dirección de propagación), así que no se pone el factor 2. Es esencial que la onda electromagnética sea transversal.

🟡 Lina: Bien, hasta aquí es un resultado puramente geométrico determinado solo por la forma de la caja y las condiciones de frontera de la onda electromagnética. El problema está en el siguiente paso — cuánta energía se asigna a cada modo.

Paso 2: Aplicación del teorema de equipartición. Según la mecánica estadística de Boltzmann que aprendimos en Cap. 3, en el equilibrio térmico se asigna una energía media de \(\frac{1}{2}k_B T\) a cada grado de libertad. Un modo de la onda electromagnética oscila con el campo eléctrico y el campo magnético intercambiando energía alternadamente. Esto es matemáticamente la misma estructura que un oscilador armónico (harmonic oscillator) — un objeto conectado a un resorte que intercambia alternadamente energía cinética y energía potencial, lo que en física se llama oscilación simple.

🔵 Kai: ¿Qué significa exactamente «matemáticamente la misma estructura»?

🟡 Lina: Si estiras un objeto conectado a un resorte y lo sueltas, el objeto oscila por la fuerza restauradora del resorte (que intenta volver a su posición original). Esta fuerza restauradora es «proporcional a la cantidad que se ha estirado el resorte (el desplazamiento)» — esta es la ley de Hooke. La ecuación de movimiento es \(m\ddot{x} = -\kappa x\), es decir, oscila por una «fuerza restauradora proporcional al desplazamiento» (\(\ddot{x}\) es una notación abreviada que representa la segunda derivada temporal de la posición \(x\), es decir, \(d^2x/dt^2\). La constante del resorte se suele escribir como \(k\) en el bachillerato, pero aquí la escribimos como \(\kappa\) (kappa) para no confundirla con el número de onda \(k\)). Cada modo de la onda electromagnética también, al derivarlo de las ecuaciones de Maxwell, obedece una ecuación de la misma forma para la amplitud del campo eléctrico \(\mathcal{E}(t)\): \(\ddot{\mathcal{E}} = -\omega^2 \mathcal{E}\) (para distinguirla de la energía \(E\), escribimos la amplitud del campo eléctrico como \(\mathcal{E}\)).

🔵 Kai: La misma forma que la ecuación del resorte... pero, ¿por qué la onda electromagnética obedece la misma ecuación que un resorte?

🟡 Lina: Intuitivamente piénsalo así. Una onda estacionaria se puede escribir como el producto de una «forma espacial» y una «oscilación temporal» — por ejemplo, \(\sin(k_x x)\sin(k_y y)\sin(k_z z) \times \mathcal{E}(t)\). La forma espacial está fijada por las condiciones de frontera de las paredes, así que solo la parte temporal \(\mathcal{E}(t)\) se mueve.

🔵 Kai: La forma espacial está determinada como un «molde», y solo la oscilación en la dirección temporal puede moverse libremente, ¿es eso?

🟡 Lina: Exacto. Al sustituir esta forma en la ecuación de ondas \(\nabla^2 f = \frac{1}{c^2}\frac{\partial^2 f}{\partial t^2}\), de la derivada de la parte espacial sale \(-k^2\). La razón es que si derivas \(\sin(k_x x)\) dos veces respecto a \(x\), obtienes \(-k_x^2 \sin(k_x x)\) (al derivar \(\sin\) obtienes \(\cos\), al derivar de nuevo vuelves a \(-\sin\), y cada vez sale \(k_x\) al frente). Lo mismo para las direcciones \(y\) y \(z\), así que al aplicar \(\nabla^2 = \partial^2/\partial x^2 + \partial^2/\partial y^2 + \partial^2/\partial z^2\) se multiplica todo por \(-(k_x^2 + k_y^2 + k_z^2) = -k^2\). La parte temporal debe satisfacer \(\ddot{\mathcal{E}} = -c^2 k^2 \mathcal{E} = -\omega^2 \mathcal{E}\) (donde \(\omega = ck\)). Esto es exactamente la misma forma que la ecuación del resorte, y la solución es \(\sin(\omega t)\) o \(\cos(\omega t)\). Aquí \(\omega = 2\pi\nu\) es la frecuencia angular — la frecuencia \(\nu\) (número de oscilaciones por segundo) multiplicada por \(2\pi\), una cantidad conveniente para escribir ecuaciones. Si la forma de la ecuación es la misma, la estructura energética también es la misma — se divide en «un término correspondiente a la velocidad de oscilación» y «un término correspondiente a la magnitud de la oscilación».

⚪ Mei: Es decir, cada modo de onda estacionaria dentro de la caja es matemáticamente igual a un resorte, y el teorema de equipartición se puede aplicar directamente.

🟡 Lina: Exacto. En el caso del resorte, hay energía cinética \(\frac{1}{2}mv^2\) y energía potencial \(\frac{1}{2}\kappa x^2\). Recuerda el teorema de equipartición que aprendimos en Cap. 3 — era «\(\frac{1}{2}k_BT\) por cada grado de libertad». Aquí, «grado de libertad» se refiere a cada término cuadrático independiente que aparece en la expresión de la energía. En la energía del resorte hay un término \(v^2\) y un término \(x^2\), un total de 2 términos cuadráticos. Así que hay 2 grados de libertad, y a cada uno se le asigna \(\frac{1}{2}k_BT\). Como el resorte tiene un término \(v^2\) y un término \(x^2\), en total se le asigna \(\frac{1}{2}k_BT + \frac{1}{2}k_BT = k_BT\). De manera similar, un modo de la onda electromagnética tiene 2 términos cuadráticos: la energía del campo eléctrico (proporcional al cuadrado de la amplitud — correspondiente al \(\frac{1}{2}\kappa x^2\) del resorte) y la energía del campo magnético (proporcional al cuadrado de la amplitud del campo magnético — correspondiente al \(\frac{1}{2}mv^2\) del resorte). De la misma manera que en el resorte, cuando el desplazamiento es máximo la velocidad es cero (energía potencial máxima, energía cinética cero), en la onda electromagnética cuando el campo eléctrico es máximo el campo magnético es cero, y cuando el campo magnético es máximo el campo eléctrico es cero — ambos oscilan intercambiando energía alternadamente. Por lo tanto, la energía media por modo es:

\[\langle E \rangle = k_B T\]

⚪ Mei: A cada modo se le asigna uniformemente una energía \(k_B T\).

🟡 Lina: Multiplicando esto por la densidad de modos, obtenemos la densidad de energía radiada por unidad de volumen y por unidad de frecuencia \(u(\nu, T)\):

\[\boxed{u(\nu, T) = \frac{8\pi\nu^2}{c^3}\,k_B T}\]

Esta es la fórmula de Rayleigh-Jeans.

🔵 Kai: ¡Como es proporcional a \(\nu^2\), la densidad de energía crece cada vez más al aumentar la frecuencia...!

🟡 Lina: Si integramos sobre todas las frecuencias:

\[U = \int_0^\infty u(\nu, T)\,d\nu = \frac{8\pi k_B T}{c^3}\int_0^\infty \nu^2\,d\nu = \infty\]

La integral diverge. La energía total del campo electromagnético dentro de la caja es infinita — esta es la catástrofe ultravioleta.

¿Por qué fracasa la teoría clásica?

🔵 Kai: Pero el conteo de modos en sí es correcto, ¿no? ¿Dónde estaba el error?

🟡 Lina: El núcleo del problema está en el teorema de equipartición que «asigna uniformemente \(k_B T\) a cada modo».

🔵 Kai: Es decir, ¿como el número de modos aumenta a medida que sube la frecuencia, pero la energía por modo no disminuye, entonces diverge?

🟡 Lina: Perspicaz. Los modos de alta frecuencia existen infinitamente (siguen aumentando como \(g(\nu) \propto \nu^2\)). Si a cada uno le asignas \(k_B T\), el total es obviamente infinito. La física clásica no tiene un «mecanismo para frenar la asignación de energía a los modos de alta frecuencia».

🔵 Kai: En los experimentos la radiación disminuye en el lado de alta frecuencia, pero la teoría clásica no tiene ese freno.

La hipótesis cuántica de Planck

🟡 Lina: En 1900, Planck introdujo una hipótesis revolucionaria para resolver este problema:

La energía de un modo de frecuencia \(\nu\) no es continua, sino que solo puede tomar valores que sean múltiplos enteros de \(h\nu\).

\[E_n = n h\nu \quad (n = 0, 1, 2, 3, \ldots)\]

Donde \(h = 6.626 \times 10^{-34}\;\mathrm{J \cdot s}\) es la constante de Planck.

🔵 Kai: ¿La energía se vuelve «discreta»...? ¿Cómo es que eso evita la divergencia ultravioleta?

🟡 Lina: Veamos en la Fig. 4.3「Cuantización de la energía」 cómo difieren la forma en que se toma la energía en la teoría clásica y en la teoría cuántica.

Cuantización de la energía

Fig. 4.3: Cuantización de la energía. En la teoría clásica (izquierda) la energía puede tomar cualquier valor continuo. En la teoría cuántica (derecha) la energía solo puede tomar múltiplos enteros de \(h\nu\), y los valores intermedios no están permitidos.

🔵 Kai: Entiendo que se vuelve discreta, pero solo con eso aún no me queda claro por qué se suprime el lado de alta frecuencia...

🟡 Lina: Recalculemos la energía media por modo bajo esta hipótesis. Recuerda la distribución de Boltzmann que aprendimos en Cap. 3. En equilibrio térmico a temperatura \(T\), la probabilidad de que se realice un estado con energía \(E_n\) es proporcional a \(e^{-E_n/k_B T}\). Para obtener la probabilidad real, se divide entre la suma de \(e^{-E_n/k_BT}\) para todos los estados (el denominador) para normalizar. La energía media es la suma de «energía de cada estado × su probabilidad»:

\[\langle E \rangle = \frac{\displaystyle\sum_{n=0}^{\infty} n h\nu \, e^{-nh\nu/k_BT}}{\displaystyle\sum_{n=0}^{\infty} e^{-nh\nu/k_BT}}\]

Si definimos \(x = h\nu/k_BT\), cada término del denominador se puede escribir como \(e^{-nh\nu/k_BT} = (e^{-h\nu/k_BT})^n = (e^{-x})^n\). Esta es una serie geométrica infinita con primer término \(1\) (cuando \(n=0\), \((e^{-x})^0 = 1\)) y razón \(r = e^{-x}\) (como \(x > 0\), entonces \(0 < r < 1\)), así que usando la fórmula que se aprende en el bachillerato \(\sum_{n=0}^{\infty} r^n = 1/(1-r)\):

\[\sum_{n=0}^{\infty} e^{-nx} = \sum_{n=0}^{\infty} (e^{-x})^n = \frac{1}{1 - e^{-x}}\]

🔵 Kai: El denominador queda limpio como serie geométrica. ¿Y el numerador?

🟡 Lina: En la serie del numerador, sacando \(h\nu\) como constante, queda \(h\nu \sum_{n=0}^{\infty} n\,e^{-nx}\). Calcular directamente \(\sum n\,e^{-nx}\) que queda es difícil, pero hay un truco ingenioso. Lo que queremos es «una serie con \(n\) multiplicado», ¿verdad? Aquí cambiamos la perspectiva — en lugar de «multiplicar \(n\) nosotros mismos», buscamos «una operación que haga aparecer \(n\) naturalmente». Resulta que si derivas \(e^{-nx}\) respecto a \(x\), obtienes \(-n\,e^{-nx}\) — como el exponente tiene \(-nx\), al derivar el \(-n\) baja al frente (igual que al derivar \(e^{ax}\) obtienes \(a\,e^{ax}\)). Es decir, con solo derivar, el \(n\) aparece al frente. Entonces, si derivamos respecto a \(x\) cada término de la serie del denominador \(\sum e^{-nx}\) que ya calculamos y los sumamos (para sumas finitas, «la derivada de la suma = la suma de las derivadas» se cumple trivialmente, ¿verdad?), la serie con \(n\) multiplicado se obtiene automáticamente. Concretamente, al derivar cada término de \(\sum_{n=0}^{\infty} e^{-nx}\) respecto a \(x\):

\[\frac{d}{dx}e^{-nx} = -n\,e^{-nx}\]

Así que al derivar toda la serie obtenemos \(\sum(-n)e^{-nx}\). Invirtiendo el signo, obtenemos \(\sum n\,e^{-nx}\):

\[\sum_{n=0}^{\infty} n\,e^{-nx} = -\frac{d}{dx}\sum_{n=0}^{\infty} e^{-nx} = -\frac{d}{dx}\frac{1}{1-e^{-x}}\]

⚪ Mei: Solo con derivar un resultado conocido se obtiene una nueva serie. Un truco inteligente.

🟡 Lina: Aquí derivamos \(f(x) = (1-e^{-x})^{-1}\). Si definimos \(u = 1-e^{-x}\), la derivada de \(e^{-x}\) es \(-e^{-x}\), así que \(du/dx = 0 - (-e^{-x}) = e^{-x}\). Por la regla de la cadena \(df/dx = (df/du)(du/dx)\):

\[f'(x) = -\frac{1}{u^2}\cdot e^{-x} = -\frac{e^{-x}}{(1-e^{-x})^2}\]

Por lo tanto:

\[\sum_{n=0}^{\infty} n\,e^{-nx} = -f'(x) = \frac{e^{-x}}{(1-e^{-x})^2}\]

🔵 Kai: Ya veo, al derivar cada término aparece \(-n\) al frente, así que con solo derivar la suma de la serie se obtiene \(\sum n\,e^{-nx}\). Pero, ¿está bien derivar término a término una suma infinita?

🟡 Lina: Buena pregunta. Primero piénsalo con sumas finitas. Por ejemplo, si derivas \(S_3(x) = 1 + e^{-x} + e^{-2x} + e^{-3x}\) respecto a \(x\), obtienes \(S_3'(x) = 0 + (-1)e^{-x} + (-2)e^{-2x} + (-3)e^{-3x}\) — solo derivas cada término y sumas. Aunque hagas \(N\) más grande, puedes hacer lo mismo. Como \(e^{-nx}\) tiende a cero rápidamente cuando \(n\) es grande, la contribución de los términos lejanos es cada vez más pequeña. Por eso el resultado de la suma finita se traslada directamente a la suma infinita. Estrictamente, existen condiciones matemáticas para «poder derivar todos los términos simultáneamente en una suma infinita», pero intuitivamente puedes pensar que «si los términos de la cola tienden a cero suficientemente rápido, está bien». Las series que decaen exponencialmente como esta satisfacen exactamente esa condición. En física se usa frecuentemente el truco de «derivar un resultado conocido para obtener un nuevo resultado».

Por lo tanto, el numerador es \(h\nu \cdot \frac{e^{-x}}{(1-e^{-x})^2}\) y el denominador es \(\frac{1}{1-e^{-x}}\). La energía media es numerador ÷ denominador:

\[\langle E \rangle = h\nu \cdot \frac{e^{-x}}{(1-e^{-x})^2} \div \frac{1}{1-e^{-x}} = h\nu \cdot \frac{e^{-x}}{(1-e^{-x})^2} \cdot \frac{1-e^{-x}}{1} = h\nu \cdot \frac{e^{-x}}{1-e^{-x}}\]

(En la última igualdad, uno de los \((1-e^{-x})\) del denominador \((1-e^{-x})^2\) se simplificó con el \((1-e^{-x})\) del numerador.)

Multiplicando numerador y denominador por \(e^{x}\) (numerador: \(e^{-x} \times e^x = 1\), denominador: \((1-e^{-x}) \times e^x = e^x - 1\)):

\[\langle E \rangle = h\nu \cdot \frac{1}{e^{x}-1} = \frac{h\nu}{e^{h\nu/k_BT} - 1}\]

🔵 Kai: ¡El \(k_B T\) de la teoría clásica se ha reemplazado por \(\dfrac{h\nu}{e^{h\nu/k_BT} - 1}\)! Pero, ¿realmente desaparece la divergencia ultravioleta con esto?

🟡 Lina: Multiplicando esto por la densidad de modos se obtiene la fórmula de radiación de Planck:

\[\boxed{u(\nu, T) = \frac{8\pi\nu^2}{c^3} \cdot \frac{h\nu}{e^{h\nu/k_BT} - 1}}\]

Límites de baja y alta frecuencia

Energía media de la distribución de Planck

Fig. 4.4: Energía media de la distribución de Planck. Energía media por modo. En la teoría clásica (equipartición) es uniformemente \(k_BT\), pero con la hipótesis cuántica de Planck decae exponencialmente a altas frecuencias.

🟡 Lina: Mira la Fig. 4.4「Energía media de la distribución de Planck」. Confirmemos que esta fórmula es consistente con la teoría clásica.

Límite de baja frecuencia (\(h\nu \ll k_BT\)): Desarrollando la exponencial en serie de Taylor, \(e^{h\nu/k_BT} \approx 1 + h\nu/k_BT\), así que:

\[\frac{h\nu}{e^{h\nu/k_BT} - 1} \approx \frac{h\nu}{h\nu/k_BT} = k_BT\]

Coincide con la fórmula de Rayleigh-Jeans. La teoría clásica era una aproximación correcta a bajas frecuencias.

🔵 Kai: ¡Oh, contiene correctamente la teoría clásica! ¿Y el lado de alta frecuencia?

🟡 Lina: Límite de alta frecuencia (\(h\nu \gg k_BT\)): Como \(e^{h\nu/k_BT} \gg 1\):

\[\frac{h\nu}{e^{h\nu/k_BT} - 1} \approx h\nu \, e^{-h\nu/k_BT} \to 0\]

Decae exponencialmente. Este es el «freno» que evita la divergencia ultravioleta. Físicamente, cuando \(h\nu\) es mayor que \(k_BT\), la energía de un solo cuanto es demasiado grande comparada con la energía térmica, y ese modo no puede excitarse. Por eso la radiación del lado de alta frecuencia se suprime.

⚪ Mei: Es decir, a bajas frecuencias la energía de un cuanto es pequeña y se comporta según la teoría clásica, pero a altas frecuencias la energía de un cuanto es demasiado grande y se «congela». La frontera está alrededor de \(h\nu \sim k_BT\).

🟡 Lina: Exacto. La fórmula de Planck da un valor finito al integrarse sobre todas las frecuencias:

\[U = \int_0^\infty u(\nu, T)\,d\nu = \frac{8\pi^5 k_B^4}{15 c^3 h^3}\,T^4 \propto T^4\]

(Esta integral se puede calcular con el cambio de variable \(x = h\nu/k_BT\), y el resultado es finito.) Esto coincide con la ley de Stefan-Boltzmann (ver Cap. 3).

📝 Ejercicios:

✅ Verificación de comprensión: ¿Qué es la catástrofe ultravioleta (ultraviolet catastrophe)?

Respuesta

El problema de que al calcular el espectro de la radiación del cuerpo negro con la teoría clásica, la energía radiada diverge a infinito en altas frecuencias (lado ultravioleta).

✅ Verificación de comprensión: ¿Cuál fue la hipótesis que Planck introdujo para resolver este problema, y cuál es su ecuación?

Respuesta

La hipótesis de que la energía no es continua sino que toma valores discretos. La ecuación es \(E = nh\nu\) (\(h\) es la constante de Planck, \(\nu\) es la frecuencia, \(n\) es un entero no negativo). La energía por cuanto es \(E = h\nu\).

✅ Verificación de comprensión: Demuestra mediante una operación de límite en la ecuación que la fórmula de radiación de Planck coincide con la fórmula de Rayleigh-Jeans a bajas frecuencias.

Respuesta

Cuando \(h\nu \ll k_BT\), \(e^{h\nu/k_BT} \approx 1 + h\nu/k_BT\), así que \(h\nu/(e^{h\nu/k_BT}-1) \approx k_BT\). Sustituyendo esto se obtiene \(u(\nu,T) \approx (8\pi\nu^2/c^3)k_BT\), que coincide con la fórmula de Rayleigh-Jeans.


4.3 La segunda crisis: el efecto fotoeléctrico

Contradicción entre la predicción de la teoría ondulatoria clásica y el experimento

🟡 Lina: Cuando se ilumina un metal con luz, los electrones salen disparados — el efecto fotoeléctrico. En la teoría ondulatoria clásica, la energía de la luz es proporcional al cuadrado de la amplitud (es decir, la intensidad), por lo que predice:

  1. Si se aumenta la intensidad de la luz, la energía de los electrones emitidos aumenta
  2. Con cualquier frecuencia de luz, si es suficientemente intensa, se pueden arrancar electrones
  3. Con luz débil, los electrones necesitan tiempo para acumular energía

🔵 Kai: ¿Los resultados experimentales son diferentes?

🟡 Lina: Completamente diferentes. Lo que mostró el experimento fue:

  1. La energía máxima de los electrones emitidos depende solo de la frecuencia de la luz, no de la intensidad
  2. Si la frecuencia no supera un cierto umbral \(\nu_0\), no importa cuán intensa sea la luz, los electrones no salen
  3. Si la luz supera el umbral, los electrones salen instantáneamente sin importar cuán débil sea

⚪ Mei: Las predicciones de la teoría clásica contradicen el experimento en los tres puntos. Organizándolo queda como en Tabla 4.1「Efecto fotoeléctrico」.

Tabla 4.1: Efecto fotoeléctrico: predicción de la teoría ondulatoria clásica vs hechos experimentales

Aspecto Predicción de la teoría ondulatoria clásica Hecho experimental
Factor determinante de la energía Intensidad de la luz (cuadrado de la amplitud) Frecuencia de la luz
Frecuencia umbral No existe (cualquier cosa sirve si es suficientemente intensa) Existe (\(\nu < \nu_0\) es imposible)
Momento de emisión del electrón Con luz débil toma tiempo acumular Emisión instantánea incluso con luz débil

✅ Verificación de comprensión: Menciona un punto en el que la predicción de la teoría ondulatoria clásica contradice el resultado experimental respecto al efecto fotoeléctrico.

Respuesta

Ejemplo: La teoría clásica predice que al aumentar la intensidad de la luz aumenta la energía de los electrones, pero experimentalmente la energía máxima de los electrones emitidos depende solo de la frecuencia de la luz y no de la intensidad. (También contradicen la existencia de la frecuencia umbral y la emisión instantánea de electrones incluso con luz débil.)

La hipótesis del cuanto de luz de Einstein y derivación de la ecuación

🟡 Lina: En 1905, Einstein llevó la hipótesis cuántica de Planck aún más lejos. Planck dijo que «la energía de los osciladores de las paredes es discreta», pero Einstein afirmó que la luz misma es un conjunto de partículas (cuantos de luz, llamados más tarde fotones, photon) con energía \(h\nu\).

Un cuanto de luz colisiona con un electrón dentro del metal. Para que el electrón escape del metal, debe superar la energía de enlace \(W\) dentro del metal (la función de trabajo, work function). Escribiendo la conservación de la energía:

\[(\text{energía del cuanto de luz}) = (\text{energía para arrancar el electrón}) + (\text{energía cinética del electrón emitido})\]
\[h\nu = W + E_{\text{cin}}\]

Mira la Fig. 4.5「Configuración experimental del efecto fotoeléctrico y modelo del cuanto de luz」. Es un diagrama de cómo un cuanto de luz entrega su energía a un electrón.

Configuración experimental del efecto fotoeléctrico y modelo del cuanto de luz

Fig. 4.5: Configuración experimental del efecto fotoeléctrico y modelo del cuanto de luz. Un cuanto de luz (energía \(h\nu\)) colisiona con un electrón en la superficie metálica, y la energía que supera la función de trabajo \(W\) se convierte en energía cinética del electrón.

El valor máximo de la energía cinética del electrón emitido \(E_{\text{max}}\) corresponde al caso en que el electrón está justo cerca de la superficie del metal y puede escapar con el mínimo de energía:

\[\boxed{E_{\text{max}} = h\nu - W}\]

🔵 Kai: ¡Qué simple...! Solo se resta la función de trabajo de la energía del cuanto de luz.

🟡 Lina: Con esta ecuación se explican todos los hechos experimentales.

Derivación de la frecuencia umbral: Para que el electrón salga se necesita \(E_{\text{max}} \geq 0\):

\[h\nu - W \geq 0\]
\[\nu \geq \frac{W}{h} \equiv \nu_0\]

Si la frecuencia no supera \(\nu_0 = W/h\), el electrón no sale. Esta es la frecuencia umbral.

Explicación de la dependencia con la intensidad: Al aumentar la intensidad de la luz, aumenta el número de cuantos de luz. Pero la energía por cuanto \(h\nu\) no cambia. Así que aumenta el número de electrones emitidos, pero la energía máxima por electrón no cambia.

🔵 Kai: Luz intensa = solo hay más partículas, pero la fuerza de impacto de cada una es la misma.

🟡 Lina: Buena analogía. Para decirlo de forma más cotidiana, piensa en el granizo. Que el capó del coche se abolle depende del tamaño de cada grano de granizo, no de la cantidad total.

⚪ Mei: Entiendo. La intensidad de la luz corresponde a la cantidad total de granizo, y la energía de un cuanto de luz corresponde al tamaño de un grano individual.

🟡 Lina: Exacto. Si graficamos \(E_{\text{max}}\) como función de \(\nu\) (Fig. 4.6「Relación lineal del efecto fotoeléctrico」):

\[E_{\text{max}} = h\nu - W\]

Relación lineal del efecto fotoeléctrico

Fig. 4.6: Relación lineal del efecto fotoeléctrico. La energía cinética máxima \(E_{\mathrm{max}}\) de los electrones emitidos es una línea recta proporcional a la frecuencia \(\nu\), donde la pendiente da la constante de Planck \(h\) y la intersección con el eje \(\nu\) da la frecuencia umbral \(\nu_0 = W/h\).

🟡 Lina: Es una recta con pendiente \(h\) e intersección \(-W\). En 1916, Millikan confirmó con precisión esta relación lineal y midió independientemente el valor de la constante de Planck \(h\). La hipótesis del cuanto de luz de Einstein fue brillantemente verificada.

¿Por qué falla la teoría clásica?

🟡 Lina: En la teoría ondulatoria clásica, la energía de la luz fluye continuamente hacia la superficie metálica, proporcional al cuadrado de la amplitud de la onda. El electrón acumula esta energía lentamente y, cuando ha acumulado suficiente, sale — ese es el escenario.

Estimemos el tiempo de acumulación con la teoría clásica. Suponiendo que la sección transversal del electrón es del tamaño atómico \(\sim (10^{-10}\;\mathrm{m})^2 = 10^{-20}\;\mathrm{m^2}\) y una intensidad de luz típica \(I \sim 1\;\mathrm{W/m^2}\), la potencia que recibe el electrón es:

\[P = I \times A \sim 1 \times 10^{-20} = 10^{-20}\;\mathrm{W}\]

El tiempo necesario para acumular la energía de la función de trabajo \(W \sim 4\;\mathrm{eV} = 6.4 \times 10^{-19}\;\mathrm{J}\) es:

\[t = \frac{W}{P} \sim \frac{6.4 \times 10^{-19}}{10^{-20}} \sim 64\;\mathrm{s}\]

🔵 Kai: El cálculo da más de un minuto. Pero en el experimento salen instantáneamente.

🟡 Lina: En los experimentos los electrones se emiten en menos de \(10^{-9}\;\mathrm{s}\). La discrepancia con la predicción clásica es de más de 10 órdenes de magnitud. Esto no es un «problema de precisión», sino que significa que el mecanismo es fundamentalmente diferente.

✅ Verificación de comprensión: Cuando se intenta explicar el efecto fotoeléctrico con la teoría ondulatoria clásica, se estima que la emisión del electrón tarda unos 64 segundos. ¿Cuánto difiere del resultado experimental?

Respuesta

En los experimentos los electrones se emiten en menos de \(10^{-9}\) segundos, así que hay una discrepancia de más de 10 órdenes de magnitud con la predicción clásica. Esto no es un problema de precisión, sino que muestra que el mecanismo clásico de que la energía de la luz fluye continuamente es en sí mismo erróneo.

El tratamiento detallado de este problema desde la mecánica cuántica se aborda en Mecánica Cuántica en Mecánica Cuántica Cap. 1.

📝 Ejercicios:

✅ Verificación de comprensión: En el efecto fotoeléctrico, ¿qué determina si el electrón sale o no: la intensidad de la luz o la frecuencia?

Respuesta

La frecuencia de la luz. Si la frecuencia no supera cierto umbral, no importa cuánto se aumente la intensidad, los electrones no salen.

✅ Verificación de comprensión: ¿Cómo trató Einstein la luz para explicar el efecto fotoeléctrico? Además, escribe la ecuación de la energía cinética máxima del electrón emitido.

Respuesta

Trató la luz como partículas (cuantos de luz) con energía \(E = h\nu\). La energía cinética máxima del electrón emitido es \(E_{\text{max}} = h\nu - W\) (\(W\) es la función de trabajo).


4.4 La tercera crisis: la precesión del perihelio de Mercurio

Discrepancia entre la predicción del modelo de Newton y la observación

🟡 Lina: La órbita de Mercurio es una elipse, pero la elipse misma gira lentamente (precesión del perihelio). Mira la Fig. 4.7「Precesión del perihelio de Mercurio」. Incluso calculando toda la influencia de los demás planetas con el modelo de Newton, queda un desfase de 43 segundos de arco por siglo respecto al valor observado.

Precesión del perihelio de Mercurio

Fig. 4.7: Precesión del perihelio de Mercurio. La órbita elíptica de Mercurio rota ligeramente con cada revolución (precesión del perihelio). El desfase de 43 segundos de arco por siglo que el modelo de Newton no puede explicar es predicho exactamente por la relatividad general.

🔵 Kai: 43 segundos de arco es extremadamente pequeño, ¿verdad?

🟡 Lina: En las unidades de ángulo hay «minutos» y «segundos» por debajo de «grados». 1 grado = 60 minutos, 1 minuto = 60 segundos, así que 1 segundo de arco es \(60 \times 60 = 3600\) veces menor que un grado. 43 segundos de arco son aproximadamente 0.012 grados — si extiendes el brazo, el diámetro de una moneda de 1 yen es de unos 1 grado, así que es alrededor de una centésima parte de eso. Es lo que se acumula en 100 años. Ciertamente es pequeño. Pero considerando la precisión del modelo de Newton, es un desfase inexplicable.

Veamos los números concretos. Comparando el valor observado de la precesión del perihelio de Mercurio con los valores calculados de las perturbaciones de cada planeta según el modelo de Newton (Tabla 4.2「Desglose de las contribuciones a la precesión del perihelio de Mercurio」):

Tabla 4.2: Desglose de las contribuciones a la precesión del perihelio de Mercurio

Causa Precesión del perihelio (segundos de arco/siglo)
Perturbación por Venus 277.9
Perturbación por Júpiter 153.6
Perturbación por la Tierra 90.0
Otros planetas 10.5
Total del modelo de Newton 532.0
Valor observado 575.0
Diferencia (desfase inexplicable) 43.0

⚪ Mei: Si restamos la predicción del modelo de Newton del valor observado, quedan exactamente 43 segundos de arco.

La hipótesis de Vulcano de Le Verrier

🟡 Lina: En 1859, el astrónomo francés Le Verrier descubrió este desfase. Intentó la misma estrategia que aprendimos en Cap. 1 con el descubrimiento de Neptuno — «¿no habrá un planeta desconocido en el interior de la órbita de Mercurio?»

🔵 Kai: Con Neptuno funcionó, ¿verdad?

🟡 Lina: Sí. A partir del desfase en la órbita de Urano se predijo la existencia de un planeta desconocido (Neptuno), y efectivamente fue descubierto. Le Verrier, con la misma lógica, predijo que había un planeta llamado «Vulcano» en el interior de la órbita de Mercurio.

🔵 Kai: Y entonces, ¿se encontró Vulcano?

🟡 Lina: Lo buscaron durante décadas pero no lo encontraron. Esta es una lección importante. Con Neptuno, se pudo resolver con «el modelo es correcto, hay un elemento desconocido». Pero esta vez, era necesario modificar el modelo mismo.

Resolución mediante la relatividad general (presentación del resultado)

🟡 Lina: En 1915, la teoría de la relatividad general de Einstein explicó exactamente este desfase de 43 segundos de arco sin parámetros adicionales. Mostrando solo el resultado:

\[\boxed{\Delta\phi = \frac{6\pi G M}{c^2 a(1-e^2)}}\]

Esta es la cantidad de precesión del perihelio (en radianes) por revolución. Donde: - \(G\): constante de gravitación universal - \(M\): masa del Sol - \(c\): velocidad de la luz - \(a\): semieje mayor de la órbita de Mercurio (el radio mayor de la elipse — corresponde al promedio de la distancia más cercana y la más lejana al Sol) - \(e\): excentricidad orbital de Mercurio (una cantidad adimensional que representa cuán «aplastada» está la elipse. Si \(e = 0\) es un círculo perfecto, cuanto más se acerca \(e\) a 1, más alargada es la elipse. Mercurio tiene \(e \approx 0.206\), siendo de las más elípticas entre los planetas del sistema solar)

🔵 Kai: ¿De dónde viene esta fórmula?

🟡 Lina: Se deriva de la solución de Schwarzschild de la relatividad general (la geometría del espacio-tiempo alrededor de una masa con simetría esférica). La derivación requiere resolver la ecuación de las geodésicas en un espacio-tiempo curvo, así que la dejamos para Cap. 6. →Para más detalles ver Relatividad General en Relatividad General Cap. 10.

Sin embargo, el «significado» de esta fórmula se puede leer incluso en esta etapa.

🔵 Kai: Aparece la combinación \(GM/c^2\), ¿qué representa?

🟡 Lina: Buena pregunta. \(R_s = 2GM/c^2\) se llama el radio de Schwarzschild (Schwarzschild radius). Intuitivamente, corresponde al radio en el que la velocidad de escape desde la superficie de un cuerpo celeste iguala la velocidad de la luz \(c\) en la mecánica de Newton.

🔵 Kai: La velocidad de escape es la velocidad necesaria para que un cohete se libere de la gravedad terrestre, ¿verdad?

🟡 Lina: Sí. Se puede derivar con la conservación de la energía. Considera un objeto lanzado con velocidad \(v\) desde la superficie de un cuerpo celeste de radio \(r\). La energía cinética en la superficie es \(\frac{1}{2}mv^2\), la energía potencial gravitatoria es \(-\frac{GMm}{r}\).

🔵 Kai: ¿Por qué la energía potencial es negativa?

🟡 Lina: Porque se toma el infinito (donde la influencia gravitatoria desaparece) como referencia cero. Como la gravedad se debilita a medida que aumenta la distancia y se hace completamente cero en el infinito, es natural tomar ese punto como «sin enlace = energía cero». Cuanto más cerca del cuerpo celeste, más enlazado por la gravedad — es decir, la energía es menor — por eso es negativa. El valor \(-GMm/r\) es el trabajo (energía) necesario para llevar el objeto desde la distancia \(r\) hasta el infinito contra la fuerza gravitatoria \(F = GMm/r^2\), con signo negativo. Como la fuerza se debilita con la distancia, el trabajo para llegar al infinito converge a un valor finito (\(\int_r^\infty GMm/r'^2\,dr' = GMm/r\) — como el integrando es \(1/r'^2\), la primitiva es \(-1/r'\). A diferencia del trabajo con fuerza constante \(F \times d\) que se aprende en el bachillerato, cuando la fuerza varía se necesita una integral, pero basta con recordar el resultado).

⚪ Mei: Es decir, si «el infinito es cero», todos los estados enlazados son negativos — intuitivamente es la imagen de «estar en un pozo».

🟡 Lina: Exacto. La condición de que justo en el infinito la velocidad sea cero — es decir, que la energía total (energía cinética + energía potencial) sea exactamente cero — es \(\frac{1}{2}mv^2 - \frac{GMm}{r} = 0\), es decir \(\frac{1}{2}mv^2 = \frac{GMm}{r}\). Cancelando \(m\) se obtiene \(v = \sqrt{2GM/r}\), que es la velocidad de escape. Poniendo \(v = c\) y resolviendo para \(r\): \(r = 2GM/c^2 = R_s\) (la derivación rigurosa requiere relatividad general, pero como escala esta estimación es correcta).

🔵 Kai: Ya veo, el radio en el que la velocidad de escape iguala la velocidad de la luz es \(R_s\).

🟡 Lina: El \(GM/c^2\) que aparece en la fórmula de la precesión del perihelio corresponde a \(R_s/2\). Aquí lo usamos como una regla para medir «cuán fuerte es el efecto relativista de la gravedad». Cuanto mayor sea \(R_s\) comparado con el radio orbital, mayor será la desviación respecto al modelo de Newton. Para el Sol, \(R_s \approx 3\;\mathrm{km}\). Comparándolo con el radio orbital de Mercurio \(a \approx 5.8 \times 10^7\;\mathrm{km}\):

\[\frac{R_s}{a} \approx \frac{3}{5.8 \times 10^7} \approx 5 \times 10^{-8}\]

🔵 Kai: 5 cienmillonésimas... increíblemente pequeño.

🟡 Lina: Por eso la desviación de la precesión del perihelio también es pequeña. Pero la acumulación de 100 años da 43 segundos de arco, detectable con la astronomía de precisión del siglo XIX. Sustituyamos los valores numéricos:

Sustituyendo los valores numéricos en unidades SI (m, kg, s):

\[\Delta\phi = \frac{6\pi \times (6.67 \times 10^{-11}\;\mathrm{m^3\,kg^{-1}\,s^{-2}}) \times (1.99 \times 10^{30}\;\mathrm{kg})}{(3.0 \times 10^8\;\mathrm{m/s})^2 \times (5.79 \times 10^{10}\;\mathrm{m}) \times (1 - 0.2056^2)}\]

Calculando el numerador:

\[6\pi \times 6.67 \times 10^{-11} \times 1.99 \times 10^{30} = 6\pi \times 1.33 \times 10^{20} \approx 2.50 \times 10^{21}\]

Calculando el denominador (\(1 - e^2 = 1 - 0.2056^2 = 1 - 0.0423 = 0.9577\)):

\[9.0 \times 10^{16} \times 5.79 \times 10^{10} \times 0.9577 \approx 4.99 \times 10^{27}\]

Por lo tanto:

\[\Delta\phi \approx \frac{2.50 \times 10^{21}}{4.99 \times 10^{27}} \approx 5.01 \times 10^{-7}\;\mathrm{rad/revolución}\]

El período orbital de Mercurio es de unos 0.241 años, así que el número de revoluciones en 100 años es \(100/0.241 \approx 415\) vueltas. La acumulación en 100 años:

\[\Delta\phi_{\text{100 años}} \approx 5.01 \times 10^{-7} \times 415 \approx 2.08 \times 10^{-4}\;\mathrm{rad}\]

Convirtiendo a segundos de arco (\(1\;\mathrm{rad} = 180°/\pi \approx 57.3°\), \(1° = 3600\;\text{segundos de arco}\), por lo que \(1\;\mathrm{rad} = 57.3 \times 3600 \approx 206265\;\text{segundos de arco}\)):

\[\Delta\phi_{\text{100 años}} \approx 2.08 \times 10^{-4} \times 206265 \approx 43\;\text{segundos de arco}\]

🔵 Kai: ¡Exactamente 43 segundos de arco! Increíble... Además, todos los números que aparecen en la fórmula son valores ya conocidos de antemano, como la masa del Sol o la órbita de Mercurio. No hay un «ajusté esto para que coincidiera».

🟡 Lina: Exacto. «Coincide con el valor experimental sin ajustar parámetros» — eso es lo que hace definitiva la capacidad de convicción de una teoría.

⚪ Mei: La proporción extremadamente pequeña \(R_s/a \sim 10^{-8}\) se convierte en una cantidad detectable gracias a la acumulación de 415 revoluciones y la conversión a ángulos. Incluso un efecto pequeño puede captarse con mediciones de precisión.

🟡 Lina: Este fue el primer éxito cuantitativo de la relatividad general. El propio Einstein contó que cuando obtuvo este resultado, «durante varios días no pude dormir de la emoción».

Revisión del modelo vs adición de parámetros

🔵 Kai: El mismo método que funcionó con Neptuno no funcionó esta vez. ¿Qué fue diferente?

🟡 Lina: Buena pregunta. Comparando el descubrimiento de Neptuno con la precesión del perihelio de Mercurio, se ve un punto muy importante desde la filosofía de la ciencia. Mira Tabla 4.3「Comparación entre el descubrimiento de Neptuno y la precesión del perihelio」 y Fig. 4.8「Dos caminos cuando la observación no coincide con el modelo」.

Tabla 4.3: Comparación entre el descubrimiento de Neptuno y la precesión del perihelio

Descubrimiento de Neptuno Precesión del perihelio de Mercurio
Problema Desfase en la órbita de Urano Desfase en la órbita de Mercurio
Solución intentada Suponer un planeta desconocido Suponer un planeta desconocido (Vulcano)
Resultado Éxito (descubrimiento de Neptuno) Fracaso (Vulcano no existe)
Solución verdadera Resuelta dentro del modelo Modificación del modelo mismo (relatividad general)
%%{init: {"theme": "default", "themeCSS": ".edgePath .path, .flowchart-link { stroke-width: 2px !important; }"}}%%
flowchart TD
    A["La observación no coincide con el modelo"] --> B{"¿Se puede resolver dentro del modelo?"}
    B -->|"Sí"| C["Añadir elementos desconocidos<br>(ajuste de parámetros)"]
    B -->|"No"| D["Modificar el modelo mismo<br>(cambio de paradigma)"]
    C --> E["✅ Descubrimiento de Neptuno<br>Resuelto dentro del modelo de Newton"]
    C --> F["❌ Hipótesis de Vulcano<br>No existía"]
    F --> D
    D --> G["✅ Relatividad general<br>Reemplaza el modelo de Newton"]

    style E fill:#c8e6c9
    style F fill:#ffcdd2
    style G fill:#c8e6c9

Fig. 4.8: Dos caminos cuando la observación no coincide con el modelo

🟡 Lina: «Cuando la predicción de un modelo no coincide, ¿se ajustan los parámetros dentro del modelo o se modifica el modelo mismo?» — esta decisión es una de las partes más difíciles de la ciencia. La respuesta correcta no se conoce de antemano. Se va esclareciendo poco a poco a través del diálogo entre experimento y teoría.

✅ Verificación de comprensión: Le Verrier intentó la misma estrategia que en el descubrimiento de Neptuno para explicar el desfase en la precesión del perihelio de Mercurio. ¿Cuál fue esa estrategia y por qué fracasó esta vez?

Respuesta

La estrategia de suponer que existe un planeta desconocido (Vulcano) en el interior de la órbita de Mercurio. Con Neptuno, se pudo resolver añadiendo un elemento desconocido dentro del modelo (mecánica de Newton), pero esta vez Vulcano no existía, por lo que la resolución dentro del modelo era imposible. La verdadera solución requería la modificación del modelo mismo (transición a la relatividad general).

📝 Ejercicios:

✅ Verificación de comprensión: ¿Cuánto es el desfase en la precesión del perihelio de Mercurio que el modelo de Newton no pudo explicar?

Respuesta

43 segundos de arco por siglo.

✅ Verificación de comprensión: ¿Qué modelo explicó este desfase de 43 segundos de arco sin parámetros adicionales?

Respuesta

La teoría de la relatividad general de Einstein (1915).


4.5 Mapa general de las preguntas abiertas

🟡 Lina: Aquí organicemos las preguntas que quedaron de los 3 capítulos anteriores y las nuevas que nacieron en este capítulo. Este será el mapa para la Parte II en adelante. Primero mira la figura que muestra las tres crisis de un vistazo (Fig. 4.9「Las tres crisis de la física clásica」).

Las tres crisis de la física clásica

Fig. 4.9: Las tres crisis de la física clásica. ① Divergencia ultravioleta de la radiación del cuerpo negro (la densidad de energía diverge a frecuencias altas en la teoría clásica), ② Frecuencia umbral del efecto fotoeléctrico (naturaleza corpuscular de la luz), ③ Precesión del perihelio de Mercurio (desfase de 43 segundos de arco/siglo inexplicable con el modelo de Newton).

⚪ Mei: Si resumimos las tres crisis en una tabla comparativa, queda como Tabla 4.4「Comparación de las tres crisis de la física clásica」.

Tabla 4.4: Comparación de las tres crisis de la física clásica

Crisis Predicción de la teoría clásica Hecho experimental Teoría que la resolvió
Radiación del cuerpo negro La densidad de energía diverge a altas frecuencias Disminuye a altas frecuencias Hipótesis cuántica de Planck (\(E = nh\nu\))
Efecto fotoeléctrico La intensidad de la luz determina la energía La frecuencia determina la energía Hipótesis del cuanto de luz de Einstein
Precesión del perihelio de Mercurio Las perturbaciones de otros planetas lo explican todo Queda un desfase de 43 seg. de arco/siglo Relatividad general de Einstein

🔵 Kai: Queda bien organizado. Pero la radiación del cuerpo negro y el efecto fotoeléctrico son ambos sobre «cuántica», mientras que Mercurio parece ir en una dirección diferente.

🟡 Lina: Buena observación. Al organizarlo, se ve que las tres crisis exigen revoluciones en direcciones diferentes. La radiación del cuerpo negro y el efecto fotoeléctrico sugieren la «discretización de la energía» y conducen a la mecánica cuántica. La precesión del perihelio de Mercurio sugiere la «geometría del espacio-tiempo» y conduce a la relatividad general. Y el problema de la velocidad de la luz conduce a la relatividad especial. En otras palabras, la mecánica cuántica cambia «qué es continuo y qué es discreto», y la relatividad cambia «la forma del espacio-tiempo mismo» — como lo que se modifica es diferente, se desarrollaron como teorías separadas.

⚪ Mei: Es decir, de las tres crisis, dos van en la dirección de la «discretización» y una en la dirección de la «geometría»; como lo que se modifica es diferente, se convirtieron en teorías separadas.

Tabla 4.5: Correspondencia entre preguntas abiertas y dónde se resuelven

Pregunta Dónde se resuelve
¿Por qué la velocidad de la luz es la misma para todos los observadores? (Cap. 2) Cap. 5 Relatividad especial
¿Cuál es la naturaleza de la gravedad? ¿Y la precesión del perihelio de Mercurio? (Cap. 1, Cap. 4) Cap. 6 Relatividad general
¿Cuál es el principio fundamental de la «discretización de la energía» que produce la radiación del cuerpo negro y el efecto fotoeléctrico? (descubierta en Cap. 4, sistematizada en Cap. 7) Cap. 7 Mecánica cuántica
Queremos hacer compatibles la mecánica cuántica y la relatividad (se ve en Cap. 7) Cap. 8 Teoría cuántica de campos
¿Se pueden unificar las 4 fuerzas? (extensión de Cap. 2) Cap. 9 Modelo estándar
Contradicción entre gravedad y mecánica cuántica (se ve en Cap. 6, Cap. 8) → Parte III El problema de la gravedad cuántica
¿Teoría unificada? (se ve en Cap. 9) → Parte IV Teoría de cuerdas
%%{init: {"theme": "default", "themeCSS": ".edgePath .path, .flowchart-link { stroke-width: 2px !important; }"}}%%
graph TD
    A["Las 3 crisis de la física clásica<br>(Capítulo 4)"] --> B["El misterio de la velocidad de la luz<br>Cap. 5: Relatividad especial"]
    A --> C["La naturaleza de la gravedad<br>Cap. 6: Relatividad general"]
    A --> D["El mundo cuántico<br>Cap. 7: Mecánica cuántica"]
    B --> E["Teoría cuántica relativista<br>Cap. 8: Teoría cuántica de campos"]
    D --> E
    C --> F["Contradicción entre gravedad y cuántica<br>Parte III: Gravedad cuántica"]
    E --> F
    E --> G["Unificación de fuerzas<br>Cap. 9: Modelo estándar"]
    F --> H["Intento de teoría unificada<br>Parte IV: Teoría de cuerdas"]
    G --> H

    style A fill:#ffcdd2
    style F fill:#fff9c4
    style H fill:#c8e6c9

Fig. 4.10: De las crisis de la física clásica a la estructura de los siguientes capítulos

🔵 Kai: Así que este es el mapa completo... Pero si la mecánica cuántica y la relatividad general avanzan en direcciones diferentes, ¿al final no se contradicen? ¿No es raro que ambas sean correctas pero no sean compatibles?

🟡 Lina: Ese es exactamente el núcleo del asunto. Cada una es asombrosamente correcta en su dominio, pero cuando intentas usarlas simultáneamente, se contradicen. Incluso cuando decimos «solución», el nuevo modelo genera nuevas preguntas. Esa cadena continúa hasta la Parte V.

🔵 Kai: «Usarlas simultáneamente», ¿en qué situaciones concretas? Normalmente con una sola basta, ¿no?

🟡 Lina: Buena pregunta. Por ejemplo, en el centro de un agujero negro, o en el instante del origen del universo — situaciones donde una masa enorme se concentra en una región extremadamente pequeña. Ahí la gravedad es fuerte (se necesita relatividad general), pero la escala es extremadamente pequeña (también se necesita mecánica cuántica). Con una sola de ellas no se puede describir. Lo trataremos en detalle en la Parte III.

⚪ Mei: Para hacer más concreta la duda de Kai: la radiación del cuerpo negro y la precesión del perihelio de Mercurio exigen correcciones en direcciones completamente diferentes. La discretización de la energía y la geometría del espacio-tiempo — lo que se modifica es diferente, pero cuando intentas usarlas simultáneamente, ¿en qué forma concreta aparece la contradicción?

🟡 Lina: Buena organización. Dije que «se contradicen», pero para ser más precisa, cuando se aplican los métodos de la mecánica cuántica a la gravedad, los cálculos divergen — un problema similar a la divergencia ultravioleta reaparece de forma mucho más profunda. Cómo resolver esa contradicción es el tema de la Parte III en adelante.

🔵 Kai: La divergencia ultravioleta que vimos en este capítulo reaparece cambiando de forma...

Nota de filosofía de la ciencia: Las tres crisis muestran vívidamente la estructura de la ciencia donde «el fracaso de un modelo exitoso genera un nuevo modelo». Pero hay que tener cuidado: el nuevo modelo también es solo una hipótesis. Tanto la relatividad general como la mecánica cuántica podrían ser reemplazadas en el futuro por un modelo más profundo. Quizás no exista una «teoría final». No olvides la actitud de juzgar por ti mismo.

✅ Verificación de comprensión: ¿En qué capítulo de la Parte II se resuelven los problemas de la radiación del cuerpo negro y el efecto fotoeléctrico?

Respuesta

Cap. 7 (Mecánica cuántica).

✅ Verificación de comprensión: ¿En qué parte de este libro de texto se trata la contradicción entre la mecánica cuántica y la relatividad general?

Respuesta

Parte III (El problema de la gravedad cuántica).


Avance del próximo capítulo

Cap. 5「Capítulo 5 ¿Por qué la velocidad de la luz es constante? — Teoría de la relatividad especial」 — Einstein responde al misterio de la velocidad de la luz predicha por las ecuaciones de Maxwell. La relatividad especial, donde el sentido común del tiempo y el espacio se reescribe.


Referencias

  • Carlo Rovelli, Reality Is Not What It Seems, Ch.3: "Albert", Ch.4: "Quanta" — Contexto histórico de la radiación del cuerpo negro, el efecto fotoeléctrico y la hipótesis cuántica
  • Lee Smolin, The Trouble with Physics, Introduction — Contexto histórico de las crisis
  • David Tong, Lectures on General Relativity, Ch.1: "Geodesics in Spacetime" — Precesión del perihelio de Mercurio
  • Mecánica Cuántica Capítulo 1 «Las tres crisis de la física clásica» — Tratamiento más detallado de la radiación del cuerpo negro, el efecto fotoeléctrico y la estabilidad atómica
  • Relatividad General Capítulo 10 «¿Es el modelo de Einstein más preciso que el de Newton?» — Derivación relativista general de la precesión del perihelio de Mercurio
  • Teoría Cuántica de Campos Capítulo 3 «Teoría clásica de campos» — Formalismo lagrangiano y ecuaciones de campo