Capítulo 1 Las 3 crisis de la física clásica — Radiación de cuerpo negro, efecto fotoeléctrico y estabilidad atómica¶
Resumen de lo anterior:
En el prólogo, vimos que todos los modelos de la física no son más que «la mejor hipótesis que hasta ahora no contradice los experimentos», y que la mecánica cuántica es un modelo que sigue prediciendo fenómenos con una precisión asombrosa, desde átomos y moléculas hasta el universo entero. A partir de ahora, seguiremos este largo viaje paso a paso con ecuaciones.
Objetivo de este capítulo
- Clarificar las 3 crisis graves que la física clásica (mecánica de Newton + electromagnetismo de Maxwell) enfrentó a finales del siglo XIX —la catástrofe ultravioleta de la radiación de cuerpo negro, el misterio del efecto fotoeléctrico y el problema de la estabilidad atómica— y comprender la hipótesis cuántica de Planck (1900), la hipótesis del cuanto de luz de Einstein (1905) y el modelo atómico de Bohr (1913) como respuesta a cada una
- En particular, dejar claro que «Einstein es uno de los fundadores de la teoría cuántica»
1.1 La física de finales del siglo XIX — La ilusión de estar «casi completa»¶
🟡 Lina: Bien, por fin comienza el viaje por la mecánica cuántica. Pero antes de saltar directamente a una nueva teoría, empecemos confirmando los «límites» de la teoría antigua — por qué fue necesaria una nueva teoría.
🔵 Kai: ¿La teoría antigua es la mecánica de Newton y el electromagnetismo de Maxwell?
🟡 Lina: Así es. Los físicos de finales del siglo XIX pensaban que con estos 2 pilares se podía explicar cualquier fenómeno de la naturaleza. La mecánica de Newton explicaba desde el movimiento de los planetas hasta las oscilaciones de un péndulo, y el electromagnetismo de Maxwell unificaba la electricidad, el magnetismo y la luz. Había gente que pensaba en serio que «la física está casi completa, y lo único que queda es mejorar la precisión de los decimales».
⚪ Mei: Pero en realidad, las cosas no fueron así.
🟡 Lina: Exacto. Entre finales del siglo XIX y principios del XX, se descubrieron fenómenos que la física clásica absolutamente no podía explicar, uno tras otro. Hoy vamos a ver las 3 crisis más graves entre ellas.
🔵 Kai: Tres crisis…… ¿Qué tan graves fueron?
🟡 Lina: No se trataba de «errores en los decimales». La teoría predecía infinito, o que los átomos colapsarían en un instante — contradicciones fundamentales con la realidad. Para resolver estas contradicciones, los físicos se vieron obligados a proponer hipótesis completamente nuevas. Ese fue el nacimiento de la teoría cuántica.
✅ Verificación de comprensión: ¿Cuáles son los «2 pilares» de la física de finales del siglo XIX? Además, a pesar de que se consideraba que estaban «casi completos», ¿por qué fue necesaria una nueva teoría?
Respuesta
Los 2 pilares son la mecánica de Newton y el electromagnetismo de Maxwell. Se descubrieron fenómenos que estos no podían explicar (la teoría predecía infinito, o que los átomos colapsarían en un instante, etc.), entrando en contradicción fundamental con la realidad, por lo que se hizo necesaria una hipótesis completamente nueva (la teoría cuántica).
1.2 Crisis ①: La radiación de cuerpo negro y la catástrofe ultravioleta¶
El misterio de la caja brillante — ¿Qué es la radiación de cuerpo negro?¶
🟡 Lina: La primera crisis es el problema de la «radiación de cuerpo negro (black-body radiation)». Se resolvió en 1900, pero primero veamos el planteamiento del problema.
🔵 Kai: ¿Qué es la radiación de cuerpo negro?
🟡 Lina: Si calientas a alta temperatura una caja sellada — por ejemplo, una caja metálica con una cavidad interior —, del interior de la caja se emite luz (ondas electromagnéticas). Si abres un pequeño orificio en la caja, la luz se escapa por ahí. El experimento consiste en medir cómo se distribuye la energía de esta luz según la frecuencia (una cantidad que corresponde al color de la luz). En la Fig. 1.1「Dispositivo experimental de radiación de cuerpo negro」 dibujé un esquema conceptual del dispositivo experimental.
Fig. 1.1: Dispositivo experimental de radiación de cuerpo negro. El interior de una caja metálica calentada a alta temperatura (cavidad de cuerpo negro) se llena de ondas electromagnéticas. La luz que se escapa por un pequeño orificio se descompone con un prisma y se mide la distribución de energía por frecuencia.
⚪ Mei: Es decir, si fijamos la temperatura, queda determinado cuánta luz de cada color sale y con qué intensidad.
🟡 Lina: Así es. Los datos experimentales se habían medido con precisión para finales del siglo XIX. El problema era que al calcular con la física clásica, el resultado no concordaba en absoluto con el experimento.
🔵 Kai: ¿En qué no concordaba?
🟡 Lina: Calculando con base en la física clásica (mecánica de Newton + electromagnetismo de Maxwell + mecánica estadística), la energía de radiación aumenta sin límite a medida que aumenta la frecuencia. Diverge a infinito en la región ultravioleta. Esto se llama la catástrofe ultravioleta (ultraviolet catastrophe).
🔵 Kai: ¡¿Infinito?! Eso obviamente está mal, ¿no?
🟡 Lina: En los experimentos, la energía alcanza un pico en cierta frecuencia y luego disminuye correctamente. La teoría predice infinito, y el experimento muestra un valor finito. Esto no es un «error en los decimales» — indicaba un defecto fundamental en el marco de la física clásica.
La hipótesis cuántica de Planck — La energía es discreta¶
🟡 Lina: Quien abordó este problema fue el físico alemán Max Planck. Fue en 1900.
🔵 Kai: ¿Cómo lo resolvió?
🟡 Lina: Planck primero encontró una fórmula que se ajustaba a los datos experimentales. Y cuando intentó derivar esa fórmula teóricamente, se dio cuenta de que necesitaba hacer una suposición descomunal.
⚪ Mei: ¿Una suposición descomunal?
🟡 Lina: Esta suposición:
La energía de un modo (oscilador) que vibra con frecuencia \(\nu\) — es decir, de cada uno de los «patrones de vibración» que vibran con una frecuencia específica — no puede tomar valores continuos. Solo puede tomar valores que sean múltiplos enteros de \(h\nu\).
Es decir, la energía que puede tener un modo de frecuencia \(\nu\) solo puede ser \(0,\; h\nu,\; 2h\nu,\; 3h\nu,\; \ldots\) — valores discretos. Los valores intermedios no existen.
🔵 Kai: ¡¿La energía no es continua?!
🟡 Lina: La ecuación que aparece aquí es la primera ecuación de la mecánica cuántica.
- \(E\): energía
- \(n\): entero no negativo (\(0, 1, 2, \ldots\))
- \(h\): constante de Planck (Planck constant). Una de las constantes fundamentales de la naturaleza
- \(\nu\) (letra griega «nu»): frecuencia de la luz. Una cantidad que corresponde al color de la luz; cuanto mayor es la frecuencia, más cerca está del violeta o azul; cuanto menor, más cerca del rojo
⚪ Mei: El valor de \(h\) es increíblemente pequeño. \(10^{-34}\)……
🟡 Lina: Así es. Como este valor es extremadamente pequeño, en la escala cotidiana no nos damos cuenta de que la energía es «discreta». Imagina una escalera. Vista de lejos parece una rampa suave, pero al acercarte ves que tiene escalones uno a uno. El descubrimiento de Planck fue que la «rampa» de la energía en realidad era una «escalera». Mira la Fig. 1.2「Comparación entre la descripción clásica de la energía (rampa continua) y la descripción de la teoría cuántica (escalera discreta)」.
Fig. 1.2: Comparación entre la descripción clásica de la energía (rampa continua) y la descripción de la teoría cuántica (escalera discreta). Como \(h\) es extremadamente pequeño, en la escala cotidiana los escalones no se ven y parece una rampa suave.
🔵 Kai: Entiendo…… Pero, ¿por qué hacer la energía «discreta» resuelve la catástrofe ultravioleta?
¿Por qué lo discreto resuelve la catástrofe ultravioleta?¶
🟡 Lina: Buena pregunta. La clave es la «energía de fluctuación térmica» que posee un sistema a temperatura \(T\). Aquí voy a tomar prestada un poco de la mecánica estadística. La mecánica estadística es el campo que trata probabilísticamente el comportamiento de sistemas donde muchas partículas se mueven térmicamente. No se estudia en detalle en el bachillerato, pero lo único que necesitamos ahora es una conclusión:
La energía típica que posee un modo de vibración (una frecuencia de luz) en un entorno a temperatura \(T\) es del orden de \(k_B T\).
Aquí \(k_B \simeq 1.38 \times 10^{-23}\;\mathrm{J/K}\) se llama la constante de Boltzmann, y cumple el papel de puente entre «temperatura» y «energía». Cuanto mayor es la temperatura, mayor es \(k_B T\), y mayor es la energía distribuida a cada modo — intuitivamente, «cuanto más caliente, más vibra intensamente».
🔵 Kai: ¿Qué tan grande es \(k_B T\) concretamente?
🟡 Lina: A temperatura ambiente (\(T \simeq 300\;\mathrm{K}\)), \(k_B T \simeq 4.1 \times 10^{-21}\;\mathrm{J} \simeq 0.026\;\mathrm{eV}\). El \(\mathrm{eV}\) (electrón-voltio) es una unidad de energía que se usa mucho en física atómica, donde \(1\;\mathrm{eV} = 1.602 \times 10^{-19}\;\mathrm{J}\) — corresponde a la energía que adquiere un electrón al ser acelerado por una diferencia de potencial de 1 V. Esta es «la referencia de la energía que se distribuye térmicamente a cada modo de vibración». La demostración rigurosa de por qué es exactamente \(k_B T\) la dejo para los libros de mecánica estadística, pero intuitivamente, como «la temperatura es una medida de la energía cinética media de las moléculas», la energía distribuida a cada modo también es proporcional a la temperatura — eso es \(k_B T\).
🔵 Kai: \(k_B T\) es la referencia de la energía de fluctuación térmica…… Entonces, ¿independientemente de la frecuencia, a cada modo se le distribuye el mismo \(k_B T\)?
🟡 Lina: Precisamente esa es la afirmación de la física clásica. A cada modo se le distribuye una energía igual de aproximadamente \(k_BT\) — esto se llama el teorema de equipartición (equipartition theorem). Para ser exactos es «\(\frac{1}{2}k_BT\) por grado de libertad», y cada modo de luz tiene 2 grados de libertad (vibración del campo eléctrico y del campo magnético), así que el total es \(k_BT\). Por ahora basta con recordar «\(k_BT\) a cada modo». En la Fig. 1.3「Comparación entre el teorema de equipartición y la teoría cuántica」 comparé visualmente la diferencia entre la equipartición clásica y la supresión cuántica. La izquierda es clásica (distribución uniforme de \(k_BT\) a todos los modos), la derecha es cuántica (los modos de alta frecuencia se «congelan»).
Fig. 1.3: Comparación entre el teorema de equipartición y la teoría cuántica. Izquierda: en la equipartición clásica se asigna uniformemente \(k_BT\) de energía a todos los modos, y como el número de modos es infinito, la energía total diverge. Derecha: con la hipótesis cuántica de Planck, los modos de alta frecuencia con \(h\nu \gg k_BT\) no pueden recibir energía y se «congelan», por lo que la energía total permanece finita.
🔵 Kai: ¿Cuántos modos hay?
🟡 Lina: Para dar esa respuesta, primero imaginemos concretamente qué es un «modo». Piensa en una cuerda de guitarra. Como ambos extremos de la cuerda están fijos, solo pueden existir patrones de vibración que quepan exactamente en la longitud de la cuerda — media longitud de onda que cabe 1 vez, 2 veces, 3 veces…… discretamente. Esos son los «modos» en 1 dimensión.
🔵 Kai: Ya veo, solo se permiten ondas que quepan en la longitud de la cuerda.
🟡 Lina: La luz dentro de una caja funciona igual: solo se permiten patrones de vibración que quepan entre las paredes. Sin embargo, la caja es tridimensional, así que hay combinaciones de patrones de vibración en 3 direcciones: largo, ancho y profundidad. En 1 dimensión solo cuentas «puntos enteros en una recta numérica», pero en 3 dimensiones cuentas «puntos de una red en el espacio». Los patrones de vibración en cada dirección se numeran con enteros (1, 2, 3, ...), así que la combinación de 3 direcciones \((n_x, n_y, n_z)\) corresponde a un modo.
🔵 Kai: Cada combinación de tres enteros corresponde a un patrón de vibración.
🟡 Lina: Así es. En una cuerda unidimensional, el número del patrón de vibración \(n\) era directamente proporcional a la frecuencia. En una caja tridimensional, los números de patrón de vibración en cada dirección \(n_x, n_y, n_z\) contribuyen independientemente a la frecuencia. En 1 dimensión, de la condición «\(n\) medias longitudes de onda caben en la longitud de la cuerda» resultaba que la frecuencia era proporcional a \(n\). En la caja tridimensional esta condición se impone independientemente en cada dirección, así que la componente de frecuencia en la dirección \(x\) es \(\nu_x \propto n_x\), en la dirección \(y\) es \(\nu_y \propto n_y\), y en la dirección \(z\) es \(\nu_z \propto n_z\).
🔵 Kai: Entiendo las frecuencias en cada dirección. Pero, ¿cómo se determina la frecuencia total? ¿Se suman simplemente?
🟡 Lina: Buena pregunta. Antes escribí «la componente de frecuencia en la dirección \(x\) es \(\nu_x \propto n_x\)». Usando estos \(\nu_x, \nu_y, \nu_z\), la frecuencia total se determina por \(\nu = \sqrt{\nu_x^2 + \nu_y^2 + \nu_z^2}\) — exactamente la misma estructura que calcular la distancia desde el origen hasta el punto \((\nu_x, \nu_y, \nu_z)\) en el espacio tridimensional usando el teorema de Pitágoras. La razón por la que resulta ser la raíz cuadrada de la suma de cuadrados es un resultado que se deriva de la ecuación de ondas, y lo trataremos en detalle en capítulos posteriores. Intuitivamente, en una cuerda unidimensional la frecuencia se determinaba por la condición «\(n\) medias longitudes de onda caben en la cuerda». En la caja tridimensional, esta condición se impone independientemente en las 3 direcciones \(x, y, z\). Al resolver la ecuación de ondas, la frecuencia total se compone por el «teorema de Pitágoras» de las componentes de frecuencia en cada dirección — exactamente la misma estructura que calcular la diagonal de un paralelepípedo a partir de sus 3 lados. Por ahora acepta que «así resulta». Entonces «el número de modos con frecuencia menor o igual a \(\nu\)» corresponde al número de puntos de red dentro de una esfera de radio \(\propto \nu\), considerando los números de patrón de vibración en cada dirección \((n_x, n_y, n_z)\) como coordenadas.
⚪ Mei: Es decir, el problema de la frecuencia se transforma en un problema geométrico de «contar puntos de red dentro de una esfera en 3 dimensiones».
🟡 Lina: Exacto. Los puntos de red están separados por 1 unidad en cada dirección, así que su número es aproximadamente igual al volumen de la esfera (imagina que a cada pequeño cubo de lado 1 le corresponde 1 punto de red. Estrictamente hay cierta desviación cerca de la superficie de la esfera, pero cuanto mayor es el radio, más despreciable es este error). Sin embargo, como los números de patrón de vibración \(n_x, n_y, n_z\) solo toman enteros positivos (\(1, 2, 3, \ldots\)), solo contamos el «primer octante» — es decir, la parte donde \(n_x > 0,\; n_y > 0,\; n_z > 0\). Esto corresponde a \(1/8\) del volumen de la esfera. Además, como la luz tiene 2 direcciones de polarización mutuamente perpendiculares, para el mismo patrón de vibración hay 2 opciones de polarización, así que el número de modos se duplica. Como el volumen de la esfera es proporcional al cubo del radio, agrupando la constante de proporcionalidad incluyendo el factor \(1/8\) y el factor de polarización 2 y llamándola \(C\), «el número total de modos con frecuencia menor o igual a \(\nu\)» \(N(\nu)\) crece aproximadamente como \(N(\nu) = C\nu^3\), proporcional a \(\nu^3\).
🔵 Kai: \(N(\nu) \propto \nu^3\)…… si la frecuencia se duplica, ¿el número de modos se multiplica por \(2^3 = 8\)? Crece a un ritmo impresionante. Pero la catástrofe ultravioleta tiene que ver con «cuántos modos se concentran cerca de cierta frecuencia», ¿no? Siento que lo que se necesita no es el total, sino algo como una densidad por frecuencia……
🟡 Lina: Exactamente. A partir de aquí calculamos «el número de modos por unidad de frecuencia cerca de la frecuencia \(\nu\)» — a esto lo llamamos densidad de modos. La imagen de la densidad de modos es «cuántos modos nuevos aparecen cuando avanzas un poco en la escala de frecuencias». Por ejemplo, como contar «cuántas emisoras hay entre 80 MHz y 81 MHz» en la banda de radio FM — la densidad de modos es eso considerado de forma continua. Matemáticamente, es el número de modos adicionales \(\Delta N\) cuando aumentas \(\nu\) en \(\Delta\nu\), dividido por \(\Delta\nu\): \(\Delta N / \Delta\nu\). Si haces \(\Delta\nu\) infinitamente pequeño, esto es la derivada \(dN/d\nu\) que aprendiste en matemáticas del bachillerato. Del argumento anterior podemos escribir \(N(\nu) = C\nu^3\) (\(C\) es una constante que agrupa el volumen de la caja, el factor de polarización 2, el \(1/8\) por contar solo enteros positivos, etc., y no necesitamos su valor concreto ahora). Derivando respecto a \(\nu\) obtenemos \(dN/d\nu = 3C\nu^2\) — es decir, la densidad de modos es proporcional a \(\nu^2\).
⚪ Mei: Derivando \(\nu^3\) obtenemos \(3\nu^2\) — la densidad de modos crece como \(\nu^2\).
🟡 Lina: Según el teorema de equipartición, a cada modo se le asigna \(k_BT\) de energía, así que el número de modos en el intervalo infinitesimal de frecuencia \(\nu\) a \(\nu + d\nu\) es «densidad de modos \(\times\) ancho infinitesimal \(d\nu\)», es decir, proporcional a \(3C\nu^2\,d\nu\). A cada uno le corresponde \(k_BT\) de energía, así que la energía en este intervalo es proporcional a \(\nu^2 \cdot k_BT\,d\nu\). Sumando sobre todas las frecuencias — la integral \(\int_0^\infty \nu^2 \cdot k_BT\,d\nu\) proporcional a la energía total de radiación de la caja.
🔵 Kai: Sumar todo con una integral…… ¿Esto converge?
🟡 Lina: Aquí \(\int_0^R \nu^2\,d\nu\), usando la fórmula \(\int x^n\,dx = x^{n+1}/(n+1)\) que aprendiste en bachillerato con \(n = 2\), da \(\nu^3/3\) evaluada de \(0\) a \(R\), es decir \(R^3/3\). Cuanto mayor sea el límite superior \(R\), el valor sigue creciendo sin límite, y cuando \(R \to \infty\) diverge a infinito — esta es la identidad matemática de la catástrofe ultravioleta.
⚪ Mei: Es decir, como el número de modos crece sin límite con la frecuencia, y a cada modo se le asigna el mismo \(k_BT\), la energía total diverge.
🟡 Lina: Exacto. Si a cada modo se le asigna \(k_B T\), la energía total diverge — esa es la catástrofe ultravioleta. En la Fig. 1.4「Conteo de modos y mecanismo de la catástrofe ultravioleta」 ilustré este mecanismo. El lado izquierdo muestra cómo se cuentan los modos con puntos de red, y el derecho muestra la diferencia en la densidad de energía entre la teoría clásica y la cuántica.
Fig. 1.4: Conteo de modos y mecanismo de la catástrofe ultravioleta. Izquierda: los modos de vibración en la caja se numeran con enteros \((n_x, n_y, n_z)\), y el número de modos con frecuencia \(\leq \nu\) corresponde al número de puntos de red dentro de una esfera de radio \(\propto \nu\). Derecha: en la teoría clásica (línea gris discontinua) se asigna uniformemente \(k_BT\) a la densidad de modos \(\propto \nu^2\) y diverge a alta frecuencia, pero en la teoría cuántica de Planck (línea roja continua) el lado de alta frecuencia se suprime exponencialmente.
🔵 Kai: Según lo que dijiste antes, el número de modos crece proporcionalmente a \(\nu^3\) sin límite. Si a todos se les asigna \(k_B T\), claro que diverge…… ¿Cómo cambia al introducir la hipótesis de Planck?
🟡 Lina: Al introducir la hipótesis cuántica de Planck, cambia ese «\(k_B T\) para cada modo». Para un modo de frecuencia \(\nu\), se necesita llenar al menos 1 unidad de energía \(h\nu\), pero el «dinero» disponible (energía térmica) es solo \(k_B T\). Si \(h\nu \gg k_B T\), ni siquiera puedes comprar un solo «boleto» de \(h\nu\).
En mecánica estadística hay una ley importante llamada la distribución de Boltzmann. Nos dice «con qué probabilidad se realiza un estado de energía \(E\) en un ambiente a temperatura \(T\)»:
\(\propto\) (se lee «proporcional a») es un símbolo que significa «es proporcional a». «Probabilidad \(\propto\) algo» significa «la probabilidad es proporcional a algo». Para entender intuitivamente por qué es una función exponencial: «cuando hay que superar varias barreras independientes, la probabilidad de superar cada una se multiplica» — en probabilidad del bachillerato aprendiste que «la probabilidad de que eventos independientes ocurran simultáneamente es el producto de las probabilidades», ¿verdad? Por ejemplo, si la probabilidad de superar 1 barrera es \(p\), la probabilidad de superar \(n\) barreras es \(p^n\). Esto decrece rápidamente cuando \(n\) aumenta. Como \(p^n = e^{n \ln p}\), decrece exponencialmente con el número de barreras \(n\) — esa es la esencia de la distribución de Boltzmann \(e^{-E/k_BT}\). La energía \(E\) corresponde al «número de barreras a superar», y \(k_BT\) a la «altura de una barrera» (en el caso de energía continua, la misma lógica se aplica como el límite de hacer infinitamente finas las barreras).
🔵 Kai: Ah, el producto de eventos independientes se convierte en una exponencial. No sabía que la multiplicación de probabilidades aparecía aquí.
🟡 Lina: La imagen es como si, cuanto más alto es el escalón, el número de «personas que pueden llegar» disminuye drásticamente. La energía térmica \(k_B T\) corresponde a «la resistencia de un escalón», y cuanto mayor es la energía \(E\) necesaria en comparación, la probabilidad de alcanzarla disminuye drásticamente. Matemáticamente, «cuanto mayor es la energía del estado, más difícil es realizarlo» — y no solo «más difícil», sino que la probabilidad cae exponencialmente de forma abrupta. Por ejemplo, si \(E = 3k_BT\), la probabilidad es \(e^{-3} \approx 0.05\) (aproximadamente 5%), si \(E = 10k_BT\), es \(e^{-10} \approx 0.00005\) (prácticamente cero). Por eso los modos con \(h\nu \gg k_B T\) en la práctica no se excitan en absoluto.
🔵 Kai: A ver…… si \(h\nu\) es mucho mayor que \(k_B T\), el exponente de \(e^{-h\nu/k_B T}\) es un número muy negativo, así que es prácticamente cero. Es decir, ¿los modos de alta frecuencia «existen pero en la práctica no pueden tener energía»? Pero al revés, ¿qué pasa con los modos de baja frecuencia? Si \(h\nu\) es mucho menor que \(k_BT\), ¿se excitan normalmente?
🟡 Lina: Exacto. El lado de baja frecuencia puede tener la misma energía \(k_BT\) que en la teoría clásica. Mira la Fig. 1.5「Distribución de Boltzmann y supresión cuántica de energía. Izquierda: distribución de Boltzmann \(e^{-E/k_BT}\)」. El gráfico de la izquierda es la distribución de Boltzmann en sí, y se puede ver que la probabilidad cae drásticamente cuando la energía supera \(k_BT\). El gráfico de la derecha muestra cómo cambia la energía media de cada modo de vibración con la frecuencia.
Fig. 1.5: Distribución de Boltzmann y supresión cuántica de energía. Izquierda: distribución de Boltzmann \(e^{-E/k_BT}\) — la probabilidad de realizar estados de mayor energía decrece exponencialmente. Derecha: comparación de la energía media de los modos de vibración — en la teoría clásica se asigna \(k_BT\) a todos los modos (línea gris discontinua), pero en la teoría cuántica la energía media se suprime exponencialmente en la región \(h\nu \gg k_BT\) (línea roja continua).
🟡 Lina: Calculemos la «energía media de un modo que solo puede tomar energías \(0, h\nu, 2h\nu, \ldots\)» usando la distribución de Boltzmann. Te mostraré solo la idea. La probabilidad de que se realice cada energía \(nh\nu\) es proporcional a \(e^{-nh\nu/k_BT}\), así que la energía media es «la suma de (cada energía) × (su probabilidad)» dividida por «la suma de probabilidades» — esto lo escribimos como \(\langle E \rangle\) (los paréntesis angulares \(\langle\;\rangle\) representan «promedio»). Es decir
Aquí \(\sum_{n=0}^{\infty}\) (símbolo sigma) significa «sustituir \(n = 0, 1, 2, \ldots\) en orden y sumar todo» — es decir, el denominador es \(e^{0} + e^{-h\nu/k_BT} + e^{-2h\nu/k_BT} + \cdots\).
🔵 Kai: ¿Sumar infinitamente? ¿No diverge?
🟡 Lina: Buena pregunta. Si definimos \(x = e^{-h\nu/k_BT}\), como \(0 < x < 1\), el denominador se convierte en una serie geométrica \(1 + x + x^2 + \cdots\). Esta suma también aparece en el bachillerato — si multiplicamos ambos lados de \(S = 1 + x + x^2 + \cdots\) por \(x\), obtenemos \(xS = x + x^2 + x^3 + \cdots\). Restando: \(S - xS = 1\), así que \(S = 1/(1-x)\). Como \(|x| < 1\), cada término se hace cada vez más pequeño y la suma converge a un valor finito.
⚪ Mei: El denominador es \(1/(1-x)\). ¿Y el numerador?
🟡 Lina: El numerador es \(\sum_{n=0}^\infty nh\nu \cdot x^n = 0 \cdot x^0 + 1 \cdot h\nu \cdot x + 2h\nu \cdot x^2 + \cdots\), pero como el término \(n = 0\) es cero y desaparece, queda \(h\nu \cdot x(1 + 2x + 3x^2 + \cdots)\). Aquí uso un truco. Quiero encontrar la suma de la serie \(1 + 2x + 3x^2 + \cdots\). En realidad, se obtiene simplemente derivando respecto a \(x\) ambos lados de la suma de la serie geométrica \(S = 1 + x + x^2 + \cdots = 1/(1-x)\). Si derivo el lado izquierdo término a término: \(dS/dx = 0 + 1 + 2x + 3x^2 + \cdots = 1 + 2x + 3x^2 + \cdots\) — exactamente la serie que queríamos (al derivar la constante \(1\) da cero y desaparece). Al derivar el lado derecho: \(d[1/(1-x)]/dx = 1/(1-x)^2\). Así que obtenemos \(1 + 2x + 3x^2 + \cdots = 1/(1-x)^2\). Quizás pienses «¿se puede derivar término a término una suma infinita?», pero cuando \(|x| < 1\) y cada término se hace cada vez más pequeño de modo que la suma converge correctamente a un valor finito, esta operación está permitida (la demostración rigurosa la dejo para las matemáticas universitarias).
🔵 Kai: ¿Se puede verificar con números concretos?
🟡 Lina: Verificándolo con \(x = 1/2\): el lado derecho es \(1/(1 - 1/2)^2 = 4\). El lado izquierdo es \(1 + 2 \cdot (1/2) + 3 \cdot (1/4) + 4 \cdot (1/8) + \cdots = 1 + 1 + 0.75 + 0.5 + \cdots\), y sumando se comprueba que efectivamente se acerca a 4. Usando esto, el numerador es \(h\nu \cdot x/(1-x)^2\). Como el denominador era \(1/(1-x)\), la energía media es
Sustituyendo \(x = e^{-h\nu/k_BT}\) de vuelta: \(1 - x = 1 - e^{-h\nu/k_BT}\), así que
(la última igualdad se obtiene multiplicando numerador y denominador por \(e^{h\nu/k_BT}\)).
⚪ Mei: Quedó una fórmula elegante. Esta es la fórmula de la energía media de Planck.
🟡 Lina: Así es. Verifiquemos el comportamiento de esta fórmula en dos límites.
- Cuando \(h\nu \ll k_B T\) (baja frecuencia): definiendo \(\xi = h\nu/k_B T \ll 1\), podemos aproximar \(e^\xi \approx 1 + \xi\), así que \(e^{h\nu/k_B T} - 1 \simeq h\nu / k_B T\), y \(\langle E \rangle \simeq k_B T\) (coincide con el resultado clásico)
- Cuando \(h\nu \gg k_B T\) (alta frecuencia): como \(e^{h\nu/k_BT} \gg 1\), el \(-1\) del denominador es despreciable y \(\langle E \rangle \simeq h\nu\, e^{-h\nu / k_B T}\), suprimido exponencialmente
⚪ Mei: Ya veo. El lado de alta frecuencia se suprime exponencialmente con \(e^{-h\nu / k_B T}\), así que no diverge a infinito.
🔵 Kai: ¡Ah, claro! El lado de baja frecuencia es el mismo \(k_B T\) que en la teoría clásica, pero solo el lado de alta frecuencia queda en estado de «el boleto es demasiado caro para comprarlo», así que el total permanece finito. …Pero espera un momento. Entonces, si subimos la temperatura, ¿qué pasa? Si \(k_BT\) se hace mayor, ¿se podrán excitar modos de frecuencia aún mayor y el pico del espectro se desplazará hacia frecuencias más altas?
🟡 Lina: Exacto. Al subir la temperatura, \(k_BT\) se hace mayor, así que el límite superior de frecuencias para las que «se puede comprar el boleto» sube, y el pico se desplaza hacia frecuencias más altas. Pero por mucho que suba la temperatura, siempre existe la región \(h\nu \gg k_BT\), y allí se mantiene la supresión exponencial — por eso la energía total siempre permanece finita. Es decir, el hecho de que la energía sea «discreta» hace que los modos de alta frecuencia sean difíciles de excitar por fluctuaciones térmicas. Con esto se resuelve la catástrofe ultravioleta. El «teorema de equipartición» de la física clásica se rompe, y la fórmula de Planck coincide perfectamente con el experimento. Mira la Fig. 1.6「Comparación de la densidad de energía de la radiación de cuerpo negro」. Puedes ver que mientras la predicción clásica (Rayleigh-Jeans) diverge a alta frecuencia, la fórmula de Planck decae exponencialmente después del pico, ¿verdad? En la figura también están los espectros a varias temperaturas, y se puede ver que cuanto mayor es la temperatura, más se desplaza el pico hacia frecuencias altas. Esto se llama la ley de desplazamiento de Wien y se deriva naturalmente de la fórmula de Planck.
Fig. 1.6: Comparación de la densidad de energía de la radiación de cuerpo negro. La predicción clásica de Rayleigh-Jeans (línea gris punteada) diverge a alta frecuencia, pero la fórmula de Planck (línea continua) decae exponencialmente después del pico. Cuanto mayor es la temperatura, más se desplaza el pico hacia frecuencias altas (ley de desplazamiento de Wien).
🔵 Kai: ¡Increíble! Se resuelve con una sola suposición. Pero…… con solo suponer «es discreto», el por qué es discreto sigue sin saberse, ¿verdad?
🟡 Lina: Tocas un buen punto. De hecho, el propio Planck sentía lo mismo. Él pensaba que esta suposición era un «truco matemático». Un medio conveniente para ajustar el cálculo, y no creía que la energía fuera realmente discreta. Más tarde declaró que «fue una suposición desesperada».
⚪ Mei: Es decir, Planck no se dio cuenta de que había iniciado una revolución en la física.
🟡 Lina: Así es. Quien tomó en serio la hipótesis de Planck y la llevó más lejos fue — Einstein, que aparece a continuación.
✅ Verificación de comprensión: ¿Cómo se relaciona el hecho de que el valor de la constante de Planck \(h\) sea extremadamente pequeño con el hecho de que la «discretización» de la energía no se observe en la vida cotidiana?
Respuesta
Como \(h \simeq 6.626 \times 10^{-34}\;\mathrm{J \cdot s}\) es extremadamente pequeño, en la escala cotidiana la unidad mínima de energía \(h\nu\) se vuelve despreciablemente pequeña. Por eso, la energía escalonada parece una cantidad continua y suave, y no nos damos cuenta de los efectos cuánticos.
✅ Verificación de comprensión: ¿Qué es la catástrofe ultravioleta? Además, explica en una frase cómo la hipótesis cuántica de Planck la resuelve.
Respuesta
Catástrofe ultravioleta: el problema de que al calcular la radiación de cuerpo negro con la física clásica, la energía de radiación diverge a infinito en el lado de alta frecuencia. Solución: al suponer que la energía solo puede tomar múltiplos enteros de \(h\nu\), la luz de alta frecuencia tiene una energía por cuanto demasiado grande para ser emitida fácilmente, y el lado de alta frecuencia se suprime naturalmente.
📝 Ejercicios:
- Cálculo para apreciar la pequeñez de la constante de Planck → Problema B-1. Experimentar la pequeñez de la constante de Planck
1.3 Crisis ②: El misterio del efecto fotoeléctrico¶
Al iluminar con luz salen electrones — pero hay algo extraño¶
🟡 Lina: La segunda crisis es el «efecto fotoeléctrico (photoelectric effect)». Este es un fenómeno descubierto por Hertz en 1887: al iluminar la superficie de un metal con luz, salen electrones del interior del metal.
🔵 Kai: ¿Como si la luz golpeara y sacara electrones?
🟡 Lina: Así es. El fenómeno en sí era conocido, pero al investigarlo en detalle se encontraron propiedades extrañas que la física clásica no podía explicar de ninguna manera. Voy a enumerar 4 cosas extrañas (Tabla 1.1「Los 4 misterios del efecto fotoeléctrico y la contradicción con la predicción clásica」).
Tabla 1.1: Los 4 misterios del efecto fotoeléctrico y la contradicción con la predicción clásica
| Misterio | Hecho experimental | Predicción clásica de ondas |
|---|---|---|
| ① Existencia de umbral | Con luz de frecuencia inferior a cierto valor, por muy intensa que sea, no salen electrones | Con luz intensa deberían salir |
| ② No depende de la intensidad | Aunque se aumente la intensidad de la luz, la energía de cada electrón que sale no cambia | Con luz más intensa debería ser mayor |
| ③ Proporcional a la frecuencia | Cuanto mayor es la frecuencia de la luz, mayor es la energía del electrón | Debería depender de la intensidad |
| ④ Respuesta instantánea | Los electrones salen en el instante en que se ilumina | Debería tardar en acumular energía |
🔵 Kai: ¡Todo es lo contrario de la predicción clásica!
🟡 Lina: Así es. En la teoría clásica de ondas, la energía de la luz está determinada por la amplitud (brillo). La onda va transfiriendo energía al electrón poco a poco, y cuando se acumula suficiente, el electrón sale — así que al iluminar con luz brillante debería acumularse rápido y el electrón saldría. Sin embargo, los resultados experimentales dicen que la clave no es el brillo sino el color (la frecuencia).
⚪ Mei: Aunque aumentes el brillo la energía del electrón no cambia, pero si cambias el color sí cambia…… Con la teoría de ondas no se puede explicar en absoluto.
La hipótesis del cuanto de luz de Einstein — La luz también es partícula¶
🟡 Lina: Aquí es donde entra Albert Einstein. En 1905 — el mismo año en que publicó la relatividad especial — escribió otro artículo revolucionario.
🔵 Kai: ¡¿Dos en el mismo año?!
🟡 Lina: Einstein llevó más lejos la idea de Planck de los «paquetes de energía». Planck dijo que «la energía de la luz toma valores discretos», pero Einstein afirmó algo mucho más atrevido.
La luz misma es un conjunto de partículas que poseen energía \(h\nu\).
Es decir, la luz no es una onda continua, sino algo como «paquetes» de energía que van volando. A estas partículas de luz, hoy las llamamos fotones (photon).
🔵 Kai: ¡¿La luz es una partícula?! Pero, ¿la luz no era una onda? La interferencia, la difracción……
🟡 Lina: Esa duda es muy razonable. La física del siglo XIX había establecido que la luz es una onda, ya que se observan franjas de interferencia en el experimento de doble rendija de Young. Y sin embargo «es una onda y al mismo tiempo una partícula» — esta «dualidad onda-partícula (wave-particle duality)» la trataremos en detalle en el próximo capítulo. Ahora concentrémonos en cómo la hipótesis de Einstein explica el efecto fotoeléctrico.
La analogía del granizo — ¿Por qué el color es lo decisivo?¶
🟡 Lina: Para entender intuitivamente la explicación de Einstein, voy a usar la analogía del granizo.
Lo que determina si el capó de un coche se abolla no es la cantidad total de granizo que cae, sino el tamaño de cada grano, ¿verdad? Aunque caiga una enorme cantidad de granizo, si cada grano es tan pequeño como un grano de arena, el capó no se abollará. En cambio, aunque haya pocos, si cada grano es del tamaño de una pelota de golf, con un solo impacto se abolla.
🔵 Kai: ¡Ah, ya entiendo! ¿La luz funciona igual?
🟡 Lina: Así es. Por muy intensa que sea la luz (= por muchos fotones que haya), si la energía de cada fotón individual es pequeña (= la frecuencia es baja), el electrón no es arrancado del átomo. En cambio, aunque la luz sea débil, si la frecuencia es suficientemente alta, la energía de cada grano es grande y el electrón sale. Mira la Fig. 1.7「Efecto fotoeléctrico entendido con la analogía del granizo」.
Fig. 1.7: Efecto fotoeléctrico entendido con la analogía del granizo. Izquierda: los fotones de baja frecuencia (luz roja) tienen una energía \(h\nu\) pequeña, así que por muchos que se lancen no pueden arrancar electrones. Derecha: los fotones de alta frecuencia (luz ultravioleta) tienen una energía individual grande, así que incluso unos pocos pueden arrancar electrones. En el efecto fotoeléctrico lo importante no es la intensidad de la luz (número de fotones) sino el color (frecuencia).
⚪ Mei: Por eso la clave es el color y no la intensidad. La intensidad solo corresponde al número de fotones.
La ecuación del efecto fotoeléctrico¶
🟡 Lina: Voy a escribirlo cuantitativamente. Los electrones dentro del metal están ligados por la atracción de las cargas positivas de los núcleos atómicos circundantes — como si estuvieran en una «habitación rodeada de paredes». La energía mínima necesaria para superar esa pared y salir se escribe como \(W\) y se llama función de trabajo (work function). \(W\) viene de la inicial de Work (trabajo) en inglés — es la energía mínima necesaria para el «trabajo» de arrancar el electrón. La condición para que ocurra el efecto fotoeléctrico es
y cuando esta condición se cumple, la energía cinética \(K\) del electrón que sale es
🔵 Kai: La energía \(h\nu\) que lleva un solo fotón menos la energía \(W\) usada para arrancar el electrón da el resto como energía cinética del electrón…… ¡Es simple! Pero, ¿no podría pasar que 2 fotones golpeen simultáneamente y con la suma de sus energías arranquen el electrón?
🟡 Lina: Buena pregunta. En realidad, usando láseres muy intensos sí ocurre un fenómeno llamado «absorción multifotónica». Pero en los experimentos normales de efecto fotoeléctrico, la intensidad de la luz no es tan alta, así que la probabilidad de que 2 fotones golpeen el mismo electrón casi simultáneamente es extremadamente baja. Por eso el proceso dominante es que un solo fotón entrega energía a un solo electrón en una relación uno a uno, y la ecuación (1.4) es suficiente. Veamos, mirando la ecuación (1.4), los 4 misterios se explican todos (Tabla 1.2「Explicación del efecto fotoeléctrico según la hipótesis del cuanto de luz de Einstein」).
Tabla 1.2: Explicación del efecto fotoeléctrico según la hipótesis del cuanto de luz de Einstein
| Misterio | Explicación de Einstein |
|---|---|
| ① Umbral | Si \(h\nu < W\), la energía de un solo fotón no es suficiente para superar la barrera, así que el electrón no sale |
| ② Independencia de la intensidad | La energía de un fotón está determinada por \(h\nu\) y no depende del número de fotones (= intensidad) |
| ③ Proporcional a la frecuencia | De \(K = h\nu - W\), cuanto mayor es \(\nu\), mayor es \(K\) |
| ④ Respuesta instantánea | Un solo fotón entrega su energía al electrón instantáneamente. No hay necesidad de acumulación |
⚪ Mei: Todo se explica con una sola ecuación.
🟡 Lina: Mira la Fig. 1.8「Relación entre energía cinética y frecuencia en el efecto fotoeléctrico」. Si graficas \(K\) contra \(\nu\), obtienes una recta con pendiente \(h\). La frecuencia donde la recta intersecta \(K = 0\), \(\nu_0 = W/h\), es la frecuencia umbral — con luz de frecuencia menor a esta, por mucha intensidad que tenga, los electrones no salen. La frecuencia umbral (es decir, la ordenada al origen \(-W\)) varía según el tipo de metal, pero la pendiente es siempre la misma — este es uno de los métodos experimentales para determinar la constante de Planck.
Fig. 1.8: Relación entre energía cinética y frecuencia en el efecto fotoeléctrico. Relación lineal \(K = h\nu - W\) de la energía cinética del electrón en el efecto fotoeléctrico. La frecuencia umbral \(\nu_0 = W/h\) difiere según el metal, pero la pendiente es común a todos y da la constante de Planck \(h\). El punto donde la recta intersecta \(K = 0\) es la frecuencia umbral; con luz de frecuencia menor, por muy intensa que sea, los electrones no salen.
🟡 Lina: Einstein recibió el Premio Nobel por este trabajo. No por la teoría de la relatividad, sino por la teoría del efecto fotoeléctrico.
🔵 Kai: ¡Vaya! No fue por la relatividad.
Einstein es uno de los fundadores de la teoría cuántica¶
🟡 Lina: Hay algo que quiero enfatizar aquí. Einstein es famoso por haber criticado la mecánica cuántica posteriormente — ¿has oído la frase «Dios no juega a los dados»?
🔵 Kai: Ah, sí, la he oído.
🟡 Lina: Pero eso es algo posterior. En 1905, Einstein estaba del lado de quienes crearon la teoría cuántica. Planck dijo «la energía es discreta» y Einstein dijo «la luz misma es partícula». Además, en 1917 introdujo el concepto de «emisión estimulada (stimulated emission)», que más tarde se convertiría en el principio del láser. Einstein es uno de los fundadores de la teoría cuántica — no lo olvides. En capítulos posteriores, veremos la escena dramática donde este fundador reaparece como crítico.
⚪ Mei: Criticar la teoría que uno mismo creó…… Es dramático.
✅ Verificación de comprensión: ¿En qué difiere la hipótesis del cuanto de luz de Einstein de la hipótesis cuántica de Planck? Describe la diferencia entre las afirmaciones de ambos.
Respuesta
Planck afirmó que «la energía de la luz de frecuencia \(\nu\) solo puede tomar múltiplos enteros de \(h\nu\)» (discretización de la energía). En cambio, Einstein afirmó que «la luz misma es un conjunto de partículas (fotones) que poseen energía \(h\nu\)». Es decir, Einstein fue más atrevido al considerar la discretización no como una propiedad de la forma de emisión/absorción de la luz, sino como una propiedad de la existencia misma de la luz.
✅ Verificación de comprensión: En el efecto fotoeléctrico, explica usando el concepto de fotón por qué la energía de los electrones que salen no cambia aunque se aumente la «intensidad» de la luz.
Respuesta
La intensidad de la luz corresponde al número de fotones. La energía de cada fotón individual es \(h\nu\) (determinada por la frecuencia), y al aumentar la intensidad la energía por fotón no cambia. Como el trabajo de arrancar un electrón lo hace un solo fotón, la energía del electrón que sale \(K = h\nu - W\) no depende de la intensidad.
📝 Ejercicios:
- Cálculo de la función de trabajo y la frecuencia umbral → Problema B-2. Función de trabajo y frecuencia umbral
1.4 Crisis ③: El problema de la estabilidad atómica¶
El modelo atómico de Rutherford — Un átomo como el sistema solar¶
🟡 Lina: La tercera crisis es el problema de la «estabilidad atómica». Se podría decir que esta fue la más grave.
🔵 Kai: Los átomos existen de forma estable, ¿no? ¿Cuál es el problema?
🟡 Lina: El problema es que «según la física clásica, los átomos no pueden existir de forma estable». Primero confirmemos la estructura del átomo. En 1911, Ernest Rutherford reveló la estructura del átomo mediante su famoso experimento con lámina de oro. El resultado fue: en el centro del átomo hay un núcleo atómico pequeño y pesado con carga positiva, y alrededor de él giran electrones con carga negativa. Una estructura similar al sistema solar.
⚪ Mei: Eso lo aprendimos en el bachillerato. Pero, ¿cuáles son las escalas concretas?
🟡 Lina: Según los experimentos, el radio del átomo es del orden de \(10^{-10}\;\mathrm{m}\), mientras que el radio del núcleo atómico es del orden de \(10^{-15}\;\mathrm{m}\). El núcleo atómico tiene un tamaño de solo una cienmilésima parte del átomo completo. Los electrones giran a gran distancia del núcleo. Mira la Fig. 1.9「Modelo atómico de Rutherford」.
Fig. 1.9: Modelo atómico de Rutherford. Alrededor del núcleo atómico central con carga positiva (rojo), el electrón con carga negativa (verde) gira en órbita circular. El radio atómico es \(\sim 10^{-10}\) m, mientras que el radio nuclear es \(\sim 10^{-15}\) m, abrumadoramente más pequeño. Este modelo explica los hechos experimentales, pero como veremos a continuación, es incompatible con el electromagnetismo clásico.
🔵 Kai: El modelo del sistema solar, es fácil de entender. Me pregunto cuál será el problema……
La predicción del electromagnetismo clásico — El átomo colapsa en un instante¶
🟡 Lina: El problema está en el electromagnetismo de Maxwell. Según esta teoría, una carga en movimiento acelerado necesariamente emite ondas electromagnéticas.
🔵 Kai: El movimiento circular…… es un movimiento acelerado, ¿verdad? Tiene aceleración centrípeta.
🟡 Lina: ¡Exacto! Un electrón en movimiento circular siempre tiene aceleración centrípeta, así que según la teoría de Maxwell, el electrón está emitiendo ondas electromagnéticas constantemente. Emitir ondas electromagnéticas significa perder energía.
🔵 Kai: Si pierde energía…… ¿qué le pasa al electrón?
🟡 Lina: Cae en espiral hacia el núcleo atómico. En el electromagnetismo clásico hay una fórmula que da la potencia radiada por una carga acelerada (la fórmula de Larmor). A grandes rasgos, cuando una carga \(e\) se mueve con aceleración \(a\), la potencia radiada (pérdida de energía por unidad de tiempo) es proporcional a \(P \propto e^2 a^2 / c^3\). El electrón del átomo de hidrógeno está a una distancia \(r \sim 10^{-10}\;\mathrm{m}\) del núcleo con aceleración centrípeta \(a \sim v^2/r\), así que se puede estimar la potencia radiada, y al dividir la energía total del electrón (\(\sim\) unos eV) por esta potencia, el tiempo de colapso es
aproximadamente — es decir, se completa en unos 10 mil millonésimos de segundo. El cálculo concreto puedes intentarlo en los problemas de práctica (la forma exacta de la fórmula de Larmor se da en el enunciado del problema, así que no necesitas memorizarla ahora).
🔵 Kai: ¡Es un instante! Pero en realidad los átomos existen de forma estable durante miles de millones de años……
🟡 Lina: Así es. Si seguimos la física clásica, los átomos no pueden existir de forma estable en absoluto. Sin embargo, en la realidad, los átomos que componen tu cuerpo han existido sin colapsar desde hace miles de millones de años. Esto es claramente una contradicción. En la Fig. 1.10「Colapso del átomo predicho por el electromagnetismo clásico」 dibujé cómo el electrón cae en espiral.
Fig. 1.10: Colapso del átomo predicho por el electromagnetismo clásico. El electrón pierde energía emitiendo ondas electromagnéticas y cae en espiral hacia el núcleo atómico. El colapso se completa en aproximadamente \(10^{-11}\) segundos.
🔵 Kai: Esto es grave…… Si aceptamos tanto la mecánica de Newton como el electromagnetismo de Maxwell, los átomos no pueden existir.
🟡 Lina: Hay otro problema más. Si el electrón cayera en espiral, la frecuencia de las ondas electromagnéticas emitidas durante el proceso debería variar continuamente. Esto es porque el radio orbital disminuye continuamente, así que la frecuencia de rotación del electrón también cambia continuamente. Sin embargo, cuando se examina experimentalmente la luz que emite un átomo, solo se observan frecuencias específicas. Las líneas espectrales son discretas.
⚪ Mei: Debería variar continuamente, pero en realidad es discreto — otra contradicción que la física clásica no puede explicar.
🟡 Lina: Exacto. La estabilidad atómica y la discretización del espectro — el modelo de Bohr que veremos a continuación resolvió estos dos misterios simultáneamente.
✅ Verificación de comprensión: Explica en no más de 2 oraciones por qué el electromagnetismo clásico dice que los átomos no pueden existir de forma estable.
Respuesta
Un electrón en movimiento circular está en movimiento acelerado, así que según el electromagnetismo de Maxwell emite ondas electromagnéticas y pierde energía continuamente. Como resultado, el electrón cae en espiral hacia el núcleo en aproximadamente \(10^{-11}\) segundos.
📝 Ejercicios:
- Estimación del orden de magnitud del tiempo de colapso atómico clásico → Problema M-3. Estimación del orden de magnitud del tiempo de colapso atómico clásico
1.5 El modelo atómico de Bohr y la fórmula de Rydberg¶
Espectros atómicos — Las «huellas dactilares» de la materia¶
🟡 Lina: Antes de entrar en el modelo de Bohr, veamos los hechos experimentales un poco más en detalle. Cuando se descompone con un prisma la luz que emite un átomo, aparecen solo frecuencias específicas como líneas delgadas (líneas de emisión). Esto se llama espectro (spectrum).
🔵 Kai: No salen todos los colores como un arcoíris, sino solo colores específicos.
🟡 Lina: Así es. El espectro tiene un patrón propio de cada elemento, como las «huellas dactilares» de la materia. En particular, el espectro del átomo de hidrógeno es el más simple y muestra un patrón regular.
En 1885, Balmer descubrió que las líneas espectrales en la región visible del átomo de hidrógeno seguían una fórmula matemática simple. Posteriormente esto se generalizó a lo que se conoce como la fórmula de Rydberg.
✅ Verificación de comprensión: ¿Qué significa que el espectro de un átomo sea «discreto»? Además, ¿en qué contradice esto la predicción de la física clásica?
Respuesta
La luz emitida por un átomo no contiene todas las frecuencias (colores), sino que aparecen solo frecuencias específicas como líneas delgadas de emisión. En el electromagnetismo clásico, como el radio orbital del electrón que cae en espiral varía continuamente, la frecuencia de la luz emitida también debería variar continuamente, y no se pueden explicar líneas espectrales discretas.
Donde - \(\lambda\): longitud de onda de la luz emitida - \(R_\infty\): constante de Rydberg. \(R_\infty \simeq 1.097 \times 10^7\;\mathrm{m^{-1}}\) - \(n, m\): enteros positivos (\(m > n\))
🔵 Kai: Si pongo números concretos en \(n\) y \(m\), ¿qué obtengo?
🟡 Lina: Con \(n = 1\) y \(m = 2, 3, 4, \ldots\) se obtiene una serie en la región ultravioleta. Esta se llama la serie de Lyman. Con \(n = 2\) y \(m = 3, 4, 5, \ldots\) se obtiene la serie en la región visible — la serie de Balmer.
⚪ Mei: El valor de \(n\) determina la serie, y al variar \(m\) se obtienen las líneas individuales dentro de la misma serie.
🟡 Lina: Exacto. Esta fórmula reproduce perfectamente los datos experimentales. Pero en 1885, nadie podía explicar por qué esta fórmula se cumplía. ¿Qué significan los enteros \(n\) y \(m\)? ¿Por qué tiene la forma \(1/n^2\)? Fue Bohr quien respondió a este misterio.
Los 3 postulados de Bohr¶
🟡 Lina: En 1913, el físico danés Niels Bohr aplicó las hipótesis cuánticas de Planck y Einstein al átomo y propuso un modelo atrevido. Consiste en 3 postulados.
Postulado 1: Existencia de estados estacionarios
El electrón solo puede existir de forma estable cuando está en órbitas específicas (estados estacionarios), y no emite ondas electromagnéticas. Las órbitas permitidas son discretas, y las órbitas intermedias no existen.
🔵 Kai: ¿¡Declarar que «no emite radiación»!? ¿No contradice eso la teoría de Maxwell?
🟡 Lina: La contradice. Bohr postuló explícitamente, como hipótesis, que «en el mundo atómico el electromagnetismo clásico no se aplica tal cual». Atrevido, ¿verdad?
Postulado 2: Condición cuántica
Las órbitas permitidas son solo aquellas en las que el momento angular \(L\) del electrón toma valores específicos. ¿Por qué el momento angular? Porque la unidad de la \(h\) de Planck es \(\mathrm{J \cdot s}\) (energía × tiempo), y esta tiene la misma dimensión que el momento angular. Verifiquémoslo — la dimensión de \(L = mvr\) es \(\mathrm{kg \cdot (m/s) \cdot m} = \mathrm{kg \cdot m^2/s}\). Por otro lado, \(\mathrm{J \cdot s} = \mathrm{kg \cdot m^2/s^2 \cdot s} = \mathrm{kg \cdot m^2/s}\). Efectivamente son iguales. Así que «si se impone una condición cuántica relacionada con \(h\), el momento angular es el candidato natural».
🔵 Kai: Precisamente porque las dimensiones coinciden, es natural imponer la condición sobre el momento angular.
🟡 Lina: El momento angular es una cantidad que representa el «ímpetu de rotación». El ímpetu del movimiento rectilíneo se expresa con el momento lineal \(mv\) (masa × velocidad) — ya lo viste en física del bachillerato. El ímpetu del movimiento rotacional se expresa como «momento lineal \(mv\) × radio de rotación \(r\)». ¿Por qué se multiplica por el radio? Porque aunque giren a la misma velocidad, cuanto mayor es el radio de rotación, más «difícil es detener la rotación» — por ejemplo, cuando haces girar una piedra atada a una cuerda, cuanto más larga es la cuerda más difícil es detenerla. A la misma velocidad, cuanto más lejos gira, mayor es el ímpetu rotacional. El ímpetu de rotación crece con «velocidad \(\times\) radio». Es decir, para un objeto de masa \(m\) en órbita circular de radio \(r\) a velocidad \(v\), se define \(L = mvr\). La condición de Bohr es
Donde \(\hbar\) (se lee «h barra») \(= h / 2\pi\) es la constante de Planck dividida por \(2\pi\), también llamada constante de Dirac (Dirac constant). Quizás pienses «¿por qué dividir por \(2\pi\) en lugar de usar \(h\) directamente?», pero esto está profundamente relacionado con el movimiento circular (una vuelta \(= 2\pi\) radianes, es decir \(360°\)), y se entenderá naturalmente cuando aprendas la onda de materia de de Broglie en el próximo capítulo. \(n\) se llama número cuántico (quantum number) y es un entero positivo. \(n = 0\) no está permitido — si el momento angular es cero, el electrón no está girando y la órbita no existiría.
🔵 Kai: Ya veo, con \(n = 0\) «no gira» así que caería al núcleo…… Pero, ¿es absolutamente imposible que exista un estado «sin girar»? ¿No se reverterá esto después?
🟡 Lina: Buena pregunta. En el modelo de Bohr la premisa es que «el electrón gira en una órbita circular», así que con \(n = 0\) (sin rotación) el radio orbital también sería cero y el electrón se superpondría con el núcleo — no tiene sentido como modelo. Así que dentro del marco del modelo de Bohr, \(n \geq 1\) es una restricción lógicamente correcta. Sin embargo, te adelanto que en la mecánica cuántica posterior sí se permiten estados con momento angular cero — en ese caso el electrón no «está girando», sino que tiene una forma de existir completamente diferente. Eso lo trataremos en detalle en capítulos posteriores. Por ahora, procedamos con \(n \geq 1\) dentro del marco del modelo de Bohr.
⚪ Mei: En resumen, el punto del postulado 2 es que «el momento angular solo puede ser un múltiplo entero de \(\hbar\)». Dividiendo el valor de \(h\) de antes por \(2\pi\):
que, al igual que \(h\), es extremadamente pequeño.
Postulado 3: Condición de frecuencia
Cuando el electrón «salta» de una órbita de energía \(E_m\) a una órbita de energía \(E_n\) (\(E_m > E_n\)), se emite luz con una frecuencia correspondiente a esa diferencia de energía.
⚪ Mei: El postulado 3 usa la \(E = h\nu\) de Planck. La diferencia de energía es exactamente la energía de un fotón.
🔵 Kai: Planck → Einstein → Bohr, el siguiente toma la idea del anterior y la desarrolla. Pero, ¿qué imagen concreta tiene eso de «saltar»?……
🟡 Lina: Buena pregunta. «Saltar» significa pasar instantáneamente a otra órbita sin pasar por estados intermedios — completamente diferente del «moverse gradualmente» clásico, es una descripción propia de la teoría cuántica. Mira la Fig. 1.11「Condición de frecuencia de Bohr」. Ilustré cómo cuando el electrón salta de un nivel alto a un nivel bajo, se emite un fotón correspondiente a la diferencia de energía. Y como para cada combinación de punto de partida y punto de llegada se emite una luz de diferente frecuencia, las líneas espectrales son discretas.
Fig. 1.11: Condición de frecuencia de Bohr. Cuando el electrón transiciona del nivel de energía \(E_m\) a \(E_n\) (\(m > n\)), se emite un fotón con energía \(h\nu\) igual a la diferencia de energía \(E_m - E_n\). Para cada combinación de punto inicial y final de la transición se emite luz de diferente frecuencia, lo que corresponde a las líneas espectrales discretas.
🟡 Lina: Para organizarlo, voy a comparar las ideas de cuantización de los 3 protagonistas (Tabla 1.3「Comparación de las ideas de cuantización de Planck, Einstein y Bohr」).
Tabla 1.3: Comparación de las ideas de cuantización de Planck, Einstein y Bohr
| Físico | ¿Qué cuantizó? | Ecuación | Nivel de audacia |
|---|---|---|---|
| Planck (1900) | La energía del oscilador | \(E = nh\nu\) | Lo consideraba «un truco de cálculo» |
| Einstein (1905) | La luz misma (fotones) | \(E_{\text{photon}} = h\nu\) | Cambió la forma de existencia de la luz |
| Bohr (1913) | Las órbitas del electrón (momento angular) | \(L = n\hbar\) | Abandonó parcialmente el electromagnetismo clásico |
🔵 Kai: Se siente como que se van haciendo más atrevidos. Truco de cálculo → esencia de la luz → abandono de la teoría clásica……
Derivación de los niveles de energía del átomo de hidrógeno¶
🟡 Lina: Ahora apliquemos los postulados de Bohr al átomo de hidrógeno y calculemos concretamente. El átomo de hidrógeno es el más simple: un núcleo con 1 protón (carga \(+e\)) alrededor del cual gira 1 electrón (carga \(-e\), masa \(m_e\)).
🔵 Kai: Es la versión más simple del modelo del sistema solar.
🟡 Lina: Supongamos que el electrón gira con velocidad \(v\) en una órbita circular de radio \(r\). La condición del movimiento circular es que la fuerza de Coulomb proporcione la fuerza centrípeta. En el bachillerato escribiste la fuerza de Coulomb como \(F = kq_1q_2/r^2\). Aquí usaré la notación estándar en física, reescribiendo la constante de Coulomb \(k\) como \(k = 1/(4\pi\varepsilon_0)\). \(\varepsilon_0\) se llama la permitividad del vacío (\(\varepsilon_0 \simeq 8.854 \times 10^{-12}\;\mathrm{F/m}\)), y simplemente es otra forma de escribir la constante de Coulomb \(k = 1/(4\pi\varepsilon_0)\) — es decir, contiene la misma información que \(k \simeq 8.99 \times 10^9\;\mathrm{N \cdot m^2/C^2}\). Si recuerdas el valor de \(k\) del bachillerato, puedes obtener \(\varepsilon_0 = 1/(4\pi k)\). En los cálculos solo hay que sustituir el valor concreto de \(\varepsilon_0\), así que por ahora no necesitas preocuparte por el significado de la unidad \(\mathrm{F/m}\). Para el átomo de hidrógeno, \(q_1 = +e\) (protón), \(q_2 = -e\) (electrón), y la magnitud de la fuerza es
El lado izquierdo es la magnitud de la fuerza de Coulomb, y el derecho es la fuerza centrípeta \(m_e v^2 / r\).
⚪ Mei: Es la misma estructura que «la fuerza gravitatoria proporciona la fuerza centrípeta» de la física del bachillerato. Solo que en vez de gravedad es la fuerza de Coulomb.
🟡 Lina: Reorganizando la ecuación (1.10):
Ahora usamos la condición cuántica del momento angular (postulado 2). El momento angular del movimiento circular es \(L = m_e v r\), así que
De la ecuación (1.12), \(v = n\hbar / (m_e r)\). Sustituyendo en la ecuación (1.11):
Multiplicando ambos lados por \(r\) y reorganizando:
🔵 Kai: ¡El radio orbital es proporcional a \(n^2\)! \(n = 1\) es la órbita más pequeña.
🟡 Lina: Así es. En la Fig. 1.12「Órbitas permitidas en el modelo atómico de Bohr」 dibujé las órbitas para cada número cuántico. ¿Puedes ver cómo el radio orbital crece rápidamente con \(n\)?
Fig. 1.12: Órbitas permitidas en el modelo atómico de Bohr. De \(r_n = a_0 n^2\), para \(n = 1, 2, 3, 4\) los radios orbitales son \(a_0, 4a_0, 9a_0, 16a_0\), creciendo cuadráticamente. No se permiten radios intermedios entre órbitas; el electrón solo puede existir en órbitas discretas.
🟡 Lina: El radio para \(n = 1\) se llama radio de Bohr (Bohr radius) y se escribe \(a_0\).
⚪ Mei: Aproximadamente \(0.5 \times 10^{-10}\;\mathrm{m}\)…… ¡Coincide con el orden de magnitud del tamaño atómico!
🟡 Lina: Ahora calculemos la energía. La energía total del electrón es la suma de la energía cinética y la energía potencial debida a la fuerza electrostática (energía potencial de Coulomb). Confirmemos el concepto de energía potencial.
🔵 Kai: La energía potencial, en el bachillerato la aprendimos como «\(mgh\) con el suelo como referencia», pero en el caso del átomo, ¿cuál es la referencia?
🟡 Lina: Buena pregunta. En el caso del átomo, tomamos como referencia (cero) «el estado en que el electrón está infinitamente lejos del núcleo y ya no siente la atracción». En el espacio donde no hay suelo, definimos como cero el «estado completamente libre». Entonces, cuando dos cargas que se atraen se acercan a una distancia \(r\), la energía potencial es \(-e^2/(4\pi\varepsilon_0 r)\). Esto es la cantidad que se obtiene al tomar con signo negativo el «trabajo realizado contra la fuerza de atracción de Coulomb para separar el electrón desde la distancia \(r\) hasta el infinito». Cuanto más se acerca atraído por la fuerza, más baja su energía, por eso el signo es negativo — la misma estructura que la energía potencial gravitatoria \(-GMm/r\).
⚪ Mei: Tomar el infinito como cero, y cuanto más ligado más negativo — es intuitivamente comprensible.
🟡 Lina: Los detalles de la derivación los dejo para los problemas de práctica, pero por ahora recuerda que «cuando la fuerza es proporcional a \(1/r^2\), al calcular el trabajo para separar desde la distancia \(r\) hasta el infinito, resulta proporcional a \(1/r\)». En términos de las matemáticas del bachillerato, la magnitud de la fuerza de Coulomb es \(F = e^2/(4\pi\varepsilon_0 r'^2)\). El trabajo para separar el electrón desde la distancia \(r\) hasta \(R\) contra la atracción es «la integral de fuerza × distancia recorrida»:
(como se aplica la fuerza en la dirección de separación, fuerza y dirección de movimiento coinciden: \(\cos\theta = 1\)). Primero, fijándonos solo en la dependencia de \(r\): como \(1/r'^2 = r'^{-2}\), usamos la fórmula \(\int x^n\,dx = x^{n+1}/(n+1)\) (\(n \neq -1\)) que aprendiste en bachillerato. Sustituye \(n = -2\) — como \(n + 1 = -1\): \(\int r'^{-2}\,dr' = r'^{-1}/(-1) = -1/r'\).
🔵 Kai: Ah, \(r'^{-1}\) es \(1/r'\). Con el signo negativo queda \(-1/r'\).
🟡 Lina: Así es. La integral definida es «valor en el límite superior − valor en el límite inferior», así que \([-1/r']_r^R = (-1/R) - (-1/r) = 1/r - 1/R\). Aquí, si hacemos \(R\) infinitamente grande, \(1/R\) se acerca cada vez más a cero (\(R = 100\) da \(0.01\), \(R = 10000\) da \(0.0001\)……). Así que en el límite \(R \to \infty\), \(1/R \to 0\), y la integral converge a \(1/r\). «Llevar el límite superior a infinito» va un poco más allá del bachillerato, pero esencialmente «si te separas lo suficiente, \(1/R\) es despreciablemente pequeño». Multiplicando de vuelta por la constante de proporcionalidad \(e^2/(4\pi\varepsilon_0)\), el «trabajo de separación» es \(+e^2/(4\pi\varepsilon_0 r)\). La energía potencial es «la energía que bajó desde el infinito (referencia cero) hasta la posición actual», así que invirtiendo el signo: \(-e^2/(4\pi\varepsilon_0 r)\).
🔵 Kai: Integrando la fuerza respecto a la distancia, \(1/r^2\) se convierte en \(1/r\). Que el signo de la energía potencial sea negativo también tiene sentido: cuanto más ligado, más bajo.
🟡 Lina: Es decir:
Dividiendo ambos lados de la ecuación (1.11) por 2: \(\frac{1}{2}m_e v^2 = \frac{e^2}{8\pi\varepsilon_0 r}\), así que
Sustituyendo \(r_n = a_0 n^2\):
⚪ Mei: La energía cinética es igual a la mitad de la magnitud de la energía potencial, y el total es negativo — el patrón típico de un estado ligado.
🟡 Lina: Ahora calculemos el valor de la parte constante. Cuando se trabaja con energías de átomos y moléculas, en julios (J) los valores son extremadamente pequeños y resulta inconveniente. Usaré el \(\mathrm{eV}\) (electrón-voltio, \(1\;\mathrm{eV} = 1.602 \times 10^{-19}\;\mathrm{J}\)) que introdujimos antes.
Sustituyendo \(e = 1.602 \times 10^{-19}\;\mathrm{C}\), \(\varepsilon_0 = 8.854 \times 10^{-12}\;\mathrm{F/m}\), \(a_0 = 0.529 \times 10^{-10}\;\mathrm{m}\) en la parte constante de la ecuación (1.15):
Por lo tanto
🔵 Kai: ¡La energía toma valores discretos proporcionales a \(1/n^2\)! \(n = 1\) es el estado de menor energía (estado fundamental), y a medida que \(n\) aumenta la energía sube.
🟡 Lina: En la Fig. 1.13「Diagrama de niveles de energía del átomo de hidrógeno」 ilustré los niveles de energía. ¿Puedes ver cómo el espaciado entre niveles se hace más estrecho a medida que \(n\) aumenta?
Fig. 1.13: Diagrama de niveles de energía del átomo de hidrógeno. Desde \(n = 1\) (estado fundamental) hasta \(n = \infty\) (ionización), la energía viene dada por \(-13.6/n^2\) eV. Las flechas representan transiciones del electrón (emisión de luz).
Derivación de la fórmula de Rydberg¶
🟡 Lina: Ahora derivemos la fórmula de Rydberg. Usando la condición de frecuencia (postulado 3), calculemos la frecuencia de la luz emitida cuando el electrón transiciona del estado con número cuántico \(m\) al estado con número cuántico \(n\) (\(m > n\)).
Cuando el electrón cae del nivel de energía alto \(E_m\) al nivel bajo \(E_n\), como \(m > n\) tenemos \(1/m^2 < 1/n^2\). Por ejemplo, \(m = 3,\; n = 2\): \(E_3 = -13.6/9 \simeq -1.51\;\mathrm{eV}\), \(E_2 = -13.6/4 = -3.40\;\mathrm{eV}\). En la recta numérica, \(-1.51\) está a la derecha (es mayor) que \(-3.40\), así que \(E_m > E_n\). En general, un número negativo es mayor cuanto menor es su valor absoluto. Por lo tanto
Como \(m > n\), tenemos \(1/n^2 - 1/m^2 > 0\), lo que garantiza \(h\nu > 0\).
🔵 Kai: ¡Sale una energía positiva. Esa es la que sale como fotón.
🟡 Lina: Entre la frecuencia \(\nu\) y la longitud de onda \(\lambda\) de la luz hay la relación \(c = \nu\lambda\) (\(c \simeq 3.0 \times 10^8\;\mathrm{m/s}\) es la velocidad de la luz). La onda vibra \(\nu\) veces por segundo, y la longitud de una onda es \(\lambda\), así que la distancia recorrida en 1 segundo es \(\nu\lambda = c\). Usando esto:
Aquí, expresemos \(R_\infty\) de la fórmula de Rydberg (1.6) en términos de constantes fundamentales. El objetivo es aclarar qué es \(R_\infty\) en \(1/\lambda = R_\infty(1/n^2 - 1/m^2)\).
Dividiendo ambos lados de \(h\nu = 13.6\;\mathrm{eV}\,(1/n^2 - 1/m^2)\) por \(hc\) (ya que \(\nu/c = 1/\lambda\)):
Así que \(R_\infty = 13.6\;\mathrm{eV}/(hc)\). Para escribirlo en constantes fundamentales, sustituimos en la parte constante de la ecuación (1.15), \(e^2/(8\pi\varepsilon_0 a_0)\), la ecuación (1.14): \(a_0 = 4\pi\varepsilon_0\hbar^2/(m_e e^2)\). Como \(1/a_0 = m_e e^2/(4\pi\varepsilon_0\hbar^2)\):
Es decir \(13.6\;\mathrm{eV} = m_e e^4/(32\pi^2\varepsilon_0^2\hbar^2)\) (el \(32\pi^2\) viene de multiplicar el denominador \(8\pi\varepsilon_0\) de \(e^2/(8\pi\varepsilon_0 a_0)\) por el denominador \(4\pi\varepsilon_0\hbar^2\) de \(1/a_0 = m_e e^2/(4\pi\varepsilon_0\hbar^2)\): \(8\pi \times 4\pi = 32\pi^2\)). Dividiendo por \(hc\):
Como \(\hbar = h/(2\pi)\), entonces \(\hbar^2 = h^2/(4\pi^2)\). Sustituyendo: el numerador es \(m_e e^4\) (como obtuvimos antes), y mirando el denominador:
🔵 Kai: A ver, sustituyo \(\hbar^2 = h^2/(4\pi^2)\) en el denominador, los \(\pi\) se simplifican entre \(32\pi^2\) y \(4\pi^2\) dando \(32/4 = 8\), y \(h^2 \cdot h = h^3\), así que queda \(8\varepsilon_0^2 h^3 c\). Pero antes apareció \(\hbar = h/(2\pi)\), y aquí se escribe con \(h\). ¿Hay algún criterio para usar uno u otro?
🟡 Lina: Buen ojo. En este cálculo, al sustituir \(\hbar^2 = h^2/(4\pi^2)\) los \(\pi\) se simplificaron limpiamente y la fórmula final quedó solo con \(h\), ¿verdad? Si en cambio sustituyeras \(h = 2\pi\hbar\) para reescribir con \(\hbar\), los \(\pi\) reaparecerían y la fórmula se complicaría un poco. Como criterio general de uso: cuando se combina con la frecuencia \(\nu\) se usa \(h\) (\(E = h\nu\)), cuando se combina con la frecuencia angular \(\omega\) se usa \(\hbar\) (\(E = \hbar\omega\)) — porque así los \(2\pi\) se cancelan y queda más limpio. La frecuencia angular \(\omega\) se define como \(\omega = 2\pi\nu\): mientras \(\nu\) es «cuántas veces vibra por segundo», \(\omega\) es «cuántos radianes (ángulo) avanza por segundo». Como una vibración completa recorre \(2\pi\) radianes (\(360°\)), \(\omega = 2\pi\nu\). Lo usaremos activamente a partir del próximo capítulo; por ahora solo recuerda la pauta para elegir entre \(h\) y \(\hbar\).
⚪ Mei: Es decir, la pauta práctica es «elegir la que hace que desaparezcan los \(\pi\)».
🟡 Lina: Históricamente también es estándar escribir la constante de Rydberg con \(h\), así que continuemos así. Sustituyendo los valores \(m_e = 9.109 \times 10^{-31}\;\mathrm{kg}\), \(e = 1.602 \times 10^{-19}\;\mathrm{C}\), \(\varepsilon_0 = 8.854 \times 10^{-12}\;\mathrm{F/m}\), \(h = 6.626 \times 10^{-34}\;\mathrm{J \cdot s}\), \(c = 2.998 \times 10^8\;\mathrm{m/s}\), obtenemos \(R_\infty \simeq 1.097 \times 10^7\;\mathrm{m^{-1}}\), que coincide perfectamente con el valor experimental. En resumen:
Usando esto:
🔵 Kai: ¡Esto es exactamente la fórmula de Rydberg (1.6) de antes! Que algo que durante 30 años no se sabía «por qué se cumplía» salga solo de los 3 postulados de Bohr……
🟡 Lina: ¡Así es! El modelo de Bohr derivó teóricamente la fórmula de Rydberg que había sido un misterio durante 30 años. Además, pudo calcular el valor de la constante de Rydberg solo a partir de constantes fundamentales (\(m_e\), \(e\), \(\varepsilon_0\), \(h\), \(c\)), y coincidió perfectamente con el valor experimental. En la Fig. 1.14「Distribución de longitudes de onda de las series espectrales del átomo de hidrógeno (eje logarítmico)」 resumí en qué región de longitud de onda aparece cada serie.
Fig. 1.14: Distribución de longitudes de onda de las series espectrales del átomo de hidrógeno (eje logarítmico). La serie de Lyman que cae a \(n_f = 1\) está en el ultravioleta, la serie de Balmer que cae a \(n_f = 2\) está en el visible (banda amarilla), y la serie de Paschen que cae a \(n_f = 3\) está en el infrarrojo. El punto de inicio de cada serie corresponde a la energía de ionización, y cuanto mayor es \(n_i\), más se agrupan las líneas.
🟡 Lina: Resumamos los logros hasta aquí. Lo que resolvió el modelo de Bohr: - Estabilidad atómica: el electrón no emite ondas electromagnéticas cuando está en un estado estacionario (postulado 1) - Discretización del espectro: como las órbitas permitidas son discretas, las diferencias de energía también son discretas, y las frecuencias de la luz emitida son discretas - Derivación de la fórmula de Rydberg: se reproduce completamente a partir de \(E_n = -13.6\;\mathrm{eV}/n^2\) y la condición de frecuencia
⚪ Mei: Corresponde limpiamente a las 3 crisis.
Limitaciones del modelo de Bohr¶
🟡 Lina: Sin embargo, también debo mencionar que el modelo de Bohr tiene limitaciones.
🔵 Kai: ¿Limitaciones? Pero si derivó la fórmula de Rydberg tan brillantemente……
🟡 Lina: El modelo de Bohr explicó brillantemente el espectro del átomo de hidrógeno (1 electrón), pero no pudo aplicarse a átomos con 2 o más electrones (del helio en adelante). Además, no podía responder a «por qué no emite radiación en estados estacionarios» ni «por qué el momento angular es un múltiplo entero de \(\hbar\)». Lo resumo (Tabla 1.4「Éxitos y limitaciones del modelo de Bohr」).
Tabla 1.4: Éxitos y limitaciones del modelo de Bohr
| Puntos de éxito | Limitaciones / puntos sin resolver |
|---|---|
| Reproduce completamente el espectro del hidrógeno | No aplicable a átomos multielectrónicos (del helio en adelante) |
| Deriva la constante de Rydberg a partir de constantes fundamentales | No responde «por qué no emite radiación en estados estacionarios» |
| Explica la estabilidad atómica | No tiene fundamento para «por qué \(L = n\hbar\)» |
| Predice correctamente el orden de magnitud del tamaño atómico | No puede predecir la intensidad (brillo) de las líneas espectrales |
🔵 Kai: «Por qué es un múltiplo entero de \(\hbar\)»…… es cierto que Bohr solo dijo «lo supongo así» y no explicó la razón. Que una suposición dé resultados correctos no significa necesariamente que la suposición sea correcta…… ¿verdad?
🟡 Lina: Exactamente. Es la idea que discutimos en el prólogo: «un modelo físico no es más que la mejor hipótesis que no contradice los experimentos». El modelo de Bohr no contradice los experimentos del átomo de hidrógeno, pero se necesita una teoría más profunda que explique «por qué es así» — esa es la razón por la que se le llama un «modelo provisional».
⚪ Mei: Da la respuesta correcta, pero su fundamento no está claro — para el verdadero «por qué» se necesita una teoría más profunda.
🟡 Lina: Exacto. La verdadera respuesta — la respuesta al «por qué» — fue dada por primera vez por la mecánica cuántica completada en 1925-26 por Heisenberg y Schrödinger. El modelo de Bohr jugó un papel históricamente extremadamente importante como puente de la física clásica a la mecánica cuántica.
🔵 Kai: La secuencia es: clásica → Bohr → mecánica cuántica completa.
🟡 Lina: Así es. Y en este viaje, para responder al «por qué» del modelo de Bohr, a partir de Cap. 4 construiremos paso a paso la mecánica cuántica desde el concepto de amplitud de probabilidad.
✅ Verificación de comprensión: Menciona 2 limitaciones principales del modelo de Bohr.
Respuesta
① No puede explicar el espectro de átomos con 2 o más electrones (del helio en adelante). ② No puede explicar las razones fundamentales de «por qué no emite ondas electromagnéticas en estados estacionarios» ni «por qué el momento angular es un múltiplo entero de \(\hbar\)» (solo lo postuló sin derivarlo).
✅ Verificación de comprensión: Cuando se aplica la condición cuántica de Bohr \(L = n\hbar\) al átomo de hidrógeno, ¿cuántas veces mayor es el radio orbital de \(n = 2\) respecto al de \(n = 1\)?
Respuesta
De la ecuación (1.13), \(r_n \propto n^2\), así que \(r_2 / r_1 = 2^2 / 1^2 = 4\) veces.
✅ Verificación de comprensión: Calcula la longitud de onda de la luz emitida cuando el electrón del átomo de hidrógeno transiciona de \(n = 3\) a \(n = 2\), usando la fórmula de Rydberg.
Respuesta
\(\displaystyle \frac{1}{\lambda} = R_\infty\left(\frac{1}{2^2} - \frac{1}{3^2}\right) = 1.097 \times 10^7 \left(\frac{1}{4} - \frac{1}{9}\right) = 1.097 \times 10^7 \times \frac{5}{36} \simeq 1.524 \times 10^6\;\mathrm{m^{-1}}\)
\(\lambda \simeq 6.56 \times 10^{-7}\;\mathrm{m} = 656\;\mathrm{nm}\) (luz roja — línea \(H_\alpha\) de la serie de Balmer).
📝 Ejercicios:
- Cálculo de la energía de ionización del átomo de hidrógeno con el modelo de Bohr → Problema M-1. Derivación de los niveles de energía del átomo de hidrógeno mediante el modelo de Bohr
Resumen — Los límites de la física clásica y el amanecer de la teoría cuántica¶
🟡 Lina: Organicemos lo que hemos visto en este capítulo (Tabla 1.5「Las 3 crisis de la física clásica y su resolución por la teoría cuántica」). A finales del siglo XIX, la física clásica enfrentó 3 crisis graves.
Tabla 1.5: Las 3 crisis de la física clásica y su resolución por la teoría cuántica
| Crisis | Núcleo del problema | Quién la resolvió y cuándo | Idea clave |
|---|---|---|---|
| Catástrofe ultravioleta de la radiación de cuerpo negro | La energía de radiación diverge a infinito a alta frecuencia | Planck (1900) | La energía es un múltiplo entero de \(h\nu\) (hipótesis cuántica) |
| Misterio del efecto fotoeléctrico | El color de la luz es lo decisivo, la intensidad es irrelevante | Einstein (1905) | La luz es partícula (fotón) con energía \(h\nu\) |
| Estabilidad atómica | El electrón colapsa en espiral en \(\sim 10^{-11}\) s | Bohr (1913) | Solo se permiten órbitas discretas para el electrón |
🟡 Lina: Mirando estas 3 rupturas en orden cronológico, se ve que en apenas 13 años se construyeron los fundamentos de la teoría cuántica. Mira la Fig. 1.15「Línea temporal del nacimiento de la teoría cuántica」.
Fig. 1.15: Línea temporal del nacimiento de la teoría cuántica. Hipótesis cuántica de Planck (1900) → Hipótesis del cuanto de luz de Einstein (1905) → Descubrimiento del núcleo atómico por Rutherford (1911) → Modelo atómico de Bohr (1913). Cada descubrimiento se construye sobre los logros anteriores, y se puede ver el flujo de herencia y desarrollo de la idea cuántica.
🔵 Kai: Lo que todos tienen en común es «lo discreto». La energía es discreta, la luz es granular, las órbitas son discretas…… Pero «por qué la naturaleza es discreta» — esa razón aún no ha aparecido, ¿verdad?
🟡 Lina: Te has dado cuenta de algo importante. De hecho, responder a ese «por qué» es el cuerpo principal de la mecánica cuántica que vamos a estudiar. Tanto Planck como Bohr solo mostraron que «si suponemos que es discreto, coincide con el experimento», sin poder explicar su fundamento. El fundamento se verá a partir de Cap. 4, cuando aprendamos la función de onda y las condiciones de contorno. Por ahora, asegúrate de tener claro el punto de partida: «la discretización es un hecho experimental».
⚪ Mei: Es decir, las 3 crisis de este capítulo solo mostraron que «se resuelven si se supone la discretización», y el «por qué es discreto» queda sin resolver, pospuesto para los capítulos siguientes.
🟡 Lina: De «continuo» a «discreto» — este es el cambio de paradigma más fundamental de la física clásica a la teoría cuántica. Y la constante que atraviesa todo esto es
La constante de Planck \(h\). El hecho de que esta constante tenga un valor finito distinto de cero es lo que hace el mundo «discreto».
🔵 Kai: Entonces, si \(h\) fuera cero, ¿qué pasaría? ¿Dejaría de ser discreto?
🟡 Lina: Exacto. Si \(h = 0\), todos los efectos cuánticos desaparecerían y volveríamos a la física clásica. Y \(h\) es muy pequeño pero no cero — por eso la física clásica es una buena aproximación en la escala cotidiana, mientras que en la escala atómica los efectos cuánticos dominan. Se puede decir que «la física clásica es el límite \(h \to 0\)».
⚪ Mei: Es decir, la pequeñez de \(h\) es lo que determina la «frontera entre lo clásico y lo cuántico».
🔵 Kai: Ya veo…… Como \(h\) no es cero, el mundo es discreto, pero como es pequeño normalmente no nos damos cuenta. Además, me impresionó que Einstein sea uno de los fundadores de la teoría cuántica. Él mismo dijo «la luz es partícula» y luego criticó la mecánica cuántica…… ¿Qué fue lo que tanto le disgustó?
🟡 Lina: Buena pregunta. La hipótesis del cuanto de luz de 1905, la teoría de emisión estimulada de 1917 — Einstein fue alguien del lado de quienes crearon la teoría cuántica. Pero cuando la mecánica cuántica se completó, sintió una profunda incomodidad con la interpretación de que «el comportamiento de la naturaleza es esencialmente probabilístico». La famosa frase «Dios no juega a los dados» es la expresión de esa incomodidad. Veremos en detalle qué fue exactamente lo problemático en Cap. 21 (cuantificación de la emisión estimulada) y Cap. 23 (la controversia EPR y la desigualdad de Bell). Espéralo con ganas.
Avance del próximo capítulo¶
🟡 Lina: En este capítulo hemos visto las 3 crisis de la física clásica y las soluciones «discretas» para cada una. Pero queda un gran misterio.
Einstein dijo que «la luz también es partícula (fotón)». Pero que la luz es una onda es un hecho establecido por experimentos de interferencia. Ser onda y al mismo tiempo partícula — ¿qué significa eso exactamente?
Además, en 1924 — unos 10 años después del modelo de Bohr — de Broglie hizo una propuesta en la dirección opuesta. «Si la luz también es partícula, ¿no serán las partículas como el electrón también ondas?» — y esto fue confirmado experimentalmente. Mira la Fig. 1.16「Formación del patrón de interferencia de electrones en la doble rendija」. Cuando se disparan electrones uno a uno hacia una rendija, al principio solo se ven puntos aleatorios, pero al aumentar el número emerge un patrón de interferencia de ondas. Este experimento es la evidencia más directa de que la idea de «onda de materia» de de Broglie es correcta, y será el punto de partida del próximo capítulo.
Fig. 1.16: Formación del patrón de interferencia de electrones en la doble rendija. Evolución temporal de la distribución de impactos cuando se disparan electrones uno a uno a una doble rendija. Con pocos electrones parecen manchas aleatorias, pero al acumular muchos emerge un patrón de interferencia de ondas. Un experimento que muestra directamente que «siendo partículas poseen propiedades de onda», y es el punto de partida de la onda de materia de de Broglie que trataremos en el próximo capítulo.
En el próximo capítulo seguiremos esta hipótesis atrevida y el experimento de difracción de electrones que la confirmó dramáticamente. Presenciemos el momento en que la frontera entre partícula y onda se disuelve.
Problemas de práctica¶
📝 Ejercicios:
- Cálculo para apreciar la pequeñez de la constante de Planck → Problema B-1. Experimentar la pequeñez de la constante de Planck
- Cálculo de la función de trabajo y la frecuencia umbral → Problema B-2. Función de trabajo y frecuencia umbral
- Estimación del orden de magnitud del tiempo de colapso atómico clásico → Problema M-3. Estimación del orden de magnitud del tiempo de colapso atómico clásico
- Cálculo de la energía de ionización del átomo de hidrógeno con el modelo de Bohr → Problema M-1. Derivación de los niveles de energía del átomo de hidrógeno mediante el modelo de Bohr
Referencias¶
- M. Planck, "Zur Theorie des Gesetzes der Energieverteilung im Normalspectrum," Verhandlungen der Deutschen Physikalischen Gesellschaft 2, 237–245 (1900).
- A. Einstein, "Über einen die Erzeugung und Verwandlung des Lichtes betreffenden heuristischen Gesichtspunkt," Annalen der Physik 17, 132–148 (1905).
- N. Bohr, "On the Constitution of Atoms and Molecules," Philosophical Magazine 26, 1–25 (1913).
- R. P. Feynman, R. B. Leighton, M. Sands, The Feynman Lectures on Physics, Vol. III (Addison-Wesley, 1965), Ch. 1.
- C. Rovelli, Reality Is Not What It Seems (Penguin, 2016), Ch. 6.
- 清水明『新版 量子論の基礎——その本質のやさしい理解のために』(サイエンス社, 2004), 第 1 章「古典物理学の破綻」.
- D. J. Griffiths, Introduction to Quantum Mechanics, 3rd ed. (Cambridge University Press, 2018), §1.1.
Feedback on this page
Let us know if something was unclear, incorrect, or could be improved.















