Principio de relatividad y transformación de Lorentz
Exploramos el concepto de sistemas de referencia y la transformación de Galileo ampliamente utilizada en la mecánica clásica. También examinamos brevemente las ecuaciones de Maxwell y el experimento de Michelson-Morley que sirvieron de base para la aparición de la transformación de Lorentz, y derivamos la matriz de transformación de Lorentz.
TL;DR
Principio de relatividad: Principio según el cual todas las leyes físicas deben ser las mismas en todos los sistemas de referencia que se mueven a velocidad constante entre sí
Factor de Lorentz $\gamma$
\[\gamma = \frac{1}{\sqrt{1-v^2/c^2}}\]
Transformación de Lorentz
\[\begin{pmatrix} \vec{x}^\prime \\ ct^\prime \end{pmatrix} = \begin{pmatrix} \gamma & -\gamma\vec{\beta} \\ -\gamma\vec{\beta} & \gamma \end{pmatrix} \begin{pmatrix} \vec{x} \\ ct \end{pmatrix}.\]
- $ \vec{x^\prime} = \gamma\vec{x}-\gamma\vec{\beta}ct $
- $ ct^\prime = \gamma ct - \gamma \vec{\beta}\cdot\vec{x} $
Transformación de Lorentz inversa
\[\begin{pmatrix} \vec{x} \\ ct \end{pmatrix} = \begin{pmatrix} \gamma & \gamma\vec{\beta} \\ \gamma\vec{\beta} & \gamma \end{pmatrix} \begin{pmatrix} \vec{x^\prime} \\ ct^\prime \end{pmatrix}.\]
- $ \vec{x} = \gamma\vec{x^\prime}+\gamma\vec{\beta}ct^\prime $
- $ ct = \gamma ct^\prime + \gamma \vec{\beta}\cdot\vec{x^\prime} $
Sistemas de referencia y principio de relatividad
Sistema de referencia (frame of reference)
- Sistema de referencia (frame of reference): Dado que el movimiento de un objeto significa que su posición cambia relativamente respecto a otros objetos, y todo movimiento es relativo, es necesario establecer un sistema de referencia para describir cualquier movimiento.
- Sistema de referencia inercial (inertial frames of reference): Un sistema en el que se cumple la primera ley del movimiento de Newton (“El estado de movimiento de un objeto permanece invariable mientras la fuerza neta que actúa sobre él sea cero”). Cualquier sistema de referencia que se mueve a velocidad constante respecto a un sistema inercial es también un sistema inercial.
Principio de relatividad (Principle of Relativity)
Es uno de los conceptos principales y una premisa básica de la física, que establece que todas las leyes físicas deben ser las mismas en todos los sistemas de referencia que se mueven a velocidad constante entre sí. Si las leyes físicas fueran diferentes para observadores en movimiento relativo, esta diferencia podría usarse para establecer un sistema de referencia absoluto y determinar quién está en reposo y quién en movimiento. Sin embargo, según el principio de relatividad, tal distinción no existe, por lo que no hay un sistema de referencia absoluto o movimiento absoluto para todo el universo, y todos los sistemas de referencia inerciales son equivalentes.
Limitaciones de la transformación de Galileo
Transformación de Galileo (Galilean transformation)
Supongamos que existen dos sistemas inerciales $S$ y $S^{\prime}$, donde $S^{\prime}$ se mueve con una velocidad constante $\vec{v}$ en la dirección $+x$ respecto a $S$, y un mismo evento es observado en las coordenadas $(x, y, z)$ en el tiempo $t$ en $S$, y en las coordenadas $(x^{\prime}, y^{\prime}, z^{\prime})$ en el tiempo $t^{\prime}$ en $S^{\prime}$.
En este caso, el valor del movimiento en la dirección $x$ medido en $S^{\prime}$ será mayor que el valor medido en $S$ por la distancia $\vec{v}t$ que $S^{\prime}$ se ha movido respecto a $S$ en la dirección $x$, por lo que
\[x^{\prime} = x - \vec{v}t \label{eqn:galilean_transform_x} \tag{1}\]y, como no hay movimiento relativo en las direcciones $y$ y $z$,
\[\begin{align*} y^{\prime} = y \label{eqn:galilean_transform_y} \tag{2} \\ z^{\prime} = z \label{eqn:galilean_transform_z} \tag{3} \end{align*}\]e intuitivamente, podemos asumir que
\[t^{\prime} = t \tag{4} \label{eqn:galilean_transform_t}\]Esta transformación de coordenadas entre diferentes sistemas inerciales, desde la ecuación ($\ref{eqn:galilean_transform_x}$) hasta la ($\ref{eqn:galilean_transform_t}$), se conoce como transformación de Galileo (Galilean transformation), y es simple e intuitiva ya que se ajusta a la mayoría de las situaciones cotidianas. Sin embargo, como se mencionará más adelante, esto contradice las ecuaciones de Maxwell.
Ecuaciones de Maxwell
A finales del siglo XIX, Maxwell expandió las ideas y resultados de investigaciones previas propuestas por otros científicos como Faraday y Ampère, revelando que la electricidad y el magnetismo son en realidad una sola fuerza, y derivó las siguientes cuatro ecuaciones que describen el campo electromagnético.
- \[\begin{gather*}\nabla\cdot{E}=\frac{q}{\epsilon_0} \\ \text{: El flujo eléctrico a través de cualquier superficie cerrada es igual a la carga neta en su interior (Ley de Gauss).} \end{gather*}\]
- \[\begin{gather*}\nabla\cdot{B}=0 \\ \text{: No existen monopolos magnéticos.} \end{gather*}\]
- \[\begin{gather*}\nabla\times{E}=-\frac{\partial B}{\partial t} \\ \text{: Un campo magnético variable crea un campo eléctrico (Ley de Faraday).} \end{gather*}\]
- \[\begin{gather*}\nabla\times{B}=\mu_0\left(J+\epsilon_0\frac{\partial E}{\partial t}\right) \\ \text{: Las corrientes eléctricas y los campos eléctricos variables crean campos magnéticos (Ley de Ampère-Maxwell).} \end{gather*}\]
Las ecuaciones de Maxwell explicaron con éxito todos los fenómenos eléctricos y magnéticos conocidos hasta entonces, predijeron la existencia de ondas electromagnéticas y también derivaron que la velocidad de las ondas electromagnéticas en el vacío, $c$, es una constante invariable, convirtiéndose en las fórmulas centrales del electromagnetismo.
Contradicción entre la transformación de Galileo y las ecuaciones de Maxwell
La mecánica newtoniana, que utiliza la transformación de Galileo, ha sido la base de la física durante más de 200 años, y las ecuaciones de Maxwell son, como se mencionó anteriormente, las ecuaciones centrales que describen los fenómenos eléctricos y magnéticos. Sin embargo, existe una contradicción entre ambas:
- Según el principio de relatividad, se espera que las ecuaciones de Maxwell también tengan la misma forma en todos los sistemas inerciales, pero cuando se aplica la transformación de Galileo para convertir los valores medidos en un sistema inercial a los valores medidos en otro sistema inercial, las ecuaciones de Maxwell toman una forma muy diferente.
- Aunque la velocidad de la luz $c$ se puede calcular a partir de las ecuaciones de Maxwell y es una constante invariable, según la mecánica newtoniana y la transformación de Galileo, la velocidad de la luz $c$ se mide de manera diferente en diferentes sistemas inerciales.
Por lo tanto, las ecuaciones de Maxwell y la transformación de Galileo no son compatibles entre sí, y al menos una de ellas debía ser modificada. Esto se convirtió en el trasfondo para la aparición de la transformación de Lorentz (Lorentz transformation), que se discutirá más adelante.
Teoría del éter (aether) y experimento de Michelson-Morley
Por otro lado, en la física del siglo XIX se creía que la luz, al igual que otras ondas como las ondas de agua o el sonido, se transmitía a través de un medio hipotético llamado éter (aether), y se hicieron esfuerzos para descubrir la existencia de este éter.
Según la teoría del éter, incluso si el espacio estuviera vacío, estaría lleno de éter, por lo que se pensaba que la rotación de la Tierra, que se mueve a una velocidad de aproximadamente 30 km/s con respecto al Sol, formaría un viento de éter que atravesaría la Tierra.
Fuente de la imagen
- Autor: Usuario de Wikimedia Cronholm144
- Licencia: CC BY-SA 3.0
Para verificar esta hipótesis, en 1887 Michelson, en colaboración con Morley, realizó el experimento de Michelson-Morley (Michelson-Morley Experiment) utilizando el interferómetro que se muestra a continuación.
Fuente de la imagen
- Autor: Albert Abraham Michelson con Edward Morley
- Licencia: dominio público
En este experimento, el rayo de luz se divide en dos al pasar por un espejo semitransparente, luego cada rayo viaja de ida y vuelta por los dos brazos perpendiculares del interferómetro, recorriendo un total de unos 11 m, y se encuentran en el punto medio, donde se producen patrones de interferencia constructiva o destructiva según la diferencia de fase entre los dos rayos. Según la teoría del éter, se esperaba que la velocidad de la luz variara dependiendo de la velocidad relativa al éter, lo que resultaría en un cambio en esta diferencia de fase y, por lo tanto, se podría observar un cambio en los patrones de interferencia. Sin embargo, en realidad no se pudo observar ningún cambio en los patrones de interferencia. Hubo varios intentos de explicar estos resultados experimentales, entre los cuales FitzGerald y Lorentz propusieron la contracción de Lorentz-FitzGerald (Lorentz–FitzGerald contraction) o contracción de longitud (length contraction), que sugiere que la longitud de un objeto se contrae cuando se mueve relativamente al éter, lo que condujo a la transformación de Lorentz.
En ese momento, Lorentz creía en la existencia del éter y pensaba que la contracción de longitud ocurría debido al movimiento relativo al éter. Más tarde, Einstein interpretó el verdadero significado físico de la transformación de Lorentz con su Teoría de la Relatividad Especial (Theory of Special Relativity), explicando la contracción de longitud en términos del concepto de espacio-tiempo en lugar del éter, y también se descubrió posteriormente que el éter no existe.
Transformación de Lorentz (Lorentz transformation)
Derivación de la transformación de Lorentz
En la misma situación que en la transformación de Galileo (ecuaciones [$\ref{eqn:galilean_transform_x}$]-[$\ref{eqn:galilean_transform_t}$]), supongamos que la relación de transformación correcta entre $x$ y $x^{\prime}$ que no contradice las ecuaciones de Maxwell es la siguiente:
\[x^{\prime} = \gamma(x-\vec{v}t). \label{eqn:lorentz_transform_x}\tag{5}\]Aquí, $\gamma$ no depende de $x$ y $t$, pero puede ser una función de $\vec{v}$. Las razones para hacer esta suposición son las siguientes:
- Para que haya una correspondencia uno a uno entre los eventos en $S$ y $S^{\prime}$, $x$ y $x^{\prime}$ deben tener una relación lineal.
- Como se sabe que la transformación de Galileo es correcta en situaciones mecánicas cotidianas, debe ser posible aproximarla a la ecuación ($\ref{eqn:galilean_transform_x}$).
- Debe tener una forma lo más simple posible.
Como las fórmulas físicas deben tener la misma forma en los sistemas de referencia $S$ y $S^{\prime}$, para expresar $x$ en términos de $x^{\prime}$ y $t$, solo es necesario cambiar el signo de $\vec{v}$ (la dirección del movimiento relativo), y como no debe haber ninguna diferencia entre los dos sistemas de referencia excepto por el signo de $\vec{v}$, $\gamma$ debe ser el mismo.
\[x = \gamma(x^{\prime}+\vec{v}t^{\prime}). \label{eqn:lorentz_transform_x_inverse}\tag{6}\]Al igual que en la transformación de Galileo, no hay razón para que las componentes perpendiculares a la dirección de $\vec{v}$, es decir, $y$ y $y^{\prime}$, y $z$ y $z^{\prime}$, sean diferentes, por lo que se establece:
\[\begin{align*} y^{\prime} &= y \\ z^{\prime} &= z \end{align*} \label{eqn:lorentz_transform_yz} \tag{7}\]Ahora, si sustituimos la ecuación ($\ref{eqn:lorentz_transform_x}$) en ($\ref{eqn:lorentz_transform_x_inverse}$), obtenemos:
\[x = \gamma^2 x - \gamma^2 \vec{v}t + \gamma \vec{v}t^{\prime}\]Por lo tanto, despejando $t^{\prime}$, tenemos:
\[t^{\prime} = \gamma t + \left(\frac{1-\gamma^2}{\gamma \vec{v}}\right)x \label{eqn:lorentz_transform_t} \tag{8}\]Además, para no contradecir las ecuaciones de Maxwell, la velocidad de la luz debe ser $c$ en ambos sistemas de referencia, lo que nos permite determinar $\gamma$. Si suponemos que en $t=0$ los orígenes de ambos sistemas de referencia estaban en el mismo lugar, por esta condición inicial, $t^\prime = 0$. Ahora, imaginemos que hubo un destello de luz en el origen común de $S$ y $S^\prime$ cuando $t=t^\prime=0$, y que los observadores en cada sistema de referencia miden la velocidad de esta luz. En este caso, en el sistema de referencia $S$:
\[x = ct \label{eqn:ct_S}\tag{9}\]y en el sistema de referencia $S^\prime$:
\[x^\prime = ct^\prime \label{eqn:ct_S_prime}\tag{10}\]Sustituyendo $x$ y $t$ en esta ecuación usando las ecuaciones ($\ref{eqn:lorentz_transform_x}$) y ($\ref{eqn:lorentz_transform_t}$), obtenemos:
\[\gamma (x-\vec{v}t) = c\gamma t + \left(\frac{1-\gamma^2}{\gamma \vec{v}}\right)cx\]Resolviendo esta ecuación para $x$:
\[\left[\gamma-\left(\frac{1-\gamma^2}{\gamma \vec{v}}\right)c \right]x = c\gamma t + \vec{v}\gamma t\] \[\begin{align*} x &= \cfrac{c\gamma t + \vec{v}\gamma}{\gamma-\left(\cfrac{1-\gamma^2}{\gamma \vec{v}}\right)c} \\ &= ct\left[ \cfrac{\gamma + \cfrac{\vec{v}}{c}\gamma}{\gamma - \left( \cfrac{1-\gamma^2}{\gamma \vec{v}} \right)c} \right] \\ &= ct\left[ \cfrac{1 + \cfrac{\vec{v}}{c}}{1 - \left( \cfrac{1}{\gamma^2}-1 \right)\cfrac{c}{\vec{v}}} \right] \end{align*}\]Sin embargo, como $x=ct$ según la ecuación ($\ref{eqn:ct_S}$),
\[\cfrac{1 + \cfrac{\vec{v}}{c}}{1 - \left( \cfrac{1}{\gamma^2}-1 \right)\cfrac{c}{\vec{v}}} = 1\]Por lo tanto,
\[\gamma = \frac{1}{\sqrt{1-v^2/c^2}} \label{lorentz_factor}\tag{11}\]Sustituyendo esta expresión de $\gamma$ en función de $\vec{v}$ en las ecuaciones ($\ref{eqn:lorentz_transform_x}$), ($\ref{eqn:lorentz_transform_yz}$), ($\ref{eqn:lorentz_transform_t}$), obtenemos finalmente las ecuaciones de transformación del sistema de referencia $S$ al $S^\prime$.
Matriz de transformación de Lorentz
Las ecuaciones de transformación que finalmente obtuvimos son las siguientes:
- \[x^\prime = \frac{x-\vec{v}t}{\sqrt{1-v^2/c^2}} \label{eqn:lorentz_transform_x_fin}\tag{12}\]
- \[y^\prime = y \label{eqn:lorentz_transform_y_fin}\tag{13}\]
- \[z^\prime = z \label{eqn:lorentz_transform_z_fin}\tag{14}\]
- \[t^\prime = \frac{t-\cfrac{\vec{v}x}{c^2}}{\sqrt{1-v^2/c^2}} \label{eqn:lorentz_transform_t_fin}\tag{15}\]
Estas ecuaciones son la transformación de Lorentz (Lorentz transformation). Si definimos $\vec{\beta}=\vec{v}/c$, podemos expresarlas en forma matricial de la siguiente manera:
\[\begin{pmatrix} x_1^\prime \\ x_2^\prime \\ x_3^\prime \\ ct^\prime \end{pmatrix} = \begin{pmatrix} \gamma & 0 & 0 & -\gamma\vec{\beta} \\ 0 & 1 & 0 & 0 \\ 0 & 0 & 1 & 0 \\ -\gamma\vec{\beta} & 0 & 0 & \gamma \end{pmatrix} \begin{pmatrix} x_1 \\ x_2 \\ x_3 \\ ct \end{pmatrix}. \label{lorentz_transform_matrix}\tag{16}\]Lorentz demostró que cuando se usa esta ecuación de transformación, las fórmulas básicas del electromagnetismo se mantienen en la misma forma en todos los sistemas de referencia inerciales. Además, podemos ver que cuando la velocidad $v$ es muy pequeña en comparación con la velocidad de la luz $c$, $\gamma \to 1$, por lo que se puede aproximar a la transformación de Galileo.
Transformación de Lorentz inversa (inverse Lorentz transformation)
A veces, puede ser más conveniente transformar las mediciones del sistema en movimiento $S^\prime$ a las mediciones del sistema en reposo $S$, en lugar de transformar las mediciones del sistema en reposo $S$ a las del sistema en movimiento $S^\prime$. En estos casos, se puede usar la transformación de Lorentz inversa (inverse Lorentz transformation).
Calculando la matriz inversa de ($\ref{lorentz_transform_matrix}$), obtenemos la siguiente matriz de transformación de Lorentz inversa:
Esto es equivalente a intercambiar las cantidades físicas con prima y sin prima en las ecuaciones ($\ref{eqn:lorentz_transform_x_fin}$)-($\ref{eqn:lorentz_transform_t_fin}$) y reemplazar $v$ por $-v$ (es decir, $\beta$ por $-\beta$).
- \[x = \frac{x^\prime+\vec{v}t^\prime}{\sqrt{1-v^2/c^2}} \tag{18}\]
- \[y = y^\prime \tag{19}\]
- \[z = z^\prime \tag{20}\]
- \[t = \frac{t^\prime+\cfrac{\vec{v}x^\prime}{c^2}}{\sqrt{1-v^2/c^2}} \tag{21}\]