preliminar - uis
Post on 03-Nov-2021
13 Views
Preview:
TRANSCRIPT
Borra
dor Pre
limin
ar
Borra
dor Pre
limin
arMatematicas Avanzadas:
de los espacios lineales al analisis vectorial
H. HernandezDepartamento de Fısica, Facultad de Ciencias,Universidad de Los Andes, Merida-Venezuela
L. A. NunezEscuela de Fısica, Facultad de Ciencias,
Universidad Industrial de Santander, Bucaramanga-Colombia
24 de septiembre de 2015
*Portada: Detalle de un manuscrito de Albert Einstein, Universidad Hebrea de Jerusalen
Borra
dor Pre
limin
arIndice general
1. Los vectores de siempre 91.1. Vectores, escalares y algebra vectorial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.1.1. Escalares y vectores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101.1.2. Algebra de vectores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.2. Independencia lineal y las bases para vectores . . . . . . . . . . . . . . . . . . . . . . . . . . . 131.3. Productos de vectores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.3.1. Producto escalar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141.3.2. Producto vectorial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161.3.3. Producto triple o mixto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161.3.4. Una division fallida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.4. Componentes, coordenadas y cosenos directores . . . . . . . . . . . . . . . . . . . . . . . . . . 181.4.1. Bases, componentes y coordenadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181.4.2. Cosenos directores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
1.5. Algebra vectorial y coordenadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191.5.1. Suma y resta de vectores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191.5.2. Dependencia e independencia lineal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 201.5.3. Producto escalar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 211.5.4. Producto vectorial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 221.5.5. Triple producto mixto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
1.6. Algebra vectorial con ındices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 231.6.1. Convencion de Einstein . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 231.6.2. Los vectores y los ındices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 241.6.3. Un par de calculos ilustrativos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 251.6.4. Escalares, pseudoescalares, vectores y pseudovectores . . . . . . . . . . . . . . . . . . . 26
1.7. Aplicaciones del algebra vectorial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 271.7.1. Rectas y vectores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 271.7.2. Planos y vectores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
1.8. Un comienzo a la derivacion e integracion de vectores . . . . . . . . . . . . . . . . . . . . . . 301.8.1. Vectores variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 301.8.2. Derivacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 301.8.3. Velocidades y aceleraciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 321.8.4. Vectores y funciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 351.8.5. El vector gradiente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
3
Borra
dor Pre
limin
ar
1.8.6. Integracion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 401.9. Vectores y numeros complejos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
1.9.1. Los numeros complejos y su algebra . . . . . . . . . . . . . . . . . . . . . . . . . . . . 441.9.2. Vectores y el plano complejo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 451.9.3. Formulas de Euler y De Moivre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 461.9.4. Algunas aplicaciones inmediatas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
1.10. Algunos ejemplos resueltos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 521.11. Ejercicios propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
2. Espacios Vectoriales Lineales 632.1. Grupos, cuerpos y espacios vectoriales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
2.1.1. Grupos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 642.1.2. Cuerpo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 662.1.3. Espacios vectoriales lineales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 662.1.4. Ejemplos espacios vectoriales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 672.1.5. La importancia de la conceptualizacion y la notacion . . . . . . . . . . . . . . . . . . . 682.1.6. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
2.2. Espacios metricos, normados y con producto interno . . . . . . . . . . . . . . . . . . . . . . . 702.2.1. Metricas y espacios metricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 702.2.2. Normas y espacios normados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 712.2.3. Espacios con producto interno . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 722.2.4. Ejercicio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
2.3. Variedades lineales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 782.3.1. Dependencia/independencia lineal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 782.3.2. Bases de un espacio vectorial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 792.3.3. El determinante de Gram . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 812.3.4. Ortogonalidad y bases ortogonales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 822.3.5. Ortogonalizacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 842.3.6. Complementos ortogonales y descomposicion ortogonal . . . . . . . . . . . . . . . . . . 872.3.7. Ejercicio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
2.4. Aproximacion de funciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 902.4.1. Condiciones para la aproximacion de funciones . . . . . . . . . . . . . . . . . . . . . . 902.4.2. El Metodo de mınimos cuadrados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 912.4.3. Interpolacion polinomial de puntos experimentales . . . . . . . . . . . . . . . . . . . . 942.4.4. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
2.5. Algunos ejemplos resueltos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
3. Vectores Duales y Tensores 1023.1. Funcionales lineales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1033.2. Parentesis tensorial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104
3.2.1. Tensores, una definicion funcional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1043.2.2. Producto tensorial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1053.2.3. La tentacion del producto interno . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1073.2.4. Bases para un producto tensorial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1093.2.5. Tensores, sus componentes y sus contracciones . . . . . . . . . . . . . . . . . . . . . . 1093.2.6. Tensor metrico, ındices y componentes . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
3.3. Un par de tensores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1133.3.1. El tensor de esfuerzos (stress) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114
Borra
dor Pre
limin
ar
3.3.2. El Tensor de inercia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1173.4. Repensando los vectores nuevamente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119
3.4.1. Vectores, covectores y leyes de transformacion . . . . . . . . . . . . . . . . . . . . . . . 1193.4.2. Cartesianas y polares, otra vez . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1203.4.3. Repensando las componentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
3.5. Transformaciones, vectores y tensores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1243.6. Un ejemplo detallado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1263.7. Teorema del cociente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1303.8. Vectores, tensores y espacios pseudo-euclideanos . . . . . . . . . . . . . . . . . . . . . . . . . 131
3.8.1. Espacios minkowskianos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1323.8.2. Un toque de Relatividad Especial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1333.8.3. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136
3.9. Bases continuas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1383.9.1. Bases de ondas planas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1393.9.2. Las Representaciones |r〉 y |p〉 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140
3.10. Ejercicios propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143
4. Matrices, Determinantes y Autovectores 1474.1. Operadores Lineales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148
4.1.1. Espacio Vectorial de Operadores Lineales . . . . . . . . . . . . . . . . . . . . . . . . . 1504.1.2. Composicion de Operadores Lineales . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1514.1.3. Funciones de Operadores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1534.1.4. Proyectores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1534.1.5. Espacio Nulo e Imagen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1544.1.6. Operadores Biyectivos e Inversos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1564.1.7. Operadores Hermıticos Conjugados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1584.1.8. Operadores Unitarios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1594.1.9. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 160
4.2. Representacion Matricial de Operadores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1614.2.1. Bases y Representacion Matricial de Operadores . . . . . . . . . . . . . . . . . . . . . 1634.2.2. Algebra de Matrices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1654.2.3. Representacion Diagonal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1654.2.4. Sistemas de ecuaciones lineales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1664.2.5. Operadores hermıticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1674.2.6. Inversa de una matriz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1674.2.7. Cambio de bases para vectores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1684.2.8. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169
4.3. Traza de Operadores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1694.3.1. Invariancia de la Traza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1704.3.2. Propiedades de la Traza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 170
4.4. Diferenciacion de Operadores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1704.4.1. Reglas de diferenciacion de operadores lineales . . . . . . . . . . . . . . . . . . . . . . 1714.4.2. La formula de Glauber . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1734.4.3. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 174
4.5. Un parentesis determinante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1744.5.1. Definicion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1744.5.2. Propiedades determinantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1754.5.3. Formula de Laplace . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177
Borra
dor Pre
limin
ar
4.6. Un zoologico de matrices cuadradas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1774.7. Autovectores y Autovalores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 180
4.7.1. Definiciones y Teoremas Preliminares . . . . . . . . . . . . . . . . . . . . . . . . . . . 1804.7.2. Algunos comentarios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1804.7.3. Algunos Ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1814.7.4. Autovalores, autovectores e independencia lineal . . . . . . . . . . . . . . . . . . . . . 182
4.8. Autovalores y Autovectores de un operador . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1834.8.1. El polinomio caracterıstico. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1834.8.2. Primero los autovalores, luego los autovectores . . . . . . . . . . . . . . . . . . . . . . 1844.8.3. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 187
4.9. Autovalores y Autovectores de Matrices Importantes . . . . . . . . . . . . . . . . . . . . . . . 1884.9.1. Autovalores y Autovectores de Matrices Similares . . . . . . . . . . . . . . . . . . . . . 1884.9.2. Autovalores y Autovectores de matrices Hermıticas . . . . . . . . . . . . . . . . . . . . 1914.9.3. Autovalores y Autovectores de matrices Unitarias . . . . . . . . . . . . . . . . . . . . . 193
4.10. Conjunto completo de observables que conmutan . . . . . . . . . . . . . . . . . . . . . . . . . 1974.10.1. Observables que Conmutan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1974.10.2. Ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2004.10.3. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 202
4.11. Sistemas de ecuaciones lineales: segunda revision . . . . . . . . . . . . . . . . . . . . . . . . . 2034.12. Algunos ejemplos resueltos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 207
5. Coordenadas Curvilıneas, Campos y Operadores Diferenciales 2165.1. Disgrecion derivativa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2175.2. Curvas y parametros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2175.3. Ejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2185.4. Coordenadas curvilıneas generalizadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 220
5.4.1. Coordenadas generalizadas, vectores y formas . . . . . . . . . . . . . . . . . . . . . . . 2215.4.2. Velocidades y aceleraciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2225.4.3. Coordenadas cartesianas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2235.4.4. Coordenadas cilındricas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2235.4.5. Coordenadas esfericas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 225
5.5. Vectores, Tensores, metrica y transformaciones . . . . . . . . . . . . . . . . . . . . . . . . . . 2285.5.1. Transformando vectores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2285.5.2. Transformando tensores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 230
5.6. Campos tensoriales y el concepto de campo . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2315.7. Campos escalares y superficies . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2345.8. Campos vectoriales y lıneas de flujo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 234
5.8.1. Lıneas de flujo o curvas integrales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2355.8.2. Trayectorias ortogonales a las lıneas de flujo . . . . . . . . . . . . . . . . . . . . . . . . 236
5.9. Flujo de Campos Vectoriales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2375.10. La fauna de los operadores vectoriales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 238
5.10.1. Derivada direccional, diferencial total y gradiente . . . . . . . . . . . . . . . . . . . . . 2385.10.2. Divergencia y flujo en campos vectoriales . . . . . . . . . . . . . . . . . . . . . . . . . 2425.10.3. Rotores, Lıneas de torbellino y Circulacion . . . . . . . . . . . . . . . . . . . . . . . . 2465.10.4. Formulario del Operador nabla, ∇ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2525.10.5. Nabla dos veces y el Laplaciano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2535.10.6. Derivadas Direccionales de Campos Vectoriales . . . . . . . . . . . . . . . . . . . . . . 2545.10.7. La Derivada Covariante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 256
Borra
dor Pre
limin
ar
5.11. Integrales y Campos Vectoriales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2615.11.1. Integrales de Campos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2615.11.2. Integrales de lınea . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2625.11.3. Integrales de Superficie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 263
5.12. Campos Vectoriales y Teoremas integrales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2635.12.1. Teorema de Gauss . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2635.12.2. Teorema de Stokes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 269
5.13. Teorıa de Potencial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2725.13.1. Potenciales escalares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2725.13.2. Potenciales vectoriales y calibres . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2735.13.3. Teorema de Green y Potenciales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2745.13.4. Teorema de Helmholtz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 274
5.14. Algunos ejemplos resueltos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2765.15. Ejercicios propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 297
Borra
dor Pre
limin
arIntroduccion
El contenido de este libro no es mas que la recopilacion de las notas de clases...
8
Borra
dor Pre
limin
arCapıtulo 1Los vectores de siempre
9
Borra
dor Pre
limin
ar
1.1. Vectores, escalares y algebra vectorial
Desde los primeros cursos de Fısica en educacion media, venimos hablando de vectores como cantidadesque tienen que ser representadas con mas de un numero. Son varias las razones que obligan a introducir este(y otro) tipo de cantidades “multidimensionales”. Enumeraremos algunas que, a nuestro criterio personal,son las mas representativas.
1. Necesidad de modelos matematicos de la naturaleza. Desde los albores del renacimiento, conGalileo Galilei a la cabeza, nos es imperioso representar cantidades de manera precisa. Las matematicasnos apoyan en esta necesidad de precision y desde ese entonces son el lenguaje de la actividad cientıfica.
2. Los modelos tienen que tener contrastacion experimental. Las ciencias y sus modelos, en ultimainstancia, tienen que ver con la realidad, con la naturaleza y por ello debemos medir y contrastar lashipotesis con esa realidad que modelamos. Necesitamos representar cantidades medibles (observables)y que, por lo tanto, tienen que ser representadas de la forma mas compacta, pero a la vez mas precisaposible.
3. Las leyes de los modelos deben ser independiente de los observadores. Cuando menos auna familia significativa de observadores, el comportamiento de la naturaleza no puede depender de lapercepcion de un determinado observador, por lo tanto, los modelos que construimos para describirlatampoco pueden depender de los observadores.
Es comun que tropecemos con: escalares, vectores, tensores y espinores, dependiendo del numero decantidades que necesitemos para representar determinado objeto matematico. Podremos constatar que lasleyes de la Fısica vienen escritas en forma vectorial (o tensorial) y, por lo tanto, sera la misma ley para lafamilia de observadores equivalentes.
1.1.1. Escalares y vectores
Dejaremos para mas adelante caracterizar objetos como tensores y espinores, por ahora nos contentaremoscon refrescar nuestros recuerdos con cantidades como:
Escalares: Seran aquellas cantidades las cuales se representan con UN solo numero, una magnitud: temperatura,volumen, masa, entre otras. Es costumbre no denotarlas de manera especial, ası T = 5oC representarauna temperatura de 5 grados centıgrados.
Vectores: Seran cantidades las cuales, para ser representadas por un objeto matematicos requieren mas de unacantidad: requieren de UN numero, UNA direccion y UN sentido. Entre las cantidades que tıpicamentereconocemos como vectores estan: la velocidad, la aceleracion, la fuerza En terminos graficos podremosdecir que un vector sera un segmento orientado, en el cual la dimension del segmento representara sumodulo y su orientacion la direccion y el sentido. Para diferenciarlos de las cantidades escalares hayuna variedad de representaciones, entre ellas: en negrita a; con una flecha arriba de la cantidad ~a; con
una tilde arriba o abajo a; o explicitando el origen del segmento orientado−−→OP . El modulo del vector lo
representaremos dentro de la funcion valor absoluto, o sencillamente sin la flecha arriba a = |a| = |~a| .
Los vectores son independientes del sistema de coordenadas. Sus caracterısticas (modulo, direccion ysentido) se preservaran en todos los sistemas de coordenadas. Mas aun, habra vectores que podremos des-plazarlos (conservando su modulo direccion y sentido) paralelos a ellos mismos, en el espacio y seguiransiendo los mismos, por ello encontraremos el termino de vectores deslizantes. Un ejemplo son las fuerzas queactuan en un determinado cuerpo, como se muestra el cuadrante I en la Figura 1.1. Tambien habra vectores
Borra
dor Pre
limin
ar
Figura 1.1: Vectores y sus operaciones
atados a un punto en el espacio, por cuanto representan una de sus propiedades: la velocidad del viento, elcampo electrico, o sus variaciones son algunos ejemplos de estos vectores atados (observe la Figura 1.2 comoejemplos ilustrativos).
1.1.2. Algebra de vectores
Enumeraremos rapidamente el algebra de vectores sin hacer referencia a un sistema de coordenadas.Desde cursos anteriores nos ensenaron a representar graficamente este algebra, ası tenemos que:
Vector nulo. Es aquel que tiene por modulo cero y no se le pude asignar direccion ni sentido. Podremoscomparar vectores si tienen la misma direccion y sentido. El frecuente representar al vector nulo por 0.
Vector unitario. Es aquel que tiene por modulo la unidad, es muy util por cuanto, para efectos algebraicos,“contiene” unicamente direccion y sentido. Lo denotaremos con un acento circunflejo, comunmente llamado“sombrero” ua = a
|a| , con lo cual todo vector se podra expresar por un modulo en la direccion y sentido de
un vector unitario: a = |a| ua.
Comparacion de vectores. Al comparar sus modulos diremos que pueden ser mayores, menores o iguales.Por lo tanto, tal y como mostramos en el cuadrante IIa de la Figura 1.1, dos vectores seran iguales, a = b,si tienen la misma direccion y sentido.
Borra
dor Pre
limin
ar
Figura 1.2: Ejemplos de vectores atados
Multiplicacion por un escalar. Un vector multiplicado por un escalar, α, cambiara su modulo si α > 0y cambiara su sentido, y eventualmente su modulo, si α < 0. Tal y como puede apreciarse en el cuadrante IIade la Figura 1.1. Claramente dos vectores proporcionales seran colineales. Diremos ademas, que el inversodel vector a sera la multiplicacion de a por (−1) . Esto es c = (−1) a = −a.
Suma de vectores. Aprendimos que para sumar vectores utilizamos la regla del paralelogramo, es decir,desplazamos paralelamente uno de los vectores y lo colocamos a continuacion del otro, de tal forma quela diagonal del paralelogramo, que tiene por lados los vectores sumandos, constituye el vector suma (vercuadrantes IIa y IIb de la Figura 1.1). Este esquema se puede generalizar para varios vectores tal y como lomostramos en el cuadrante III de la Figura 1.1. Allı construimos un polıgono cuyos lados los constituyen losvectores sumandos a,b, c, d y n con n = a + b + c + d.
Notese que aun en el caso tridimensional, el vector suma siempre sera coplanar (estara en el mismo plano)a los sumandos que lo generaron.
Igualmente, podemos definir la resta de vectores al sumar el inverso. Esto es
a− b ≡ a + (−b) ⇒ 0 = a− a ≡ a + (−a) .
En terminos graficos la resta de dos vectores se representa colocando los vectores (minuendo y sustraendo)con el mismo origen y uniendo las cabezas de flecha. Dependiendo de cual vector es el minuendo y cualsustraendo el vector resta apuntara del sustraendo hacia el minuendo, esto es, (a + b + c)− a = b + c.
Borra
dor Pre
limin
ar
Claramente, el modulo del vector resta representa la distancia entre los dos extremos de los vectoresminuendo y el sustraendo
Un resumen de propiedades. Podemos resumir las propiedades del algebra de vectores como sigue:
La suma de vectores:
• tiene un unico elemento neutro 0 + a = a + 0 = a, ∀a,
• existe un elemento simetrico −a (uno para cada vector) tal que 0 = a− a ≡ a + (−a),
• es conmutativa a + b = b + a,
• es asociativa (a + b) + c = a + (b + c),
• es distributiva respecto a la multiplicacion por escalares: α (a + b) = αa + αb;
La multiplicacion de escalares por vectores:
• es conmutativa aα = αa,
• es asociativa α (βa) = (αβ) a,
• es distributiva (α+ β) a = αa + βa.
1.2. Independencia lineal y las bases para vectores
Armados con el algebra y explicitando sus propiedades podemos construir la primera aproximacion a unode los conceptos fundamentales del algebra lineal. La nocion de independencia o dependencia lineal.
Diremos que tres vectores a,b, c son linealmente independientes si se cumple que
α a + β b + γ c = 0 ⇒ α = β = γ = 0
es decir, que la unica manera que al sumar cualquier multiplo de a,b y c de manera que la suma se anule esobligando a que los escalares sean necesariamente nulos. Si no se cumple lo anterior entonces diremos queuno de los vectores sera linealmente dependiente y por lo tanto se podra expresar como combinacion linealde los otros dos
α a + β b + γ c = 0 alguno de
α 6= 0β 6= 0γ 6= 0
⇒ c = α a + β b
Los vectores linealmente independientes formaran una base para el espacio donde estos vectores “viven” yel numero maximo de vectores linealmente independientes sera la dimension de ese espacio de “residencia”.Tratemos de concretar algunas de estas afirmaciones.
Dos vectores linealmente dependientes son colineales. Es claro que
α a + β b = 0 con alguno de
α 6= 0β 6= 0
⇒
a = −β
αb
b = −αβ
a
el contrario tambien sera cierto: si dos vectores son colineales ellos seran linealmente dependientes.
a = λb ⇒ αa + βb = 0 ⇒ αλb + βb = 0 ⇒ (αλ+ β) b = 0 ⇒ λ = −βα,
con lo cual podremos afirmar que si dos vectores son linealmente independientes ellos no son colineales.
Borra
dor Pre
limin
ar
Tres vectores linealmente dependientes son coplanares. Es claro que por ser los tres vectores lineal-mente dependientes al menos uno de los escalares tiene que ser distinto de cero, digamos γ, esto es
α a + β b + γ c = 0 ⇒ c = −αγ
a− β
γb = ξ1a + ξ2b ,
pero como ξ1a ∝ a y ξ2 b ∝ b, esto significa que ξ1a y a son colineales, de la misma manera que ξ2b y b, ypor lo tanto, la suma estara en el mismo plano.
Dos vectores linealmente independientes expanden todos los vectores coplanares. Dado dosvectores a y b linealmente independientes, entonces cualquier vector c, coplanar con a y b, podra expresarsecomo una combinacion lineal de estos. Diremos que c se expresa en terminos de a y b como c = ξ1a + ξ2by esa expresion es unica.
La primera de las afirmaciones es directa por cuanto hemos visto que si a y b son linealmente indepen-dientes y c es coplanar con a y b, entonces, necesariamente a,b y c son linealmente dependientes. Estoes:
α a + β b + γ c = 0⇒ c = −αγ
a− β
γb = ξ1a + ξ2b
La demostracion de que la expansion es unica viene de suponer que existen dos maneras distintas de repre-sentar al vector c
c = ξ1a + ξ2b
c = ζ1a + ζ2b
⇒ 0 =(ξ1 − ζ1
)a +
(ξ2 − ζ1
)b ⇒
ξ1 − ζ1 = 0 ⇒ ξ1 = ζ1
ξ2 − ζ2 = 0 ⇒ ξ2 = ζ2
debido a que a y b son linealmente independiente.La demostracion para el caso tridimensional es equivalente. Es decir tres vectores linealmente indepen-
dientes a,b y c expanden, de manera unıvoca, todos los vectores del espacio. Esta demostracion queda parael lector.
Cuando un vector c se pueda expresar en terminos de dos vectores linealmente independientes, a y bdiremos que a y b forman una base para todos los vectores coplanares a estos. Igualmente para el casotridimensional: tres vectores linealmente independientes a,b y c conformaran una base para los vectores delespacio. Los numeros ξ1 y ξ2 para el caso bidimensional se denominan las componentes de c a lo largo de ay b, respectivamente. Equivalentemente, ξ1, ξ2, ξ3 seran las componentes de cualquier vector para el caso 3Da lo largo de a,b y c, respectivamente. Esta nomenclatura sera mas evidente luego de la proxima seccion.
1.3. Productos de vectores
1.3.1. Producto escalar
Denominaremos producto escalar de dos vectores a y b a un escalar cuyo valor sera igual al producto delos modulos multiplicado por el coseno del angulo que ellos forman
ζ = a · b = |a| |b| cos(θ)〈a,b〉
El significado geometrico del producto escalar es evidente, cuadrante I de la Figura 1.3. El producto escalarrepresenta la proyeccion de a sobre b y equivalentemente la proyeccion de b sobre a.
De esta definicion se derivan varias consecuencias las cuales por obvias no dejan de ser importantes:
Borra
dor Pre
limin
arFigura 1.3: Productos de Vectores
El producto escalar de un vector consigo mismo, siempre es positivo:ζ = a · a = |a|2 ≥ 0, y solo sera nulo si a es el vector nulo. Esto es, ζ = 0 ⇒ a = 0. Con esto podemosconcluir que |a| =
√a · a =
√ζ.
El producto escalar es conmutativo:ζ = a · b = b · a, ya que el angulo entre los vectores es el mismo y la multiplicacion entre escalares esconmutativa.
El producto escalar es distributivo:Esto es, a · (b + c) = a · b + a · c. La demostracion (grafica) puede apreciarse en el cuadrante II de laFigura 1.3.
La multiplicacion por un escalar :ζ = αζ = |α| (a · b) = (αa) · b = a · (αb) = |αa| |b| cos(θ)〈a,b〉 = |a| |αb| cos(θ)〈a,b〉.
Desigualdad de Cauchy-Schwarz.A partir de la definicion de producto interno es inmediata la comprobacion de la siguiente desigualdad:
(a · b)2
=(|a| |b| cos(θ)〈a,b〉
)2 ⇒ (a · b)2 ≤ |a|2 |b|2 ⇔ a · b ≤ |a| |b|
ya que 0 ≤ cos2(θ)〈a,b〉 ≤ 1.
Del producto escalar surge el Teorema del Coseno.Es inmediato calcular el producto escalar de un vector consigo mismo, para ello vamos a suponer quec = a + b, con lo cual
c = a + b ⇒ c · c = (a + b) · (a + b) ⇒ |c|2 = |a|2 + |b|2 + 2 |a| |b| cos(θ)〈a,b〉
que no es otra cosa que el teorema del coseno y esta ilustrado en el cuadrante III de la Figura 1.3.
Borra
dor Pre
limin
ar
Diremos que dos vectores no nulos son ortogonales (perpendiculares) si su producto escalar es nulo.Esta afirmacion es inmediata
a ⊥ b ⇒ θ〈a,b〉 =π
2⇒ a · b = |a| |b| cos(θ)〈a,b〉 = 0 .
1.3.2. Producto vectorial
Tambien hemos aprendido que existe otro producto entre vectores: el producto vectorial. A diferencia delproducto escalar que genera un escalar, el producto vectorial tiene como resultado otro vector: c = a × b(realmente un pseudovector o vector axial en contraposicion a los vectores polares, pero eso lo veremos masadelante en la seccion 1.6.4), con las siguientes caracterısticas:
El modulo de c, sera |c| = |a| |b| sen(θ)〈a,b〉. Es claro que el modulo de c representa el area delparalelogramo cuyos lados estan formados por a y b (ver el cuadrante V de la Figura 1.3).
Tal y como muestran los cuadrantes IV y V de la Figura 1.3, c tendra como direccion la perpendicularal plano que forman a y b, y como sentido la regla del pulgar derecho, regla de la mano derecha, o demanera mas elegante, sera positiva cuando la multiplicacion de a× b corresponda al sentido horario.
Podemos deducir algunas consecuencias de esta definicion.
El producto vectorial es anticonmutativo.a× b = −b× a, y se sigue de la definicion que expresa el cuadrante IV de la Figura 1.3.
El producto vectorial es distributivo respecto a la suma.a× (b + c) = a× b + a× c. La demostracion de esto lo dejaremos para mas adelante.
La multiplicacion por un escalar.
|c| = |α| |a× b| = |(αa)× b| = |a× (αb)| = |αa| |b| sen(θ)〈a,b〉 = |a| |αb| sen(θ)〈a,b〉
Dos vectores seran colineales si su producto vectorial se anula.Como en el caso cuando se anulaba el producto escalar identificabamos a dos vectores ortogonales,cuando se anula el producto vectorial tendremos dos vectores paralelos. Es claro que esto se cumple deinmediato
a ‖ b ⇒ θ〈a,b〉 = 0 ⇒ |c| = |a× b| = |a| |b| sen(θ)〈a,b〉 = 0
Si el modulo del vector es cero, obvio que es el vector nulo. Ahora bien, tambien de aquı deducimosque
c = a× b ⇒ c · a = (a× b) · a = c · b = (a× b) · b = 0 .
1.3.3. Producto triple o mixto
Analicemos ahora el numero (pseudoescalar) que proviene de la multiplicacion
V = c · (a× b) = |c| |(a× b)| cos(θ)〈c,a×b〉
Este producto tambien cumple con algunas propiedades que enunciaremos ahora y demostraremos mas tarde
El producto mixto representa el volumen del paralelepıpedo cuyos lados son los vectores a,b y c.|a× b| representa el area de la base y la altura esta representada por la proyeccion del vector c sobrela perpendicular al plano de la base que es, precisamente |c| cos(θ)〈c,a×b〉.
Borra
dor Pre
limin
arFigura 1.4: Vectores, bases y componentes
El producto mixto es cıclico respecto a sus factores.
(a× b) · c = (c× a) · b = (b× c) · a
Esta afirmacion se vera demostrada mas adelante.
El producto mixto se anula cuando se repite alguno de sus factores.
(a× b) · a = (a× b) · b = (a× a) · c = (b× b) · c = 0 .
Claramente, si (a× b)⊥a⇒ (a× b) · a = 0.
Si los tres vectores a,b y c son coplanares (linealmente dependientes) entonces:
(a× b) · c = 0 ,
dicho de manera mas elegante, util e impactante: tres vectores que cumplen con:
(a× b) · c 6= 0 ,
forman una base para el espacio tridimensional. Esa base se denominara levogira (contraria al giro delas manecillas del reloj) si el producto (a× b) · c < 0 y dextrogira (la convencional base de la manoderecha) si (a× b) · c > 0.
1.3.4. Una division fallida
Uno esperarıa que para cada una de las definiciones de productos vectoriales, existiera el vector cociente,es decir, que pudieramos “despejar” uno de los multiplicados en terminos del otro. La situacion es que estaoperacion no esta definida unıvocamente y lo podemos intuir a partir de una de las definiciones de producto.
Borra
dor Pre
limin
ar
Supongamos que tenemos un producto escalar: ζ = a · b con lo cual, si pudieramos “despejar”, digamos
b =ζ
a¿Tendrıamos entonces definido b de una manera unıvoca? La respuesta es NO, ya que ζ = a·
(ζ
a+ d
)donde a ⊥ d, por lo cual existen infinitos b =
ζ
a+ d que cumplen ζ = a · b.
1.4. Componentes, coordenadas y cosenos directores
La formulacion de las leyes fısicas debe hacerse en termino de cantidades vectoriales (tensoriales). Estoindependiza su formulacion de un sistema particular de coordenadas, pero llegado el momento de calcularvalores y utilizar estas leyes, es mucho mas conveniente referirla a un sistema de coordenadas particularmenteadaptado a la geometrıa del problema. En ese caso la ecuacion vectorial se convertira en tantas ecuacionescomo componentes (referidas al sistema de coordenadas utilizado) tengan los vectores en ese sistema decoordenadas.
1.4.1. Bases, componentes y coordenadas
Tal y como mencionamos anteriormente, tres vectores no coplanares cualesquiera son linealmente in-dependientes y constituyen una base para el espacio tridimensional. Denominaremos, de ahora en adelante aestos vectores base wi, y por ser linealmente independientes podremos expresar cualquier vector a comouna combinacion lineal unica, tal y como lo mostramos en el cuadrante I de la Figura 1.4.
Con los vectores base w1,w2,w3 podemos construir un sistema (oblicuo en general) de coordenadasal colocarlos con un mismo origen, esto es
a = ξ1w1 + ξ2w2 + ξ3w3
donde las cantidadesξ1, ξ2, ξ3
son numeros (no son escalares) que representan las componentes del vector
a a lo largo de cada uno de los vectores base w1,w2,w3 . Notese que por costumbre (la cual sera evidentemas adelante) etiquetamos estos numeros con superındices y la letra que identifica el vector.
Mas aun, cada punto P del espacio viene definido por un radiovector r (P ) ≡−−→OP que une el origen
de coordenadas con el punto P y se le asocian tres numerosx1, x2, x3
, los cuales son las proyecciones
a lo largo de cada uno de los ejes coordenados
0x1, 0x2, 0x3
. Los numerosx1, x2, x3
se denominaran
componentes de r (P ) en el sistema de referencia w1,w2,w3.Existe una familia de sistemas de coordenadas en la cual sus vectores base son ortogonales (o mejor
ortonormales), es decir los vectores base e1, e2, e3 son perpendiculares entre si. Tal y como mostraremosmas adelante, siempre se puede construir un sistema ortogonal e1, e2, e3 u ortonormal i1, i2, i3 a partirde una base generica de vectores linealmente independientes w1,w2,w3. Cuando el sistema sea ortogonalsus componentes se denominaran rectangulares. Dependiendo del signo del triple producto mixto el sistemade coordenadas sera dextrogiro ((e1 × e2) · e3 > 0) o levogiro ((e1 × e2) · e3 < 0), tal y como se muestra enel cuadrante III de la Figura 1.4.
Es costumbre ancestral, por relaciones de dominacion de los derechos sobre los izquierdos (en latın eitaliano los zurdos son siniestros) utilizar la convencion dextrogira donde el producto: (e1 × e2) · e3 > 0, yen ese caso utilizamos el bien conocido conjunto de vectores unitarios i, j,k con los que ya hemos estadofamiliarizados
a = axi + ayj + azk y r (P ) = x i + y j + z k .
Tambien es costumbre representar este sistema de coordenadas ortonormal como: i ≡ i1, j ≡ i2 y k ≡ i3para recordar que estamos en un sistema de coordenadas cartesianas y utilizaremos los superındices 1, 2, 3
Borra
dor Pre
limin
ar
para indicar las componentes del vector.
a = a1i1 + a2i2 + a3i3 y r (P ) = x1 i1 + x2 i2 + x3 i3 .
Obviamente el modulo del vector se podra expresar con la utilizacion del Teorema de Pitagoras
|a| =√
(a1)2 + (a2)2 + (a3)2 y |r (P )| =√
(x1)2 + (x2)2 + (x3)2
y la multiplicacion por un escalar sera
αa = α(a1i1 + a2i2 + a3i3
)=(αa1
)i1 +
(αa2
)i2 +
(αa3
)i3 ⇒ |αa| = α
√(a1)2 + (a2)2 + (a3)2
Igualmente para un vector unitario
ua =a
|a|=
a1i1 + a2i2 + a3i3√(a1)2 + (a2)2 + (a3)2
con lo cual todo vectora = |a| ua =
√(a1)2 + (a2)2 + (a3)2 ua .
1.4.2. Cosenos directores
Como se puede apreciar en el cuadrante IV de la Figura 1.4, podemos construir tres triangulos rectanguloscon el radiovector A (P ) como hipotenusa de cada uno de ellos. Los angulos que forma el radiovector A (P )con cada uno de los ejes coordenados x, y, z son α, β, γ respectivamente, con lo cual
Ax = |A| cos(α) Ay = |A| cos(β) y Az = |A| cos(γ) ⇒ cos2(α) + cos2(β) + cos2(γ) = 1
pero ademas
uA =A
|A|= cos(α) i + cos(β) j + cos(γ) k .
1.5. Algebra vectorial y coordenadas
Es posible reescribir el algebra vectorial mediante operaciones referidas a las coordenadas, como se mues-tra a continuacion.
1.5.1. Suma y resta de vectores
La suma sera representada por
a + b =(a1i1 + a2i2 + a3i3
)+(b1i1 + b2i2 + b3i3
)=(a1 + b1
)i1 +
(a2 + b2
)i2 +
(a3 + b3
)i3
y obviamente, la resta
a− b =(a1i1 + a2i2 + a3i3
)−(b1i1 + b2i2 + b3i3
)=(a1 − b1
)i1 +
(a2 − b2
)i2 +
(a3 − b3
)i3
con lo cual la distancia entre dos puntos P y M sera
d (P,M) = |(r (P ) = a)− (r (M) = b)| =√
(x1 − y1)2
+ (x2 − y2)2
+ (x3 − y3)2.
Borra
dor Pre
limin
ar
1.5.2. Dependencia e independencia lineal
Ahora es facil estudiar la dependencia o independencia lineal en coordenadas. Otra vez, tres vectores:a = a1i1 + a2i2 + a3i3 ,b = b1i1 + b2i2 + b3i3 y c = c1i1 + c2i2 + c3i3, seran linealmente independientes si secumple que
α a + β b + γ c = 0 ⇒ α = β = γ = 0
Antes de proseguir en forma general, veamos algunos casos particulares
La base canonica: i1 = i ≡ (1, 0, 0) , i2 = j ≡ (0, 1, 0) , i3 = k ≡ (0, 0, 1). Estos vectores son claramentelinealmente independientes y por lo tanto constituyen una base.
Los vectores: e1 = i ≡ (1, 0, 0) , e2 = i + j ≡ (1, 1, 0) , e3 = i + j + k ≡ (1, 1, 1), no son linealmenteindependientes de manera obvia. Por lo tanto, veamos lo siguiente:
α = 0α+ β = 0
α+ β + γ = 0
⇒ α = 0
β = 0γ = 0
con lo cual demostramos que son linealmente independientes y por lo tanto constituyen una base paralos vectores tridimensionales.
En general tendremos que
0 = α(a1i1 + a2i2 + a3i3
)+ β
(b1i1 + b2i2 + b3i3
)+ γ
(c1i1 + c2i2 + c3i3
)
=(αa1 + βb1 + γc1
)i1 +
(αa2 + βb2 + γc2
)i2 +
(αa3 + βb3 + γc3
)i3 ⇒
αa1 + βb1 + γc1 = 0αa2 + βb2 + γc2 = 0αa3 + βb3 + γc3 = 0
Esto no es otra cosa que un sistema de 3 ecuaciones lineales con 3 incognitas α, β, γ y la solucion queestamos buscando α = β = γ = 0 se cumplira si∣∣∣∣∣∣
a1 b1 c1
a2 b2 c2
a3 b3 c3
∣∣∣∣∣∣ = a1(b2c3 − b3c2
)+ a2
(b3c1 − b1c3
)+ a3
(b1c2 − b2c1
)6= 0 .
Ejercicios
1. Dados los vectores
A = i1 + 2i2 + 3i3 , B = 4i1 + 5i2 + 6i3 , C = 3i1 + 2i2 + i3 , D = 6i1 + 5i2 + 4i3
a) Encuentre
A + B + C + D A + B−C−D A−B + C−D −A + B−C + D
b) El angulo entre los vectores A,B,C,D y los vectores base i1, i2, i3.
c) La magnitud de los vectores A,B,C,D.
d) El angulo entre A y B y entre C y D.
e) La proyeccion de A sobre B.
f ) ¿Son los vectores A,B,C,D coplanares?
Borra
dor Pre
limin
ar
1.5.3. Producto escalar
Ahora refrasearemos, en termino de una base de vectores ortogonales, lo expresado en la seccion 1.3.1.Representaremos el producto escalar de dos vectores en una base cartesiana i1, i2, i3, que es una baseortonormal, de la siguiente manera:
a · b =(a1i1 + a2i2 + a3i3
)·(b1i1 + b2i2 + b3i3
)= a1b1 + a2b2 + a3b3
ya que por ser ortogonales se tiene que:
i1 · i1 = i2 · i2 = i3 · i3 = 1 , y
i1 · i2 = i2 · i1 = 0i1 · i3 = i3 · i1 = 0i2 · i3 = i3 · i2 = 0
Las propiedades del producto escalar en coordenadas cartesianas se comprueban facilmente
El producto interno de un vector consigo mismo, siempre es positivo.
ζ = a · a = |a|2 = (a1)2 + (a2)2 + (a3)2 ≥ 0
y(a1)2 + (a2)2 + (a3)2 = 0 ⇒ a1 = a2 = a3 = 0 ⇔ a = 0
Adicionalmente |a| =√ζ =√
a · a =√
(a1)2 + (a2)2 + (a3)2
El producto escalar es conmutativo
ζ = a · b = b · a = a1b1 + a2b2 + a3b3 = b1a1 + b2a2 + b3a3 .
El producto escalar es distributivo:
a · (b + c) =[a1i1 + a2i2 + a3i3
]·[(b1 + c1
)i1 +
(b2 + c2
)i2 +
(b3 + c3
)i2],
por lo tanto:
a1(b1 + c1
)+ a2
(b2 + c2
)+ a3
(b3 + c3
)=(
a1b1 + a1c1)
+(a2b2 + a2c2
)+(a3b3 + a3c3
)=(
a1b1 + a2b2 + a3b3)
+(a1c1 + a2c2 + a3c3
)= a · b + a · c
La multiplicacion por un escalar.
|α| (a · b) = (αa) · b = a · (αb) =(αa1
)b1 +
(αa2
)b2 +
(αa3
)b3 = a1
(αb1)
+ a2(αb2)
+ a3(αb3)
Desigualdad de Cauchy Schwarz.
a · b = a1b1 + a2b2 + a3b3 ≤√
(a1)2 + (a2)2 + (a3)2√
(b1)2 + (b2)2 + (b3)2 = |a| |b|
Diremos que dos vectores, no nulos son ortogonales (perpendiculares) si su producto escalar es nulo.Esta afirmacion es inmediata
a ⊥ b ⇒ θ〈a,b〉 =π
2⇒ a · b = |a| |b| cos(θ)〈a,b〉 = 0 ,
Borra
dor Pre
limin
ar
por lo cual
a1b1 + a2b2 + a3b3 = |a| |b| cos(θ)〈a,b〉 ⇒ cos(θ)〈a,b〉 =a1b1 + a2b2 + a3b3√
(a1)2 + (a2)2 + (a3)2√
(b1)2 + (b2)2 + (b3)2
de donde se deduce que para dos vectores perpendiculares
a⊥b ⇒ 0 = a1b1 + a2b2 + a3b3 .
Del producto escalar surge el Teorema del Coseno. Es inmediato generalizar el producto escalar de unvector consigo mismo, para ello suponemos que c = a + b, con lo cual
c = a + b ⇒ c · c = (a + b) · (a + b) ⇒ |c|2 = |a|2 + |b|2 + 2 |a| |b| cos(θ)〈a,b〉 ,
que no es otra cosa que el teorema del coseno y esta ilustrado en el cuadrante III de la Figura 1.3.
1.5.4. Producto vectorial
De igual manera, lo que aprendimos en la seccion 1.3.2 ahora lo expresamos en terminos de las compo-nentes de los vectores en una base ortonormal de la forma
c = a× b =(a2b3 − a3b2
)i1 +
(a3b1 − a1b3
)i2 +
(a1b2 − a2b1
)i3
lo anterior se puede organizar como el determinante de la matriz
c = a× b =
∣∣∣∣∣∣i1 i2 i3a1 a2 a3
b1 b2 b3
∣∣∣∣∣∣con lo cual
|c| =
√(a2b3 − a3b2)
2+ (a3b1 − a1b3)
2+ (a1b2 − a2b1)
2
=√
(a1)2 + (a2)2 + (a3)2√
(b1)2 + (b2)2 + (b3)2 sen(θ)〈a,b〉
1.5.5. Triple producto mixto
Finalmente, analicemos el numero (pseudoescalar) que proviene de la multiplicacion
V = c · (a× b) = |c| |a× b| cos(θ)〈c,a×b〉 =
∣∣∣∣∣∣c1 c2 c3
a1 a2 a3
b1 b2 b3
∣∣∣∣∣∣ .Obviamente, este numero representa del volumen del paralelepıpedo cuyos lados quedan definidos por a,by c.
Ejercicios
1. Dados los vectores
A = i1 + 2i2 + 3i3 , B = 4i1 + 5i2 + 6i3 , C = 3i1 + 2i2 + i3 , D = 6i1 + 5i2 + 4i3
Borra
dor Pre
limin
ar
a) Encuentre (A + B) · (C + D)
b) Los productos A×B, B×C, C×D y los angulos que estos forman con D.
c) C · (A×B).
2. Si i1, i2, i3 es una base ortonormal. Diga si los siguientes vectores forman una base
a)e1 = 2i1 + i2 − 3i3 , e2 = i1 − 4i3 , e3 = 4i1 + 3i2 − i3
b)e1 = i1 − 3i2 + 2i3 , e2 = 2i1 − 4i2 − i3 , e3 = 3i1 + 2i2 − i3
1.6. Algebra vectorial con ındices
Antes de comenzar con la presentacion de este esquema de calculo cabe aclarar algunas costumbres yconvenciones con la notacion de ındices.
1.6.1. Convencion de Einstein
1. Los ındices repetidos (arriba y abajo) indicaran suma por los valores que tomen los ındices. Las com-ponentes de los vectores tendran ındices arriba y los vectores base abajo:
a = a1e1 + a2e2 + a3e3 =
3∑m=1
amem ⇔ a = amem = aiei .
2. Los ındices repetidos son mudos (no importa la letra que lo etiquete) y representan suma. Ası
KjAj = KmAm = K1A1 +K2A2 +K3A3 = B .
En este punto del discurso, la posicion de los ındices (arriba y abajo) solo tiene sentido estetico y soloası indican suma. Mas adelante veremos que representan cantidades distintas.
3. Llamaremos contraccion cuando sumamos respecto a un par de ındices, vale decir:∑i
Aii = A11 +A2
2 +A33 =⇒ Aii = A1
1 +A22 +A3
3
Las cantidades con dos o mas ındices las llamaremos componentes de tensores, son arreglos bidimensio-nales (tridimensionales, tetradimensionales, segun el numero de ındices) y seran considerados en detalleposteriormente. Por ahora, contentemonos con saber que son cantidades con dos ındices. Es claro quela contraccion de ındices convierte un conjunto de numeros (i× j)→ 1, en un solo numero.
4. Los ındices libres (aquellos que no estan sumados) indican el numero de objetos disponibles y debenmantenerse. Por ejemplo:
Kki Ak = Bi ⇔
K1
1A1 +K21A2 +K3
1A3 = B1
K12A1 +K2
2A2 +K32A3 = B2
K11A1 +K2
1A2 +K31A3 = B1
con lo cual Kki Ak = Bi representan 3 ecuaciones. La operacion Kk
i Akj = Bij representan 9.
Borra
dor Pre
limin
ar
5. La delta de Kronecker1 δki lleva un ındice arriba y uno abajo. Representa δki = 1 si i = k y es nula enlos otros casos. Con esto:
Kkij δ
ik = K1
1j δ11︸︷︷︸
=1
+K12j
=0︷︸︸︷δ21 +K1
3j
=0︷︸︸︷δ31 +K2
1j
=0︷︸︸︷δ12 +K2
2j δ22︸︷︷︸
=1
+K23j
=0︷︸︸︷δ32 +K3
1j
=0︷︸︸︷δ13 +K3
2j
=0︷︸︸︷δ23 +K3
3j δ33︸︷︷︸
=1
es decirKkij δ
ik = Kk
kj = Kiij = K1
1j +K22j +K3
3j .
6. Ademas de la delta de Kronecker introduciremos el sımbolo de permutacion de Levi-Civita2 εijk parael caso de tres dimensiones, vale decir i, j, k = 1, 2, 3
εijk = εijk =
+1 cuando (1, 2, 3) ; (3, 1, 2) ; (2, 3, 1) permutacion cıclica−1 cuando (1, 3, 2) ; (3, 2, 1) ; (2, 1, 3) permutacion impar o anticıclica
0 cuando i = j; i = k ∧ j = k
y quiere decir que es distinto de cero cuando todos los ındices son diferentes: 1 si la permutacion deındices es cıclicas (o par) y −1 si la permutacion es anticıclica (o impar). Con ello, si queremos calcularpor ejemplo: ci = εijkajbk, entonces resulta:
c1 = ε111a1b1 + ε112a1b2 + ε113a1b3 + ε121a2b1 + ε122a2b2 + ε123a2b3 + ε131a3b1 + ε132a3b2 + ε133a3b3
c2 = ε211a1b1 + ε212a1b2 + ε213a1b3 + ε221a2b1 + ε222a2b2 + ε223a2b3 + ε231a3b1 + ε232a3b2 + ε233a3b3
c3 = ε311a1b1 + ε312a1b2 + ε313a1b3 + ε321a2b1 + ε322a2b2 + ε323a2b3 + ε331a3b1 + ε332a3b2 + ε333a3b3
con lo cual
ci = εijkajbk ⇒
c1 = ε123a2b3 + ε132a3b2 = a2b3 − a3b2
c2 = ε231a3b1 + ε213a1b3 = a3b1 − a1b3
c3 = ε312a1b2 + ε321a2b1 = a1b2 − a2b1
7. A continuacion enumeramos algunas propiedades de la delta de Kronecker y del sımbolo de permutacionde Levi-Civita, dejamos al lector su demostracion. Ellas son:
δjj = 3 ,
εjkmεilm = δijδ
lk − δikδlj = δijδ
lk − δljδik ,
εjmnεimn = 2δij ,
εijkεijk = 6 .
1.6.2. Los vectores y los ındices
Sumas de vectores
La suma de vectores sera expresada de la siguiente manera
a + b = aiei + biei =(ai + bi
)ei = ciei ⇒ ci = ai + bi con i = 1, 2, 3
1LEOPOLD KRONECKER (7 diciembre 1823 Legnica, Polonia, 29 diciembre 1891, Berlin, Alemania) Matematico polaco conimportantes contribuciones en teorıa de numeros, funciones elıpticas y algebra, ası como la interrelacion entre estas disciplinas.
2TULLIO LEVI-CIVITA (1873 Padova, Veneto, 1941 Roma, Italia) Geometra italiano y uno de los desarrolladores delCalculo Tensorial que mas tarde serıa utilizado por Einstein y Weyl como el lenguaje de la Relatividad General.
Borra
dor Pre
limin
ar
Producto escalar
A partir da ahora y de forma equivalente, expresaremos el producto escalar en termino de los ındices. Deforma y manera que
a · b = |a| |b| cos(θ)ab = aibi con i = 1, 2, 3
Producto vectorial
En terminos de ındices, la componente i del producto vectorial se puede expresar como
(a× b)i
= εijkajbk con i, j, k = 1, 2, 3
todas las particularidades de producto vectorial ahora descansan en las propiedades del sımbolo de LevyCivita.
Triple producto mixto
Analicemos ahora el numero (pseudoescalar) que proviene de la multiplicacion
c · (a× b) = |c| |a× b| cos(θ)〈c,a×b〉 = ciεijk ajbk = εijk c
iajbk =
∣∣∣∣∣∣c1 c2 c3
a1 a2 a3
b1 b2 b3
∣∣∣∣∣∣1.6.3. Un par de calculos ilustrativos
Mostremos dos casos de identidades vectoriales que pueden ser demostradas mediante la utilizacion deındices.
1. a× (b× c) = (c · a) b− (a · b) c
El resultado sera un vector, por lo tanto
(a× (b× c))i
= εijkaj (b× c)k
= εijkajεkmnbmcn = εijkεkmnajb
mcn = εijkεmnkajbmcn
=(δimδ
jn − δjmδin
)ajb
mcn = δimδjnajb
mcn − δjmδinajbmcn
= δimbmδjnajc
n − δincnδjmajbm = biancn︸︷︷︸
(c·a)
− ciajbj︸︷︷︸(a·b)
(a× (b× c))i
= bi (c · a)− ci (a · b) .
2. (a× b) · (c× d) = (a · c) (b · d)− (a · d) (b · c)
Borra
dor Pre
limin
ar
El lado derecho es un escalar, por lo tanto
(a× b) · (c× d) = (a× b)l(c× d)l
= εljkajbk εlmncmdn = εljkεlmn ajbkc
mdn
= εjklεmnl ajbkcmdn =
(δjmδ
kn − δkmδjn
)ajbkc
mdn
= δjmδknajbkc
mdn − δkmδjnajbkcmdn
= δjmajcm︸ ︷︷ ︸
(a·c)
δknbkdn︸ ︷︷ ︸
(b·d)
− δkmbkcm︸ ︷︷ ︸(b·c)
δjnajdn︸ ︷︷ ︸
(a·d)
= (a · c) (b · d)− (b · c) (a · d) .
1.6.4. Escalares, pseudoescalares, vectores y pseudovectores
La diferencia entre vectores polares y axiales proviene del siguiente comportamiento bajo transformacionesde coordenadas y bases. Un vector polar (normal, comun y corriente) queda invariante bajo la siguientetransformacion (reflexion)
ei → −eiai → −ai
=⇒ a = aiei →
(−ai
)(−ei) = aiei = a .
Mientras que un pseudovector o vector axial cambia de signo cuando las componentes de los vectores y susvectores base que lo generan tambien lo hacen:
ei → −eiai → −aibi → −bi
=⇒ c = a× b→[εijk (−aj) (−bk)
](−ei) = −ciei = −c
es decir
a× b =(a2b3 − a3b2
)e1 +
(a3b1 − a1b3
)e2 +
(a1b2 − ayb1
)e3 ,
luego de la reflexion:
a× b =[(−a2
) (−b3
)−(−a3
) (−b2
)](−e1) +
[(−a3
) (−b1
)−(−a1
) (−b3
)](−e2)
+[(−a1
) (−b2
)−(−a2
) (−b1
)](−e3)
= −[(a2b3 − a3b2
)e1 +
(a3b1 − a1b3
)e2 +
(a1b2 − a2b1
)e3
]= − (a× b)
Existen varias e importantes cantidades fısicas que vienen representadas por pseudovectores, entre ellasmencionamos:
Velocidad Angular: v = ω × rCantidad de Movimiento Angular: L = r× p
Torque: τ = r× F
Campo de Induccion Magnetica:∂B
∂t= −∇×E
Adicionalmente el volumen, V = c · (a× b), como era de esperarse, no es invariante bajo el cambio delespacio
ci → −ciai → −aibi → −bi
=⇒ V = c · (a× b) = ciεijk ajbk → (−ci)
[εijk (−aj) (−bk)
]= −V ,
Borra
dor Pre
limin
arFigura 1.5: Geometrıa analıtica y vectores cartesianos
el volumen es un pseudoescalar.Mientras que los escalares si son invariantes bajo esta transformacion
ai → −aibi → −bi
=⇒ ζ = a · b = aibi →
(−ai
)(−bi) = ζ .
En general tambien tendremos multiplicacion entre algunos de estos objetos, con lo cual construiremosotros objetos. Dejamos al lector demostrar la siguiente tabla de relaciones
vector · vector = escalarvector · pseudovector = pseudoescalar
pseudovector · pseudovector = escalarvector × vector = pseudovectorvector × pseudovector = vector
pseudovector × pseudovector = pseudovector
1.7. Aplicaciones del algebra vectorial
Uno de los terrenos mas exitosos de las aplicaciones del algebra vectorial es la geometrıa analıtica. Estose realiza en base a la definicion que hicieramos de radio vector, en la cual a cada punto, P, del espacio leasociabamos un radiovector posicion tal y como lo mostramos en el cuadrante I de la Figura 1.4 .
P ←→ (x, y, z) ≡(x1, x2, x3
)⇒ r (P ) = x i + y j + z k = x1i1 + x2i2 + x3i3 = xiii
A partir de esta definicion todas las propiedades geometricas del espacio las podemos construir con vectores.
1.7.1. Rectas y vectores
La ecuacion de la recta en termino de vectores la definiremos fijando uno de sus puntos, digamos:
r (P1) ≡ X (P1) = X1 = x1 i + y1 j + z1 k = x1(1)i1 + x2
(1)i2 + x3(1)i3 ←→ (x1, y1, z1) ,
Borra
dor Pre
limin
ar
y un vector que indique su direccion, digamos A = A1 i +A2 j +A3 k (ver cuadrante I de la Figura 1.5) conlo cual la ecuacion de una recta en lenguaje vectorial sera:
X = X1 + λA ⇒ x1 i + y1 j + z1 k+ λ (A1 i +A2 j +A3 k) ⇒
x = x1 + λA1
y = y1 + λA2
z = z1 + λA3
donde X = x i + y j + z k es el conjunto de puntos genericos que cumple con la ecuacion de la recta en 3D.Si utilizamos la notacion de ındices, las ecuaciones anteriores son mas evidentes:
X = X1 + λA ⇒ xiii = xi(1)ii + λAiii ⇒ xi = xi(1) + λAi para i = 1, 2, 3 .
Notese que efectivamente se cumplen tres ecuaciones escalares y cada una de ellas tiene la forma de unarecta. Ademas, tal y como se muestra la Figura 1.5 el punto generico (x, y, z) lo describe (sobre la recta) lavariacion del modulo de A mediante la constante de proporcionalidad λ. Si se requiere describir una rectaque pase por dos puntos: (x1, y1, z1) y (x2, y2, z2) entonces una vez seleccionado uno de los puntos (digamos(x1, y1, z1)) seleccionamos el vector A = r (P2) − r (P1) como la resta de los dos radiovectores a los puntosP2 y P1. Esto es
X = X1 + λ (X2 −X1) ⇒ X =X1 + δX2
1− δ, con δ =
X1 −X
X2 −X.
Aquı la division entre vectores δ tiene sentido porque no es una division entre vectores genericos es una divi-sion entre vectores que tienen la misma direccion Notese ademas que, lo mismo ocurre cuando “despejamos”λ de la ecuacion de la recta
λ =X−X1
A⇒ xi = xi(1) + λAi ⇒ λ =
xi − xi(1)
Ai=x− x1
Ax=y − y1
Ay=z − z1
Az
y equivalentemente ocurre cuando “despejamos” λ de la ecuacion de la recta que pasa por dos puntos.
λ =X−X1
X2 −X1⇒ xi = xi(1) + λ
(xi(2) − x
i(1)
)⇒ λ =
xi − xi(1)
xi(2) − xi(1)
=x− x1
x2 − x1=
y − y1
y2 − y1=
z − z1
z2 − z1
1.7.2. Planos y vectores
Ocurre exactamente lo mismo cuando construimos la ecuacion vectorial para un plano. En general unasuperficie la define su vector normal (perpendicular). En el caso de una superficie plana (un plano) tendrauna unica normal que lo define, por lo tanto, un plano vendra definido por su vector perpendicular en un
punto, digamos P1 : (x1, y1, z1). La ecuacion vectorial del plano vendra definida por todos los vectores−−→PQ
tales que sean perpendiculares a un determinado vector A (ver cuadrante II de la Figura 1.5). Donde el puntoP es un punto generico (x, y, z) que define un radiovector. La ecuacion vectorial del plano sera simplemente
A ·
r (P )− r (P1)︸ ︷︷ ︸B
= 0 ⇔ A · (r− r1) = 0 ⇔ A · r = A · r1︸ ︷︷ ︸b
Borra
dor Pre
limin
ar
Esto es, se tiene que cumplir la condicion
(A1 i +A2 j +A3 k) · [(x i + y j + z k)− (x1 i + y1 j + z1 k)] = 0
(A1 i +A2 j +A3 k) · [(x− x1) i + (y − y1) j + (z − z1) k] = 0
A1 (x− x1) +A2 (y − y1) +A3 (z − z1) = 0
con lo cual la ecuacion del plano queda como siempre la hemos conocido
A1x+A2y +A3z −A1x1 −A2y1 −A3z1 = 0 ⇒ A1x+A2y +A3z = b = A1x1 +A2y1 +A3z1
es decir, de manera mas compacta
Aixi −Ajxj1 = 0 ⇒ Akxk = b = Alx
l1
Es claro que A · r1 = b es la proyeccion del radiovector r (P1) sobre la perpendicular que define al plano. Porlo tanto sera la distancia entre el plano y el origen de coordenadas. Si b = 0 el plano pasa por el origen decoordenadas.
Consideremos ahora el cuadrante III de la Figura 1.5. Allı estan especificados tres puntos en el espaciocaracterizados por sus correspondientes radiovectores posicion: r (P1) = r1, r (P2) = r2 y r (P3) = r3. Estostres puntos seran coplanares si
(r1 − r2) · [(r2 − r3)× (r3 − r1)] = 0 ⇔ εmnl (xm1 − xm2 ) (xn2 − xn3 )
(xl3 − xl1
)= 0
y la ecuacion del plano vendra dada por
(r− r1) · [(r2 − r1)× (r3 − r1)] = 0 .
Ejercicios
1. Verifique las siguientes identidades
a)A× (B×C) + B× (C×A) + C× (A×B) = 0
b)
(A×B) · (C×D) =
∣∣∣∣∣∣A ·C A ·D
B ·C B ·D
∣∣∣∣∣∣c)
(A×B)× (C×D) = B[A · (C×D)]−A[B · (C×D)]
d)(A×B) · (C×D) + (B×C) · (A×D) + (C×A) · (B×D) = 0
2. Dada la siguiente basee1 = −4i1 + 2i2 , e2 = 3i1 + 3i2 , e3 = 2i3
Encuentre las componentes covariantes y contravariantes de un vector que va del origen al puntoP = (1, 1, 1).
Borra
dor Pre
limin
ar
Figura 1.6: Vectores variables
1.8. Un comienzo a la derivacion e integracion de vectores
1.8.1. Vectores variables
Los vectores podran ser constantes o variables. Ahora bien, esta caracterıstica se verificara tanto en lascomponentes como en la base. Esto quiere decir que cuando un vector es variable podran variar su modulo,su direccion, su sentido, o todo junto o por separado. Obviamente esta variabilidad del vector dependera dela base en la cual se exprese, por lo cual un vector podra tener una componente constante en una base y noconstante en otra, vale decir
A (t) = Ak (t) ek (t) = Ak′ek′ (t) .
Notese que hemos utilizado una base ek (t) de vectores variables a diferencia de la tradicional base devectores cartesianos, los cuales son constantes en modulo, direccion y sentido (ver los cuadrantes I y II dela Figura 1.6). Mas aun, tal y como se muestra en cuadrante II de la Figura 1.6, todo vector variable podraser expresado como la suma de uno variable, a (t) , mas otro constante c
A (t) = a (t) + c .
1.8.2. Derivacion
De esta manera, cuando uno piensa en un vector variable A (t) uno rapidamente intenta establecer uncociente incremental:
lım∆t→0
A (t+ ∆t)−A (t)
∆t= lım
∆t→0
∆A (t)
∆t=
dA (t)
dt
Borra
dor Pre
limin
ar
el cuadrante IV de la Figura 1.6 ilustra graficamente este cociente incremental.Como siempre, las propiedades de esta operacion derivacion seran
d
dt[A (t) + B (t)] =
d
dtA (t) +
d
dtB (t) , (1.1)
d
dt[α (t) A (t)] =
[d
dtα (t)
]A + α (t)
[d
dtA (t)
], (1.2)
d
dt[A (t) ·B (t)] =
[d
dtA (t)
]B + A (t)
[d
dtB (t)
], (1.3)
d
dt[A (t)×B (t)] =
[d
dtA (t)
]×B + A (t)×
[d
dtB (t)
]. (1.4)
Ahora bien, esto implica que
A (t) = Ak (t) ek (t) ⇒ dA (t)
dt=
d[Ak (t) ek (t)
]dt
=dAk (t)
dtek (t) +Ak (t)
dek (t)
dt
con lo cual hay que tener cuidado al derivar vectores y cerciorarse de la dependencia funcional de la basey componentes. Habra sistemas de coordenadas (bases de vectores) que seran constantes y otros en loscuales sus vectores bases cambiaran en su direccion. El primer termino de la ultima ecuacion representa lavariacion del modulo, y el segundo muestra la contribucion de los cambios en direccion del vector. Mas aun,mostraremos apoyandonos en la ilustracion de el cuadrante III de la Figura 1.6 que, independientementedel sistema de coordenada, el cambio en el modulo apunta en la direccion del vector, mientras que lascontribuciones en direccion apuntan en la direccion perpendicular al vector. Esto es:
dA (t)
dt=
d |A (t)|dt
u‖ + |A (t)| u⊥ , con u‖ · u⊥ = 0 .
Es facil convencernos de la forma del primer termino. Siempre podemos representar un vector como sumodulo y un vector unitario en la direccion apropiada. Esto es
A (t) = |A (t)| u(t) =⇒ dA (t)
dt=
d [|A (t)| u (t)]
dt=
d |A (t)|dt
u (t) + |A (t)| du (t)
dt,
adicionalmente: |A (t)|2 = A (t) ·A (t), por lo tanto
d[|A (t)|2
]dt
≡ d [A (t) ·A (t)]
dt= 2 |A (t)| d |A (t)|
dt≡ 2A (t) · dA (t)
dt,
con lo cual, al despejar de esta ultima ecuacion
d |A (t)|dt
≡ A (t)
|A (t)|︸ ︷︷ ︸u(t)
· dA (t)
dt= u (t) · dA (t)
dt,
para que finalmente
u (t) · dA (t)
dt= u (t) ·
[d |A (t)|
dtu (t) + |A (t)| du (t)
dt
]⇒
u (t) · dA (t)
dt=
d |A (t)|dt
u (t) · du (t)
dt= 0
Borra
dor Pre
limin
ar
Es decir que el cambio en el modulo de un vector se manifiesta en la direccion del mismo vector, tal ycomo era intuitivo suponer. Adicionalmente, vemos que el vector siempre sera perpendicular a su derivada.Graficamente podemos apreciarlo en el cuadrante IV de la Figura 1.6 , pero tambien surge analıticamente siderivamos el vector unitario en la direccion de A (t)
d [u (t) · u (t)]
dt≡
d(|u (t)|2
)dt
=d (1)
dt≡ 0 = u (t) · du (t)
dt⇒ u (t) ⊥ du (t)
dt,
es decir
dA (t)
dt=
d [|A (t)| u (t)]
dt=
d |A (t)|dt
u (t) + |A (t)| du (t)
dt=
d |A (t)|dt
u‖ + |A (t)| u⊥ .
Supongamos que ahora definimos un vector
∆θ = ∆θ v con
v ⊥ u‖
v ⊥ u⊥
⇒
v × u‖ = u⊥
u⊥ × v = u‖
u‖ × u⊥ = v
donde ∆θ es el angulo de rotacion del vector A (t) (ver cuadrante V de la Figura 1.6). Claramente
∆A⊥ = [A (t+ ∆t) sen (∆θ)] u⊥ ≈ [A (t+ ∆t) ∆θ] u⊥ ⇒ ∆A⊥ = ∆θ ×A (t) ,
entonces
∆A⊥∆t
≡[
∆A
∆t·A⊥
]A⊥ =
∆θ
∆t×A (t) ⇒
[dA (t)
dt· u⊥
]u⊥ =
dθ (t)
dtv ×A (t) = ω ×A (t) ,
donde hemos identificado ω = dθ(t)dt v. Podemos ir mas alla observando el cuadrante V de la Figura 1.6,
vemos que si suponemos que el modulo del vector es constante, entonces
d |A (t)|dt
= 0 ⇒ dA (t)
dt= |A (t)| u⊥ ⇒
[dA (t)
dt· u⊥
]u⊥ = ω ×A (t) .
1.8.3. Velocidades y aceleraciones
El radio vector posicion de una partıcula genera los vectores velocidad y aceleracion
r = r (t) ⇒ v (t) =dr (t)
dt⇒ a (t) =
dv (t)
dt=
d2r (t)
dt2,
ahora bienr = rur = xi + yj + zk , con ur = cos(θ) i + sen(θ) j .
Si suponemos que la partıcula describe una trayectoria entonces
r = r (t)
θ = θ (t)
⇐⇒
x = x (t)y = y (t)z = z (t)
; ur = ur (t) ;i = constj = constk = const
Borra
dor Pre
limin
ar
Es muy comun denotar a la derivada temporal sobre funciones de una variable con un punto, es decir,podemos utilizar la siguiente notacion
g(t) ≡ dg (t)
dt,
con lo cual
durdt
=d [cos(θ (t))i + sen(θ (t))j]
dt= − sen(θ (t)) θ(t)i + cos(θ (t))θ(t)j
durdt
= θ(t)[− sen(θ (t))i + cos(θ (t))j]︸ ︷︷ ︸uθ
= θ(t)uθ ,
ya que
|ur| =√
ur · ur =√
[cos(θ (t)) i + sen(θ (t)) j] · [cos(θ (t)) i + sen(θ (t)) j] = 1
|uθ| =√
uθ · uθ =√
[− sen(θ (t)) i + cos(θ (t)) j] · [− (sen(θ (t)))i + cos(θ (t))j] = 1 ,
yuθ · ur = ur · uθ = [− sen(θ (t)) i + cos(θ (t)) j] · [cos(θ (t)) i + sen(θ (t)) j] = 0 .
Mas aun
duθdt
=d [−sen(θ (t)) i + cos(θ (t)) j]
dt= − cos(θ (t)) i− sen(θ (t)) j = −θ(t)ur .
Para una partıcula que sigue un movimiento generico, su trayectoria vendra descrita en coordenadascartesianas por:
r = x (t) i + y (t) j + z (t) k ,
su velocidad sera
v (t) =dr (t)
dt=
d [x (t) i + y (t) j + z (t) k]
dt= x(t)i + y(t)j + z(t)k = vx (t) i + vy (t) j + vz (t) k ,
y la aceleraciona (t) = vx(t)i + vy(t)j + vz(t)k = ax (t) i + ay (t) j + az (t) k .
Mientras que en coordenadas polares sera
r (t) = r (t) ur (t) ⇒ v (t) =d [r (t) ur (t)]
dt= r(t)ur (t) + r (t)
dur (t)
dt,
con lo cual la velocidad vendra dada por
v (t) = vr (t) ur (t) + r (t) θ(t)uθ (t) ,
Borra
dor Pre
limin
ar
y la aceleracion
a (t) =dv (t)
dt=
d[vr (t) ur (t) + r (t) θ(t)uθ (t)
]dt
=d [vr (t) ur (t)]
dt+
d[r (t) θ(t)uθ (t)
]dt
= r(t)ur (t) + r(t)dur (t)
dt+ r(t)θ(t)uθ (t) + r (t) θ(t)uθ (t) + r (t) θ(t)
duθ (t)
dt
=
r(t)− r (t)
(θ(t)
)2
ur (t) +
2 r(t)θ(t) + r (t) θ(t)
uθ (t) .
Claramente para el caso de un movimiento circular
r = R = const ⇒ dR
dt= 0 ⇒
r (t) = R ur (t)
v (t) = R θ(t)uθ
a (t) = −R θ(t)2ur (t) +R θ(t)uθ (t)
De aquı podemos ver claramente que el vector velocidad v (t) y el vector posicion r (t) son ortogonales. Lavelocidad, v (t) , siempre es tangente a la trayectoria r (t) y en este caso la trayectoria es una circunferencia.
En general el vector
rmed =∑i
∆ r (ti) =∑i
(r (ti + ∆ti)− r (ti)) ⇒ lım∆t→0
∑i
∆ r (ti) =
∫dr (t) = r (t) ,
es decir dr (t) = lım∆t→0
∑i ∆ r (ti) es tangente a la trayectoria. Es claro que
dr (t) = d [x (t) i + y (t) j + z (t) k] ≡ dx (t)
dti +
dy (t)
dtj +
dz (t)
dtk .
Tal y como mencionamos arriba, para el sistema de coordenadas cartesiano podemos definir un vector(en este caso) velocidad angular ω tal que:
ω
|ω|× ur = uv
uv ×ω
|ω|= ur
ur × uv =ω
|ω|
⇒ v (t) = ω × r (t)
Supongamos por simplicidad que elegimos el sistema de coordenadas cartesiano, donde r esta en elplano x, y. En este caso es inmediato comprobar que vi = εijkωjxk, y dado que r y v tienen unicamentecomponentes 1 y 2 entonces, necesariamente ω tiene unicamente componente 3, Es decir
r = riei
v = viei
⇒
v1 = ε1j2ωjx2
v2 = ε2j1ωjx1
⇒ ω = |ω| e3 = ωk ,
Borra
dor Pre
limin
ar
comor = x (t) i + y (t) j ,
entonces
v (t) =dr (t)
dt= vx (t) i + vy (t) j = ω × r (t) = θ(t)k× [x (t) i + y (t) j] ,
se vera mas claro en coordenadas polares, esto es
v (t) =dr (t)
dt=r (t) θ(t)uθ (t) = [|ω| un (t)]× [r (t) ur (t)] , |r (t)| = const
=r (t) θ(t)︸ ︷︷ ︸v⊥
uθ (t) = |ω| r (t) uθ (t) ⇒ θ(t) ≡ |ω| .
1.8.4. Vectores y funciones
Antes de continuar con la integracion repensemos algunas funciones de tipo φ (x, y, z) y V (x, y, z). Estasfunciones son sin duda funciones de varias variables:
φ = φ (x, y, z) ,
V = V (x, y, z) = iVx (x, y, z) + jVy (x, y, z) + kVz (x, y, z) .
Un par de reflexiones se pueden hacer en este punto, primeramente, dado que hemos relacionado un puntodel espacio con un radio vector posicion, entonces
P(x,y,z) ↔ (x, y, z)↔ r = x i + y j + z k ⇒
φ = φ (x, y, z) ≡ φ (r)
V = V (x, y, z) ≡ V (r)
La primera funcion, φ (r) sera una funcion escalar de argumento vectorial o, simplemente un campo escalary la segunda se conoce como una funcion vectorial de argumento vectorial o campo vectorial. Como hemosdicho, este tipo de funciones y las operaciones que pueden ser realizadas con ellas, y su significado, serananalizadas en detalle mas adelante durante el desarrollo de este curso.
En segundo lugar, siempre podremos parametrizar las coordenadas y tendremos
φ = φ (t) = φ (x (t) , y (t) , z (t)) ,
V = V (t) = V (x (t) , y (t) , z (t)) = Vx (x (t) , y (t) , z (t)) i + Vy (x (t) , y (t) , z (t)) j + Vz (x (t) , y (t) , z (t)) k .
Este caso lo hemos encontrado en montones de situaciones, por ejemplo, el movimiento parabolico vienedescrito por vectores velocidad y posicion dados por:
v(t) = −gt k + v0 = −gt k + (v0xi + v0yj + v0zk) ⇒
vx = v0x
vy = v0y
vz = v0z − gt
r(t) = −g2t2 k + v0t = −g
2t2 k + (v0xi + v0yj + v0zk) t ⇒
x = v0xty = v0ytz = v0zt− g
2 t2
Borra
dor Pre
limin
ar
Derivada de funciones φ (r (t))
Al derivar una funcion de argumento vectorial tambien se aplica la “regla de la cadena”. Esto es, si
φ (r (t)) = g (x (t) , y (t) , z (t))
entonces:
dφ (r (t))
dt=∂φ (x (t) , y (t) , z (t))
∂x
dx (t)
dt+∂φ (x (t) , y (t) , z (t))
∂y
dy (t)
dt+∂φ (x (t) , y (t) , z (t))
∂z
dz (t)
dt
=
[∂ (x, y, z)
∂xi +
∂φ (x, y, z)
∂yj+∂φ (x, y, z)
∂zk
]·[
dx (t)
dti +
dy (t)
dtj +
dz (t)
dtk
]
= ∇φ (x (t) , y (t) , z (t)) · dr (t)
dt,
donde hemos representado
∇φ (r (t)) =∂φ (x, y, z)
∂xi +
∂φ (x, y, z)
∂yj +
∂φ (x, y, z)
∂zk = ∂iφ (x, y, z) ei = φ,i (x, y, z) ii ,
y lo llamaremos el gradiente de la funcion φ (r (t)).El gradiente de un campo escalar es uno de los objetos mas utiles que encontraremos en el estudio de
problemas de fısica-matematica, el cual lo utilizaremos por ahora de manera operacional. Es bueno recordarque emerge como consecuencia de una derivacion contra un parametro. El gradiente mide el cambio de lafuncion φ (x, y, z).
La idea de gradiente nos lleva a considerar a ∇ como un operador vectorial que actua sobre la funcionescalar de variable vectorial φ (r (t)). Es decir, y con un poquito de imaginacion
∇φ (r (t)) ≡(∂
∂xi +
∂
∂yj+
∂
∂zk
)φ (x, y, z) =
(ii∂
i)φ (x, y, z)
⇓
∇ () =
(∂ ()∂x
i +∂ ()∂y
j+∂ ()∂z
k
)= ii∂
i () .
Derivada de funciones V (r (t))
De modo que inspirados en la regla de la cadena de una funcion escalar de variable vectorial podemoscomprobar que
dV
dt=
dVx (x, y, z)
dti +
dVy (x, y, z)
dtj +
dVz (x, y, z)
dtk =
dV i (x, y, z)
dtii
por consiguiente, si V, tiene por componentes cartesianas (Vx, Vy, Vz) las componentes del vector derivado
seran(
dVxdt ,
dVydt ,
dVzdt
). Con lo cual cada componente
d(V i (x (t) , y (t) , z (t))
)dt
=d(V i(xj (t)
))dt
=∂(V i(xj))
∂xkdxk (t)
dt=
(dr (t)
dt·∇)V i (x, y, z) ,
Borra
dor Pre
limin
ar
en terminos vectoriales
dV
dt=
(dr (t)
dt·∇)
V ≡ (v ·∇) V ⇒ d ()dt
= (v ·∇) () ≡ vi∂i () ,
con v la derivada del radiovector posicion r (t), es decir, la velocidad. Entonces, estamos viendo que el cambiodel vector V respecto al tiempo es el cambio de sus componentes en la direccion de la velocidad.
Si se nos ocurre calcular la derivada del vector velocidad para encontrar la aceleracion tendremos quenos quedara expresada como
a =dv
dt= (v ·∇) v ⇒ ai = (v ·∇) vi ,
donde las componentes cartesianas de los vectores velocidad y aceleracion son: vi = vi (x (t) , y (t) , z (t)) yai = ai (x (t) , y (t) , z (t)), respectivamente.
1.8.5. El vector gradiente
El operador vectorial ∇ () merece un poco de atencion en este nivel. Tal y como hemos visto
∇φ (x, y, z) =∂φ (x, y, z)
∂xi +
∂φ (x, y, z)
∂yj +
∂φ (x, y, z)
∂zk ,
= ∂1φ (x, y, z) i1 + ∂2φ (x, y, z) i2 + ∂3φ (x, y, z) i3 .
Con el operador nabla ∇ () realizaremos operaciones igual como con un vector comun y corriente. Asıen el caso de ∇×E, que se denomina rotor de E, este viene definido por
∇×E =
(∂
∂xi +
∂
∂yj +
∂
∂zk
)× (Exi + Eyj + Ezk)
=
(∂Ez∂y− ∂Ey
∂z
)i +
(∂Ex∂z− ∂Ez
∂x
)j +
(∂Ey∂x− ∂Ez
∂y
)k = εijk∂jEk ii .
Tambien podemos hablar del “producto escalar” de nabla por un vector a. A esta operacion la llamaremosdivergencia de a:
∇ · a =∂ai
(xj)
∂xi≡ ∂iai
(xj)≡ ∂ax (x, y, z)
∂x+∂ay (x, y, z)
∂y+∂az (x, y, z)
∂z,
pero por ahora consideremos nabla ∇ como un vector.De este modo habra una gran cantidad de relaciones vectoriales que involucran a ∇, las cuales se podran
demostrar. Veamos algunos ejemplos.
1. ∇ (a · b) = (a ·∇) b + (b ·∇) a + a× (∇× b) + b× (∇× a)El resultado es un gradiente, es decir un vector. El lado izquierdo sera
(∇ (a · b))i
= ∂i (a · b) = ∂i(ajb
j)
=(∂iaj
)bj +
(∂ibj
)aj
Borra
dor Pre
limin
ar
mientras que el lado derecho
(∇ (a · b))i
=(aj∂
j)bi +
(bj∂
j)ai + εijkaj
(~∇× b
)k
+ εijkbj (∇× a)k
=(aj∂
j)bi +
(bj∂
j)ai + εijkajεkmn∂
mbn + εijkbjεkmn∂man
=(aj∂
j)bi +
(bj∂
j)ai + εijkεmnkaj∂
mbn + εijkεmnkbj∂man
=(aj∂
j)bi +
(bj∂
j)ai +
(δimδ
jn − δjmδin
)aj∂
mbn +(δimδ
jn − δjmδin
)bj∂
man
= aj∂jbi + bj∂
jai + δimδjnaj∂
mbn − δjmδinaj∂mbn + δimδjnbj∂
man − δjmδinbj∂man
= aj∂jbi + bj∂
jai + an∂ibn − am∂mbi + bn∂
ian − bm∂mai
= aj∂jbi − am∂mbi︸ ︷︷ ︸
=0
+ bj∂jai − bm∂mai︸ ︷︷ ︸
=0
+ an∂ibn + bn∂
ian
= an∂ibn + bn∂
ian = ∂i(ajb
j)
= ∂i (a · b) .
2. ∇× (a ·∇) a = (∇ · a) (∇× a)− [∇ · (∇× a)] a + (a ·∇) (∇× a)− [(∇× a) ·∇] a
Iniciamos la traduccion a ındices por el lado izquierdo de la ecuacion, ası
∇× (a ·∇) a = εijk∂j (am∂m) ak = εijk (∂jam) ∂mak + εijkam∂j∂
mak
= εijk (∂jam) ∂mak + am∂m(εijk∂jak
),
el lado derecho lo traduciremos termino por termino
(∇ · a) (∇× a) = (∂mam)(εijk∂jak
)− [∇ · (∇× a)] a = −
[∂mε
mjk∂jak]ai = −
[εmjk∂m∂jak
]ai = 0
(a ·∇) (∇× a) = am∂m(εijk∂jak
)− [(∇× a) ·∇] a = −
[(εmjk∂jak
)∂m]ai .
El segundo termino se anula por cuanto εmjk es antisimetrico respecto a los ındices m, j mientras que∂m∂j es simetrico. El tercer termino del desarrollo del lado derecho corresponde con el segundo deldesarrollo del lado izquierdo. Por lo tanto, llegamos a la siguiente igualdad
εijk (∂jam) ∂mak = (∂mam)(εijk∂jak
)−[(εmjk∂jak
)∂m]ai
Para verificar la igualdad tendremos que evaluar componente a componente. Esto es, para el ladoizquierdo:
ε1jk (∂jam) ∂mak = ε123 (∂2am) ∂ma3 + ε132 (∂3am) ∂ma2
= (∂2am) ∂ma3 − (∂3am) ∂ma2
= (∂2a1) ∂1a3 + (∂2a2) ∂2a3 + (∂2a3) ∂3a3 − (∂3a1) ∂1a2 − (∂3a2) ∂2a2 − (∂3a3) ∂3a2 ,
mientras que para el primer termino del lado derecho
(∂mam)(ε1jk∂jak
)= (∂mam)
(ε123∂2a3
)+ (∂mam)
(ε132∂3a2
)= ∂2a3∂
1a1︸ ︷︷ ︸α
+ ∂2a3∂2a2 + ∂2a3∂
3a3 − ∂3a2∂1a1︸ ︷︷ ︸
β
− ∂3a2∂2a2 − ∂3a2∂
3a3 ,
Borra
dor Pre
limin
ar
y el segundo termino se escribe como
−[(εmjk∂jak
)∂m]ai = −
(ε1jk∂jak
)∂1a
1 −(ε2jk∂jak
)∂2a
1 −(ε3jk∂jak
)∂3a
1
= − (∂2a3 − ∂3a2) ∂1a1 − (∂3a1 − ∂1a3) ∂2a
1 − (∂1a2 − ∂2a1) ∂3a1
= ∂3a2∂1a1︸ ︷︷ ︸
β
− ∂2a3∂1a1︸ ︷︷ ︸
α
+ ∂1a3∂2a1 − ∂3a1∂2a
1︸ ︷︷ ︸γ
+ ∂2a1∂3a1︸ ︷︷ ︸
γ
− ∂1a2∂3a1 .
Al sumar ambos terminos se eliminan los sumandos indicados con letras griegas, y queda como
(∂mam)(ε1jk∂jak
)−[(εmjk∂jak
)∂m]ai = ∂2a3∂2a2
Ξ+ ∂2a3∂3a3
Υ
−∂3a2∂2a2Ω
−∂2a2∂3a3Ψ
+ ∂1a3∂2a1Λ
−∂1a2∂3a1Σ
,
y al compararlo con el desarrollo del lado derecho e identificar termino a termino queda demostrada laigualdad
ε1jk (∂jam) ∂mak = (∂2a1) ∂1a3Λ
+ (∂2a2) ∂2a3Ξ
+ (∂2a3) ∂3a3Υ
− (∂3a1) ∂1a2Σ
− (∂3a2) ∂2a2Ω
− (∂3a3) ∂3a2Ψ
.
De igual manera se procede con i = 2 e i = 3.
Ejercicios
1. Demuestred
dt[A · (B×C)] =
dA
dt· (B×C) + A ·
(dB
dt×C
)+ A ·
(B× dC
dt
)2. Demuestre
d
dt
[A ·
(dA
dt× d2A
dt2
)]= A ·
(dA
dt× d3A
dt3
)3. Demuestre que
∇× (∇×A) = ∇∇ ·A−∇ ·∇A
4. Demuestre que∇× (φ∇φ) = 0
5. Muestre que∇× [A× (∇×A)] = 0
si A = (y, z)i.
Borra
dor Pre
limin
ar
1.8.6. Integracion
Despues de haber diferenciado campos escalares y vectoriales, el siguiente paso es integrarlos. Encontra-remos algunos objetos vectoriales a integrar y seran:∫
V (u) du → integracion de un vector por un escalar
∫c
φ (x, y, z) dr → integracion de un escalar a lo largo de un vector
∫c
V (x, y, z) · dr → integracion de un vector a lo largo de otro vector
∫c
V (x, y, z)× dr → integracion de un vector por otro vector .
El primero de los casos es el tipo de integral que siempre hemos utilizado para encontrar la posicion apartir de la velocidad. Los siguientes tres casos se conocen con el nombre de integrales de lınea por cuantoes importante la “ruta” o trayectoria que sigamos al integrar. Esto aparece indicado por la letra C en laintegral y sera evidente mas adelante. En general la integral de lınea dependera de la trayectoria.
Un vector por un escalar
El primer caso de este tipo integrales es el trivial que siempre hemos utilizado:∫V (u) du = i
∫Vx (u) du+ j
∫Vy (u) du+ k
∫Vz (u) du =
(∫V i (u) du
)ii .
La integral de un vector (en un sistema de coordenadas cartesianas) por un escalar se convierte en la sumade tres integrales, cada una a lo largo de las componentes cartesianas del vector.
Ası integramos la aceleracion de un movimiento parabolico
dv
dt= a = −g k ⇒ v =
∫a dt = k
∫−g dt = −k gt + v0 = −k gt + iv0x + jv0y + k .v0z
Ahora bien, existen sutilezas en este caso que debemos tener en cuenta. Por ejemplo, considere la integral∫dt
(a× d2a
dt2
)=
∫dt
(d
dt
(a× da
dt
)− da
dt× da
dt
)=
∫dt
d
dt
(a× da
dt
)= a× da
dt+ c .
Pero en general los casos quedan resueltos integrando componente a componente con la ayuda de la notacionde ındices ∫
dt (a× b) =
[∫dt(εijkajbk
)]ii .
Tal vez, uno de los problemas que ilustra mejor esta situacion es el movimiento bajo fuerzas centrales.La Ley de Gravitacion de Newton nos dice que∑
F = m a ⇒ mGM
r2mM
ur = mdv
dt⇒ dv
dt=GM
r2mM
ur .
Borra
dor Pre
limin
ar
Es costumbre definir la velocidad aerolar, va, como el area barrida por el radio vector posicion, r (t) quedescribe la trayectoria de la partıcula
2va = r× dr
dt= r ur ×
d (r ur)
dt= rur ×
(dr
dtur + r
durdt
)= r ur × r
durdt
= r2ur ×durdt
.
Notese que si c es un vector constante
d
dt
(ur ×
durdt
)= 0 ⇒ ur ×
durdt
= c ⇒ 2va = r2ur ×durdt
= const ,
con lo cual
d
dt(v × va) =
dv
dt× va =
GM
r2mM
ur × va =MG
2
ur ×
(ur ×
durdt
)
d
dt(v × va) =
MG
2
(ur ·
durdt
)ur − (ur · ur)
durdt
=MG
2
durdt
,
integrando
v × va =MG
2ur + p
donde p es un vector arbitrario de constante de integracion. Finalmente nos damos cuenta que
r · (v × va) = r ur ·(MG
2ur + p
)=MG
2r + rp cos(θ)
= εijkrivjvak ≡ va · (r× v) = va · va = v2a
y entonces
v2a =
MG
2r + rp cos θ ⇒ r =
v2a
MG2 + p cos(θ)
≡2v2aMG
1 + 2pMG cos(θ)
que constituye la ecuacion de una conica.
Un escalar a lo largo de un vector∫Cφ (r) dr
El segundo objeto que “tropezaremos” es la integracion de funciones de varias variables a lo largo de unacurva determinada. Esto es∫C
φ (x, y, z) dr =
∫C
φ (x, y, z) (dx i + dy j + dz k) = i
∫C
φ (x, y, z) dx+j
∫C
φ (x, y, z) dy+k
∫C
φ (x, y, z) dz .
La integral se nos ha convertido en tres integrales, las cuales son ahora componentes de un vector. Estoes posible dado que la base (i, j,k) es una base constante. Ahora bien, cada una de estas integrales soninterdependientes, dado que hay que seguir la misma curva C. Consideremos el caso bidimensional que esmas simple y contiene toda la riqueza conceptual del tridimensional.
Por ejemplo:
φ (x, y) = 3x2 + 2y ⇒∫ (1,2)
(0,0)
(3x2 + 2y
)dr = i
∫ (1,2)
(0,0)
(3x2 + 2y
)dx+ j
∫ (1,2)
(0,0)
(3x2 + 2y
)dy
Borra
dor Pre
limin
ar
Se requiere especificar la curva C a lo largo de la cual integraremos desde el punto P1 → (0, 0) al puntoP2 → (1, 2). Si recorremos la ruta C1: (0, 0)→ (1, 0)→ (1, 2) tendremos que
(0, 0)→ (1, 0) ⇒ y = cte = 0 ⇒∫ (1,0)
(0,0)
(3x2 + 2y
)dr = i
∫ (1,0)
(0,0)
(3x2 + 2y
)dx = i
∫ 1
0
(3x2)
dx = i
(1, 0)→ (1, 2) ⇒ x = cte = 1 ⇒∫ (1,0)
(0,0)
(3x2 + 2y
)dr = j
∫ (1,2)
(0,0)
(3x2 + 2y
)dy = j
∫ 2
0
(3 + 2y) dy = 10j
con lo cual
C1 ←→ (0, 0)→−−−−−→
CA1
(1, 0)→ (1, 2)−−−−−→
CB1
⇒∫ (1,2)
(0,0)
(3x2 + 2y
)dr = i + 10j
Si hubieramos seleccionado la recta que une a estos dos puntos como la curva C2 entonces
C2 : y = 2x ⇒ dy = 2dx ,
entonces ∫ (1,2)
(0,0)
(3x2 + 2y
)dr = i
∫ (1,2)
(0,0)
(3x2 + 2y
)dx+ j
∫ (1,2)
(0,0)
(3x2 + 2y
)dy
= i
∫ 1
0
(3x2 + 2 (2x)
)dx+ j
∫ 1
0
(3x2 + 2 (2x)
)2dx = 3i + 6j
En general la curva C se parametrizara y las integrales en varias variables se convertiran en integrales alo largo del parametro que caracteriza la curva
C ←→ x = x (τ) , y = y (τ) , z = z (τ)
Por lo tanto:∫C
φ (x, y, z) dr =
∫C
φ (x (τ) , y (τ) , z (τ))
(∂x (τ)
∂τdτ i +
∂y (τ)
∂τdτ j +
∂z (τ)
∂τdτ k
)= i
∫C
φ (x (τ) , y (τ) , z (τ))∂x (τ)
∂τdτ + j
∫C
φ (x (τ) , y (τ) , z (τ))∂y (τ)
∂τdτ
+ k
∫C
φ (x (τ) , y (τ) , z (τ))∂z (τ)
∂τdτ .
Las parametrizaciones para las curvas anteriores son muy simples
CA1 =
x = τ
y = 0; CB1 =
x = 2
y = τ; C2 =
x = τ
y = 2τ
Un vector a lo largo de otro vector∫C
F (r) · dr
Quiza la integral de lınea mas conocida sea una del tipo∫C
F (r) ·dr por cuanto nos la hemos “tropezado”en el calculo del trabajo que realiza una fuerza. Todo lo que hemos considerado al parametrizar la curva enel caso anterior, sigue siendo valido.∫
C
F (r) · dr =
∫C
Fx (x, y, z) dx+
∫C
Fy (x, y, z) dy +
∫C
Fz (x, y, z) dz =
∫C
F i(xj)
dxi
Borra
dor Pre
limin
ar
Por lo cual, si consideramosF (r) =
(3x2 + 2xy3
)i + 6xy j ,
entonces ∫ (1, 34√
2)
(0,0)
F (r) · dr =
∫ (1, 34√
2)
(0,0)
((3x2 + 2xy3
)i + 6xy j
)(dx i + dy j)
=
∫ (1, 34√
2)
(0,0)
(3x2 + 2xy3
)dx+
∫ (1, 34√
2)
(0,0)
6xy dy ,
y si la curva que une esos puntos viene parametrizada por
x = 2τ2
y = τ3 + τ
⇒
∂x(τ)∂τ = 4τ
∂y(τ)∂τ = 3τ2 + 1
entonces la primera de las integrales resulta∫ (1, 34
√2)
(0,0)
(3x2 + 2xy3
)dx =
∫ (3(2τ2)2
+ 2(2τ2) (τ3 + τ
)3)(4τ) dτ
=
∫ √2
2
0
(12τ5 + 4τ12 + 12τ10 + 12τ8 + 4τ6
)dτ =
1
4+
9305
96 096
√2 .
Y la segunda ∫ (1, 34√
2)
(0,0)
6xy dy =
∫ √2
2
0
6(2τ2) (τ3 + τ
) (3τ2 + 1
)dτ =
65
32,
con lo cual∫ (1, 34√
2)
(0,0)
F (r) · dr =
∫ (1, 34√
2)
(0,0)
(3x2 + 2xy3
)dx+
∫ (1, 34√
2)
(0,0)
6xy dy =73
32+
9305
96 096
√2 .
Ejercicios
1. Un campo de fuerza actua sobre un oscilador descrito por
F = −kxi− kyj
Compare el trabajo hecho al moverse en contra de este campo al ir desde el punto (1, 1) al punto (4, 4)siguiendo los siguientes caminos:
a) (1, 1)→ (4, 1)→ (4, 4)
b) (1, 1)→ (1, 4)→ (4, 4)
c) (1, 1)→ (4, 4) siguiendo el camino x = y
2. Dado el campo de fuerza
F = − y
x2 + y2i +
x
x2 + y2j
Calcule el trabajo hecho en contra de este campo de fuerza al moverse al rededor de un circulo de radiouno y en el plano x− y
Borra
dor Pre
limin
ar
a) desde 0 a π en sentido contrario a la agujas del reloj.
b) desde 0 a −π en sentido de las agujas del reloj.
3. Evaluar la siguiente integral ∮r · dr .
1.9. Vectores y numeros complejos
Desde los primeros cursos de matematica nos hemos tropezado con las llamadas raıces imaginarias ocomplejas de polinomios. De este modo la solucion a un polinomio cubico
x3 − 3x2 + 4x− 12 = 0 ⇒
x = 2ix = −2ix = 3
⇒ (x+ 2i) (x− 2i) (x− 3) = 0
o cuadratico
x2 + 4 = 0 ⇒
x = 2ix = −2i
⇒ (x+ 2i) (x− 2i)
nos lleva a definir un numero i2 = −1 ⇒ i =√−1. Como vimos arriba al multiplicar el numero imaginario
i por cualquier numero real obtendremos el numero imaginario puro ib, con b ∈ <. La nomenclatura denumeros imaginarios surgio de la idea de que estas cantidades no representaban mediciones fısicas. Esa ideaha sido abandonada pero el nombre quedo.
1.9.1. Los numeros complejos y su algebra
Un numero complejo, z, es la generalizacion de los numeros imaginarios (puros), ib. Esto es
z = a+ ib con a, b ∈ < ⇒
a→ parte real
b→ parte imaginaria
Obviamente los numeros reales seran a + i0 numeros complejos con su parte imaginaria nula. Los numerosimaginarios puros seran numeros complejos con su parte real nula, esto es, 0+ ib. Por ello, en general diremosque
z = a+ ib ⇒ a = Re (z) ∧ b = Im (z) ,
es decir, a corresponde a la parte real de z y b a su parte imaginaria.Cada numero complejo, z, tendra un numero complejo conjugado, z∗ tal que
z = a+ ib z∗ = a− ib⇓
(z∗)∗
= z ∧ z · z∗ = a2 + b2 ,
claramentez · z∗ ≥ 0 ⇒ |z|2 = |z∗|2 = z · z∗ .
Es importante senalar que, en general, no existe relacion de orden entre los numeros complejos. Valedecir, que no sabremos si un numero complejo es mayor que otro. No esta definida esta operacion.
z1 ≯ z2 ∨ z1 ≮ z2 .
Borra
dor Pre
limin
ar
Las relaciones de orden solo se podran establecer entre modulos de numeros complejos y no numeros complejosen general.
Rapidamente recordamos el algebra de los numeros complejos:
Dos numeros complejos seran iguales si sus partes reales e imaginarios lo son
z1 = z2 ⇒ (a1 + ib1) = (a2 + ib2) ⇒ a1 = a2 ∧ b1 = b2 .
Se suman dos numeros complejos sumando sus partes reales y sus partes imaginarias.
z3 = z1 + z2 ⇒ (a1 + ib1) + (a2 + ib2) = (a1 + a2)︸ ︷︷ ︸a3
+ i(b1 + b2)︸ ︷︷ ︸b3
= a3 + ib3 ,
claramente z + z∗ = 2 Re z, tambien z − z∗ = 2 Im z. Igualmente es inmediato comprobar que
(z1 + z2)∗
= z∗1 + z∗2 .
Se multiplican numeros complejos por escalares multiplicando el escalar por sus partes reales e imagi-narias
z3 = αz1 ⇒ α (a1 + ib1) = (αa1) + i (αb1) .
Se multiplican numeros complejos entre si, multiplicando los dos binomios y teniendo cuidado quei2 = −1.
z3 = z1z2 ⇒ (a1 + ib1) · (a2 + ib2) = (a1a2 − b1b2) + i (a1b2 + b1a2) ,
tambien es inmediato comprobar que (z1z2)∗
= z∗1z∗2 .
Se dividen numeros complejos siguiendo la estrategia de racionalizacion de fracciones irracionales. Estoes
z3 =z1
z2⇒ (a1 + ib1)
(a2 + ib2)=
(a1 + ib1)
(a2 + ib2)
(a2 − ib2)
(a2 − ib2)=a1a2 + b1b2(a2
2 + b22)+ i
b1a2 − a1b2(a2
2 + b22),
es claro que el divisor sera cualquier numero complejo excepto el cero complejo: 0 + i0.
1.9.2. Vectores y el plano complejo
Mirando con cuidado el algebra de numeros complejos nos damos cuenta que un numero complejo puedeser representado por una dupla de numeros complejos es decir,
z = (a+ ib) z = (a, b)
las propiedades entre numeros complejos de igualdad, suma y multiplicacion por un escalar arriba expuestas secumplen de forma inmediata con esta nueva representacion. Hay que definir las operaciones de multiplicaciony division entre numeros complejos de forma que
(a1, b1) (a2, b2) = (a1a2 − b1b2, a1b2 + b1a2) ∧ (a1, b1)
(a2, b2)=
(a1a2 + b1b2(a2
2 + b22),b1a2 − a1b2(a2
2 + b22)
)Esta asociacion de un numero complejo con una pareja de numeros inmediatamente nos lleva a imaginarun punto en un plano (complejo) en el cual la primera componente (horizontal) representa la parte realy la segunda componente (vertical) representa la parte imaginaria. De esta forma asociamos a un numerocomplejo a un vector que une a ese punto (a, b) con el origen del plano complejo. Esta representacion de
Borra
dor Pre
limin
ar
numeros complejos como vectores un el plano (complejo) de conoce con el nombre de Diagrama de Argand3 apesar que no fue Jean Argand, sino Caspar Wessel4 el primero en proponerlo. Por cierto, esta interpretacionfue tres veces redescubierta, primero por Caspar Wessel en 1799, luego por Jean Argand en 1806 y finalmentepor Gauss5 en 1831.
De esta manera, como un recordatorio al plano real
z = x+ iy z = r (cos(θ) + i sen(θ)) con
r =√zz∗ = |z| =
√x2 + y2
tan(θ) =y
xdonde − π ≤ θ ≤ π
La interpretacion vectorial de numeros complejos permite que la suma de numeros complejos sea representadapor la “regla del paralelogramo”. Mientras que los productos escalar y vectorial nos llevan a
z1 · z2 = Re (z1z∗2) = Re (z∗1z2) ∧ z1 × z2 = Im (z∗1z2) = −Im (z1z
∗2)
Con esta interpretacion tendremos
x = Re z componente real del vector z o parte real de zy = Im z componente imaginaria del vector z o parte imaginaria de z
r =√zz∗ = |z| modulo, magnitud o valor absoluto de z
θ angulo polar o de fase del numero complejo z
1.9.3. Formulas de Euler y De Moivre
Nos hemos tropezado con la expansion en Taylor6, esta serie permite expresar cualquier funcion infini-tamente diferenciable alrededor de un punto x0 como una serie infinita de potencias del argumento de lafuncion. Esto es:
f (x) = 1 +df (x)
dx
∣∣∣∣x=x0
(x− x0) +1
2
d2f (x)
dx2
∣∣∣∣x=x0
(x− x0)2
+1
3!
d3f (x)
dx3
∣∣∣∣x=x0
(x− x0)3
+ · · · · · ·
f (x) = Cn (x− x0)n, con Cn =
1
n!
dn f (x)
d xn
∣∣∣∣x=x0
y donde n = 0, 1, 2, 3, . . .
3En honor a JEAN ROBERT ARGAND (Ginebra, Suiza, 18 Julio 1768; Parıs, Francia 13 agosto 1822). Contador peromatematico aficionado, propuso esta interpretacion de numeros complejos como vectors en un plano complejo en un libroautoeditado con sus reflexiones que se perdio y fue rescatado 7 anos despues, fecha a partir de la cual Argand comenzo apublicar en Matematicas.
4CASPAR WESSEL (Vestby, Noruega 8 junio 1745; 25 marzo 1818, Copenhagen, Dinamarca) Matematico noruego quese dedico principalemente al levantamiento topografico de Noruega. Su trabajo sobre la interpretacion de numeros complejospermanecio desconocido por casi 100 anos.
5 JOHANN CARL FRIEDRICH GAUSS (30 abril 1777, Brunswick, Alemania; 23 febrero 1855, Gottingen, Alemania). Unode los matematicos mas geniales y precoces de la Historia. Desde los 7 anos comenzo a mostrar sus condiciones de genialidad.Sus contribuciones en Astronomıa y Matematicas son multiples y diversas.
6BROOK TAYLOR (18 agosto 1685, Edmonton, Inglaterra; 29 diciembre 1731, Londres, Inglaterra) Fısico y Matematicoingles contemporaneo de Newton y Leibniz y junto con ellos participo profundamente en el desarrollo del Calculo diferencial eintegral. Ademas de sus aportes al estudio del magnetismo, capilaridad y termometrıa, desarrollo el area de diferencias finitasque hasta hoy utilizamos para calculos en computacion. Invento la integracion por partes y descubrio la serie que lleva sunombre.
Borra
dor Pre
limin
ar
con lo cual, si consideramos x0 = 0, entonces podemos ver algunos desarrollos en series de funciones elemen-tales
ex = 1 + x+1
2x2 +
1
6x3 +
1
24x4 +
1
120x5 +
1
720x6 +
1
5040x7 + · · · · · ·
cos(x) = 1− 1
2x2 +
1
24x4 − 1
720x6 + · · · · · ·
sen(x) = x− 1
6x3 +
1
120x5 − 1
5040x7 + · · · · · ·
Es facil convencerse que la serie
eiθ = 1 + iθ − 1
2θ2 +
(−1
6i
)θ3 +
1
24θ4 +
1
120iθ5 − 1
720θ6 +
(− 1
5040i
)θ7 + · · · · · ·
puede rearreglarse como
eiθ =
(1− 1
2θ2 +
1
24θ4 − 1
720θ6 + · · · · · ·
)︸ ︷︷ ︸
cos(θ)
+ i
(θ − 1
6θ3 +
1
120θ5 − 1
5040θ7 + · · · · · ·
)︸ ︷︷ ︸
sen(θ)
eiθ = cos(θ) + i sen(θ) ,
esta relacion se conoce como la relacion de Euler7. Con lo cual ahora tenemos tres formas de representar unnumero complejo
z = x+ iy z = r (cos(θ) + i sen(θ)) z = reiθ .
La expresion z = x + iy se conoce como forma cartesiana de representacion de un numero complejo,la forma z = r (cos(θ) + i sen(θ)) sera la forma trigonometrica o polar y la expresion z = eiθ sera la for-ma de Euler. Es importante notar una sutileza implıcita en esta notacion. La forma cartesiana representaunıvocamente a un numero complejo, mientras que la forma polar (y la de Euler), es ambigua
z = r (cos(θ) + i sen(θ)) = r (cos(θ + 2nπ) + i sen(θ + 2nπ)) , (1.5)
es decir, existen varios valores del argumento que definen el mismo numero complejo. Esto se consideraramas adelante cuando tratemos las funciones de numero complejos.
Las sumas de numeros complejos son mas facilmente planteables en su forma cartesiana. Mientras lasmultiplicacion y division seran directas en la forma de Euler
z1 = r1eiθ1
z2 = r2eiθ2
⇒ z1z2 = eiθ1eiθ2 = ei(θ1+θ2) = r1r2 (cos (θ1 + θ2) + i sen (θ1 + θ2)) .
Mas aun, siz = x+ iy ⇒ ez = e(x+iy) = exeiy = ex (cos(y) + i sen(y)) ,
7LEONHARD EULER (15 abril 1707, Basilea, Suiza; 18 septiembre 1783, San Petersburgo, Rusia). Uno de los matematicosmas prolıficos de todos los tiempos. Desarrollo inmensamente campos como la geometrıa analıtica y trigonometrıa, siendo elprimero que considero el coseno y el seno como funciones. Hizo aportes significativos en el desarrollo del calculo diferencial eintegral ası como tambien, astronomıa, elasticidad y mecanica de medios contınuos.
Borra
dor Pre
limin
ar
a partir de la relacion o formula de Euler se puede demostrar la De Moivre8(eiθ)n
= einθ (cos(θ) + i sen(θ))n
= cos (nθ) + i sen (nθ) , con n entero.
1.9.4. Algunas aplicaciones inmediatas
Presentaremos algunas aplicaciones inmeditas la formula de De Moivre en diferentes ambitos.
Identidades trigonometricas
La primera de las aplicaciones de la formula de De Moivre es para construir identidades trigonometricasen las cuales se expresa el coseno, o el seno, de factores de un angulo. Veamos las siguientes (nada triviales)identidades trigonometricas
cos(3θ) = 4 cos3(θ)− 3 cos(θ) o sen(3θ) = 3 sen(θ)− 4sen3(θ) ,
para demostrar estas (y otras) identidades utilizamos la formula de De Moivre, es decir
cos(3θ) + i sen( 3θ) = (cos(θ) + i sen(θ))3
= cos3(θ)− 3 cos(θ) sen2(θ) + i(3 cos2(θ) sen(θ)− sen3(θ)
),
igualando ahora parte real e imaginaria tendremos
cos(3θ) = cos3(θ)− 3 cos(θ) sen2(θ)
= cos3(θ)− 3 cos(θ)(1− cos2(θ)
)= 4 cos3(θ)− 3 cos(θ)
sen(3θ) = 3 cos2(θ) sen(θ)− sen3(θ)
= 3(1− sen2(θ)
)sen(θ)− sen3(θ) = 3 sen(θ)− 4sen3(θ) .
El metodo puede extenderse a expresiones de senos y cosenos de nθ.Igualmente podemos desarrollar un metodo para encontrar expresiones de potencias de funciones trigo-
nometricas en termino de funciones de factores de angulo del tipo (cos(θ))n
= F (cos(nθ), sen(nθ)). Paraempezar, supongamos que tenemos un numero complejo de modulo 1, de tal forma que
z = eiθ = cos(θ) + i sen(θ) ⇒
zn +
1
zn= 2 cos(nθ)
zn − 1
zn= 2i sen(nθ)
Estas identidades surgen de manera inmediata de
zn +1
zn= (cos(θ) + i sen(θ))
n+ (cos(θ) + i sen(θ))
−n= (cos(nθ) + i sen(nθ)) + (cos (−nθ) + i sen (−nθ))
= cos(nθ) + i sen(nθ) + cos(nθ)− i sen(nθ) = 2 cos(nθ) ,
igualmente puede demostrarse la segunda de las afirmaciones anteriores.
8ABRAHAM DE MOIVRE (26 mayo 1667 in Vitry-le-Francois, Francia; 27 noviembre 1754, Londres Inglaterra) Matematicofrances que tuvo que emigrar a Inglaterra por razones religiosas. Contemporaneo de Newton, Liebniz y Halley, fue pionero consus contribuciones en geometrıa analıtica y teorıa de probabilides.
Borra
dor Pre
limin
ar
Ahora bien, supongamos ademas que n = 1, con lo cual se cumple que
z +1
z= eiθ + e−iθ = 2 cos(θ) y z − 1
z= eiθ − e−iθ = 2i sen(θ) ,
que tambien lo sabıamos desde la mas temprana edad de nuestros cursos de bachillerato. Ahora bien, lo quequiza no sabıamos en ese entonces (y quiza ahora tampoco) es que a partir de aquı podemos construir, porejemplo:
cos5(θ) =1
25
(z +
1
z
)5
=1
25
[(z5 +
1
z5
)+
(5z3 +
5
z3
)+
(10z +
10
z
)],
es decir
cos5(θ) =1
25[2 cos(5θ) + 10 cos(3θ) + 20 cos(θ)] ,
de la misma manera se puede proceder con otras potencias y con potencias de la funcion seno.
Raıces de polinomios
La formula de De Moivre nos puede ayudar para encontrar raıces de polinomios. Supongamos, paraempezar, que queremos encontrar las n raıces de la ecuacion zn = 1. Para ello procedemos con el siguienteartificio
zn = 1 = cos (2πk) + i sen (2πk) = ei(2πk) , donde k = 0, 1, 2, ....
con lo cual las n raıces de la ecuacion zn = 1 seran
zn = 1 ⇒ z = ei(2πkn )
⇓
z
︷ ︸︸ ︷0 = 1; z1 = e2πi( 1
n ); z2 = e2πi( 2n ); z3 = e2πi( 3
n ); · · · zn−2 = e2πi(n−2n ); zn−1 = e2πi(n−1
n )
es decir, n raıces corresponderan a los n valores de k = 0, 1, 2, · · ·n−2, n−1. Mayores valore de k no proveennuevas raıces.
Estas propiedades pueden extenderse a raıces de polinomios. Supongamos la siguiente ecuacion polinomicacon sus raıces:
z5 − z4 + 2z − 2 = 0 ⇒(z4 + 2
)(z − 1) = 0 ⇒
z4 + 2 = 0 ⇒ z4 = −2
z − 1 = 0 ⇒ z = 1
una vez mas
z4 = −2(1) = −2(ei(2πk)
)⇒ z =
[−2(ei(2πk)
)]1/4= (−2)1/4ei(
2πk4 ) =
1
2(1 + i) 23/4ei(
2πk4 )
donde hemos utilizado el hecho de que: (−1)1/4 = i1/2 =√
22 (1 + i) . Por lo tanto:
z0 =1
2(1 + i) 23/4 , z1 =
1
2(1 + i) 23/4ei(
π2 ) =
i
2(1 + i) 23/4 ,
z2 =1
2(1 + i) 23/4ei(π) = −1
2(1 + i) 23/4 , z3 =
1
2(1 + i) 23/4ei(
3π2 ) = − i
2(1 + i) 23/4 ,
Borra
dor Pre
limin
ar
por lo tanto, la ecuacion z5 − z4 + 2z − 2 = 0, tendra las siguientes cinco raıces:
z0 =1
2(1 + i) 23/4 , z1 = −1
2(1− i) 23/4 , z2 = −1
2(1 + i) 23/4 , z3 =
1
2(1− i) 23/4 , z4 = 1 .
Una afirmacion que nos han dicho, y que quiza no sepamos de donde viene, es que si un polinomiocon coeficientes reales tiene raıces complejas, ellas seran complejas conjugadas unas de otras. Vale decir, siz5 − z4 + 2z − 2 = 0 tiene como raız z0 = 1
2 (1 + i) 23/4, tambien tendra como raız z3 = 12 (1− i) 23/4 y
z0 = z∗3 .Esta afirmacion se prueba de forma general si suponemos que tenemos la siguiente ecuacion
ai zi = 0 , con i = 0, 1, 2, · · ·n− 1, n ⇒ a0 + a1 z + a2 z
2 · · ·+ an−1 zn−1 + an z
n = 0 ,
donde los coeficientes a0, a1, a2, · · · , an−1, an los suponemos reales, esto es: ai = a∗i para todos los valoresdel ındice i.
Al tomar el complejo conjugado nos queda:
a0 + a1 z + a2 z2 · · ·+ an−1 z
n−1 + an zn = 0 ⇐⇒ a∗0 + a∗1 z
∗ + a∗2 (z∗)2 · · ·+ a∗n−1 (z∗)
n−1+ a∗n (z∗)
n= 0 ,
como los coeficientes son reales tenemos que
a0 + a1 z + a2 z2 · · ·+ an−1 z
n−1 + an zn = 0 ⇐⇒ a0 + a1 z
∗ + a2 (z∗)2 · · ·+ an−1 (z∗)
n−1+ an (z∗)
n= 0 ,
esto nos dice que si z es solucion tambien lo sera z∗ ya que la ecuacion es la misma por tener los mismoscoeficientes (reales).
Ahora consideremos el siguiente polinomio complejo
P (z) = z6 − z5 + 4z4 − 6z3 + 2z2 − 8z + 8 = 0 .
Si por algun metodo comprobamos que (z3 − 2) es uno de sus factores, entonces podremos encontrar lasraıces del polinomio P (z). Veamos, claramente si (z3 − 2) es un factor podemos expresar
P (z) = z6 − z5 + 4z4 − 6z3 + 2z2 − 8z + 8 = (z3 − 2)(z3 − z2 + 4z − 4) = (z3 − 2)(z − 1)(z2 + 4) ,
con lo cual, como z es complejo, hay que tener cuidado con las raıces encubiertas
z6 − z5 + 4z4 − 6z3 + 2z2 − 8z + 8 = 0 ⇒ (z3 − 2)(z − 1)(z2 + 4) = 0 ⇒
z3 = 2
z = 1
z2 = −4
Por un lado: z2 = −4 ⇒ z = ±2i .Y por el otro:
z3 = 2 = 2(ei(2πk)
)⇒ z =
[2(ei(2πk)
)]1/3= 21/3ei(
2πk3 ) .
Por lo tanto:
z0 = 21/3 , z1 = 21/3ei(2π3 ) = −21/3
2
[1−√
3i], z2 = 21/3ei(
4π3 ) = −21/3
2
[1 +√
3i].
La ecuacion z6 − z5 + 4z4 − 6z3 + 2z2 − 8z + 8 = 0, tendra las siguientes seis raıces:
z =3√
2 , z = − 13√
4
[1±√
3 i], z = 1 , z = ±2i .
Borra
dor Pre
limin
ar
Logaritmos y potencias de numeros complejos
Definamos la siguiente funcionz = eiθ ⇐⇒ Ln(z) = iθ ,
donde Ln representa el logaritmo natural del numero complejo z. Notese que hemos utilizado Ln en lugarde tradicional ln y la razon es la ambiguedad implıcita en la notacion de Euler, vale decir
z = reiθ ⇐⇒ Ln(z) = ln(r) + i (θ + 2nπ) = ln(r) + iθ ,
en otras palabras, Ln(z) no es funcion por el hecho de ser multivaluada. Se supera esta dificultad cuando serestringe el argumento −π < θ ≤ π y esta se conoce como el valor principal de la funcion
Por ejemplo, al evaluar
Ln (−3i) = Ln[3ei(−
π2 +2nπ)
]= ln(3) + i
(−π
2+ 2nπ
)con n = 0, 1, 2, · · ·
decimos que el valor principal del Ln (−3i) sera ln(3)− iπ2 .Con la misma intuicion se procede con las potencias de numeros complejos. Si queremos evaluar z = i−5i
tendremos que proceder como sigue
z = i−5i ⇒ Ln (z) = Ln(i−5i
)= −5iLn (i) = −5iLn
[ei(
π2 +2nπ)
]= 5
(π2
+ 2nπ),
con lo cual z = i−5i ¡es un numero real!
Para finalizar consideremos otro par de casos de potencias y logaritmos: ii y Ln[√
3 + i3].
Entonces
ii =[ei(
π2 +2nπ)
]i= ei
2(π2 +2nπ) = e−(π2 +2nπ) ,
y para
Ln
[√3 + i
3]
= 3 Ln
[2ei(
arctan(
1√3
))]= 3
[ln(2) + i
(arctan
(1√3
)+ 2nπ
)]= ln(8) + i
(π2
+ 6nπ).
Ejercicios
1. Demuestre que
a)cos(3α) = cos3(α)− 3 cos(α)sen2(α)
b)sen(3α) = 3 cos2(α)sen(α)− sen3(α)
2. Encuentre las raıces de
a) 2i
b) 1−√
3i
c) (−1)1/3
d) 81/6
e) (−8− 8√
3i)1/4
Borra
dor Pre
limin
ar
1.10. Algunos ejemplos resueltos
1. Hemos definido como la posicion, R, del centro de masa para un sistema de N partıculas como
R =ΣNi=1miriΣNj=1mj
donde ri corresponde con la posicion de la i−esima partıcula.
Determine la posicion del centro de masa para un sistema de tres masas, mi = 1,2,3, colocadas en losvertices de un triangulo equilatero de lado l = 2.
Solucion: Al colocar el origen de coordenadas en uno de los vertices y uno de los ejes de coordenadassobre uno de los lados, entonces
R =Σ3i=1miri
Σ3j=1mj
=m1r1 +m1r1
MT=
1 · 2i + 3 ·(i +√
3j)
6=
5
6i +
√3
2j
2. Dada una base ortonormal i, j,k y los siguientes vectores
a = 3i + 2j + k , b = 3i− 2j + k , c = i− k
a) Comprobar si a,b, c forman una base.
Solucion: Para que los vectores formen una base tienen que ser linealmente independientes. Estoes αa + βb + γc = 0 ⇒ α = β = γ = 0, con lo cual
α (3i + 2j + k) + β (3i− 2j + k) + γ (i− k) = 0 ⇒
3α+ 3β + γ = 02α− 2β = 0α+ β − γ = 0
y al resolver el sistema se obtiene: α = β = γ = 0 con lo cual se demuestra que son linealmenteindependientes.
Otra manera de resolverlo es mostrar que: c · (a× b) 6= 0 y efectivamente
c · (a× b) =
∣∣∣∣∣∣1 0 −13 2 13 −2 1
∣∣∣∣∣∣ = 4 6= 0 .
b) Si a,b, c forman una base, exprese d = i + 2j , e = 3i− 2j y f = a× b en termino de esa basea,b, c. De lo contrario, construya una base como a,b,a × b y exprese los vectores d, e, fen termino de esa nueva base.
Solucion: Como forman base expresamos los vectores en esos terminos. Esto es
i + 2j = α (3i + 2j + k) + β (3i− 2j + k) + γ (i− k) ⇒
3α+ 3β + γ = 12α− 2β = 2α+ β − γ = 0
resolviendo tendremos que d = 58a− 3
8b + 14c. Seguidamente
3i− 2j = α (3i + 2j + k) + β (3i− 2j + k) + γ (i− k) ⇒
3α+ 3β + γ = 32α− 2β = −2α+ β − γ = 0
Borra
dor Pre
limin
ar
resolviendo tendremos que e = − 18a + 7
8b + 34c
Ahora bien
f = a× b ≡ (3i + 2j + k)× (3i− 2j + k) ≡
∣∣∣∣∣∣i j k3 2 13 −2 1
∣∣∣∣∣∣ = 4i− 12k
con lo cual
4i− 12k = α (3i + 2j + k) + β (3i− 2j + k) + γ (i− k) ⇒
3α+ 3β + γ = 42α− 2β = 0α+ β − γ = −12
y finalmente f = a× b = −a− b + 10c .
3. Utilizando la notacion de ındices demostrar que para cualquier trıo de vectores a,b, c se cumple quea× (b× c) + b× (c× a) + c× (a× b) = 0.
Solucion: En notacion de ındices
a× (b× c) + b× (c× a) + c× (a× b) = εlmiamεijkbjck + εlmibmεijkc
jak + εlmicmεijkajbk
con lo cual, arreglando
εlmiεijkambjck + εlmiεijkbmc
jak + εlmiεijkcmajbk =(
δljδmk − δmj δlk
)amb
jck +(δljδ
mk − δmj δlk
)bmc
jak +(δljδ
mk − δmj δlk
)cma
jbk
y ahora desarrollando los productos de las δ’s, e indentificando termino a termino, notamos que seanula akblck︸ ︷︷ ︸
I
−akbkcl︸ ︷︷ ︸II
+
bkclak︸ ︷︷ ︸II
−bkckal︸ ︷︷ ︸III
+
ckalbk︸ ︷︷ ︸III
−ckakbl︸ ︷︷ ︸I
= 0 .
4. Una partıcula se mueve a lo largo de una curva descrita por
x(t) = 3t2 y(t) = 4t3 − t z(t) = t
a) Encuentre las expresiones para los vectores: posicion, velocidad y aceleracion de esa partıcula.
Solucion:
r(t) = 3t2i + (4t3 − t)j + tk , v = 6ti + (12t2 − 1)j + k , a = 6i + 24tj .
b) Encuentre las expresiones, mas generales, de los vectores tangentes y perpendiculares a todo puntode la trayectoria de la partıcula.
Solucion: Vector tangente a todo punto de la trayectoria es el vector velocidad
v = 6ti + (12t2 − 1)j + k ,
El perpendicular a todo punto, sera un vector b = bxi + byj + bzk, tal que
(6ti + (12t2 − 1)j + k) · (bxi + byj + bzk) = 6tbx + (12t2 − 1)by + bz = 0 ,
con lo cualb = bxi + byj− (6tbx + (12t2 − 1)by)k .
Borra
dor Pre
limin
ar
5. El campo de fuerzas del oscilador anarmonico anisotropo bidimensional se escribe como
F = −k1x2i + k2yj . (1.6)
Encuentre el trabajo realizado,∫ (x2,y2)
(x1,y1)dr · F a lo largo de las siguientes trayectorias
a) (1, 1)→ (4, 1)→ (4, 4)
Solucion:∫ (4,1)
(1,1)
(idx) · (−k1x2i + k2j) +
∫ (4,4)
(4,1)
(jdy) · (−k116i + k2yj) = −21k1 +15k2
2
b) (1, 1)→ (1, 4)→ (4, 4)
Solucion:∫ (1,4)
(1,1)
(jdy) · (−k1i + k2yj) +
∫ (4,4)
(1,4)
(idx) · (−k1x2i + k24j) = −21k1 +
15k2
2
c) (1, 1)→ (4, 4) para x = y
Solucion:∫ (4,4)
(1,1)
(idx+ jdx) · (−k1x2i + k2xj) =
∫ (4,4)
(1,1)
(−k1x2 + k2x)dx = −21k1 +
15k2
2
6. Dados los siguientes puntos en el espacio (1, 0, 3); (2,−1, 0); (0,−1, 1); (−1, 0, 1).
a) Considere los tres primeros puntos. ¿Estos tres puntos son coplanares? ¿por que? Explique.
Solucion: Tres puntos en el espacio definen un plano, por lo tanto siempre seran coplanares.
b) Encuentre el area del triangulo que tiene por vertices esos tres puntos.
Solucion: Para ello seleccionamos uno de los puntos como un vertice privilegiado (digamos(2,−1, 0)) respecto al cual construiremos dos vectores que representan dos de los lados del triangu-lo. Esto es
a = (1, 0, 3)− (2,−1, 0)↔ a = −i + j + 3k ,
yb = (0,−1, 1)− (2,−1, 0)↔ b = −2i + k ,
con lo cual, el area del vertice sera la mitad del area del paralelogramo que tiene por lados estosdos vectores. Es decir
A =1
2|a× b| ⇒ a× b =
∣∣∣∣∣∣i j k−1 1 3−2 0 1
∣∣∣∣∣∣ = i− 5j + 2k⇒ A =1
2|i− 5j + 2k| =
√30
2.
c) Encuentre la ecuacion del plano que los contiene
Solucion: La ecuacion del plano vendra dada por
(r− r1) · ((r2 − r1)× (r3 − r1)) = 0 ,
donder = xi + yj + zk, r1 = i + 3k, r2 = 2i− j, r3 = −j + k,
Borra
dor Pre
limin
ar
con lo cual la ecuacion del plano queda como∣∣∣∣∣∣(x− 1) y (z − 3)
1 −1 −3−1 −1 −2
∣∣∣∣∣∣ = 0 ⇒ −(x− 1) + 5y − 2(z − 3) = 0 ⇒ x− 5y + 2z = 7 .
d) Considere los cuatro puntos ¿Estos cuatro puntos son coplanares? ¿por que? De NO ser coplanares,encuentre la distancia del cuarto punto al posible plano que contiene a los otros tres.
Solucion: Para verificar si el cuarto punto esta en el plano, verificamos si cumple la ecuacion quelo define
(−1)− 5(0) + 2(1) 6= 7 ,
los cuatro puntos no son coplanares. Para calcular la distancia del cuarto punto al plano seconstruye el vector unitario normal al plano
nP =a× b
|a× b|=
1√30
(i− 5j + 2k) , d = nP · c =1√30
(i− 5j + 2k) · (−3i + j + k) ,
con lo cual la distancia al cuarto punto sera
d = nP · c =1√30
(i− 5j + 2k) · (−3i + j + k) = − 6√30.
7. Considere los siguientes tres vectores
w1 = i + 3k , w2 = 2i− 3j , w3 = −j + k .
a) ¿Forman una base para R3? Explique detalladamente
Solucion: Son linealmente independientes, estos es
αw1 + βw2 + γw3 = 0 ⇒ α = β = γ = 0 ,
que se comprueba directamente al resolver
α +2β = 0−3β −γ = 0
3α +γ = 0
b) Si es que forman base, exprese el vector a = i− 3j + 3k en la posible base w1,w2,w3Solucion: Como son linealmente independientes, forman base, con lo cual cualquier vector puedeser expresado como combinacion lineal de estos tres. Eso es:
a = αw1 + βw2 + γw3 ⇒
α +2β = 1−3β −γ = −3
3α +γ = 3
⇒
α = 1
3
β = 13
γ = 2
8. Utilizando la notacion de ındices muestre si se cumple la siguiente identidad
∇× (a× b) = a (∇ · b)− b (∇ · a) + (b ·∇) a− (a ·∇) b.
Borra
dor Pre
limin
ar
Solucion:
∇× (a× b) = εijk∂j(εklmalbm) = (δilδ
jm − δimδ
jl )∂j(a
lbm) = ∂m(aibm)− ∂l(albi) ,
expandiendo la derivada
∇× (a× b) = bm∂m(ai) + ai∂m(bm)− bi∂l(al)− al∂l(bi) ≡ (b ·∇)a + (∇ · b)a− (∇ · a)b− (a ·∇)b .
9. La trayectoria de un punto en el plano vista por un observador 1 es
r1(t) = 5 cos(3t2) i + 5 sen(3t2) j .
a) Exprese las aceleraciones radiales y tangenciales de esta partıcula.
Solucion: Es claro que la partıcula describe un movimiento circular donde θ(t) = 3t2
r(t) = 5ur ⇒ v(t) =dr(t)
dt= 5
dθ(t)
dtuθ = 30t uθ ⇒ a(t) =
da(t)
dt= 30 uθ − 30t ur .
b) Considere ahora un segundo observador, el cual describe una trayectoria respecto al primerorepresentada por
r21(t) = (t3 − 4t)i + (t2 + 4t) j .
Encuentre las expresiones para los vectores posicion, velocidad y aceleracion de la partıcula me-didos respecto al segundo observador.
Solucion: La trayectoria de la partıcula respecto al segundo observador sera
r2(t) = r1(t)− r21(t) = 5 cos(3t2) i + 5 sen(3t2) j− ((t3 − 4t)i + (t2 + 4t) j) ,
con lo cualr2(t) = (5 cos(3t2)− (t3 − 4t))i + (5 sen(3t2)− (t2 + 4t))j ,
entonces
v2(t) =dr2(t)
dt= (30t cos(3t2)− (3t2 − 4))i + (30t sen(3t2)− (2t+ 4))j ,
y
a2(t) =dv2(t)
dt= (30 cos(3t2)− 180tt sen(3t2)− 6t)i + (30 sen(3t2)− 180t2 cos(3t2)− 2)j .
Borra
dor Pre
limin
ar
1.11. Ejercicios propuestos
1. Auguste Bravais9 se dio cuenta que replicando un arreglo geometrico muy simple, se puede describiruna estructura cristalina. Dicho de otro modo, que conociendo una celda simple, podemos conocer laestructura cristalina. Esto es que las posiciones de los atomos en una red cristalina puede ser descrita porun vector R = a+b+c = n1a1 +n2a2 +n3a3 = niai donde los ai son vectores no coplanares (vectoresprimitivos o, simplemente en nuestro lenguaje, vectores base). Los ni son numeros enteros (negativos,cero o positivos). La posicion de cada atomo de un cristal puede ser descrita como reescalamientos(discretos) de este vector generico o, de manera mas precisa, la traslacion del origen de coordenadaspor un vector. Ese concepto se conoce como redes de Bravais10. En cada red puede haber varios vectoresprimitivos11. Se puede definir la celda primitiva como la estructura mınima que replicada reproducetodo el cristal. Vale decir la estructura cristalina es invariante bajo traslaciones espaciales del tipoR′ = R + T con T = miai.
Figura 1.7: Las 5 redes de Bravais bidimensionales fundamentales: 1 Oblicuas, 2 rectangular, 3 rectangu-lar centrada (rombica), 4 hexagonal, y 5 cuadrada. Figura tomada de http://en.wikipedia.org/wiki/
Bravais_lattice
a) Redes de Bravais bidimensionales. Tal y como muestra la Figura 1.7 existen 5 tipos distintosde redes de Bravais bidimensionales.
1) Dada la red bidimensional de la Figura 1.8 encuentre todos los posibles vectores primitivos yceldas primitivas asociadas.
9http://en.wikipedia.org/wiki/Auguste_Bravais10http://en.wikipedia.org/wiki/Bravais_lattice11http://www.engr.sjsu.edu/rkwok/Phys175A/Chapter%201.pdf
Borra
dor Pre
limin
arFigura 1.8: Red cristalina bidimensional. Encuentre todos los posibles vectores y celdas primitivas asociadas
2) La humanidad ha estado seducida por la geometrıa desde que empezo a representar figuras.A partir de las cuatro imagenes que se ilustran en la Figura 1.9, encuentre todos los posiblesvectores y celdas primitivas asociadas.
3) Maurits Cornelis Escher12 fue un fenomenal dibujante holandes, quien se intereso por lassimetrıas de los grupos de imagenes de papel tapiz. Berend, hermano de Maurits, era cris-talografo y le mostro la belleza de las simetrıas de la naturaleza. En las cuatro obras delgenero de Teselado13 de M.C. Escher, presentadas en la Fig 1.10 encuentre todos los posiblesvectores y celdas primitivas asociadas.
b) Redes de Bravais Tridimensionales. Este tipo de redes complica un poco mas el escenario.Se puede demostrar que existen 14 de estas redes, tal y como se muestran en la Figura 1.11
Muestre que los volumenes de ocupacion atomica, para los sistemas Monoclınico, Triclınico,Ortorombico, Tetragonal, Romboedrico, exagonal y cubico, corresponden a las expresionesque se muestran en la Figura 1.11.
El sistema cubico, el mas simple, corresponde a un sistema con un unico parametro de reda = |a|, ya que a = b = c. Ademas, una posible descripcion, para el caso mas simple, esa = i; b = j; c = k, los tres vectores cartesianos ortogonales. Existen otros sistemas quetambien estan asociados al cubico. Estos son el sistema cubico cara centrada (fcc por sussiglas en ingles) y cubico cuerpo centrado (bcc). En el primero existen atomos en el centro decada una de las caras del cubo definido por la trıada, a = b = c. En el sistema fcc se anadeun atomo la centro del cubo simple.
1) Muestre que un sistema bcc tambien puede ser descrito por los vectores primitivos: a = ai,b = aj y c = a(i + j + k)/2. Dibuje la celda primitiva y calcule su volumen.
2) Muestre que un sistema bcc tambien puede ser descrito por los vectores primitivos: a =a(j + k− i)/2, b = a(k + i− j)/2 y c = a(i + j− k)/2. Dibuje la celda primitiva y calculesu volumen.
3) Muestre que un sistema fcc tambien puede ser descrito por los vectores primitivos: a =a(j + k)/2, b = a(i + k)/2 y c = a(i + j)/2. Otra vez, dibuje la celda primitiva y calculesu volumen.
12http://en.wikipedia.org/wiki/M._C._Escher13http://en.wikipedia.org/wiki/Tessellation
Borra
dor Pre
limin
arFigura 1.9: Cuatro detalles geometricos. Cuadrante I: Mural egipcio. Cuadrante II: Mural Mural Asirio.Cuadrante III: Tejido Tahitı. Cuadrante IV: Ilustracion en pieza de porcelana china. Tomado de http:
//en.wikipedia.org/wiki/Wallpaper_group
Se puede definir la red recıproca como
a′ =b× c
a · (b× c); b′ =
c× a
a · (b× c); y c′ =
a× b
a · (b× c);
De esta manera es claro que, por construccion, a′ · b = a′ · c = 0 y ademas a′ · a = 1. Conlo cual podemos generalizarlo como ei
′ · ej = δi′
j . Exprese los vectores y las celdas recıprocaspara los sistemas cubico simple, y los distintos bcc y fcc. Calcule ademas el volumen de cadacelda recıproca.
2. Considerando que
r = x i + y j + z k = xmem,
A = A(r) = A(x, y, z) = Ai(x, y, z)ei y B = B(r) = B(x, y, z) = Bi(x, y, z)ei
φ = φ(r) = φ(x, y, z) y ψ = ψ(r) = ψ(x, y, z)
usando la notacion de ındices e inspirandose en las secciones 1.6.3, 1.8.5 y 1.10, muestre las siguientesidentidades vectoriales
a) ∇(φψ) = φ∇ψ + ψ∇φ
b) ∇ · (φA) = φ∇ ·A + (∇φ) ·Ac) ∇×∇φ = 0, tambien ∇ · (∇×A) y ¿que puede decir de ∇× (∇ ·A)?
d) ∇ · (A×B) = (∇×A) ·B + A× (∇×B)
e) ∇× (∇×A) = ∇(∇ ·A)−∇2A
Borra
dor Pre
limin
ar
Figura 1.10: Teselados de M.C. Escher, tomados de http://www.wikipaintings.org/en/
paintings-by-genre/tessellation?firstArtist=m-c-escher#artist-m-c-escher
3. Una partıcula se mueve bajo la ley r(t) = x(t)i + y(t)j + z(t)k con
x(t) = 2t2; y(t) = t2 − 4t; z(t) = 3t− 5.
El parametro t representa el tiempo. Encuentre las expresiones para la aceleracion y la velocidad de lapartıcula, para t = 1 y en la direccion del vector i− 3j + 2k.
4. Suponga ahora el caso general de una partıcula que se mueve en una curva descrita por r(t) = x(t)i +y(t)j + z(t)k. Muestre que el vector velocidad es tangente a la trayectoria descrita
5. Encuentre la ecuacion vectorial para una trayectoria recta que pasa por los puntos P → (1, 2, 3) yQ→ (1, 1, 1)
6. Encuentre el angulo entre los siguientes planos x+ y + z = 9 y x+ y − z = 3.
7. Un fluido se considera irrotacional si su campo de velocidades v = v(r) = v(x, y, t) cumple con laecuacion ∇× v = 0. Suponga, ahora que v = (x+ 2y + az)i + (bx− 3y − z)j + (4x+ cy + 2z)k.
a) Encuentre el valor de a, b y c para que este campo de velocidades sea irrotacional
b) Es intuitivo convencerse que si ∇ × v = 0 ⇒ v = ∇ψ. Encuentre expresion para la funcionpotencial ψ = ψ(r) = ψ(x, y, z)
c) Considere la siguiente integral I =∫C dr · v. Donde C es el circuito a recorrer.
1) Calcule el valor de la integral I a lo largo del trayecto: (0, 0, 0)→ (1, 1, 0) mediante una seg-mento de recta. Luego, de (1, 1, 0)→ (2, 0, 0) a lo largo de otro segmento de recta. Finalmenteregresando (2, 0, 0)→ (0, 0, 0) tambien siguiendo una recta.
Borra
dor Pre
limin
ar
Figura 1.11: Las 14 Redes de Bravais Tridimensionales y las estructuras cristalinas asociadas. Tomado dehttp://en.wikipedia.org/wiki/Bravais_lattice
2) Calcule el valor de la integral I de (0, 0, 0)→ (2, 0, 0) a lo largo de un arco de circunferenciaque cumple con la ecuacion (x−1)2 +y2 = 1. Ahora regresando de (2, 0, 0)→ (0, 0, 0) tambiena traves de una recta.
3) ¿Que puede concluir del campo v?
8. Dos funciones complejas Z1(t) y Z2(t) cumplen con las siguientes ecuaciones
dZ∗1dt
==−i
Z1 − Z2y
dZ∗2dt
==−i
Z2 − Z1
Muestre que las siguientes cantidades son constantes.
Z1 + Z2
|Z1 − Z2|
Borra
dor Pre
limin
ar
|Z1|2 + |Z2|2
9. Considere la siguiente ecuacion
z7 − 4z6 + 6z5 − 6z4 + 6z3 − 12z2 + 8z + 4 = 0
Encuentre sus raıces sabiendo que z3 = 2.
10. Muestre que la expansion binomial puede ser escrita como
(1 + x)n =
n∑m=0
Am(n) xm con Am(n) =n!
m!(n−m)!
Si esta convencido de la expansion anterior, considere ahora una parecida:(1 + eiθ
)ny muestre que
n∑m=0
Am(n) cos(nθ) = 2n cosn(θ
2
)cos
(nθ
2
)y
n∑m=0
Am(n) sen(nθ) = 2n cosn(θ
2
)sen
(nθ
2
)11. Las funciones hiperbolicas se definen como
cosh(x) =ex + ex
2y senh(x) =
ex + ex
2
y de manera analoga a las funciones trigonometricas tendremos el resto de funciones
tanh(x) =senh(x)
cosh(x); sech(x) =
1
cosh(x); csech(x) =
1
senh(x); ctanh(x) =
1
tanh(x);
a) Muestre las siguientes equivalencias
cosh(x) = cos(ix), i senh(x) = sen(ix), cos(x) = cosh(ix) y i sen(x) = senh(x)
b) Muestre las siguientes identidades
cosh2(x)− senh2(x) = 1; sech2(x) = 1− tanh2(x); cosh(2x) = cosh2(x) + senh2(x)
c) Resuelva las siguientes ecuaciones hiperbolicas
cosh(x)− 5senh(x)− 5 = 0, 2 cosh(4x)− 8 cosh(2x) + 5 = 0 y cosh(x) = senh(x) + 2sech(x)
d) La posicion de una partıcula vista desde dos observadores relativistas O y O puede expresarse entermino de funciones hiperbolicas como
xµ = Lµν xν con µ, ν = 0, 1 y Lµν =
(cosh(φ) −senh(φ)senh(φ) cosh(φ)
)Encuentre la matriz Lµν tal que xν = Lνµ x
µ
Muestre que ds2 = (x0)2 − (x1)2 = (x0)2 − (x1)2 .
Borra
dor Pre
limin
arCapıtulo 2Espacios Vectoriales Lineales
63
Borra
dor Pre
limin
ar
2.1. Grupos, cuerpos y espacios vectoriales
2.1.1. Grupos
Considere el siguiente conjunto G = g1, g2, g3, · · · , gn, · · · y la operacion . Entonces estos elementosforman un grupo abeliano1 respecto a la operacion si ∀ gi ∈ G se tiene que:
1. Cerrada respecto a la operacion : gi ∈ G, gj ∈ G ⇒ ∃ gk = gi gj ∈ G
2. Asociativa respecto a la operacion : gk (gi gj) = (gk gi) gj
3. Existencia de un elemento neutro: ∃ 1 ∈ G ⇒ gi 1 = gi = 1 gi
4. Existencia de un elemento inverso: gi ∈ G ⇒ ∃ g−1i ∈ G ⇒ gi g−1
i = g−1i gi = 1
5. Conmutativa respecto a la operacion : gi gj ≡ gj gi .
Ejemplos de grupos:
Los enteros Z = · · · − 3− 2,−1, 0, 1, 2, 3, · · · respecto a la suma pero no respecto a la multiplicacion(excluyendo el cero) por cuanto no existe inverso
Los racionales respecto a la suma y a la multiplicacion
Los numeros complejos z = eiθ respecto a la multiplicacion
Las rotaciones en 2 dimensiones (2D), sin embargo las rotaciones en 3D forman un grupo no-abeliano
Dado un grupo de tres elementos, G = 1, a, b y la operacion . Por construccion si queremos que laoperacion de dos de los elementos provea un tercero distinto, entonces la UNICA “tabla de multiplica-cion” posible sera:
1 a b1 1 a ba a b 1b b 1 a
Si solo se cumplen las cuatro primeras, entonces se dice que simplemente forman grupo respecto a laoperacion . Se pueden definir subgrupos si un subconjuntos de los elementos de un grupo gi ∈ G tambienforman un grupo.
El numero de los elementos de un grupo puede ser finito o infinito. En el primer caso de denominangrupos finitos y el numero de elementos que contenga se conoce como el orden del grupo. Un grupo finitoque se construye a partir de una operacion con un unico miembro se denomina grupo cıclico, y el casomas elemental es G =
I,X,X2, X3, · · · , Xg−1
. Obviamente hemos definido aquı: X2 = XX y X3 =
X2X = XXX y ası consecutivamente hasta ejecutarse g − 1 veces, entonces se retoma el elementoidentidad, esto es: Xg−1 X = Xg = I.
1NIELS HENRIK ABEL, (1802-1829 Noruega) Pionero en el desarrollo de diferentes ramas de la matematica moderna, Abelmostro desde su infancia un notable talento para el estudio de las ciencias exactas. Tal predisposicion se verıa muy prontoconfirmada por sus precoces investigaciones sobre cuestiones de algebra y calculo integral, en particular sobre la teorıa de lasintegrales de funciones algebraicas (a las que se denominarıa abelianas en honor de su formulador) que no habrıa de publicarsehasta 1841, doce anos despues de su fallecimiento. En 2002 el gobierno noruego lanzo el premio Abel que llenara el vacıo queexiste en la premiacion Nobel del gobierno sueco, en el cual no existe premiacion para la comunidad matematica.
Borra
dor Pre
limin
ar
Considere los siguientes conjuntos y operaciones
Gmod8 = 1, 3, 5, 7 y la operacion multiplicacion modulo 8. Esto es: multiplicar dos de los elementosy dividirlo entre (para este caso) 8. De esta forma 3 · 3 = 9 y el residuo de dividir 9/8 es 1, vale decir(3 · 3)mod8 = 1 De esta manera construimos entonces la tabla de multiplicacion
×mod8 1 3 5 71 1 3 5 73 3 1 7 55 5 7 1 37 7 5 3 1
Gmod5 = 1, 2, 3, 4 y la operacion multiplicacion modulo 5. Tabla de multiplicacion:
×mod5 1 2 3 41 1 2 3 42 2 4 1 33 3 1 4 24 4 3 2 1
⇔
×mod5 1 2 4 31 1 2 4 32 2 4 3 14 4 3 1 23 3 1 2 4
Gmod24 = 1, 5, 7, 11 y la operacion multiplicacion modulo 24. Tabla de multiplicacion:
×mod24 1 5 7 111 1 5 7 115 5 1 11 77 7 11 1 511 11 7 5 1
G× = 1, i,−1,−i y la operacion multiplicacion:
× 1 i -1 -i1 1 i -1 -ii i -1 -i 1
-1 -1 -i 1 i-i -i 1 i -1
Diremos que los grupos Gmod8 y Gmod24 son isomorfos porque tienen tablas equivalentes de multiplicacion.Esto es, dado un grupo generico G = 1, A,B,C su tabla de multiplicacion sera:
× 1 A B C1 1 A B CA A 1 C BB B C 1 AC C B A 1
Borra
dor Pre
limin
ar
Note que A−1 =A y que siempre la operacion de dos elementos da uno distinto a los operados.De igual forma los grupos G× y Gmod5 son isomorfos con una tabla de multiplicacion
× 1 A B C1 1 A B CA A B C 1B B C 1 AC C 1 A B
2.1.2. Cuerpo
Definiremos como un cuerpo (o campo) el conjunto A = α1, α2, α3, · · · , αn, · · · sobre el cual estandefinidas dos operaciones: suma (+) y multiplicacion (·) y que satisfacen las siguientes propiedades:
1. Forman un grupo abeliano respecto a la suma (+), con el elemento neutro representado por el cero (0).
2. Forman un grupo abeliano respecto a la multiplicacion (·). Se excluye el cero (0) y se denota el elementoneutro de la multiplicacion como (1).
3. Es distributiva respecto a la suma (+) : Dados αi, αj y αk se tiene queαi · (αj + αk) = αi · αj + αi · αk.
Ejemplos tıpicos de campos lo constituyen los racionales Q, los numeros reales R y los numeros complejosC. Normalmente se refiere estos campos como Campos Escalares.
2.1.3. Espacios vectoriales lineales
Sea el conjunto de objetos V = |v1〉 , |v2〉 , |v3〉 · · · |vi〉 · · · . Se denominara V un espacio vectorial linealy sus elementos |vi〉 vectores, si existe una operacion suma, , respecto a la cual los elementos |vi〉 ∈ Vforman un grupo abeliano y una operacion multiplicacion por un elemento de un campo, K = α, β, γ · · · ,tal que:
1. La operacion suma es cerrada en V : ∀ |vi〉 , |vj〉 ∈ V ⇒ |vk〉 = |vi〉 |vj〉 ∈ V
2. La operacion suma es conmutativa y asociativa:
a) ∀ |vi〉 , |vj〉 ∈ V ⇒ |vi〉 |vj〉 = |vj〉 |vi〉b) ∀ |vi〉 , |vj〉 , |vk〉 ∈ V ⇒ (|vi〉 |vj〉) |vk〉 = |vi〉 (|vj〉 |vk〉)
3. Existe un unico elemento neutro |0〉 : |0〉 |vj〉 = |vj〉 |0〉 = |vj〉 ∀ |vj〉 ∈ V
4. Existe un elemento simetrico para cada elemento de V: ∀ |vj〉 ∈ V ∃ |−vj〉 / |vj〉 |−vj〉 = |0〉
5. α (β |vi〉) = (αβ) |vi〉
6. (α+ β) |vi〉 = α |vi〉+ β |vi〉
7. α (|vi〉 |vj〉) = α |vi〉 α |vj〉
8. 1 |vi〉 = |vi〉
Es inmediato notar que podemos definir subespacios vectoriales dentro de los espacios vectoriales. Ellosseran aquellos conjuntos de vectores que cumplan con los requisitos anteriores pero ademas cerrados dentrode los mismos conjuntos de vectores.
Borra
dor Pre
limin
ar
2.1.4. Ejemplos espacios vectoriales
Seran ejemplos de espacios vectoriales los siguientes:
1. Los numeros reales y complejos con el campo de reales o complejos y definidas las operaciones ordinariasde suma y multiplicacion.
V ≡ R , ≡ + , |v〉 ≡ x , K ≡ R.V ≡ C , ≡ + , |v〉 ≡ x+ iy , K ≡ R.
Cuando el campo K es el conjunto de los numeros reales se dira que es un espacio vectorial real denumeros reales si V ≡ R, y si V ≡ C se dira un espacio vectorial real de numeros complejos. Por suparte, si K ≡ C diremos que es un espacio vectorial complejo de numeros reales (V ≡ R) o complejos(V ≡ C). Siempre se asociara el campo de escalares al espacio vectorial. Se dira que es un espaciovectorial sobre el campo de los escales. Si el campo es real (complejo) se dira que el espacio vectoriales real (complejo).
2. El espacio V ≡ Rn = R ×R × · · · ×R, vale decir el producto cartesiano de R, cuyos elementos sonn−uplas de numeros, con la operacion suma ordinaria de vectores en n-dimensionales y la multiplicacionpor escalares.
|x〉 = (x1, x2, x3, · · ·xn) ∧ |y〉 = (y1, y2, y3, · · · , yn)
|x〉 |y〉 ≡ (x1 + y1, x2 + y2, x3 + y3, · · ·xn + yn)
α |x〉 = (αx1, αx2, αx3, · · ·αxn) .
Este espacio vectorial es de dimension finita. Igualmente, sera un espacio vectorial Cn = C×C×· · ·×Cpara el cual los elementos xi ∈ C. Si para este caso el campo sobre el cual se define el espacio vectorialCn es real, tendremos un espacio vectorial real de numeros complejos.
Es obvio que el caso V ≡ R para el cual |x〉1 = (x1, 0, 0, · · · , 0) y |y〉1 = (y1, 0, 0, · · · , 0) o cual-quier espacio de vectores formados por las componentes, i.e. |x〉i = (0, 0, 0, · · · , xi, · · · 0) y |y〉i =(0, 0, 0, · · · , yi, · · · 0) formaran subespacios vectoriales dentro de Rn.
3. El espacio E∞ constituido por vectores |x〉 = (x1, x2, x3, · · ·xn, · · · ) contables pero con infinitas com-ponentes.
|x〉 = (x1, x2, x3, · · · , xn, · · · ) ∧ |y〉 = (y1, y2, y3, · · · , yn, · · · )|x〉 |y〉 ≡ (x1 + y1, x2 + y2, x3 + y3, · · · , xn + yn, · · · )
α |x〉 = (αx1, αx2, αx3, · · · , αxn, · · · ) ,
con la restriccion que
lımn→∞
n∑i=1
xi = L , con L finito .
4. El conjunto de la matrices n× n reales o complejas con el campo K real o complejo.
|x〉 = Mab ∧ |y〉 = Nab
|x〉 |y〉 ≡Mab +Nab = (M +N)abα |x〉 = αMab = (αM)ab
Es tambien obvio que se podran formar subespacios vectoriales cuyos elementos sean matrices dedimension menor a n× n.
Borra
dor Pre
limin
ar
5. El conjunto de todos los polinomios con coeficientes reales: P =a0, a1x, a2x
2, · · · , anxn, · · ·
, con la suma ordinaria entre polinomios y la multiplicacion ordinaria de polinomios con escalares.
6. Espacios Funcionales (de los cuales los polinomios son un caso particular). En estos espacios los vectoresseran funciones, la suma sera la suma ordinaria entre funciones y la multiplicacion por un escalartambien sera la multiplicacion ordinaria de una funcion por un elemento de un campo
|f〉 = f (x) ∧ |g〉 = g (x)
|f〉 |g〉 ≡ f (x) + g (x) ≡ (f + g) (x)
α |f〉 = (αf) (x) ≡ αf (x) .
7. El conjunto de todas las funciones continuas e infinitamente diferenciables, definidas en el intervalo[a, b] : C∞[a,b] .
8. El conjunto de todas las funciones complejas de variable real, ψ (x) , definidas en [a, b] , de cuadrado
integrable (es decir para las cuales∫ ba
dx |ψ (x)|2 sea finita). Este espacio se denomina comunmenteL2 y puede ser definido en un rango [a, b], finito o infinito, y para mas de una variable.
2.1.5. La importancia de la conceptualizacion y la notacion
En los ejemplos antes mencionados hemos utilizado para representar un vector abstracto la notacionde |v1〉 y con ellos construimos un espacio vectorial abstracto V = |v1〉 , |v2〉 , |v3〉 , · · · , |vn〉. Un espaciovectorial abstracto sera un conjunto de elementos genericos que satisfacen ciertos axiomas. Dependiendo delconjunto de axiomas tendremos distintos tipos de espacios abstractos. En matematica el concepto de espaciosabstracto es reciente (1928) y, aparentemente, se le debe a Maurice Frechet2. La teorıa resulta de desarrollarlas consecuencias logicas que resultan de esos axiomas. Los elementos de esos espacios se dejan sin especificara proposito. Ese vector abstracto puede representar, vectores en Rn, matrices n × n o funciones continuas.La notacion |v1〉, que se denomina un ket y al cual le corresponde un bra 〈v2| proviene del vocablo inglesbraket que significa corchete y sera evidente mas adelante cuando construyamos escalares braket 〈v2| |v1〉 .Esta util notacion la ideo Paul Dirac3, uno de los fısicos mas influyentes en el desarrollo de la fısica del sigloXX.
2.1.6. Ejercicios
1. Sea S el conjunto de todos los numeros reales excluyendo −1 y defina la operacion
a b = a+ b+ ab
donde + es la suma estandar entre numeros reales.
a) Muestre que [S,] forman grupo
b) Encuentre la solucion en S para la ecuacion 2 x 3 = 7
2MAURICE FReCHET (1878 Maligny, Yonne, Bourgogne-1973 Parıs, Francia). Versatil matematico frances, con importantescontribuciones en Espacios Metricos, Topologıa y creador del concepto de Espacios Abstractos.
3PAUL ADRIEN MAURICE DIRAC (1902 Bristol, Inglaterra 1984-Tallahassee, EE.UU). Ademas de contribuir de maneradeterminante en la comprension de la Mecanica Cuantica, es uno de los creadores de la Mecanica Cuantica Relativista la cualayudo a comprender el papel que juega el espın en las partıculas subatomicas. Por sus importantes trabajos compartio conErwin Schrodinger el Premio Nobel de Fısica en 1933.
Borra
dor Pre
limin
ar
2. Considere un triangulo equilatero. Uno puede identificar operaciones de rotacion alrededor de un ejeperpendicular a la figura y reflexiones respecto a planos que dejan invariante la figura del triangulo.
a) Muestre que el conjunto de estas operaciones forma un grupo G4 =I,R, R,X1, X2, X3
. con
I la operacion identidad; R y R las rotaciones y X1, X2 y X3 las reflexiones. Muestre ademas,que las rotaciones forman un subgrupo cıclico de orden 3, mientras que las reflexiones forman unsubgrupo cıclico de orden 2
b) Construya la tabla de multiplicacion para G4
c) Considere las siguientes matrices
I =
(1 00 1
); A =
− 12
√3
2
−√
32 − 1
2
B =
− 12 −
√3
2
√3
2 − 12
C =
(−1 00 1
); D =
12 −
√3
2
−√
32 − 1
2
E =
12
√3
2
√3
212
Muestre que forman grupo bajo la multiplicacion de matrices y que ese grupo es isomorfo a G4
d) Considere las siguientes funciones
f1(x) = x; f2(x) =1
x; f3(x) =
1
1− x; f4(x) =
x− 1
x; f5(x) = 1− x; f6(x) =
x
x− 1;
Muestre que forman grupo bajo la operacion fi(x)fj(x) = fi(fj(x)) y que ese grupo es isomorfoa G4
.
3. Definamos una operacion binaria como
x y = x+ y + αxy
con x, y, α ∈ R y ademas α 6= 0.
a) Demuestre que es asociativa
b) Muestre que genera un grupo enR−
(−1α
). Es decir, ∀x, y ∈ R ∧ x 6= −1
α , y 6=−1α entonces
x y forma un grupo
4. Muestre que el siguiente conjunto de transformaciones en el plano xy forman un grupo y construya sutabla de multiplicacion
a) 1 =
x→ x
y → y
b) I =
x→ −x
y → −y
Borra
dor Pre
limin
ar
c) Ix =
x→ −x
y → y
d) Iy =
x→ x
y → −y
5. Muestre que tambien seran espacios vectoriales
a) El conjunto de todas las funciones f = f (x) definidas en x = 1 con f (1) = 0. Si f (1) = c¿Tendremos igual un espacio vectorial? ¿Por que?
b) Los vectores (x, y, z) ∈ V3 tal que sus componentes satisfacen el siguiente sistema de ecuacionesalgebraico
a11x+ a12y + a13z = 0
a21x+ a22y + a23z = 0
a31x+ a32y + a33z = 0
2.2. Espacios metricos, normados y con producto interno
2.2.1. Metricas y espacios metricos
El siguiente paso en la dotacion de propiedades de los espacios lineales lo constituye la idea de metrica odistancia entre sus elementos. El concepto de metrica surge de la generalizacion de la idea de distancia entredos puntos de la recta real.
Un espacio vectorial sera metrico si podemos definir una funcion d tal que:
d : V ×V→ R / ∀ |x〉 , |y〉 , |z〉 ∈ V
y se cumple que:
1. d (|x〉 , |y〉) ≥ 0 , si d (|x〉 , |y〉) = 0 ⇒ |x〉 ≡ |y〉
2. d (|x〉 , |y〉) ≡ d (|y〉 , |x〉)
3. d (|x〉 , |y〉) ≤ d (|x〉 , |z〉) + d (|y〉 , |z〉) (La desigualdad triangular).
Ası, diremos que (V,K,, d) es un espacio vectorial, lineal, metrico.
Ejemplos
1. Espacios euclidianos reales Rn .
a) Para R, es decir la recta real, la definicion de metrica es d (|x〉 , |y〉) ≡ |x− y| .
b) Para R2, es decir el plano, una definicion de metrica es: d (|x〉 , |y〉) ≡√
(x1 − y1)2
+ (x2 − y2)2.
Tambien podemos construir otra definicion de metrica como: d (|x〉 , |y〉) ≡ |x1 − y1|+|x2 − y2|. Laprimera de estas metricas se conoce como metrica euclıdea y la segunda como metrica Manhattano metrica de taxistas. Es claro como el mismo espacio vectorial genera varios espacios metricos,dependiendo de la definicion de metrica, y para el caso particular de estas dos metricas correspon-den corresponden a medidas del desplazamiento en aviones (metrıca euclıdea) o vehıculos terresteen ciudades.
Borra
dor Pre
limin
ar
c) En general para espacios euclidianos reales Rn una posible definicion de metrica sera:
d (|x〉 , |y〉) ≡√
(x1 − y1)2
+ (x2 − y2)2
+ (x3 − y3)2
+ · · ·+ (xn − yn)2.
2. Espacios unitarios n−dimensionales, o espacios euclidianos complejos, Cn. La definicion de distanciapuede construirse como:
d (|x〉 , |y〉) ≡√|x1 − y1|2 + |x2 − y2|2 + |x3 − y3|2 + · · ·+ |xn − yn|2
y es claro que se recobra la idea de distancia en el plano complejo: d (|x〉 , |y〉) ≡ |x− y|.
3. Para los espacios de funciones C∞[a,b] una posible definicion de distancia serıa:
d (|f〉 , |g〉) ≡ maxt∈[a,b]
|f (t)− g (t)| .
Es importante destacar que las definiciones de distancia arriba propuesta son invariante bajo traslacionesde vectores. Esto es: |x〉 = |x〉+ |a〉 ∧ |y〉 = |y〉+ |a〉, entonces, d (|x〉 , |y〉) ≡ d (|x〉 , |y〉) .
2.2.2. Normas y espacios normados
La idea de distancia, de metrica, es el equipamiento mas elemental que uno le puede exigir a un espaciovectorial. Mucho mas interesante aun son aquellos espacios vectoriales que estan equipados con la idea denorma y, a partir de allı, se define la idea de distancia. La norma tiene que ver con el “tamano” del vector yla metrica tiene que ver con la distancia entre vectores. Cuando definimos la metrica a partir de la norma,vinculamos las propiedades algebraicas del espacio con sus propiedades geometricas.
La Norma, ‖|vi〉‖ ≡ N (|vi〉) de un espacio vectorial V = |v1〉 , |v2〉 , |v3〉 · · · |vn〉 sera una funcionN : V→ R / ∀ |vi〉 ∈ V que cumple con:
1. N (|vi〉) ≡ ‖|vi〉‖ ≥ 0 , si ‖|vi〉‖ = 0 ⇒ |vi〉 ≡ |0〉
2. N (α |vi〉) ≡ ‖α |vi〉‖ = |α| ‖|vi〉‖
3. ‖|vi〉+ |vj〉‖ ≤ ‖|vi〉‖+ ‖|vj〉‖ (Desigualdad Triangular).
La definicion de Norma induce una metrica de la forma d (|vi〉 , |vj〉) ≡ ‖|vi〉 − |vj〉‖. Se denota en estecaso un espacio vectorial normado como (V,K,; ‖·‖) y tambien se le conoce como un Espacio de Banach.El concepto de espacio vectorial normado fue formulado en 1922 de manera independiente por S. Banach4,H. Hahn y N. Wiener.
Ejemplos
1. Espacios euclidianos reales, Rn y espacios euclidianos complejos Cn. Para estos espacios de Banach, laNorma se define como:
‖|x〉‖ =
√|x1|2 + |x2|2 + |x3|2 + · · ·+ |xn|2 =
(n∑i=1
|xi|2) 1
2
,
4STEFAN BANACH (1892 Kracovia, Polonia-1945 Lvov,Ucrania) Matematico polaco, uno de los fundadores del AnalisisFuncional Moderno, con sus mayores contribuciones a la teorıa de espacios topologicos. Hizo tambien importantes aportes a lateorıa de la Medida, Integracion y Teorıa de Conjuntos y Series Ortogonales.
Borra
dor Pre
limin
ar
es claro que para un espacio euclidiano R3 se cumple que ‖|x〉‖ =√x2
1 + x22 + x2
3, por lo tanto, laidea de Norma generaliza la nocion de “tamano” del vector |x〉. Tambien es claro que la definicion dedistancia se construye a partir de la norma de la forma:
d (|x〉 , |y〉) ≡ ‖|x〉 − |y〉‖ =
√|x1 − y1|2 + |x2 − y2|2 + |x3 − y3|2 + · · ·+ |xn − yn|2 .
2. Para el espacio lineal de matrices n × n reales o complejas con el campo K real o complejo, unadefinicion de norma es
‖M‖ =
m∑a=1
n∑b=1
|Mab| ,
y la correspondiente definicion de distancia
d (|x〉 , |y〉) ≡ ‖M −N‖ =
m∑a=1
n∑b=1
|Mab −Nab| .
3. Para los espacios funcionales C∞[a,b] una posible definicion de norma serıa:
‖|f〉‖ = maxt∈[a,b]
|f (t)| ,
otra posible definicion serıa
‖|f〉‖ =
(∫t∈[a,b]
dx |f (x)|2) 1
2
.
2.2.3. Espacios con producto interno
El siguiente paso en la construccion de espacios vectoriales mas ricos es equiparlo con la definicion deproducto interno y a partir de esta definicion construir el concepto de norma y con este el de distancia.La idea de producto interno generaliza el concepto de producto escalar de vectores en R3 e incorpora a losespacios vectoriales abstractos el concepto de ortogonalidad y descomposicion ortogonal. Historicamente, lateorıa de espacios vectoriales con producto interno es anterior a la teorıa de espacios metricos y espacios deBanach y se le debe a D. Hilbert5. Adicionalmente, la semejanza entre la geometrıa euclidiana y la geometricade Rn ha hecho que espacios en los cuales de puedan definir, distancia, angulos, a partir de una definicionde producto interno, se denominen tambien espacios euclidianos.
Producto interno
En un espacio vectorial abstracto V = |v1〉 , |v2〉 , |v3〉 · · · |vn〉, la definicion del producto interno dedos vectores se denota como 〈vi| vj〉 y es una funcion: V ×V→ K ∀ |vi〉 , |vj〉 , |vk〉 ∈ V, es decir, asocia aese par de vectores con un elemento del campo, o cuerpo, K.
Las propiedades que definen el producto interno son:
1. 〈vi| vi〉 ∈ K ∧ 〈vi| vi〉 ≥ 0 ∀ |vi〉 ∈ V , si 〈vi| vi〉 = 0 ⇒ |vi〉 ≡ |0〉5DAVID HILBERT (1862 Kaliningrad, Rusia-1943 Gottingen, Alemania) Matematico aleman defensor de la axiomatica
como enfoque primordial de los problemas cientıficos. Hizo importantes contribuciones en distintas areas de la matematica,como: Invariantes, Campos de Numeros Algebraicos, Analisis Funcional, Ecuaciones Integrales, Fısica-Matematica y Calculo enVariaciones.
Borra
dor Pre
limin
ar
2. 〈vi| vj〉 = 〈vj | vi〉∗ ∀ |vi〉 , |vj〉 ∈ V
3. 〈vi| vj + vk〉 = 〈vi| vj〉+ 〈vi| vk〉 ∧ 〈vi + vj | vk〉 = 〈vi| vk〉+ 〈vj | vk〉 ∀ |vi〉 , |vj〉 , |vk〉 ∈ V
4. 〈vi| αvj〉 = α 〈vi| vj〉 ∧ 〈αvi| vj〉 = α∗ 〈vi| vj〉 ∀ |vi〉 , |vj〉 ∈ V ∧ α ∈ K
5. 〈vi| 0〉 = 〈0| vi〉 = 0
A partir de la definicion de producto interno se construyen los conceptos de norma y distancia
‖|vi〉‖ =√〈vi| vi〉 y d (|vi〉 , |vj〉) ≡ ‖|vi〉 − |vj〉‖ =
√〈vi − vj | vi − vj〉
La desigualdad de Cauchy-Schwarz
Todo producto interno 〈vi| vj〉 definido en un espacio vectorial abstracto V = |v1〉 , |v2〉 , |v3〉 · · · |vn〉cumple con la desigualdad de Cauchy-Schwarz
|〈vi| vj〉|2 ≤ 〈vi| vi〉 〈vj | vj〉 ⇐⇒ |〈vi| vj〉| ≤ ‖|vi〉‖ ‖|vj〉‖ .
Es claro que si |vi〉 = |0〉 ∧ |vj〉 = |0〉 se cumple la igualdad y es trivial la afirmacion.Para |vi〉 ∧ |vj〉 cualesquiera, procedemos construyendo |vk〉 = α |vi〉+ β |vj〉 con |vi〉 ∧ |vj〉 arbitrarios,
pero α y β tendran valores particulares, por lo tanto
〈vk| vk〉 ≡ 〈αvi + βvj | αvi + βvj〉 ≥ 0
〈αvi + βvj | αvi + βvj〉 = 〈αvi| αvi〉+ 〈αvi| βvj〉+ 〈βvj | αvi〉+ 〈βvj | βvj〉 ≥ 0
= |α|2 〈vi| vi〉+ α∗β 〈vi| vj〉+ β∗α 〈vj | vi〉+ |β|2 〈vj | vj〉 ≥ 0 .
Si α = 〈vj | vj〉, se tiene que
〈vj | vj〉 〈vi| vi〉+ β 〈vi| vj〉+ β∗ 〈vj | vi〉+ |β|2 ≥ 0 ,
seguidamente seleccionamos β = −〈vi| vj〉 y por lo tanto β∗ = −〈vj | vi〉 y consecuentemente
〈vj | vj〉 〈vi| vi〉 ≥ 〈vi| vj〉 〈vj | vi〉 = |〈vi| vj〉|2 .
De la desigualdad de Cauchy-Schwarz y la definicion de norma se desprende que
|〈vi| vj〉|2
‖|vi〉‖2 ‖|vj〉‖2≤ 1 ⇒ −1 ≤ |〈vi| vj〉|
‖|vi〉‖ ‖|vj〉‖≤ 1 ,
por lo tanto podemos definir el “angulo” entre los vectores abstractos |vi〉 ∧ |vj〉 como
cos(Θ) =|〈vi| vj〉|‖|vi〉‖ ‖|vj〉‖
,
Mas aun, a partir de la definicion de norma se obtiene
‖|vi〉+ |vj〉‖2 = 〈vi + vj | vi + vj〉 = 〈vi| vi〉+ 〈vi| vj〉+ 〈vi| vj〉∗+ 〈vj | vj〉 = 〈vi| vi〉+ 2 Re (〈vi| vj〉) + 〈vj | vj〉
con lo cual hemos generalizado para un espacio vectorial abstracto el teorema del coseno
‖|vi〉+ |vj〉‖2 = ‖|vi〉‖2 + ‖|vj〉‖2 + 2 ‖|vi〉‖ ‖|vj〉‖ cos(Θ)
y para el caso que los vectores |vi〉 ∧ |vj〉 sean ortogonales, esto es 〈vi| vj〉 = 0, tendremos el teorema dePitagoras generalizado
‖|vi〉+ |vj〉‖2 = ‖|vi〉‖2 + ‖|vj〉‖2 .
Borra
dor Pre
limin
ar
Ejemplos
1. Espacios euclidianos reales, Rn y espacios euclidianos complejos Cn.
Los vectores de estos espacios pueden ser representados por |x〉 = (x1, x2, · · ·xn) ∧ |y〉 = (y1, y2, · · · , yn)y el producto interno queda definido por
〈x| y〉 = x1y1 + x2y2 + x3y3, · · ·xnyn =
n∑i=1
xiyi ,
es claro que esta definicion de producto interno coincide, para R2 (y R3) con la idea de productoescalar convencional que consideramos en las secciones 1.3.1 y 1.5.3, vale decir
a = axi + ayj
b = bxi + byj
⇒ a · b = axbx + ayby .
Ahora bien, el lector puede comprobar que para vectores en R2 tambien se puede proveer una definicionde producto interno
a~ b = 2axbx + axby + aybx + ayby ,
igualmente valida, con lo cual es claro que en un mismo espacio vectorial pueden coexistir diferentesproductos internos. Por su parte, la norma es
‖|x〉‖ =√〈x| x〉 =
√x2
1 + x22 + x2
3, · · ·+ x2n =
√√√√ n∑i=1
x2i .
La distancia tambien recupera la idea intuitiva de distancia euclidiana
d (|x〉 , |y〉) ≡ ‖|x〉 − |y〉‖ =√〈x− y| x− y〉
d (|x〉 , |y〉) =
√(x1 − y1)
2+ (x2 − y2)
2+ (x3 − y3)
2+ · · ·+ (xn − yn)
2.
El teorema del coseno queda como
n∑i=1
(xi + yi)2
=
n∑i=1
x2i +
n∑i=1
y2i + 2
√√√√ n∑i=1
x2i
√√√√ n∑i=1
y2i cos(Θ) ,
mientras que el teorema de Pitagoras es
n∑i=1
(xi + yi)2
=
n∑i=1
x2i +
n∑i=1
y2i ,
obvio que para R2 tanto el teorema del coseno como el teorema de Pitagoras retoman su forma tradi-cional. Finalmente la desigualdad de Cauchy-Schwarz se expresa
|〈x| y〉| ≤ ‖|x〉‖ ‖|y〉‖ ⇒
∣∣∣∣∣n∑i=1
xiyi
∣∣∣∣∣2
≤n∑i=1
x2i
n∑i=1
y2i .
Borra
dor Pre
limin
ar
2. Para los espacios de funciones continuas C∞[a,b] una posible definicion de producto interno serıa
〈f | g〉 =
∫dx f∗ (x) g (x) ,
de la cual se deriva la expresion para la norma
‖|f〉‖2 = 〈f | f〉 =
∫dx |f (x)|2 ,
la distancia entre funciones quedara definida como
d (|f〉 , |g〉) ≡ ‖|f〉 − |g〉‖ ≡√〈f − g| f − g〉 =
√〈f | f〉 − 〈f | g〉 − 〈f | g〉∗ + 〈g| g〉
d (|f〉 , |g〉) =
√∫dx |f (x)− g (x)|2
=
√∫dx |f (x)|2 − 2 Re
(∫dx f∗ (x) g (x)
)+
∫dx |g (x)|2 .
Los teoremas del coseno puede ser escrito como∫dx |f (x) + g (x)|2 =
∫dx |f (x)|2 +
∫dx |g (x)|2
+ 2
(∫dx |f (x)|2
) 12(∫
dx |g (x)|2) 1
2
cos(Θ) ,
donde
cos(Θ) =
∫dx f∗ (x) g (x)(∫
dx |f (x)|2) 1
2(∫
dx |g (x)|2) 1
2
,
y como era de esperarse el teorema de Pitagoras queda∫dx |f (x) + g (x)|2 =
∫dx |f (x)|2 +
∫dx |g (x)|2 ,
para funciones f (x) y g (x) ortogonales, mientras que para este caso, la desigualdad de Cauchy-Schwarzse expresa ∣∣∣∣∫ dx f∗ (x) g (x)
∣∣∣∣2 ≤ ∫ dx |f (x)|2∫
dx |g (x)|2 .
2.2.4. Ejercicio
Los vectores en R3 en coordenada cartesianas los definimos como a = axi + ayj + azk y definimos una“tabla de multiplicacion” entre ellos de la forma
⟨ei |ej〉 = δij con i, j = 1, 2, 3, esto es:⟨
ei |ej〉 i j k
i 1 0 0j 0 1 0k 0 0 1
con i, j = 1, 2, 3
Borra
dor Pre
limin
ar
Un cuaternion cartesiano puede escribirse de manera analoga a los vectores cartesianos, vale decir:
|a〉 = aα |qα〉 = a0 + ai |qi〉 = a0 + axi + ayj + azk ,
con α = 0, 1, 2, 3 y donde las ai (con i = 1, 2, 3) son numeros reales que representan las componentesvectoriales en coordenadas cartesianas de los cuaterniones, mientras que la a0, tambien un numero real se lellama componente escalar6. Los cuaterniones fueron inventados por el matematico irlandes William RowanHamilton a mediados del siglo XIX, y por decirlo de alguna manera, son hıbridos o generalizaciones a unplano hipercomplejo. Un vector cartesiano es un cuaternion con la componente escalar nula.
Basandonos en este esquema podemos definir la “tabla de multiplicacion” para los cuaterniones cartesia-nos como
|q′i〉 |qj〉 1 |q1〉 |q2〉 |q3〉1 1 |q1〉 |q2〉 |q3〉|q′1〉 |q1〉 −1 |q3〉 − |q2〉|q′2〉 |q2〉 − |q3〉 −1 |q1〉|q′3〉 |q3〉 |q2〉 − |q1〉 −1
Notese que por el hecho que |qj〉 |qj〉 = −1 ⇒ |q1〉 |q1〉 = |q2〉 |q2〉 = |q3〉 |q3〉 = −1, se puedepensar que un cuaternion es la generalizacion de los numeros complejos a mas de una dimension (un numerohipercomplejo) donde la parte imaginaria tendrıa tres dimensiones y no una como es costumbre. Esto es
|a〉 = aα |qα〉 = a0 |q0〉︸︷︷︸1
+ aj |qj〉 = a0 + a1 |q1〉+ a2 |q2〉+ a3 |q3〉︸ ︷︷ ︸“parte compleja”
Siendo consistente con esa vision de generalizacion de un numero complejo, definiremos el conjugado deun cuaternion como |b〉z = b0 |q0〉 − bj |qj〉 con j = 1, 2, 3. Es decir, en analogıa con los numeros complejosel conjugado de un cuaternion cambia el signo de su “parte compleja vectorial”. Igualmente, definiremos lasuma entre cuaterniones como
|a〉 = aα |qα〉
|b〉 = bα |qα〉
⇒ |c〉 = cα |qα〉 = |a〉+ |b〉 = (aα + bα) |qα〉 ⇒ cα = (aα + bα)
Esto quiere decir que los vectores se suman componente a componente. Mientras que la multiplicacion porun escalar queda definida por α |c〉 = αcα |qα〉, es decir se multiplica el escalar por cada componente.
1. Compruebe si los Cuaterniones, |a〉, forman un espacio vectorial respecto a una operacion esa sumay esa multiplicacion por escalares, analoga a la de los vectores en R3 en coordenada cartesianas ¿Loscuaterniones |a〉 son vectores, pseudovectores o ninguna de las anteriores? Explique por que.
2. Dados dos cuaterniones |b〉 ≡(b0,b
)y |r〉 ≡
(r0, r
), entonces, el producto entre cuaterniones |d〉 =
|b〉 |r〉 podra representarse como
|d〉 = |b〉 |r〉 ←→(d0,d
)=(b0r0 − b · r, r0b + b0r + b× r
)donde · y × corresponden con los productos escalares y vectoriales tridimensionales de siempre.
6Recuerde que estamos utilizando la convencion de Einstein en la cual cα |qα〉 ≡ c0 +∑3j=1 c
j |qj〉. Es decir hemos supuesto
que |q0〉 ≡ 1, la unidad en los numeros reales. Adicionalmente, notese que los ındices griegos α, β, · · · toman los valores 0, 1, 2, 3,mientras que los latinos que acompanan a los vectores cartesianos toman los siguiente valores j, k, l = 1, 2, 3.
Borra
dor Pre
limin
ar
Ahora con ındices: dados |b〉 = bα |qα〉 y |r〉 = rα |qα〉, compruebe si el producto |d〉 = |b〉 |r〉 puedeser siempre escrito de la forma
|d〉 = |b〉 |r〉 = a |q0〉+ S(ij)δ0i |qj〉+A[jk]ibjrk |qi〉
donde a representa un escalar; S(ij)δ0i tres cantidades (recuerde que los ındices latinos toman los valores
j, k, l = 1, 2, 3, mientras i = 0, 1, 2, 3); donde S(ij) indica Sji = Sij , que la cantidad Sij es simetrica, ypor lo tanto
(Sijδ0
i + Sjiδ0i
)|qj〉. Mientras A[jk]i representa un conjunto de objetos antisimetricos en
j y k: A[jk]i → Ajki = −Akji →(Ajkibjrk −Akjibjrk
)|qi〉7.
Identifique las cantidades: a, S(ij) y A[jk]i en terminos de las componentes de los cuaterniones ¿Elproducto de cuaterniones |d〉 = |a〉 |r〉 sera un vector, pseudovector o ninguna de las anteriores?Explique por que.
3. Muestre que los cuaterniones pueden ser representados por matrices complejas 2× 2 del tipo
|b〉 ←→(
z w−w z
)donde z, w son numeros complejos y w y z sus complejos conjugados
4. Muestre que una representacion posible para la base de cuaterniones es, la matriz unitaria 4x4 y
|q1〉 =
0 1 0 0−1 0 0 00 0 0 10 0 −1 0
; |q2〉 =
0 0 0 −10 0 −1 00 1 0 01 0 0 0
; |q3〉 =
0 0 −1 00 0 0 11 0 0 00 −1 0 0
5. Compruebe si la siguiente es una buena definicion de producto interno:
〈a |b〉 = |a〉z |b〉
6. Modifique un poco la definicion anterior de tal forma que se tenga la
(a |b) =1
2[〈a |b〉 − |q1〉 〈a |b〉 |q1〉]
y compruebe si esta definicion compleja del producto interno cumple con todas las propiedades. Noteseque un cuaternion de la forma |f〉 = f0 + f1 |q1〉 es un numero complejo convencional.
7. Compruebe si la siguiente es una buena definicion de norma para los cuaterniones
n(|b〉) = ‖|a〉‖ =√〈a |a〉 =
√|a〉z |a〉
8. Comprebe si un cuaternion definido por
|a〉 =|a〉z
‖|a〉‖2
puede ser considerado como el inverso o elemento simetrico de |a〉 respecto a la multiplicacion
9. Compruebe si los Cuaterniones |a〉 forman un grupo respecto a una operacion multiplicacion .
7Para familiarizarse con las expresiones vectoriales con la notacion de ındices puede consultar la seccion 1.6
Borra
dor Pre
limin
ar
10. Los vectores en R3 en coordenadas cartesianas, |v〉, pueden ser representados como cuaterniones dondela parte escalar es nula v0 = 0→ |v〉 = vj |qj〉. Compruebe si el siguiente producto conserva la norma
|v′〉 = |a〉 |v〉 |a〉
Estos es: ‖|v′〉‖2 =(v1′)2
+(v2′)2
+(v3′)2
≡(v1)2
+(v2)2
+(v3)2
= ‖|v〉‖2
2.3. Variedades lineales
2.3.1. Dependencia/independencia lineal
Siguiendo la misma lınea de razonamiento que en las secciones 1.2 y 1.5.2, generalizamos el concepto dedependencia e independencia lineal de R2 y R3. Ası
|0〉 = C1 |v1〉+ C2 |v2〉+ C3 |v3〉 · · ·+ Cn |vn〉 =
n∑i=1
Ci |vi〉 ,
Podemos afirmar que:
Si esta ecuacion se cumple para algun conjunto de Ci no nulos, se dira que el conjunto de vectorescorrespondiente |vi〉 son linealmente dependientes.
Por el contrario, si esta ecuacion solo puede ser satisfecha para todos los Ci = 0, entonces se dira queel conjunto de vectores correspondiente |vi〉 son linealmente independientes.
Ejemplos dependencia/independencia lineal
1. Dados tres vectores en R4
|v1〉 =
13−1
2
; |v2〉 =
2013
; |v3〉 =
−1
100
.
El criterio de independencia lineal se cumple si |0〉 = C1 |v1〉+C2 |v2〉+C3 |v3〉 y todos los Ci sonnulos, esto es
C1 +2C2 −C3 = 03C1 +C3 = 0−C1 +C2 = 02C1 +3C2 = 0
de donde es claro ver que la unica solucion posible implica C1 = C2 = C3 = 0, es decir, el conjunto devectores: |v1〉 , |v2〉 , |v3〉 son linealmente independientes.
2. Si consideramos el espacio vectorial V = |v1〉 , |v2〉 , |v3〉 , · · · , |vn〉 seran ejemplos de independen-cia lineal:
|vk〉 ≡ f (t) = tk para k = 1, 2, 3, · · · Es claro que un polinomio de grado n + 1, no podra serexpresado en terminos un polinomio de grado n, en otras palabras, tn+1 6=
∑ni=0 Ci t
i .
|vk〉 ≡ f (t) = eakt con a1, a2, a3, · · · coeficientes constantes. Tambien salta a la vista que nopodremos expresar una de esas funciones exponenciales como una combinacion lineal.
Borra
dor Pre
limin
ar
3. Si consideramos |v1〉 = cos2(t), |v2〉 = sen2(t) y |v3〉 = 1, es claro que |v1〉 , |v2〉 , y |v3〉 son linealmentedependientes por cuanto |v1〉+ |v2〉 = |v3〉 . Notese que si
|v1〉 = cos(t), |v2〉 = sen(t) y |v3〉 = 1,
entonces |v1〉 , |v2〉 , y |v3〉 seran vectores linealmente independientes.
4. Consideremos ahora otro ejemplo en P3:
|x1〉 = 1; |x2〉 = x− 1; |x3〉 = x2; |x4〉 = x2 + 2x+ 1 .
Podemos ver que este conjunto es linealmente dependiente ya que siempre podremos expresar
|x4〉 = 3|x1〉+ 2|x2〉+ |x3〉 .
Ejercicios
1. Considere un conjunto S conformado unicamente por numeros reales positivos. Consideremos las si-guientes reglas sobre S: Por “suma”de dos numeros entenderemos su producto en el sentido usual, yel “producto”de un elemento r ∈ S y un numero real λ entenderemos r elevado a la potencia de λ, enel sentido usual. ¿S es un espacio vectorial?
2. Considere el conjunto de vectores en el plano conformado por vectores localizados en el origen y cuyospuntos finales permanecen siempre en el primer cuadrante. ¿Este conjunto es un espacio vectorial?
3. Diga si los siguientes conjuntos de vectores en P3 son o no linealmente independientes.
a) |x1〉 = 2x; |x2〉 = x2 + 1; |x3〉 = x+ 1; |x4〉 = x2 − 1
b) |x1〉 = x(x− 1); |x2〉 = x; |x3〉 = x3; |x4〉 = 2x3 − x2
2.3.2. Bases de un espacio vectorial
Ahora bien, dado un espacio vectorial V = |v1〉 , |v2〉 , |v3〉 · · · , |vn〉, si encontramos que el conjuntode |vn〉 es linealmente dependiente, entonces siempre es posible despejar uno de los vectores en terminosde los demas, vale decir
|vn〉 = C1 |v1〉+ C2 |v2〉+ C3 |v3〉 · · ·+ Cn−1 |vn−1〉 =
n−1∑i=1
Ci |vi〉 .
Seguidamente podemos proceder a comprobar si |v1〉 , |v2〉 , |v3〉 · · · , |vn−1〉 es un conjunto de vectoreslinealmente independientes, es decir, si C1 = C2 = C3 = · · · = Cn−1 = 0. En caso de no serlo se procedeotra vez a despejar uno de los vectores en terminos de los anteriores y a aplicar el criterio de independencialineal:
|vn−1〉 = C1 |v1〉+ C2 |v2〉+ C3 |v3〉 · · ·+ Cn−2 |vn−2〉 =
n−2∑i=1
Ci |vi〉 ,
se comprueba si se cumpleC1 = C2 = C3 = · · · = Cn−1 = 0 .
Borra
dor Pre
limin
ar
En caso contrario, se repite este procedimiento hasta encontrar un conjunto |v1〉 , |v2〉 , |v3〉 · · · , |vn−j〉 devectores linealmente independientes. Esto es:
C1 = C2 = C3 = · · · = Cn−j = 0 ,
y por lo tanto
|vn−j+1〉 = C1 |v1〉+ C2 |v2〉+ C3 |v3〉 · · ·+ Cn−j |vn−j〉 =
n−j∑i=1
Ci |vi〉 .
Nos preguntamos nuevamente si se cumple que:
C1 = C2 = C3 = · · · = Cn−j = 0 .
En el caso de ser cierto, esto significarıa que
|0〉 = C1 |v1〉+ C2 |v2〉+ C3 |v3〉 · · ·+ Cn−j |vn−j〉 =
n−j∑i=1
Ci |vi〉 ,
Diremos entonces que |v1〉 , |v2〉 , |v3〉 , · · · , |vn−j〉 forman una base para V.La dimension de V sera el conjunto de vectores linealmente independientes, que para este caso sera n−j.
Ası se puede comprobar que, dado |x〉 ∈ V, entonces
|x〉 =
n−j∑i=1
Ci |vi〉 ∀ |x〉 ∈ V ,
y el conjunto C1, C2, C3, · · ·Cn−j sera unico.Diremos que el numero mınimo de vectores:
|v1〉 , |v2〉 , |v3〉 , · · · , |vn−j〉
que expanden V conforman una base de ese espacio vectorial, y que el numero finito de cantidades
C1, C2, C3, · · ·Cn−j ,
constituyen las componentes de |x〉 relativas a la base |v1〉 , |v2〉 , · · · , |vn−j〉.De lo anteriormente expuesto se puede concretar la siguiente definicion:A un conjunto finito de vectores de un espacio vectorial
B = |v1〉 , |v2〉 , |v3〉 , · · · , |vn〉 ∈ V,
se les denominara una base de ese espacio V si los |v1〉 , |v2〉 , |v3〉 , · · · , |vn〉 son linealmente independientesy expanden V. El espacio vectorial se denominara de dimension finita sı el conjunto de vectores base es finitoy de dimension infinita sı, por el contrario, el conjunto de vectores base es infinito.
Es facil darse cuenta que si V lo expanden n vectores linealmente independientes, cualquier otro vector|x〉 ∈ V sera linealmente dependiente. Igualmente, y facilmente demostrable, es que todas las bases de unespacio vectorial V, de dimension finita, tendran el mismo numero de elementos y ese numero de elementosera la dimension del espacio.
Adicionalmente, puede ser que dentro de un espacio vectorial V se puedan encontrar subespacios y dentrode esos subespacios un conjunto de vectores base.
Borra
dor Pre
limin
ar
Vale decir, si ∀ |x〉 ∈ V:
|x〉 = C1 |v1〉 · · ·+ Cn−j |vn−j〉︸ ︷︷ ︸S1
+ Cn−j+1 |vn−j+1〉 · · ·Cn−k |vn−k〉︸ ︷︷ ︸S2
+ Cn−k+1 |vn−k+1〉 · · ·Cn |vn〉︸ ︷︷ ︸S3
con|x〉 = |x1〉+ |x2〉+ |x3〉 y |x1〉 ∈ S1; |x2〉 ∈ S2; |x3〉 ∈ S3 ,
entonces diremos que V es la suma directa de S1,S2 y S3 y lo denotaremos como: V = S1 ⊕ S2 ⊕ S3.
2.3.3. El determinante de Gram
Existe una forma directa de comprobar la independencia lineal de una conjunto de vectores
|v1〉 , |v2〉 , |v3〉 · · · , |vn〉 ∈ V .
Dado un |x〉 ∈ V, entonces, y al multiplicar por 〈vi|, resulta:
|x〉 =
n∑i=1
Ci |vi〉 ⇒
C1 〈v1 |v1〉+ C2 〈v1 |v2〉+ C3 〈v1 |v3〉+ · · ·+ Cn 〈v1 |vn〉 = 〈v1 |x〉C1 〈v2 |v1〉+ C2 〈v2 |v2〉+ C3 〈v2 |v3〉+ · · ·+ Cn 〈v2 |vn〉 = 〈v2 |x〉...
...C1 〈vn |v1〉+ C2 〈vn |v2〉+ C3 〈vn |v3〉+ · · ·+ Cn 〈vn |vn〉 = 〈vn |x〉
donde las C1, C2, C3, · · ·Cn son las incognitas, por lo cual, para que este sistema tenga solucion se imponeque ∣∣∣∣∣∣∣∣∣
〈v1 |v1〉 〈v1 |v2〉 〈v1 |v3〉 · · · 〈v1 |vn〉〈v2 |v1〉 〈v2 |v2〉 〈v2 |v3〉 · · · 〈v2 |vn〉
.... . .
...〈vn |v1〉 〈vn |v2〉 〈vn |v3〉 · · · 〈vn |vn〉
∣∣∣∣∣∣∣∣∣ 6= 0
Esto es, que el determinante de Gram8 distinto de cero implica que el conjunto de vectores: |v1〉 , |v2〉 , |v3〉 · · · , |vn〉es linealmente independiente. La inversa tambien es cierta.
Ejemplos bases espacios lineales
1. El espacio vectorial Vn tendra dimension n y una de las posibles bases |v1〉 , |v2〉 , |v3〉 · · · , |vn〉 sera|v1〉 = (1, 0, 0, · · · , 0)|v2〉 = (0, 1, 0, · · · , 0)|v3〉 = (0, 0, 1, · · · , 0)...
...|vn−j〉 = (0, 0, 0, · · · , 1)
Esta base se conoce con el nombre de base canonica.
2. El espacio de polinomios, Pn, de grado g ≤ n tendra como una de las posibles bases al conjunto1, t, t2, t3, · · · , tn
, porque cualquier polinomio de grado ≤ n podra ser expresado como combinacion
lineal de estos n+1 vectores. Mas aun, el espacio de todos los polinomios, P∞, tendra como una posiblebase al conjunto de funciones
1, t, t2, t3, · · · , tn · · ·
. En este caso P∞ sera infinito dimensional.
8JORGEN PEDERSEN GRAM (1850-1916 Dinamarca) Matematico danes, que alternaba su actividad de gerente de unaimportante companıa de seguros con las matematicas (Probabilidad, Analisis Numerico y Teorıa de Numeros). Es conocidomayormente por el metodo de ortogonalizacion, pero se presume que no fue el quien primero lo utilizo. Aparentemente fueideado por Laplace y utilizado tambien por Cauchy en 1836. Gram murio arrollado por una bicicleta a la edad de 61 anos.
Borra
dor Pre
limin
ar
2.3.4. Ortogonalidad y bases ortogonales
En una espacio vectorial con producto interno, dos vectores |e1〉 ∧ |e2〉 seran ortogonales si su productointerno se anula
|e1〉 ⊥ |e2〉 ⇔ 〈e2 |e1〉 = 0 .
Se denomina un conjunto ortogonal de vectores |e1〉 , |e2〉 , |e3〉 · · · , |en〉 si
〈ei |ej〉 = δij ‖|ej〉‖2 , i, j = 1, 2, 3, · · · , n y con
δij = 0 si i 6= jδij = 1 si i = j
y se denominara conjunto ortonormal si ‖|ej〉‖2 = 1.Un conjunto ortogonal de vectores |e1〉 , |e2〉 , |e3〉 , · · · , |en〉 ∈ V es linealmente independiente, mas
aun, para el caso particular de un espacio euclidiano, |e1〉 , |e2〉 , |e3〉 , · · · , |en〉 conforman una base orto-gonal para V. La demostracion es sencilla. Para un determinado espacio vectorial una combinacion lineal delos |e1〉 , |e2〉 , |e3〉 , · · · , |en〉 se anula.
n∑i=1
Ci |ei〉 = |0〉 ⇒
〈e1| [∑ni=1 Ci |ei〉] = 0 ⇒
∑ni=1 Ci δ1i = 0 ⇒ C1 = 0
〈e2| [∑ni=1 Ci |ei〉] = 0 ⇒
∑ni=1 Ci δ2i = 0 ⇒ C2 = 0
〈e3| [∑ni=1 Ci |ei〉] = 0 ⇒
∑ni=1 Ci δ3i = 0 ⇒ C3 = 0
.... . .
......
〈en| [∑ni=1 Ci |ei〉] = 0 ⇒
∑ni=1 Ci δni = 0 ⇒ Cn = 0
con lo cual, queda claro que: |e1〉 , |e2〉 , |e3〉 , · · · , |en〉 son un conjunto de vectores linealmente indepen-dientes.
Si la dimension de V es n (dim V = n) y tenemos n vectores linealmente independientes, entonces esosn vectores |e1〉 , |e2〉 , |e3〉 , · · · , |en〉 forman una base ortogonal para V, y por lo tanto, las componentesde un vector en esa base se pueden expresar de manera simple.
∀ |x〉 ∈ V ⇒ |x〉 =
n∑i=1
Ci |ei〉 ⇒ 〈ej |x〉 = 〈ej |
[n∑i=1
Ci |ei〉
]⇒ Cj =
〈ej |x〉〈ej |ej〉
En el caso de un conjunto ortonormal de vectores |e1〉 , |e2〉 , |e3〉 · · · , |en〉 ∈ Vn, con ‖|ej〉‖2 = 1, lascomponentes de cualquier vector quedan determinadas de una forma todavıa mas simple y con consecuenciasmucho mas impactantes
‖|ej〉‖2 = 1 ⇒ Cj = 〈ej |x〉 ⇒ |x〉 =
n∑i=1
Ci |ei〉 =
n∑i=1
〈ei |x〉 |ei〉 ≡n∑i=1
|ei〉 〈ei|︸ ︷︷ ︸1
|x〉 .
Es bueno recalcar la relacion de cierren∑i=1
|ei〉 〈ei| = 1 ,
con lo cual es trivial demostrar la formula de Parseval
∀ |x〉 , |y〉 ∈ V ⇒ 〈y |x〉 ≡ 〈y|
(n∑i=1
|ei〉 〈ei|
)|x〉 =
n∑i=1
〈y| ei〉 〈ei| x〉 =
n∑i=1
〈y |ei〉 〈x |ei〉∗
para el caso de |x〉 ≡ |y〉 se llega la generalizacion del Teorema de Pitagoras
〈x |x〉 ≡ ‖|x〉‖2 =
n∑i=1
|〈x |ei〉|2 .
Borra
dor Pre
limin
ar
Ejemplos de bases ortogonales
1. Funciones Trigonometricas:
Uno de los ejemplos mas emblematicos es el caso de las funciones continuas, reales de variable real y
definidas en [0, 2π], C∞[0,2π], con lo cual el producto interno viene definido por 〈f | g〉 =∫ 2π
0dx f (x) g (x),
esto es, el conjunto de funciones |e1〉 , |e2〉 , |e3〉 , · · · , |en〉 · · · representadas por
|e0〉 = 1, |e2n−1〉 = cos(nx) y |e2n〉 = sen(nx), con n = 1, 2, 3, · · ·
Es claro que |e1〉 , |e2〉 , |e3〉 , · · · , |en〉 , · · · es un conjunto de funciones ortogonales por cuanto
〈en |em〉 = δnm ‖|en〉‖2 ⇒
0 si n 6= m
∫ 2π
0dx sen(nx) sen(mx) = 0∫ 2π
0dx cos(nx) sen(mx) = 0∫ 2π
0dx cos(nx) cos(mx) = 0
‖|en〉‖2 si n = m
∫ 2π
0dx = 2π si n = m = 0∫ 2π
0dx cos2(nx) = π si n = m = 2k − 1∫ 2π
0dx sen2(nx) = π si n = m = 2k
con k = 1, 2, 3, · · · , tambien.
Podremos construir una base ortonormal de funciones: |e1〉 , |e2〉 , |e3〉 , · · · , |en〉 , · · · de la forma
|e0〉 =1√2π, |e2n−1〉 =
1√π
cos(nx) y |e2n〉 =1√π
sen(nx).
Cualquier funcion definida en el intervalo [0, 2π] puede expresarse en terminos de esta base como
|f〉 =
∞∑i=1
Ci |ei〉 ⇒ Ci = 〈ei |f〉 =
1√2π
∫ 2π
0dx f (x) = a0 si i = 0
1√2π
∫ 2π
0dx f (x) cos(nx) = a2n−1 si i = 2n− 1
1√2π
∫ 2π
0dx f (x) sen(nx) = a2n si i = 2n
donde los Ci son los coeficientes de Fourier
2. Polinomios de Legendre: Otro de los ejemplos tıpicos lo constituyen los llamados polinomios de Legen-dre. Polinomios Pn(x) definidos en el intervalo [−1, 1] y generados a partir de la Formula de Rodrigues9
Pn(x) =1
n!2ndn
dxn(x2 − 1)n, n = 0, 1, 2, .....
con P0(x) = 1. Algunos de estos polinomios son:
P1(x) = x , P2(x) =1
2(3x2 − 1) , P3(x) =
x
2(5x2 − 3) , P4(x) =
1
8(35x4 − 30x2 + 3) , . . .
9BENJAMIN OLINDE RODRIGUES (1794 Burdeos, Francia - 1851, Parıs Francia) Banquero, matematico y activistapolıtico socialista frances durante la Revolucion Francesa. De origen judıo, y cuyas contribuciones fundamentales como laformula para la generacion de Polinomios de Legendre, permanecieron olvidadas por mucho tiempo.
Borra
dor Pre
limin
ar
Como veremos mas adelante, los polinomios de Legendre son solucion de la ecuacion diferencial
(1− x2) y′′ − 2x y′ + λ(λ+ 1)y = 0 .
Es facil comprobar que los polinomios de Legendre |Pα〉 = Pα(x) son mutuamente ortogonales con unproducto interno definido como
〈Pn|Pm〉 =
∫ 1
−1
Pn(x)Pm(x)dx =2
2n+ 1δnm ,
con norma definida por
‖Pn‖2 = 〈Pn|Pn〉 =
∫ 1
−1
P 2n(x)dx =
2
2n+ 1.
Por lo tanto, cualquier funcion en el intervalo [−1, 1] puede ser expresada en esa base.
f(x) = |F 〉 =
∞∑k=0
ak |Pk〉 =
∞∑k=0
〈Pk|F 〉〈Pk|Pk〉
|Pk〉 .
Si f(x) es un polinomio
f(x) =
m∑n=0
bnxn =
∞∑k=0
ak |Pk〉 =
∞∑n=0
anPn(x)
no se requiere hacer ninguna integral por cuanto los coeficientes an se determinan a traves de unsistema de ecuaciones algebraicas. Por ejemplo, para el caso de f(x) = x2 tendremos
f(x) = x2 = a0P0(x) + a1P1(x) + a2P2(x)
= a0 + a1x+1
2a2(3x2 − 1)
=1
3P0(x) +
2
3P2(x) .
2.3.5. Ortogonalizacion
Hemos visto que un conjunto de vectores ortogonales forman una base para un espacio vectorial. Ahorabien, siempre es posible construir un conjunto de vectores ortogonales a partir de un conjunto de vectoreslinealmente independientes. Es metodo de “ortogonalizacion” se conoce como el metodo de Gram-Schmidt10,en honor de estos dos matematicos alemanes que NO inventaron el metodo pero lo hicieron famoso. Al parecer,este procedimiento de ortogonalizacion se le debe al matematico frances P.S. Laplace.
Dado un conjunto de vectores linealmente independientes, |v1〉 , |v2〉 , |v3〉 , · · · , |vn〉 que expanden unespacio Euclidiano de dimension finita, En. Entonces siempre se puede construir un conjunto ortogonal devectores, |e1〉 , |e2〉 , |e3〉 , · · · , |en〉 que tambien expandan En de la siguiente forma:
10ERHARD SCHMIDT (1876, Estonia - 1959 Alemania). Matematico aleman fundador del primer instituto de matematicasaplicadas de Berlın. Alumno de Hilbert, Schmidt hizo sus mayores contribuciones en el campo de Ecuaciones Integrales y Teorıade Funciones en el Espacio de Hilbert.
Borra
dor Pre
limin
ar
|e1〉 ≡ |v1〉
|e2〉 ≡ |v2〉 − 〈v2 |e1〉〈e1 |e1〉 |e1〉 \ 〈e2 |e1〉 = 0
|e3〉 ≡ |v3〉 − 〈v3 |e2〉〈e2 |e2〉 |e2〉 − 〈v3 |e1〉〈e1 |e1〉 |e1〉 \〈e3 |e1〉 = 0〈e3 |e2〉 = 0
|e4〉 ≡ |v4〉 − 〈v4 |e3〉〈e3 |e3〉 |e3〉 − 〈v4 |e2〉〈e2 |e2〉 |e2〉 − 〈v4 |e1〉〈e1 |e1〉 |e1〉 \
〈e4 |e1〉 = 0〈e4 |e2〉 = 0〈e4 |e3〉 = 0
......
|en〉 ≡ |vn〉 −∑n−1i=1
〈vn |ei〉〈ei |ei〉 |ei〉 \
〈e4 |e1〉 = 0〈e4 |e2〉 = 0〈e4 |e3〉 = 0
...〈e4 |en−1〉 = 0
Ası siempre es posible construir una base ortonormal a partir de un conjunto de vectores linealmenteindependientes. Esta base ortogonal sera unica en En, si existe otra sus vectores seran proporcionales. Masaun, cada espacio vectorial Vn de dimension finita tendra una base ortogonal asociada.
Ejemplos de ortogonalizacion
1. Un subespacio de V4, expandido por los siguientes vectores
|v1〉 =
13−1
2
; |v2〉 =
2013
; |v3〉 =
−1
100
,
Borra
dor Pre
limin
ar
tendra una base ortogonal asociada dada por
|e1〉 ≡ |v3〉 =
−1
100
;
|e2〉 ≡ |v2〉 −〈v2 |e1〉〈e1 |e1〉
|e1〉 =
2013
− (−1)
−1
100
=
1113
|e3〉 ≡ |v1〉 −〈v1 |e2〉〈e2 |e2〉
|e2〉 −〈v1 |e1〉〈e1 |e1〉
|e1〉 =
|e3〉 ≡
13−1
2
− ( 9
12
)1113
− (1)
−1
100
=
54
54
− 74
− 14
;
y la base ortonormal asociada sera
|e1〉 =|e〉√〈e1 |e1〉
=
(√2
2
)−1
100
; |e2〉 =|e2〉√〈e2 |e2〉
=
(√12
12
)1113
;
|e3〉 =|e3〉〈e3 |e3〉
=
(2√
3
9
)
54
54
− 74
− 14
2. Para el caso de R2 es muy claro. Si tenemos dos vectores |v1〉 y |v2〉 linealmente independientes,
|v1〉 =
(11
); |v2〉 =
(01
);
elegimos |e1〉 ≡ |v2〉 entonces, |e2〉 vendra dado por
|e2〉 ≡ |v1〉 −〈v1 |e1〉〈e1 |e1〉
|e1〉 ⇒ |e2〉 ≡(
11
)−(
01
)=
(10
)tal y como se esperaba, el otro vector ortogonal es el canonico.
Borra
dor Pre
limin
ar
3. Consideramos el espacio de polinomios, Pn, de grado g ≤ n definidos en el intervalo [−1, 1]. Esteespacio vectorial tendra como una de las posibles bases al conjunto
1, t, t2, t3, · · · , tn
con el producto
interno definido por 〈f | g〉 =∫ 1
−1dx f (x) g (x).
Por lo tanto, se procede a construir una base ortogonal de la forma:
|e0〉 ≡ |v0〉 = 1
|e1〉 ≡ |v1〉 −〈v1 |e0〉〈e0 |e0〉
|e0〉 = t
ya que 〈v1 |e0〉 =∫ 1
−1dx t = 0; 〈e0 |e0〉 =
∫ 1
−1dx = 2 ,
|e2〉 ≡ |v2〉 −〈v2 |e1〉〈e1 |e1〉
|e1〉 −〈v2 |e0〉〈e0 |e0〉
|e0〉 = t2 − 13
〈v2 |e0〉 =∫ 1
−1dx t2 = 2
3 ; 〈v2 |e1〉 =∫ 1
−1dx t3 = 0;
〈e1 |e1〉 =∫ 1
−1dx t2 = 2
3 ,
|e3〉 ≡ |v3〉 −〈v3 |e2〉〈e2 |e2〉
|e2〉 −〈v3 |e1〉〈e1 |e1〉
|e1〉 −〈v3 |e0〉〈e0 |e0〉
|e0〉 = t3 − 35 t
〈v3 |e0〉 =∫ 1
−1dx t3 = 0; 〈v3 |e1〉 =
∫ 1
−1dx t4 = 2
5
〈v3 |e2〉 =∫ 1
−1dx t3
(t2 − 1
3
)= 0; 〈e2 |e2〉 =
∫ 1
−1dx
(t2 − 1
3
)2= 8
45 ,...
Podemos resumir los calculos anteriores como se muestra a continuacion:
|vn〉 |en〉 |en〉1 1
√12
t t√
32 t
t2(t2 − 1
3
)12
√52
(3t2 − 1
)t3
(t3 − 3
5 t)
12
√72
(5t3 − 3t
)t4
(t4 − 6
7 t2 + 3
35
)18
√92
(35t4 − 30t2 + 3
)...
......
2.3.6. Complementos ortogonales y descomposicion ortogonal
Sea un subespacio S ⊂ V, un elemento |vi〉 ∈ V se dice ortogonal a S si 〈sk |vi〉 = 0 ∀ |sk〉 ∈ S,es decir, es ortogonal a todos los elementos de S . El conjunto |v1〉 , |v2〉 , |v3〉 , · · · , |vm〉 de todos los
Borra
dor Pre
limin
ar
elementos ortogonales a S, se denomina S−perpendicular y se denota como S⊥. Es facil demostrar que S⊥
es un subespacio, aun si S no lo es.Dado un espacio euclidiano de dimension infinita V : |v1〉 , |v2〉 , |v3〉 , · · · , |vn〉 , · · · y un subespacio
de V con dimension finita, S ⊂ V y dim S = m. Entonces ∀ |vk〉 ∈ V puede expresarse como la suma de
dos vectores |sk〉 ∈ S ∧ |sk〉⊥ ∈ S⊥. Esto es
|vk〉 = |sk〉+ |sk〉⊥ , |sk〉 ∈ S ∧ |sk〉⊥ ∈ S⊥ .
Mas aun, la norma de |vk〉 se calcula a traves del teorema de Pitagoras generalizado
‖|vk〉‖2 = ‖|sk〉‖2 +∥∥∥|sk〉⊥∥∥∥2
.
La demostracion es sencilla. Primero se prueba que la descomposicion ortogonal |vk〉 = |sk〉+|sk〉⊥ es siempreposible. Para ello recordamos que S ⊂ V es de dimension finita, por lo tanto existe una base ortonormal|e1〉 , |e2〉 , |e3〉 · · · |em〉 para S. Es decir, dado un |vk〉 definimos los elementos |sk〉 y |sk〉⊥ como siguen
|sk〉 =
m∑i=1
〈vk |ei〉 |ei〉 ∧ |sk〉⊥ = |vk〉 − |sk〉
Notese que 〈vk |ei〉 |ei〉 es la proyeccion de |vk〉 a lo largo de |ei〉 y |sk〉 se expresa combinacion lineal de labase de S, por lo tanto, esta en S. Por otro lado
⊥ 〈sk |ei〉 = 〈vk−sk |ei〉 = 〈vk |ei〉 − 〈sk |ei〉 = 〈vk |ei〉 −
m∑j=1
〈vk |ej〉 〈ej |
|ei〉 = 0 ⇒ |sk〉⊥ ⊥ |ej〉
lo cual indica que |sk〉⊥ ∈ S⊥.
Podemos ir un poco mas alla. La descomposicion |vk〉 = |sk〉+ |sk〉⊥ es unica en V. Para ello suponemosque existen dos posibles descomposiciones, vale decir
|vk〉 = |sk〉+ |sk〉⊥ ∧ |vk〉 = |tk〉+ |tk〉⊥ , con |sk〉 ∧ |tk〉 ∈ S ∧ |sk〉⊥ ∧ |tk〉⊥ ∈ S⊥ .
Por lo tanto
|vk〉 − |vk〉 =(|sk〉+ |sk〉⊥
)−(|tk〉+ |tk〉⊥
)= 0 ⇒ |sk〉 − |tk〉 = |tk〉⊥ − |sk〉⊥ .
Pero |sk〉− |tk〉 ∈ S, es decir, ortogonal a todos los elementos de S⊥ y |sk〉− |tk〉 = |tk〉⊥− |sk〉⊥, con lo cual|sk〉 − |tk〉 ≡ |0〉 que es el unico elemento que es ortogonal a el mismo y en consecuencia la descomposicion
|vk〉 = |sk〉+ |sk〉⊥ es unica.Finalmente, con la definicion de norma
‖|vk〉‖2 =∥∥∥|sk〉+ |sk〉⊥
∥∥∥2
=(〈sk|+ 〈sk|⊥
)(|sk〉+ |sk〉⊥
)= 〈sk |sk〉+⊥ 〈sk |sk〉⊥ = ‖|sk〉‖2 +
∥∥∥|sk〉⊥∥∥∥2
.
Ası, dado Sm un subespacio de V de dimension finita y dado un |vk〉 ∈ V el elemento
|sk〉 ∈ S ⇒ |sk〉 =
m∑i=1
〈vk |ei〉 |ei〉 ,
sera la proyeccion de |vk〉 en S.En general, dado un vector |x〉 ∈ V y un subespacio de V con dimension finita, Sm ⊂ V y dim S = m,
entonces la distancia de |x〉 a Sm es la norma de la componente de |x〉 , perpendicular a Sm, y mas aun esadistancia sera mınima y |x〉Sm la proyeccion d |x〉, en Sm sera el elemento de Sm mas proximo a |x〉 y, porla mejor aproximacion.
Borra
dor Pre
limin
ar
2.3.7. Ejercicio
Sea Pn el conjunto de todos los polinomios de grado n, en x, con coeficientes reales:
|pn〉 p(x) = a0 + a1x+ a2x2 + ...+ an−1x
n−1 =
n−1∑i=0
aixi
1. Demostrar que Pn es un espacio vectorial respecto a la suma de polinomios y a la multiplicacion depolinomios por un escalar (numero real).
2. Si los coeficientes ai son enteros ¿Pn sera un espacio vectorial? ¿ Por que?
3. ¿Cual de los siguientes subconjuntos de Pn es un subespacio vectorial?
a) El polinomio cero y todos los polinomios de grado n− 1.
b) El polinomio cero y todos los polinomios de grado par.
c) Todos los polinomios que tienen a x como un factor (grado n > 1).
d) Todos los polinomios que tienen a x− 1 como un factor.
4. ¿Cual de los siguientes polinomios pertenece al subespacio de P? Subespacio P generado por: |x1〉 =x3 + 2x+ 1; |x2〉 = x2 − 2; |x3〉 = x3 + x;
a) x2 − 2x+ 1
b) x4 + 1
c) − 12x
3 + 52x
2 − x− 1
d) x− 5
5. Probar que los polinomios
|x1〉 = 1; |x2〉 = x; |x3〉 =3
2x2 − 1
2; |x4〉 =
5
2x3 − 3
2x;
forman una base en P4. Expresar |p〉 = x2; |q〉 = x3 en funcion de esa base.
6. Sean |pn〉 = p(x)=∑n−1i=0 aix
i, |qn〉 = q(x) =∑n−1i=0 bix
i ∈ Pn. Considerese la siguiente definicion:
〈qn|pn〉 a0b0 + a1b1 + a2b2 + ...+ an−1bn−1 =
n−1∑i=0
aibi
a) Muestre que esta es una buena definicion de producto interno.
b) Con esta definicion de producto interior ¿Se puede considerar Pn un subespacio de C[a,b]? ¿Porque?
7. Considerando estas definiciones de producto interior en Pn
a) 〈qn|pn〉 =∫ 1
−1p(x)q(x)dx
b) 〈qn|pn〉 =∫ 1
0p(x)q(x)dx
Encontrar la distancia y el angulo entre los siguientes pares de vectores en P3
Borra
dor Pre
limin
ar
a) |x1〉 = 1; |x2〉 = x
b) |x1〉 = 2x; |x2〉 = x2
8. Encontrar la proyeccion perpendicular de los siguientes vectores en C[−1,1] (espacio de funciones conti-nuas en el intervalo [-1,1]) al subespacio generado por los polinomios: 1, x, x2− 1. Calcular la distanciade cada una de estas funciones al subespacio mencionado.
a) f(x) = xn; n entero
b) f(x) = sen(x)
c) f(x) = 3x2
2.4. Aproximacion de funciones
2.4.1. Condiciones para la aproximacion de funciones
Sea |v1〉 , |v2〉 , |v3〉 , · · · , |vn〉 , · · · un espacio euclidiano de dimension infinita, V, y un subespacioSm ⊂ V, con dimension finita dim S = m, y sea un elemento |vi〉 ∈ V. La proyeccion de |vi〉 en Sm, |si〉 ,sera el elemento de Sm mas proximo a |vk〉. En otras palabras
‖|vi〉 − |si〉‖ ≤ ‖|vi〉 − |ti〉‖ ∀ |ti〉 ∈ S .
La demostracion se sigue ası
|vi〉 − |ti〉 = (|vi〉 − |si〉) + (|si〉 − |ti〉) ⇒ ‖|vi〉 − |ti〉‖2 = ‖|vi〉 − |si〉‖2 + ‖|si〉 − |ti〉‖2 ,
ya que |vi〉 − |si〉 = |sk〉⊥ ∈ S⊥ ∧ |si〉 − |t i〉 ∈ S, y vale el teorema de Pitagoras generalizado.Ahora bien, como
‖|si〉 − |ti〉‖2 ≥ 0 ⇒ ‖|vi〉 − |ti〉‖2 ≥ ‖|vi〉 − |si〉‖2 ⇒ ‖|vi〉 − |ti〉‖ ≥ ‖|vi〉 − |si〉‖ .
Desarrollemos la aproximacion de funciones continuas, reales de variable real, definidas en [0, 2π], C∞[0,2π],
mediante funciones trigonometricas y con el producto interno definido por: 〈f | g〉 =∫ 2π
0dx f (x) g (x).
Hemos visto que para este espacio vectorial tenemos una base ortonormal definida por
|e0〉 = ϕ0 (x) =1√2π
, |e2n−1〉 = ϕ2n−1 (x) =1√π
cos(nx) y |e2n〉 = ϕ2n (x) =1√π
sen(nx).
Por lo tanto, cualquier funcion definida en el intervalo [0, 2π] puede expresarse en terminos de esta base comomostramos a continuacion
|f〉 =
∞∑i=1
Ci |ei〉 ,
con Ci = 〈ei |f〉 =
∫ 2π
0
dx f (x)ϕi(x) =
1√2π
∫ 2π
0dx f (x) = a0 si i = 0
1√π
∫ 2π
0dx f (x) cos(nx) = a2n−1 si i = 2n− 1
1√π
∫ 2π
0dx sen(nx) f (x) = a2n si i = 2n
Borra
dor Pre
limin
ar
Los Ci son los coeficientes de Fourier. Es decir, cualquier funcion puede ser expresada como una serie deFourier de la forma
f (x) =1
2a0 +
∞∑k=1
[ak cos(kx) + bk sen(kx)] ,
donde
ak =1
π
∫ 2π
0
dx f (x) cos(kx) ∧ bk =
∫ 2π
0
dx f (x) sen(kx) f (x) .
Es claro que para la aproximacion de funciones por funciones trigonometricas cuyos coeficientes son loscoeficientes de Fourier constituyen la mejor aproximacion. Por lo tanto, de todas las funciones F (x) ∈ C∞[0,2π]
las funciones trigonometricas, T (x) minimizan la desviacion cuadratica media∫ 2π
0
dx (f (x)− P (x))2 ≥
∫ 2π
0
dx (f (x)− T (x))2.
2.4.2. El Metodo de mınimos cuadrados
Una de las aplicaciones mas importantes en la aproximacion de funciones es el metodo de mınimoscuadrados. La idea es determinar el valor mas aproximado de una cantidad fısica, c, a partir de un conjuntode medidas experimentales: x1, x2, x3, · · ·xn. La intencion es encontrar el mejor valor de c a partir de eseconjunto de datos experimentales.
Para ello asociamos el conjunto de medidas x1, x2, x3, · · ·xn con las componentes de un vector |x〉 enRn. Ası tendremos que
|x〉 = (x1, x2, x3, · · ·xn) ∧ c |y〉 = (c,c,c, · · · c) ,
y, por lo tanto la mejor aproximacion de c|y〉, que llamaremos c′ |y〉, sera la proyeccion perpendicular de |x〉(las medidas) sobre el subespacio generado por |y〉. Esto es
c′ =〈x |y〉〈y |y〉
=x1 + x2 + x3, · · ·+ xn
n,
que no es otra cosa que el promedio aritmetico de las medidas. Es claro que la proyeccion perpendicular de|x〉 sobre |y〉 hace mınimo la distancia entre el subespacio perpendicular generado por |y〉 y el vector |x〉. Esdecir, hace mınimo el cuadrado de esa distancia
[d (|x〉 , c′ |y〉)]2 = 〈x−c′y |x−c′y〉 =
n∑i=1
(xi − c′)2.
Este problema se puede generalizar si se desea medir dos (o n) cantidades. Para el caso de dos cantidadesextendemos la dimension del espacio y los resultados experimentales se expresaran como un vector de 2ndimensiones
|x〉 = (x11, x12, x13, · · ·x1n, x21, x22, x23, · · ·x2n) ,
mientras que los vectores que representan las cantidades mas aproximadas seran
c′1 |y1〉 =
c′1,c′1,c′1, · · · c′1︸ ︷︷ ︸,n
0, 0, 0, · · · 0︸ ︷︷ ︸n
∧ c′2 |y2〉 = (0, 0, 0, · · · 0, c′2,c′2,c′2, · · · c′2) .
Borra
dor Pre
limin
ar
Ahora |y1〉 , |y2〉 expanden un subespacio vectorial sobre el cual |x〉 tiene como proyeccion ortogonalc′1 |y1〉+c ′2 |y2〉 y consecuentemente |x−c′1y1−c′2y2〉 sera perpendicular a |y1〉 , |y2〉, por lo tanto
c′1 =〈x |y1〉〈y1 |y1〉
=x11 + x12 + x13, · · ·+ x1n
n∧ c′2 =
〈x |y2〉〈y2 |y2〉
=x21 + x22 + x23, · · ·+ x2n
n.
La consecuencia mas conocida de esta aproximacion de funciones es el “ajuste” de un conjunto de datosexperimentales (x1, y1) , (x2, y2) , (x3, y3) , · · · , (xn, yn) a la ecuacion de una recta y =cx. En este caso, elplanteamiento del problema se reduce a encontrar el vector c′ |x〉, en el subespacio S (|x〉), que este lo mascercano posible al vector |y〉 = c |x〉.
Por lo tanto ‖|c′x− y〉‖2 sera lo menor posible y |c′x− y〉 sera perpendicular a S (|x〉), por lo que
〈x |c′x− y〉 = 0 ⇒ c′ =〈x |y〉〈x |x〉
=x1y1 + x2y2 + x3y3 · · ·+ xnyn
x21 + x2
2 + x23, · · ·+ x2
n
.
Para tratar de aclarar lo antes expuesto, consideremos tres ejemplos que muestran la versatilidad delmetodo y la ventaja de disponer de una clara notacion. Primeramente, mostraremos el caso mas utilizadode construir el mejor ajuste lineal a un conjunto de datos experimentales. Buscaremos la mejor recta quedescribe ese conjunto de puntos. Luego mostraremos la aplicacion del metodo para buscar la mejor funcionbilineal, vale decir que ajustaremos la mejor funcion de dos variables con una contribucion lineal de susargumentos: f = f(x1, x2) = ax1 + bx2. Finalmente, mostraremos como se puede utilizar el metodo demınimos cuadrados para ajustar un conjunto de datos experimentales a un polinomio de cualquier grado.Veamos los tres casos:
1. Si el conjunto de datos experimentales es: (1, 2) , (3, 2) , (4, 5) , (6, 6) ¿Cual es la recta que ajusta masacertadamente a estos puntos? La ecuacion queda como
|y〉 = c |x〉 ⇒
2256
= c
1346
⇒ c′ =〈x |y〉〈x |x〉
=2 + 6 + 20 + 36
1 + 9 + 16 + 36=
32
31= 1,03226 .
Se puede generalizar este procedimiento cuando se tiene que una cantidad y que es una combinacionlineal desconocida de un conjunto de cantidades
y = c1x1 + c2x2 + c3x3 + · · ·+ cmxm .
En este caso se ejecutaran n experimentos con n > m y el conjunto de medidas experimentales sera
(y1, x11, x12, · · ·x1m; y2, x21, x22, · · ·x2m; y3, x31, x32, · · ·x3m; · · · yn, xn1, xn2, xn3, · · ·xnm)
y a partir de estas generamos el siguiente sistema de ecuaciones
y1 = c′1x11 + c′2x12 + c′3x13, · · ·+ c′mx1m
y2 = c′1x21 + c′2x22 + c′3x23, · · ·+ c′mx2m
y3 = c′1x31 + c′2x32 + c′3x43, · · ·+ c′mx4m
...
yn = c′1xn1 + c′2xn2 + c′3xn3, · · ·+ c′mxnm
Borra
dor Pre
limin
ar
en el cual las incognitas c′1,c′2,c′3, · · · c′m hacen que el lado derecho de las ecuaciones antes mencionadassean los mas proximas a las y1, y2, y3, · · · yn, por lo tanto, si consideramos los vectores
|x1〉 = (x11, · · ·x1n) ; |x2〉 = (x21, · · ·x2n) ; · · · |xm〉 = (xm1, · · ·xmn) ; |y〉 = (ym1, · · · yn)
los vectores |x1〉 , |x2〉 , · · · |xm〉 expanden el subespacio S (|x1〉 , |x2〉 , · · · |xm〉) donde esta la aproxi-macion de |y〉 . La distancia de este subespacio al vector |y〉, sera mınima. Esto es
[d (S (c′i |xi〉) , |y〉)]2
= 〈S (c′i |xi〉)−y |S (c′i |xi〉)−y〉
y |S (c′i |x〉)−y〉 sera ortogonal a los |xi〉:
〈xj |S (c′i |x〉)−y〉 ≡ 〈xi
∣∣∣∣∣m∑i=1
c′i |x〉−y
⟩= 0 ∀ i, j = 1, 2, 3, · · ·m
Podemos construir el sistema de ecuaciones normales para la aproximacion que hemos considerado:
c′1 〈x1 |x1〉+ c′2 〈x1 |x2〉+ c′3 〈x1 |x3〉+ · · ·+ c′m 〈x1 |xm〉 = 〈x1 |y〉c′1 〈x2 |x1〉+ c′2 〈x2 |x2〉+ c′3 〈x2 |x3〉+ · · ·+ c′m 〈x2 |xm〉 = 〈x2 |y〉...
...c′1 〈xm |x1〉+ c′2 〈xm |x2〉+ c′3 〈xn |x3〉+ · · ·+ c′m 〈xm |xm〉 = 〈xn |y〉
(2.1)
donde, tal y como se ha senalado, las incognitas son las c′1,c′2,c′3, · · · c′m .
2. Se sospecha que una determinada propiedad de un material cumple con la ecuacion y = ax1 + bx2. Sial realizar un conjunto de medidas experimentales obtenemos y1
x11
x12
=
1512
;
y2
x21
x22
=
1221
;
y3
x31
x32
=
1011
;
y4
x41
x42
=
01−1
Es claro que tenemos un subespacio de m = 2 dimensiones y hemos hecho n = 4 veces el experimento.Los vectores considerados arriba seran
|x1〉 = (1, 2, 1, 1) ; |x2〉 = (2, 1, 1,−1) ; |y〉 = (15, 12, 10, 0)
por lo tanto, vectorialmente |y〉 = a |x1〉+ b |x2〉, es decir las ecuaciones normales (2.1) se escriben
7a +4b = 494a +7b = 52
⇒
a = 4511
b = 5611
⇒ 11y = 45x1 + 56x2
3. Se puede extender el razonamiento anterior y generar un ajuste “lineal no lineal”. Esto es: el ajustelineal es en los coeficientes, pero la funcionalidad de la ley a la cual queremos ajustar los datos puedeser un polinomio de cualquier orden. Ese es el caso de una parabola que ajusta al siguiente conjuntode puntos
(0, 1) , (1, 3) , (2, 7) , (3, 15) ⇔ y = ax2 + bx+ c
Las ecuaciones toman la forma de1 = 0 +0 +c3 = a +b +c7 = 4a +2b +c
15 = 9a +3b +c
Borra
dor Pre
limin
ar
y los vectores construidos a partir de los datos experimentales seran
|x1〉 = (0, 1, 4, 9) ; |x2〉 = (0, 1, 2, 3) ; |x3〉 = (1, 1, 1, 1) ; |y〉 = (1, 3, 7, 15) .
Una vez mas, la ecuacion vectorial serıa |y〉 = a |x1〉 + b |x2〉 + c |x3〉 y las ecuaciones normales (2.1)para este sistema se construyen como
136 = 98a +36b +14c62 = 36a +14b +6c26 = 14a +6b +4c
⇒
a = −6
b = 1135
c = − 325
⇒ y = −6x2 +113
5x− 32
5.
2.4.3. Interpolacion polinomial de puntos experimentales
Muchas veces nos encontramos con la situacion en la cual tenemos un conjunto de (digamos n) medidaso puntos experimentales (x1, y1 = f(x1)), (x2, y2 = f(x2)), · · · , (xn, yn = f(xn)) y para modelar eseexperimento quisieramos una funcion que ajuste estos puntos. El tener una funcion nos provee la granventaja de poder intuir o aproximar los puntos que no hemos medido. La funcion candidata mas inmediataes un polinomio y debemos definir el grado del polinomio y la estrategia que aproxime esos puntos. Puede serque no sea lineal el polinomio y queramos ajustar esos puntos a un polinomio tal que este pase por los puntosexperimentales. Queda entonces por decidir la estrategia. Esto es: si construimos la funcion como “trozos”de polinomios que ajusten a subconjuntos (x1, y1 = f(x1)), (x2, y2 = f(x2)), · · · , (xm, ym = f(xm)) conm < n. de los puntos experimentales En este caso tendremos una funcion de interpolacion para cada conjuntode puntos. Tambien podemos a ajustar la funcion a todo el conjunto de puntos experimentales y, en ese casoel maximo grado del polinomio que los interpole sera de grado n − 1. Para encontrar este polinomio loexpresamos como una combinacion lineal de Polinomios de Legendre. Esto es
P(x) = f(x) =
n−1∑k=0
Ck |Pk〉 =
n−1∑k=0
CkPk(x) ⇒
y1 = f(x1) = C0P0(x1) + C1P1(x1) + · · ·+ Cn−1Pn−1(x1)y2 = f(x2) = C0P0(x2) + C1P1(x2) + · · ·+ Cn−1Pn−1(x2)...yn = f(xn) = C0P0(xn) + C1P1(xn) + · · ·+ Cn−1Pn−1(xn)
que no es otra cosa que un sistema de n ecuaciones con n incognitas: los coeficientes C0, C1, · · ·Cn−1 Alresolver el sistema de ecuaciones y obtener los coeficientes, podremos obtener la funcion polinomica queinterpola esos puntos. Una expansion equivalente se pudo haber logrado con cualquier otro conjunto depolinomios ortogonales, que ellos son base del espacio de funciones. Es importante hacer notar que debidoa que los polinomios de Legendre esta definido en el intervalo [−1, 1] los puntos experimentales deberanre-escalarse al ese intervalo para poder encontrar el polinomio de interpolacion como combinacion lineal delos Polinomios de Legendre.
Consideremos los puntos experimentales representado en la figura 2.1. Al construir el sistema de ecua-ciones obtendremos lo siguiente:
Borra
dor Pre
limin
arFigura 2.1: En el lado izquierdo se muestran los puntos experimentales:(2, 8), (4, 10), (6, 11), (8, 18), (10, 20), (12, 34) y a la derecha la funcion polinomica que los interpola.
−8 + C0 − C1 + C2 − C3 + C4 − C5 = 0
−10 + C0 − 35 C1 + 1
25 C2 + 925 C3 − 51
125 C4 + 4773125 C5 = 0
−11 + C0 − 15 C1 − 11
25 C2 + 725 C3 + 29
125 C4 − 9613125 C5 = 0
−18 + C0 + 15 C1 − 11
25 C2 − 725 C3 + 29
125 C4 + 9613125 C5 = 0
−20 + C0 + 35 C1 + 1
25 C2 − 925 C3 − 51
125 C4 − 4773125 C5 = 0
−34 + C0 + C1 + C2 + C3 + C4 + C5 = 0
y al resolver el sistema obtendremos que
C0 =2249
144, C1 =
3043
336, C2 =
1775
504, C3 = −175
216, C4 =
625
336, C5 =
14375
3024
con lo cual
P(x) = f(x) =2249
144+
3043
336x+
1775
504P (2, x)− 175
216P (3, x) +
625
336P (4, x) +
14375
3024P (5, x)
la interpolacion queda representada en al figura 2.1.Es importante senalar que mientras mas puntos experimentales se incluyan para la interpolacion, el
polinomio resultante sera de mayor grado y, por lo tanto incluira oscilaciones que distorcionaran una apro-ximacion mas razonable. Por ello, la estrategia de hacer la interpolacion a trozos, digamos de tres puntos entres puntos, generara un mejor ajuste, pero sera una funcion (un polinomio) contınuo a trozos.
Borra
dor Pre
limin
ar
2.4.4. Ejercicios
Para estos ejercicios supondremos la utilizacion de cualquier ambiente de manipulacion simbolica, tipoMAPLE11, Mathematica12, MAXIMA13 o similares.
1. Al medir la temperatura a lo largo de una barra material obtenemos los siguientes valores
xi (cm) 1, 0 2, 0 3, 0 4, 0 5, 0 6, 0 7, 0 8, 0 9, 0Ti (C) 14, 6 18, 5 36, 6 30, 8 59, 2 60, 1 62, 2 79, 4 99, 9
Encuentre, mediante el metodo de los mınimos cuadrados los coeficientes que mejor ajustan a la rectaT = ax+ b.
2. Considere el espacio vectorial, C∞[−1,1], de funciones reales, continuas y continuamente diferenciables
definidas en el intervalo [−1, 1]. Es claro que una posible base de este espacio de funciones la constituye elconjunto de monomios
1, x, x2, x3, x4, · · ·
por cuanto estas funciones son linealmente independientes.
a) Si suponemos que este espacio vectorial esta equipado con un producto interno definido por
〈f |g〉 =∫ 1
−1dx f(x)g(x), muestre que esa base de funciones no es ortogonal.
b) Utilizando la definicion de producto interno 〈f |g〉 =∫ 1
−1dx f(x)g(x) ortogonalice la base
1, x, x2, x3, x4, · · ·
y encuentre los 10 primeros vectores ortogonales, base para C∞[−1,1]. Estanueva base de polinomios ortogonales se conoce como los polinomios de Legendre
c) Modifique un poco la definicion de producto interno 〈f |g〉 =∫ 1
−1dx f(x)g(x)
√(1− x2) y ortogo-
nalice la base
1, x, x2, x3, x4, · · ·
y encuentre otros 10 primeros vectores ortogonales base parael mismo C∞[−1,1]. Esta nueva base de polinomios ortogonales se conoce como los polinomios deTchebychev.
d) Suponga la funcion h(x) = sen(3x)(1− x2):
1) Expanda la funcion h(x) en terminos de la base de monomios y de polinomios de Legendre,grafique, compare y encuentre el grado de los polinomios en los cuales difieren las expansiones.
2) Expanda la funcion h(x) en terminos de la base de monomios y de polinomios de Tchebychev,grafique, compare y encuentre el grado de los polinomios en los cuales difieren las expansiones.
3) Expanda la funcion h(x) en terminos de la base de polinomios de Legendre y de Tchebychev,grafique, compare y encuentre el grado de los polinomios en los cuales difieren las expansiones.
4) Estime en cada caso el error que se comete como funcion del grado del polinomio (o monomio)de la expansion.
¿Que puede concluir respecto a la expansion en una u otra base?
11http://www.maplesoft.com12http://www.wolfram.com/mathematica/13http://maxima.sourceforge.net
Borra
dor Pre
limin
ar
2.5. Algunos ejemplos resueltos
1. Consideramos el espacio vectorial de polinomios de grado g ≤ n definidos en el intervalo [0, 1] o en elintervalo [−1, 1] segun el caso
a) ¿Cual o cuales de los siguientes conjuntos de vectores en P3 son linealmente independientes?Explique por que.
1)|x1〉 = 2x; |x2〉 = x2 + 1; |x3〉 = x+ 1; |x4〉 = x2 − 1 .
Solucion: Resultan ser linealmente dependiente ya que podremos expresar
|x4〉 = |x1〉+ |x2〉 − 2|x3〉 .
2)|x1〉 = x(x− 1); |x2〉 = x; |x3〉 = x3; |x4〉 = 2x3 − x2 .
Solucion: Linealmente dependiente ya que siempre podremos expresar
|x4〉 = −|x1〉+ |x2〉+ 2|x3〉 .
b) Considerando las siguientes definiciones de producto interior en Pn
〈qn|pn〉 =
∫ 1
−1
p(x)q(x)dx y 〈qn|pn〉 =
∫ 1
0
p(x)q(x)dx .
En P3 encuentre la distancia y el angulo entre los vectores
|x1〉 = x(x− 1); |x2〉 = x .
Solucion: En general la definicion de distancia es
d (|x1〉, |x2〉) =√〈x2 − x1 |x2 − x1〉
por lo tanto para 〈qn|pn〉 =∫ 1
−1p(x)q(x)dx la distancia sera
√〈x2 − x1 |x2 − x1〉 =
√∫ 1
−1
[x(x− 1)− x]2
dx =1
15
√690
y para 〈qn|pn〉 =∫ 1
0p(x)q(x)dx sera
√〈x2 − x1 |x2 − x1〉 =
√∫ 1
0
(x(x− 1)− x)2
dx =2
15
√30 .
Con respecto a los angulos:
θ = arc cos
(〈x1 |x2〉√
〈x1 |x1〉√〈x2 |x2〉
).
Para 〈qn|pn〉 =∫ 1
−1p(x)q(x)dx tenemos
Borra
dor Pre
limin
ar
θ = arc cos
(〈x1 |x2〉√
〈x1 |x1〉√〈x2 |x2〉
)= arc cos
∫ 1
−1(x(x− 1))x dx√∫ 1
−1(x(x− 1))
2dx√∫ 1
−1x2dx
= arc cos
(− 1
12
√15√
6
)= 2,4825 rad .
Para 〈qn|pn〉 =∫ 1
0p(x)q(x)dx
θ = arc cos
(〈x1 |x2〉√
〈x1 |x1〉√〈x2 |x2〉
)= arc cos
∫ 1
0(x(x− 1)) (x) dx√∫ 1
0(x(x− 1))
2dx√∫ 1
0x2dx
= arc cos
(− 1
12
√15√
2
)= 2,4825 rad .
¡El mismo angulo!
c) Una de las posibles bases de Pn sera el conjunto
1, x, x2, x3, · · · , xn
con el producto interno
definido por 〈f | g〉 =∫ 1
0dx f (x) g (x).
1) Encuentre la base ortonormal que expande el subespacio S3 de los polinomios, Pn, de gradog ≤ 3.Solucion: El subespacio S3 tendra como vectores linealmente independientes
1, x, x2, x3
,
para encontrar la base ortonormal utilizamos el metodo de Gram Smith, con lo cual tendremosque
|en〉 ≡ |vn〉 −n−1∑i=1
〈vn |ei〉〈ei |ei〉
|ei〉 ,
esto es
|e1〉 = |v1〉 = 1
|e2〉 = |v2〉 −〈v2 |e1〉〈e1 |e1〉
|e1〉 = x−∫ 1
0xdx∫ 1
0dx
= x− 1
2
|e3〉 = |v3〉 −〈v3 |e1〉〈e1 |e1〉
|e1〉 −〈v3 |e2〉〈e2 |e2〉
|e2〉 = x2 −∫ 1
0x2dx∫ 1
0dx−∫ 1
0x2(x− 1
2
)dx∫ 1
0
(x− 1
2
)2dx
(x− 1
2
)= x2 − x+
1
6
|e4〉 = |v4〉 −〈v4 |e1〉〈e1 |e1〉
|e1〉 −〈v4 |e2〉〈e2 |e2〉
|e2〉 −〈v4 |e3〉〈e3 |e3〉
|e3〉
= x3 −∫ 1
0x3dx∫ 1
0dx−
(∫ 1
0x3(x− 1
2
)dx) (x− 1
2
)∫ 1
0
(x− 1
2
)2dx
−
(∫ 1
0x3(x2 + 1
6 − x)
dx) (x2 + 1
6 − x)
∫ 1
0
(x2 + 1
6 − x)2
dx
= x3 − 1
20+
3
5x− 3
2x2
Borra
dor Pre
limin
ar
Normalizando
|ξ1〉 =|e1〉√〈e1 |e1〉
=1√∫ 1
0dx
= 1
|ξ2〉 =|e2〉√〈e2 |e2〉
=x− 1
2√∫ 1
0
(x− 1
2
)2dx
= 2√
3
(x− 1
2
)
|ξ3〉 =|e3〉√〈e3 |e3〉
=x2 + 1
6 − x√∫ 1
0
(x2 + 1
6 − x)2
dx= 6√
5
(x2 +
1
6− x)
|ξ4〉 =|e4〉√〈e4 |e4〉
=x3 − 1
20 + 35x−
32x
2√∫ 1
0
(x3 − 1
20 + 35x−
32x
2)2
dx= 20
√7
(x3 − 1
20+
3
5x− 3
2x2
)
2) Encuentre las componentes del polinomio g (x) = 5 + 3x2−x3 +x5 proyectado sobre esa baseortonormal que expande a S3
Solucion: Las componentes de la proyeccion de g (x) en S3 serıan
c1 = 〈g |ξ1〉 =
∫ 1
0
(1)(5 + 3x2 − x3 + x5
)dx =
71
12
c2 = 〈g |ξ2〉 =
∫ 1
0
(2√
3
(x− 1
2
))(5 + 3x2 − x3 + x5
)dx =
197
420
√3
c3 = 〈g |ξ3〉 =
∫ 1
0
(6√
5
(x2 +
1
6− x))(
5 + 3x2 − x3 + x5)
dx =23
210
√5
c4 = 〈g |ξ4〉 =
∫ 1
0
(20√
7
(x3 − 1
20+
3
5x− 3
2x2
)) (5 + 3x2 − x3 + x5
)dx =
4
315
√7 ,
con lo cual
|g〉S3 =71
12|ξ1〉+
197
420
√3 |ξ2〉+
23
210
√5 |ξ3〉+
4
315
√7 |ξ4〉 .
Finalmente la proyeccion del polinomio en S3 sera
gS3 (x) =71
12+
197√
3
420
[2√
3
(x− 1
2
)]+
23√
5
210
[6√
5
(x2 +
1
6− x)]
+4√
7
315
[20√
7
(x3 − 1
20+
3
5x− 3
2x2
)]
gS3 (x) =71
12+
197
70
(x− 1
2
)+
23
7
(x2 +
1
6− x)
+16
9
(x3 − 1
20+
3
5x− 3
2x2
)es decir
gS3 (x) =313
63+
25
42x+
13
21x2 +
16
9x3
La norma sera
‖|g〉S3‖2 =
(71
12
)2
+
(197
420
√3
)2
+
(23
210
√5
)2
+
(4
315
√7
)2
=1,418,047
39,690∼= 35,728 .
Borra
dor Pre
limin
ar
2. Encuentre la mınima distancia desde el subespacio S3 al polinomio g (x)
Solucion: La distancia mınima sera la norma del vector ortogonal a S3 tal que
|g〉 = |g〉S3 + |g〉⊥S3 donde |g〉S3 ∈ S3
y |g〉⊥S3 es un vector de su complemento ortogonal. Por lo tanto el Teorema de Pitagoras nos dice que
‖|g〉‖2 = ‖|g〉S3‖2 + ‖|g〉⊥S3‖2
con lo cual tendremos que la mınima distancia sera
‖|g〉⊥S3‖ =
√‖|g〉‖2 − ‖|g〉S3‖2
‖|g〉‖2 =
∫ 1
0
(5 + 3x2 − x3 + x5
)2dx =
495193
13860
‖|g〉S3‖2 =1418047
39690
con lo cual
‖|g〉⊥S3‖ =
√495193
13860− 1418047
39690≈ 1,196 5× 10−2
3. Sea f (x) = e2x una funcion perteneciente al espacio lineal de funciones continuas y continuamente dife-
renciables, C∞[−1,1], en el cual el producto interno viene definido por 〈q|p〉 =∫ 1
−1p(x)q(x) dx. Encuentre
el polinomio lineal mas cercano a la funcion f (x).
Solucion: En el subespacio S1 de polinomios lineales, los vectores base son 1, x. Es una base orto-gonal pero no es normal, con lo cual la normalizamos
|e1〉 = |v1〉 = 1 ⇒ |ξ1〉 =1√〈e1 |e1〉
=1√∫ 1
−1dx
=1
2
√2
|e2〉 = |v2〉 −〈v2 |e1〉〈e1 |e1〉
|e1〉 = x−∫ 1
−1xdx∫ 1
−1dx
= x ⇒ |ξ2〉 =x√∫ 1
−1x2dx
=
√6
2x
y la proyeccion ortogonal de esta funcion sera
c0 =
∫ 1
−1
e2x
(1
2
√2
)dx = −
√2
4
(−e2 + e−2
)y c1 =
∫ 1
−1
(√6
2x
)e2xdx =
√6
8
(e2 + 3e−2
)con lo cual la funcion lineal sera
Pn =
(√6
8
(e2 + 3e−2
))x−√
2
4
(−e2 + e−2
).
Borra
dor Pre
limin
arBibliografıa
[1] Arfken, G. B.,Weber, H., Weber, H.J. (2000) Mathematical Methods for Physicists 5ta Edicion(Academic Press, Nueva York)
[2] Borisenko, A.I, y Tarapov I.E. (1968) Vector and Tensor Analisys (Dover Publications Inc, NuevaYork)
[3] Dennery, P. y Krzywicki, A. (1995) Mathematics for Physicists (Dover Publications Inc, Nueva York)
[4] Harper, C. (1971) Introduction to Mathematical Physics (Prentice Hall, Englewood Cliff, N.J:)
[5] Hassani, S. (1991) Foundations of Mathematical Physics (Prentice Hall, International Edition,London:
[6] Hauser, W (1971) Introduction to Principles of Electromagnetism (Addison-Wesley Pub CoReading)
[7] Riley, K.F., Hobson, M.P. y Bence, S.J. (2002) Mathematical Methods for Physics and Enginee-ring (Cambridge University Press)
[8] Santalo, L.A (1969) Vectores y Tensores (Editorial Universitaria, Buenos Aires)
[9] Schutz, B. (1980) Geometrical Methods in Mathematical Physics (Cambridge University Press,Londres)
[10] Spiegel, M. (1959) Vector Analysis (Schaums Outline Series, McGraw Hill New York)
101
Borra
dor Pre
limin
arCapıtulo 3Vectores Duales y Tensores
102
Borra
dor Pre
limin
ar
3.1. Funcionales lineales
Definiremos funcionales lineales como aquella operacion que asocia un numero complejo (o real) a unvector |v〉 ∈ V y cumple con la linealidad, vale decir:
∀ |v〉 ∈ V → F [|v〉] ∈ C ,
F [α |v1〉+ β |v2〉] ≡ α F [|v1〉] + β F [|v2〉] ∀ |v〉 , |v1〉 , |v2〉 ∈ V .
El conjunto de funcionales lineales F1,F2,F3, · · · ,Fn, · · · constituyen a su vez un espacio vectorial, elcual se denomina espacio vectorial dual de V y se denotara como V∗. Es facil convencerse que los funcionaleslineales forman un espacio vectorial ya que dados F1,F2 ∈ V∗ se tiene
(F1 + F2) [|v〉] = F1 [|v〉] + F2 [|v〉]
(α F) [|v〉] = α∗ F [|v〉]
∀ |v〉 ∈ V .
A este espacio lineal tambien se le llama espacio de formas lineales y a los funcionales 1−formas.En aquellos espacios lineales con producto interno definido (Espacios de Hilbert), el mismo producto
interno constituye la expresion natural del funcional. Ası tendremos que
Fa [|v〉] ≡ 〈a |v〉 ∀ |v〉 ∈ V ∧ ∀ 〈a| ∈ V∗ .
Es claro comprobar que el producto interno garantiza que los Fa,Fb, · · · forman un espacio vectorial:
(Fa + Fb) [|v〉] = Fa [|v〉] + Fb [|v〉] = 〈a |v〉+ 〈b |v〉
(α Fa) [|v〉] = 〈αa |v〉 = α∗ 〈a |v〉 = α∗ Fa [|v〉]
∀ |v〉 ∈ V .
Esta ultima propiedad se conoce como antilinealidad.Se establece entonces una correspondencia 1 a 1 entre kets y bras, entre vectores y funcionales lineales (o
formas diferenciales):λ1 |v1〉+ λ2 |v2〉 λ∗1 〈v1|+ λ∗2 〈v2| ,
que ahora podemos precisar:
〈a |v〉 = 〈v |a〉∗ ,〈a |λ1v1 + λ2v2〉 = λ1 〈a |v1〉+ λ2 〈a |v2〉 ,〈λ1a1+λ2a2 |v〉 = λ∗1 〈a1 |v〉+ λ∗2 〈a2 |v〉 .
Mas aun, dada una base |e1〉 , |e2〉 , |e3, 〉 · · · |en〉 para V siempre es posible asociar una base para V∗ detal manera que
|v〉 = λi |ei〉 〈v| = λ∗i⟨ei∣∣ , con λi =
⟨ei |v〉 ∧ λ∗i = 〈v |ei〉 para i = 1, 2, · · · , n
En un lenguaje arcaico (y muchos textos de Mecanica todavıa lo reproducen) denominan a la base delespacio dual
⟨ei∣∣ la base recıproca de |ei〉.
Notese que estamos utilizando la notacion de Einstein en la que ındices repetidos indican suma, y endonde las bases del espacio dual de formas diferenciales
⟨ek∣∣ llevan los ındices arriba. Los ındices arriba se
llamaran contravariantes y los ındices abajo covariantes. Las componentes de las formas diferenciales en unabase dada, llevan ındices abajo 〈a| = ai
⟨ei∣∣ mientras que las componentes de los vectores los llevan arriba
|a〉 = aj |ej〉.
Borra
dor Pre
limin
ar
3.2. Parentesis tensorial
La extension natural al concepto de funcional lineal es el concepto de tensor.
3.2.1. Tensores, una definicion funcional
Definiremos como un tensor a un funcional lineal que asocia un numero complejo (o real) a un vector |v〉 ∈V, a una forma 〈u| ∈ V∗, o ambas y cumple con la linealidad. Esto es:
∀ |v〉 ∈ V ∧ 〈u| ∈ V∗ → T [〈u| ; |v〉] ∈ C
T [ 〈u| ;α |v1〉+ β |v2〉] ≡ αT [〈u| ; |v1〉] + β T [〈u| ; |v2〉] ∀ |v1〉 , |v2〉 ∈ V ∧ 〈u| ∈ V∗
T [ζ 〈u1|+ ξ 〈u2| ; |v〉] ≡ ζT [〈u1| ; |v〉] + ξ T [〈u2| ; |v〉] ∀ |v〉 ,∈ V ∧ 〈u1| , 〈u2| ∈ V∗
En pocas palabras: un tensor es un funcional generalizado cuyos argumentos son vectoresy/o formas, loque significa que T [•; •] es una cantidad con dos “puestos” y una vez “cubiertos” se convierte en un escalar(complejo o real). Un tensor, con un argumento correspondiente a un vector y un argumento correspondientea una forma, lo podremos representar de la siguiente manera:
T
|v〉↓ ;
〈u|↓•
∈ C
Un tensor con dos argumentos correspondientes a vectores y uno a una forma serıa
T [, ; •]⇒ T
|v1〉↓ , |v2〉↓ ;
〈u|↓•
∈ C⇒ tensor de tipo
(12
);
y el caso contrario
T [; •, •]⇒ T
|v〉↓ ;
〈u1|↓• ,〈u2|↓•
∈ C⇒ tensor de tipo
(21
)En general
T
|v1〉↓ , |v2〉↓ , · · · , |vn〉↓ ;
〈u1|↓• ,〈u2|↓• · · · ,
〈um|↓•
⇒ tensor de tipo
(mn
).
En esta notacion el punto y coma (;) separa las “entradas” formas de las “entradas” vectores. Es impor-tante recalcar que el orden si importa, no solo para las cantidades separadas por ;, sino el orden de los“puestos” vectores y “puestos” formas separados por coma y repercutira en las propiedades de los tensores.Por ejemplo: si el orden de las “entradas” vectores no importa, podremos permutarlas sin alteraral tensor, tendremos entonces tensores simetricos respecto a esos “puestos” o “entradas”; delmismo modo, seran tensores antisimetricos aquellos en los cuales si el orden importa y al permutar esos“puestos” o “entradas” hay un cambio de signo en el tensor. Todos estos casos seran tratados con detallemas adelante, pero vale la pena recalcar que en general, para un tensor generico el orden de la “entradas” o“puestos” si importa pero no necesariamente se comporta como los casos resenados anteriormente.
Borra
dor Pre
limin
ar
Obviamente las formas pueden ser representadas por tensores ya que son funcionales lineales de vectores,es decir:
Un vector es un tensor del tipo
(10
)⇒ T
〈a|↓• ∈ C.
los vectores constituyen un caso especial de tensores.
Una forma es un tensor del tipo
(01
)⇒ T
|a〉↓ ∈ C.
porque son funcionales lineales para las formas diferenciales.
Un tensor
(mn
)es un funcional lineal que asocia m 1-formas y n vectores en C.
3.2.2. Producto tensorial
Como sera evidente mas adelante, los tensores (simples) pueden provenir del producto tensorial (exterioro directo) de espacios vectoriales. Esto es, dados E1 y E2 dos espacios vectoriales con dimensiones n1 y n2,respectivamente y vectores genericos, |ϕ(1)〉 y |χ(2)〉 pertenecientes a estos espacios vectoriales: |ϕ(1)〉 ∈ E1
y |χ(2)〉 ∈ E2. Definiremos el producto tensorial (exterior o directo) de espacios vectoriales, E = E1⊗E2, si
a cada par de vectores |ϕ(1)〉 y |χ(2)〉 le asociamos un tensor tipo
(20
)y si se cumple que
|ϕ(1)χ(2)〉 = |ϕ(1)〉 ⊗ |χ(2)〉 = T
〈ζ(1)|↓• ,
〈ξ(2)|↓•
= 〈ζ(1) |ϕ(1)〉 〈ξ(2) |χ(2)〉 ∈ C
y si ademas se cumplen las siguientes propiedades:
1. La suma entre tensores de E viene definida como
|ϕ(1)χ(2)〉+ |ζ(1)ξ(2)〉 = |ϕ(1)〉 ⊗ |χ(2)〉+ |ζ(1)〉 ⊗ |ξ(2)〉= |ϕ(1) + ζ(1)〉 ⊗ |χ(2) + ξ(2)〉
2. El producto tensorial es lineal respecto a la multiplicacion con numeros reales λ y µ
[|λϕ(1)〉]⊗ |χ(2)〉 = [λ |ϕ(1)〉]⊗ |χ(2)〉 = λ [|ϕ(1)〉 ⊗ |χ(2)〉] = λ |ϕ(1)χ(2)〉|ϕ(1)〉 ⊗ [|µχ(2)〉] = |ϕ(1)〉 ⊗ [µ |χ(2)〉] = µ [|ϕ(1)〉 ⊗ |χ(2)〉] = µ |ϕ(1)χ(2)〉
3. El producto tensorial es distributivo respecto a la suma:
|ϕ(1)〉 ⊗ [|χ1(2)〉+ |χ2(2)〉] = |ϕ(1)〉 ⊗ |χ1(2)〉+ |ϕ(1)〉 ⊗ |χ2(2)〉[|ϕ1(1)〉+ |ϕ2(1)〉]⊗ |χ(2)〉 = |ϕ1(1)〉 ⊗ |χ(2)〉+ |ϕ2(1)〉 ⊗ |χ(2)〉
Notese que los ındices (1) y (2) denotan la pertenencia al espacio respectivo.
Es facil convencerse que los tensores |ϕ(1)χ(2)〉 ∈ E = E1 ⊗E2 forman un espacio vectorial y la demos-tracion se basa en comprobar los axiomas o propiedades de los espacios vectoriales tal y como lo describimosen la Seccion 2.1.3:
Borra
dor Pre
limin
ar
1. La operacion suma es cerrada en V : ∀ |vi〉 , |vj〉 ∈ V⇒|vk〉 = |vi〉 |vj〉 ∈ VEsto se traduce en demostrar que sumados dos tensores |ϕ(1)χ(2)〉 , y |ζ(1)ξ(2)〉 ∈ E el tensor sumatambien pertenece a E, con a y b pertenecientes al campo del espacio vectorial
a |ϕ(1)χ(2)〉+ b |ζ(1)ξ(2)〉 = |aϕ(1) + ζ(1)〉 ⊗ |χ(2) + bξ(2)〉
y esto se cumple siempre ya que, el producto tensorial es lineal respecto a la multiplicacion con numerosreales y por ser E1 y E2 espacios vectoriales se cumple
|aϕ(1) + ζ(1)〉 = a |ϕ(1)〉+ |ζ(1)〉 ∈ E1
|ϕ(2) + bζ(2)〉 = |ϕ(2)〉+ b |ζ(2)〉 ∈ E2
=⇒ |ϕ(1) + ζ(1)〉 ⊗ |χ(2) + ξ(2)〉 ∈ E2
2. La operacion suma es conmutativa y asociativaConmutativa ∀ |vi〉 , |vj〉 ∈ V⇒|vi〉 |vj〉 = |vj〉 |vi〉Esta primera es clara de la definicion de suma
|ϕ(1)χ(2)〉+ |ζ(1)ξ(2)〉 = |ϕ(1) + ζ(1)〉 ⊗ |χ(2) + ξ(2)〉
|ζ(1)ξ(2)〉+ |ϕ(1)χ(2)〉 = |ζ(1) + ϕ(1)〉 ⊗ |ξ(2) + χ(2)〉
por ser E1 y E2 dos espacios vectoriales∀ |vi〉 , |vj〉 , |vk〉 ∈ V ⇒ (|vi〉 |vj〉) |vk〉 = |vj〉 (|vi〉 |vk〉)una vez mas, esto se traduce en:
(|ϕ(1)χ(2)〉+ |ζ(1)ξ(2)〉) + |κ(1)κ(2)〉 = |ϕ(1)χ(2)〉+ (|ζ(1)ξ(2)〉+ |κ(1)κ(2)〉)
con lo cual, por la definicion de suma la expresion anterior queda como
(|ϕ(1) + ζ(1)〉 ⊗ |ξ(2) + χ(2)〉) + |κ(1)κ(2)〉 = |ϕ(1)χ(2)〉+ (|ζ(1) + κ(1)〉 ⊗ |ξ(2) + κ(2)〉)
|(ϕ(1) + ζ(1)) + κ(1)〉 ⊗ |(ξ(2) + χ(2)) + κ(2)〉 = |ϕ(1) + (ζ(1) + κ(1))〉 ⊗ |ξ(2) + (χ(2) + κ(2))〉
3. Existe un unico elemento neutro: ∃ |0〉 / |0〉 |vj〉 = |vj〉 |0〉 = |vj〉 ∀ |vj〉 ∈ VEs decir,
|ϕ(1)χ(2)〉+ |0(1)0(2)〉 = |ϕ(1) + 0(1)〉 ⊗ |χ(2) + 0(2)〉 = |ϕ(1)〉 ⊗ |χ(2)〉 = |ϕ(1)χ(2)〉
4. Existe un elemento simetrico para cada elemento de V :∀ |vj〉 ∈ V ∃ |−vj〉 / |vj〉 |−vj〉 = |0〉 ⇒
|ϕ(1)χ(2)〉 − |ϕ(1)χ(2)〉 = |ϕ(1)− ϕ(1)〉 ⊗ |χ(2)− χ(2)〉 = |0(1)〉 ⊗ |0(2)〉 = |0(1)0(2)〉
5. α (β |vi〉) = (αβ) |vi〉 ⇒
α (β |ϕ(1)χ(2)〉) = α (|βχ(2)〉 ⊗ |ϕ(1)〉) = |αβχ(2)〉 ⊗ |ϕ(1)〉= (αβ) |χ(2)〉 ⊗ |ϕ(1)〉 = (αβ) |ϕ(1)χ(2)〉
Borra
dor Pre
limin
ar
6. (α+ β) |vi〉 = α |vi〉+ β |vi〉 ⇒
(α+ β) |ϕ(1)χ(2)〉 = |ϕ(1)〉 ⊗ |(α+ β)χ(2)〉 = |ϕ(1)〉 ⊗ |αχ(2) + βχ(2)〉= |ϕ(1)〉 ⊗ [(α |χ(2)〉+ β |χ(2)〉)]= α |ϕ(1)〉 ⊗ |χ(2)〉+ β |ϕ(1)〉 ⊗ |χ(2)〉
7. α (|vi〉 |vj〉) = α |vi〉 α |vj〉 ⇒
α (|ϕ(1)χ(2)〉+ |ζ(1)ξ(2)〉) = α (|ϕ(1) + ζ(1)〉 ⊗ |ξ(2) + χ(2)〉)= |α (ϕ(1) + ζ(1))〉 ⊗ |ξ(2) + χ(2)〉= |αϕ(1) + αζ(1)〉 ⊗ |ξ(2) + χ(2)〉= (|αϕ(1)χ(2)〉+ |αζ(1)ξ(2)〉)= α |ϕ(1)χ(2)〉+ α |ζ(1)ξ(2)〉
Equivalentemente, podemos construir un producto tensorial entre espacios de formas diferenciales. SiE∗1 y E∗2 son dos espacios vectoriales duales a E1 y E2, con dimensiones n1 y n2, respectivamente. A estosespacios pertenecen las formas diferenciales genericas 〈ζ(1)| ∈ E∗1 y 〈ξ(2)| ∈ E∗2. Definiremos el productotensorial de espacios vectoriales duales, E∗= E∗1 ⊗ E∗2, si a cada par de formas diferenciales 〈ζ(1)| ∈ E∗1 y
〈ξ(2)| ∈ E∗2 le asociamos un tensor tipo
(02
). Esto es
〈ζ(1)ξ(2)| = 〈ζ(1)| ⊗ 〈ξ(2)|
3.2.3. La tentacion del producto interno
A partir de las definiciones de productos internos en E1 y E2, uno puede verse tentado a definir unproducto interno de la siguiente forma
〈ϕ(1)χ(2) |ϕ(1)χ(2)〉 = 〈ϕ(1) |ϕ(1)〉 · 〈χ(2) |χ(2)〉 .
Mostraremos, sin embargo, que NO es una buena definicion de producto interno, y para ello debemos de-mostrar que se satisfacen los axiomas o propiedades del producto interno que expusimos en la Seccion 2.2.3.
Para facilitar la lectura repetiremos aquı las propiedades que definen el producto interno (expuestas enla Seccion 2.2.3) y haremos las “adaptaciones” del caso son:
1. 〈x| x〉 ∈ R ∧ 〈x| x〉 ≥ 0 ∀ |x〉 ∈ V si 〈x| x〉 = 0⇒ |x〉 ≡ |0〉Esto es:
〈ϕ(1)χ(2) |ϕ(1)χ(2)〉 = 〈ϕ(1) |ϕ(1)〉 · 〈χ(2) |χ(2)〉
como 〈ϕ(1) |ϕ(1)〉 y 〈χ(2) |χ(2)〉 son buenas definiciones de producto interno tendremos que
〈ϕ(1) |ϕ(1)〉 ≥ 0
〈χ(2) |χ(2)〉 ≥ 0
⇒ 〈ϕ(1)χ(2) |ϕ(1)χ(2)〉 ≥ 0
Aquı vale la pena mencionar algunos puntos sutiles sobre la segunda parte de la propiedad a demostrar:
Borra
dor Pre
limin
ar
si 〈x| x〉 = 0⇒ |x〉 ≡ |0〉 lo cual para este caso se traducen en
〈ϕ(1)χ(2) |ϕ(1)χ(2)〉 = 〈ϕ(1) |ϕ(1)〉 · 〈χ(2) |χ(2)〉 = 0
〈ϕ(1) |ϕ(1)〉 · 〈χ(2) |χ(2)〉 = 0⇒
〈ϕ(1) |ϕ(1)〉 = 0
〈χ(2) |χ(2)〉 6= 0
⇒ |ϕ(1)〉 = |0(1)〉
〈ϕ(1) |ϕ(1)〉 6= 0
〈χ(2) |χ(2)〉 = 0
⇒ |χ(1)〉 = |0(1)〉
〈ϕ(1) |ϕ(1)〉 = 0
〈χ(2) |χ(2)〉 = 0
⇒ |ϕ(1)〉 = |0(1)〉
|χ(1)〉 = |0(1)〉
definitivamente, habrıa que restringir los posibles vectores que intervienen en el producto tensorial, demodo que no fuera posible vectores del tipo
|ϕ(1)0(2)〉 ≡ |ϕ(1)〉 ⊗ |0(2)〉 o |0(1)χ(2)〉 ≡ |0(1)〉 ⊗ |χ(2)〉
solo ası se cumple la propiedad mencionada.
2. 〈x| y〉 = 〈y| x〉∗ ∀ |x〉 , |y〉 ∈ VEsto puede ser demostrado facilmente como sigue
〈ϕ(1)χ(2) |ϕ(1)χ(2)〉 = 〈ϕ(1) |ϕ(1)〉 · 〈χ(2) |χ(2)〉= 〈ϕ(1) |ϕ(1)〉∗ · 〈χ(2) |χ(2)〉∗
= (〈ϕ(1) |ϕ(1)〉 · 〈χ(2) |χ(2)〉)∗
= 〈ϕ(1)χ(2) |ϕ(1)χ(2)〉∗
3. 〈x| y + z〉 = 〈x| y〉+ 〈x| z〉 ∧ 〈x+ z| y〉 = 〈x| y〉+ 〈z| y〉 ∀ |x〉 , |y〉 , |z〉 ∈ VPartimos del lado derecho de la primera de las igualdades anteriores:
〈ϕ(1)χ(2)| [|ϕ(1)χ(2)〉+ |ζ(1)ξ(2)〉] = 〈ϕ(1)χ(2)| [|ϕ(1) + ζ(1)〉 ⊗ |ξ(2) + χ(2)〉]= 〈ϕ(1) |ϕ(1) + ζ(1)〉 · 〈χ(2) |ξ(2) + χ(2)〉
y otra vez, como 〈ϕ(1) |ϕ(1)〉 y 〈χ(2) |χ(2)〉 son buenas definiciones de producto interno tendremosque:
〈ϕ(1) |ϕ(1) + ζ(1)〉 = 〈ϕ(1) |ϕ(1)〉+ 〈ϕ(1) |ζ(1)〉〈χ(2) |ξ(2) + χ(2)〉 = 〈χ(2) |ξ(2)〉+ 〈χ(2) |χ(2)〉
y al multiplicar 〈χ(2) |ξ(2) + χ(2)〉 por 〈ϕ(1) |ϕ(1) + ζ(1)〉 surgiran cuatro sumandos
〈ϕ(1) |ϕ(1)〉 〈χ(2) |ξ(2)〉+〈ϕ(1) |ϕ(1)〉 〈χ(2) |χ(2)〉+〈ϕ(1) |ζ(1)〉 〈χ(2) |ξ(2)〉+〈ϕ(1) |ζ(1)〉 〈χ(2) |χ(2)〉
lo cual contrasta con el lado izquierdo al utilizar la definicion dos veces que tienen dos sumandos
〈ϕ(1)χ(2) |ϕ(1)χ(2)〉+ 〈ϕ(1)χ(2) |ζ(1)ξ(2)〉 = 〈ϕ(1) |ϕ(1)〉 · 〈χ(2) |χ(2)〉+ 〈ϕ(1) |ζ(1)〉 · 〈χ(2) |ξ(2)〉
por lo cual NO se cumple esta propiedad y no hay forma de enmendarla.
Borra
dor Pre
limin
ar
3.2.4. Bases para un producto tensorial
Si |ui(1)〉 y |vi(2)〉 son, respectivamente, bases discretas para E1 y E2 entonces podremos construirel tensor
|ui(1)vj(2)〉 = |ui(1)〉 ⊗ |vj(2)〉 ∈ E
el cual funcionara como una base para E y, por lo tanto, podremos construir un tensor generico de E
|ϕ(1)χ(2)〉 = |ϕ(1)〉 ⊗ |χ(2)〉 = ϕiχj |ui(1)vj(2)〉
donde ϕi y χj son las componentes de |ϕ(1)〉 y |χ(2)〉 en sus respectivas bases. En otras palabras, lascomponentes de un tensor en E corresponden a la multiplicacion de las componentes de los vectores en E1
y E2. Recuerde que estamos utilizando la convencion de Einstein de suma tacita en ındices covariantes ycontravariantes, en la cual ck |vk〉 ≡
∑nk=1 c
k |vk〉 .Es importante senalar que si bien un tensor generico |Ψ〉 ∈ E siempre se puede expandir en la base
|ui(1)vj(2)〉 no es cierto que todo tensor de E provenga del producto tensorial de E1 y E2. Es decir, E tienemas tensores de los que provienen el producto tensorial. Esta afirmacion puede intuirse del hecho que si|Ψ〉 ∈ E entonces
|Ψ〉 = ci,j |ui(1)vj(2)〉
por ser |ui(1)vj(2)〉 base para E. Es claro que dados dos numeros α1 y α2 habra ci,j que no provienen dela multiplicacion de α1α2.
3.2.5. Tensores, sus componentes y sus contracciones
Componentes de un tensor
Denominaremos componentes de un tensor, aquellos numeros que surgen de incorporar bases de formasdiferenciales y vectores. Ası, si |ui(1)〉 , |vj(2)〉 , |tk(3)〉 y 〈xm(1)| , 〈yn(2)| son bases para los vectores y
las formas, respectivamente, las componentes de un tensor
(23
)seran
Smnijk = S
|ui(1)〉↓ ,
|vj(2)〉↓ ,
|tk(3)〉↓ ;
〈xm(1)|↓• ,
〈yn(2)|↓•
.Claramente, esta definicion de componentes contiene a las componentes ci,j de aquellos espacios tensorialesgenerados por el producto tensorial. Si consideramos un tensor como resultado de un producto tensorial yconsideramos las bases |ui(1)〉 , 〈xm(1)|, sus componentes se pueden expresar ϕm(1)χi(1), vale decir,(
11
)⇐⇒ |ϕ(1)〉 ⊗ 〈∆(1)| ⇒ 〈xm(1) |ϕ(1)〉 ⊗ 〈∆(1)| ui(1)〉 ⇒ ϕm(1)δi(1)
Combinaciones lineales de tensores
Es claro que podremos sumar (componentes) de tensores como lo hemos hecho con la suma de (compo-nentes) de vectores
a + b = (ax + bx) i + (ay + by) j + (az + bz) k =(a1 + b1
)i +(a2 + b2
)j +(a3 + b3
)k =
(ai + bi
)|ei〉
esto es:
Rijkl = αQijkl + βP ijkl .
Borra
dor Pre
limin
ar
Producto tensorial de tensores
Podemos extender aun mas la idea del producto directo y extenderla para tensores. Ası, para dos tensores
tipo
(20
)y
(21
)se tiene que
|ϕ(1)χ(2)〉 = |ϕ(1)〉 ⊗ |χ(2)〉 = T
〈ζ(1)|↓• ,
〈ξ(2)|↓•
|µ(1)κ(2)Θ(1)〉 = |µ(1)〉 ⊗ |κ(2)〉 ⊗ 〈Θ (1)| = P
|ui(1)〉↓ ;
〈ε(1)|↓• ,
〈φ(2)|↓•
=⇒
|ϕ(1)χ(2)〉 ⊗ |µ(1)κ(2)Θ(1)〉 = |ϕ(1)〉 ⊗ |χ(2)〉 ⊗ |µ(1)〉 ⊗ |κ(2)〉 ⊗ 〈Θ (1)|
= T
〈ζ(1)|↓• ,
〈ξ(2)|↓•
⊗ P|ui(1)〉
↓ ;
〈ε(1)|↓• ,
〈φ(2)|↓•
= R
|ui(1)〉↓ ;
〈ε(1)|↓• ,
〈φ(2)|↓• ,
〈ζ(3)|↓• ,
〈ξ(4)|↓•
Por ejemplo, en componentes:
Sijlmk = QijP lmk .
Contraccion de un tensor
Denominaremos una contraccion cuando sumamos las componentes covariantes y contravariantes, estoes, si tenemos ϕi(1)χi(1) entonces se genera un escalar independiente de la base. Esta situacion sera masevidente cuando definamos metricas y contraccion de tensores. Por analogıa y considerando un caso mas
general, dada una componente Smnijk correspondiente a un tensor
(23
)podremos construir un nuevo tensor(
12
)a partir de una contraccion. Las componentes de este nuevo tensor seran: Smnijk ⇒ Sinijk ≡ Snjk.
Del mismo modo, dadas las componentes de dos tensores, P lm y Qijzk generaran componentes de nuevos
tensores Rlijk = P lmQijmk. Ası(20
)⇒ P lm(
22
)⇒ Qijzk
⇒(
31
)⇒ Rlijk = P lmQijmk
Es claro que si dos tensores derivan de productos tensoriales y si |ui(1)〉 , 〈um(1)| y |vi(2)〉 son bases
Borra
dor Pre
limin
ar
ortonormales para E1 E∗1 y E2, entonces sus productos podran ser expresados como
|γ(1)δ(2)〉 =(γi(1)δj(2)
)︸ ︷︷ ︸P ij
|ui(1)〉 ⊗ |vj(2)〉
|α(1)β(1)〉 =(αl(1)βm(2)
)︸ ︷︷ ︸Qlm
|ul(1)〉 ⊗ 〈um(1)|
⇒
[(αl(1)βm(2)
)|ul(1)〉 ⊗ 〈um(1)|
] [(γi(1)δj(2)
)|ui(1)〉 ⊗ |vj(2)〉
]⇒
αl(1)βm(2)(γi(1)δj(2)
)〈um(1) |ui(1)〉︸ ︷︷ ︸
δmi
|vj(2)〉 ⊗ |ul(1)〉 ⇒
αl(1)βk(2)(γk(1)δj(2)
)|vj(2)〉 ⊗ |ul(1)〉 = P ijQli |vj(2)ul(1)〉 = Rjl |vj(2)ul(1)〉 .
Pero mas aun, si |ui(1)vj(2)〉 = |ui(1)〉⊗ |vj(2)〉 ∈ E es base de E entonces se puede demostrar lo anteriorsin circunscribirnos a tensores cuyas componentes provengan de multiplicacion de las componentes en cadaespacio vectorial.
Simetrizacion de tensores
Un tensor (las componentes) sera simetrico respecto a dos de sus ındices si su permutacion no cambia suvalor:
Sij = Sji; Sij = Sji; Sij···kl···mn = Sij···lk···mn Sij···kl···mn = Sij···lk···mn
y sera antisimetrico si
Aij = −Aji; Aij = −Aji Aij···kl···mn = −Aij···lk···mn Aij···kl···mn = −Aij···lk···mn .
Un tensor de rango 2, viene representado por una matriz. La matriz que representa un tensor de rango2, tendra como maximo 6 componentes distintas
Sij = Sji =
S11 S1
2 S13
S21 S2
2 S23
S31 S3
2 S33
=
S11 S1
2 S13
S12 S2
2 S23
S13 S2
3 S33
mientras que un tensor antisimetrico de segundo orden tendra, cuando maximo, tres componentes con valorabsoluto distintos de cero
Aij = −Aji =
0 A12 A1
3
−A21 0 A2
3
−A31 −A3
2 0
Siempre es posible construir tensores simetricos y antisimetricos a partir de un tensor generico. Esto es:
Sij =1
2(Tij + Tji) ≡ T(ij) ⇐⇒ Sij···kl···mn =
1
2(Tij···kl···mn + Tij···lk···mn) = Tij···(kl)···mn
Aij =1
2(Tij − Tji) ≡ T[ij] ⇐⇒ Aij···kl···mn =
1
2(Tij···kl···mn − Tij···lk···mn) = Tij···[kl]···mn
Borra
dor Pre
limin
ar
Mas aun, es evidente que las componentes de un tensor generico Tij , pueden expresarse como una combinacionde su parte simetrica y antisimetrica
Tij = Sij +Aij .
Obviamente que algo equivalente se puede realizar para componentes contravariantes de tensores.
3.2.6. Tensor metrico, ındices y componentes
Para una base generica, |uj〉, no necesariamente ortogonal, de un espacio vectorial con producto interno,
podemos definir la expresion de un tensor simetrico
(02
)que hemos denominado tensor metrico de la
siguiente manera
g
|ui〉↓ , |uj〉↓, = gij ≡ gji ⇒ gij ≡ gji = g [|ui〉 , |uj〉]
g
〈ui|↓• ,〈uj|↓•
= gij ≡ gij ⇒ gij ≡ gij = (gij)−1
Notese que las gij ≡ gji son las componentes del tensor g[, ]
una vez que la base |uj〉 ha actuado.
La denominacion de tensor metrico, no es gratuita, g[, ]
cumple con todas las propiedades de la
metrica definida para un Espacio Vectorial Euclidiano expuestas en la Seccion 2.2.1.Una vez mas, para facilitar la lectura, transcribiremos a continuacion esas propiedades :
1. g [|ui〉 , |uj〉] = gij ≡ gji ≥ 0 ∀ |uj〉 , y si g [|ui〉 , |uj〉] = 0⇒ i = j
2. g [|ui〉 , |uj〉] = g [|uj〉 , |ui〉] ⇒ gij ≡ gji
3. g [|ui〉 , |uj〉] ≤ g [|ui〉 , |uk〉] + g [|uk〉 , |uj〉]: La desigualdad Triangular
Si la base generica, |ui〉 = |ei〉, es ortonormal, entonces estas propiedades emergen de manera natural
g [, ] ≡ gij⟨ei∣∣⊗ ⟨ej∣∣ ≡ gji ⟨ej∣∣⊗ ⟨ei∣∣ y g [•, •] ≡ gij |ei〉 ⊗ |ξj〉 ≡ gji |ej〉 ⊗ |ei〉 ,
con lo cual sus componentes seran matrices simetricas gij = gji e igualmente gij = gji.En general impondremos que(
gij⟨ui∣∣⊗ ⟨uj∣∣) (gkm |uk〉 ⊗ |um〉) = gijg
km⟨ui |uk〉
⟨uj |um〉 = gijg
kmδikδjm = gijg
ji = δii = n ,
ya que i, j = 1, 2, 3, · · · , n. Con lo cual gij es la matriz inversa de gij . Es decir, hemos definido las componentes
contravariantes del tensor de modo que cumplan con gikgkj = δji
Adicionalmente, tambien es claro que(gij⟨ui∣∣⊗ ⟨uj∣∣) |a〉 = ak
(gij⟨ui∣∣⊗ ⟨uj∣∣) |uk〉 = akgij
⟨uj |uk〉
⟨ui∣∣ = akgijδ
jk
⟨ui∣∣ = akgik
⟨ui∣∣ ≡ ai ⟨ui∣∣ ,
con lo cual ai = akgik. De la misma forma
〈a|(gij |ui〉 ⊗ |uj〉
)= 〈a|
(gij |ui〉 ⊗ |uj〉
)= gij 〈a |ui〉 ⊗ |uj〉 = akg
ij⟨uk |ui〉 |uj〉 = akg
kj |uj〉 ≡ aj |uj〉 ,
Borra
dor Pre
limin
ar
otra vez aj = akgkj , ahora subimos el ındice correspondiente.
De esta manera, el tensor metrico nos permite asociar formas con vectores, componentes covariantes(formas) a componentes contravariantes (vectores) y dicho rapido y mal, pero de uso muy frecuente: eltensor metrico nos permite subir y bajar ındices.
Otra forma de verlo es combinando las propiedades del producto directo de tensores y contraccion deındices
gij |ui〉 ⊗ |uj〉 ⊗ P lmnk |ul〉 ⊗ |um〉 ⊗ |un〉 ⊗⟨uk∣∣ ⇒ gijP lmnk |uj〉 ⊗ P lmnk |ul〉 ⊗ |um〉 ⊗ |un〉 ⊗
⟨uk∣∣ ui〉
gijP lmnk |uj〉 ⊗ |ul〉 ⊗ |um〉 ⊗ |un〉 ·⟨uk∣∣ ui〉︸ ︷︷ ︸δki
= P jlmn |uj〉 ⊗ |ul〉 ⊗ |um〉 ⊗ |un〉
gijP lmni ≡ P jlmn
Adicionalmente, el tensor metrico permite la contraccion de ındices. Ası, dado un producto tensorial dedos vectores que se pueden expresar en una base ortonormal |ei〉
|a, b〉 = |a〉 ⊗ |b〉 = akbm |ek〉 ⊗ |ξm〉⇓(
gij⟨ei∣∣⊗ ⟨ej∣∣) (ak |ek〉 ⊗ bm |em〉) = akbmgijδ
ikδjm = akbmgkm = akbk = 〈b |a〉 = 〈a |b〉 .
Es decir, el producto interno de dos vectores involucra, de manera natural, la metrica del espacio,
〈b |a〉 = 〈a |b〉 = akbk = akbk = akbmgkm = akbmg
km .
Obviamente la norma de un vector, tambien incluira al tensor metrico:
‖|a〉‖2 = 〈a |a〉 = aiaj⟨ei |ej〉 = aia
i = aiaj gij = aiaj gij .
El caso mas emblematico lo constituye la norma de un desplazamiento infinitesimal. Para una basegenerica, |uj〉 no necesariamente ortogonal de un espacio vectorial con producto interno, el desplazamientoinfinitesimal puede expresarse como
(ds)2 ≡ 〈dr |dr〉 =
(dxk
⟨uk∣∣) (dxm |um〉) =
⟨uk |um〉dxk dxm = dxmdxm = gkmdxkdxm .
Si la base |ej〉 es ortogonal (cosa mas o menos comun pero no necesariamente cierta siempre) las matricesgij y gij son diagonales y cumplen que
gii =1
gii⇒ (ds)
2=(h1 dx1
)2+(h2 dx2
)2+(h3 dx3
)2donde hi =
√gii, con i, j = 1, 2, 3 (aquı no hay suma), se denominan los factores de escala.
3.3. Un par de tensores
En esta seccion vamos a ejemplificar la utilizacion de los tensores en varios ambitos de la Fısica, enparticular de la Mecanica. En la proxima seccion 3.3.1 consideraremos el tensor de esfuerzos para describirlas tensiones internas de cuerpos sometidos a fuerzas externas. Haremos el analisis tanto para el caso de doscomo de tres dimensiones. Luego en la Seccion 3.3.2 consideraremos el tensor de inercia y su impacto en ladinamica de cuerpos en movimiento.
Borra
dor Pre
limin
ar
3.3.1. El tensor de esfuerzos (stress)
Figura 3.1: Tensor de Esfuerzos (stress) en 2 dimensiones
El caso 2D
Supongamos un cuerpo que se encuentra en equilibrio y esta sometido a un conjunto de fuerzas externas.Para facilitar las cosas consideremos el efecto de esas fuerzas sobre un plano que contiene a un determinadopunto P (ver figura 3.1 cuadrante Ia) Es decir, vamos a considerar los efectos de las componentes de todaslas fuerzas sobre ese plano y obviaremos el efecto del resto de las componentes.
Como observamos en la figura 3.1 Ib y Ic, si cortamos la superficie en dos lıneas (AB y A′B′), podemosver que el efecto del conjunto de fuerzas externas es distinto sobre P en la direccion perpendicular a cada unade esas lıneas. De hecho, al “cortar” la superficie las fuerzas que aparecen sobre las lıneas AB (y A′B′) eranfuerzas internas y ahora son externas al nuevo cuerpo “cortado”. Ası, estas fuerzas por unidad de longitud1
1En el caso tridimensional, las fuerzas que generan los esfuerzos seran definidas como fuerzas por unidad de area. Ese casolo veremos en la proxima seccion.
Borra
dor Pre
limin
ar
sobre el punto P existen como un conjunto de fuerzas que generan esfuerzos (stress). Por lo tanto, es claroque los esfuerzos sobre un punto dependen del punto, de las fuerzas externas y de la direccion del efecto.
Para irnos aclarando consideremos un elemento de area infinitesimal ds sobre la cual actua un conjuntode fuerzas externas, las cuales las podemos descomponer como normales y tangenciales a la lınea sobre lacual estan aplicadas (ver figura 3.1 cuadrante II). Es costumbre denotar los esfuerzos normales y tangenciales
dA = dxdy ⇒
↑ Y2 = σ2dx −→ X2 = τ2dx
Y3 = τ3dy ↑X3 = σ3dy →
dxdy ds dy
dx
↑ Y1 = τ1dy→ X1 = σ1dy
↑ Y4 = σ4dx → X4 = τ4dx
Consideramos la segunda ley de Newton aplicada a cada diferencial de masa dm y obtendremos
∑Fexti = dm a = 0 ⇒
τ1dy + σ2dx+ τ3dy + σ4dx = 0 = (σ2 + σ4) dx+ (τ1 + τ3) dy ;
σ1dy + τ2dx+ σ3dy + τ4dx = 0 = (τ2 + τ4) dx+ (σ1 + σ3) dy
con lo cualσ2 = −σ4; τ1 = −τ3
τ2 = −τ4 σ1 = −σ3
como se esta en equilibrio, tambien la sumatoria de torques se tendra que anular. Esto es
(τ1dy) dx2 − (τ2dx) dy
2 = 0
(τ3dy) dx2 − (τ4dx) dy
2 = 0
⇒ τ1 = τ2 = τ3 = τ4
entonces, nos damos cuenta que existen solo tres cantidades independientes: dos esfuerzos normales σ1 y σ2;y un esfuerzo tangencial τ1. Adicionalmente notamos que los esfuerzos tienen que ver con la direccion dela fuerza y la superficie sobre la cual va aplicada. Con ello podemos disenar la siguiente notacion para losesfuerzos: σij . El primer ındice indica la direccion de la fuerza y el segundo direccion de la normal de lasuperficie donde esta aplicada. Ası, tal y como muestra la figura (ver figura 3.1 cuadrante II)
σ1 ≡ σxx; −σ4 ≡ σyy; τ2 ≡ σxy ≡ σyxEl cambio de signo se debe a lo incomodo de la notacion: σ4 ≡ σy−y ya que la normal de lado 4 apunta
en la direccion −y. Es importante tambien senalar que los esfuerzos en cualquier punto contenido en eldiferencial de area dA = dxdy deben ser considerado constantes. O, lo que es lo mismo, que podemos hacertender a cero el area del diferencial y con ello asociar los esfuerzos σij a un punto P contenido en dA sobrela cual hemos calculado los esfuerzos.
En esta misma lınea de razonamiento, nos podemos preguntar cual es la expresion de los esfuerzos cuandose miden respecto a una superficie generica, definida por un vector normal n (ver figura 3.1 cuadrante III).Es decir, queremos conocer los esfuerzos medidos en el punto P y en la direccion n, es decir, σnn.
Tendremos que
x→ σxxdy + σxydx = σnnds cos(φ) + σsnds sen(φ) ; y → σyydx+ σyxdy = σnnds sen(φ)− σsnds cos(φ)
Ahora bien, dado que dy = ds cos(φ) y dx = ds sen(φ), entonces podemos expresar
σnn = σxx cos2(φ) + σxy sen(φ) cos(φ) + σyx sen(φ) cos(φ) + σyy sen2(φ)
σsn = σxx sen(φ) cos(φ) + σxy sen2(φ)− σyx cos2(φ)− σyy sen(φ) cos(φ)
Borra
dor Pre
limin
arFigura 3.2: Tensor de Esfuerzos en 3 dimensiones
y si ahora nos damos cuenta que si construimos una matriz
Aij =
(Axn AxsAyn Ays
)=
(cos(φ) sen(φ)sen(φ) − cos(φ)
)entonces podemos expresar
σnn = AxnAxnσxx +AxnA
ynσxy +AynA
xnσyx +AynA
ynσyy ⇒ σnn = AinA
jnσij con i, j = n, s
σsn = AxsAxnσxx +AxsA
ynσxy +AysA
xnσyx +AysA
ynσyy ⇒ σsn = AisA
jnσij con i, j = n, s
es decir,σkl = AikA
jlσij , con i, j, k, l = n, s .
Como veremos mas adelante, cualquier objeto que transforme como σkl = AikAjlσij lo llamaremos tensor
de segundo orden.
El caso 3D
Podemos proceder como en el caso anterior estableciendo las condiciones de equilibrio∑Fexti = 0 y
∑τ exti = 0 ,
con ello construimos un volumen (cubico) diferencial y construimos los esfuerzos normales y tangenciales,los cuales seran
σxxdydz; σyydxdz; σzzdxdy; σxzdxdy; σyzdxdy; σxydxdz;
Siguiendo el mismo proceso que involucra imponer el equilibrio, es facil demostrar que al igual que el casoanterior, el tensor de esfuerzos σij cumple con:
σxz = σzx; σyz = σzy; σxy = σyx .
Borra
dor Pre
limin
ar
Tendremos 6 componentes (tres normales y tres tangenciales) independientes. Es decir, si bien el tensorde esfuerzos σij viene representado por una matriz 3 × 3 y por lo tanto tiene 9 elementos, solo 6 sonindependientes. Vayamos ahora el caso general para un tensor de esfuerzos en un medio elastico. Para elloconstruimos un tetraedro regular tal y como muestra la figura 3.2, y sobre su cara generica asociada a unvector normal n una fuerza F
F = F iii = Fxi + Fyj + Fzk ⇒
Fx = σxndSn
Fy = σyndSn
Fz = σzndSn
⇒ F i = σijnjdS ⇒ F = σ · dS
de esta manera se especifica como la fuerza actua sobre un determinado elemento de superficie. Es claro quela condicion de equilibrio se traduce en∑
Fxi = 0 ⇒ σxndSn −1
2σxxdy dz − 1
2σxydx dz − 1
2σxzdx dy = 0
∑Fyi = 0 ⇒ σyndSn −
1
2σyxdy dz − 1
2σyydx dz − 1
2σyzdx dy = 0
∑Fzi = 0 ⇒ σzndSn −
1
2σzxdy dz − 1
2σzydx dz − 1
2σzzdx dy = 0
Si consideramos la proyeccion de dSn sobre cada uno de los planos del sistema cartesiano tendremos que
dSn cos (i; n) = 12dy dz = dSn Axn
dSn cos (j; n) = 12dx dz = dSn Ayn
dSn cos (k; n) = 12dx dy = dSn Azn
⇒ σxn = σxxAxn + σxyA
yn + σxzA
zn
y equivalentemente
σyn = σyxAxn + σyyA
yn + σyzA
zn; y σzn = σzxA
xn + σzyA
yn + σzzA
zn ,
las cuales se conocen como las relaciones de Cauchy, y representan los esfuerzos sobre la superficie con normaln.
Ahora bien, dado que F = σ · dS es una relacion vectorial podemos proyectar en la direccion um
um · F = um · (σ · dS) ⇒ Fm = σmn dSn =(σmi A
in
)dSn =
(σmi A
in
)dSn
σmndSn =(σmiA
in
)dSn ⇒ σmndSn =
(σkiA
kmA
in
)dSn con i, j = x, y, z
Una vez mas vemos que transforma como un tensor.
3.3.2. El Tensor de inercia
Consideremos el caso de un sistema de n partıculas. La cantidad de movimiento angular para este sistemavendra dada por
L =∑i
m(i)
(r(i) × v(i)
)
Borra
dor Pre
limin
ar
donde hemos indicado que la i−esima partıcula que esta en la posicion r(i) tiene una velocidad v(i). Silas distancias entre las partıculas y entre las partıculas y el origen de coordenadas es constante podremosexpresar la velocidad de cada una de ellas como
v(i) = ω × r(i)
(¿por que?). Donde ω es la velocidad angular instantanea del sistema. Entonces tendremos que
L =∑i
m(i)
[r(i) ×
(ω × r(i)
)]=∑i
m(i)
[ω(r(i) · r(i)
)− r(i)
(ω · r(i)
)],
y para cada partıcula se cumple que las componentes de la cantidad de movimiento angular seran
Lk =∑i
m(i)
[ωk(rm(i)r(i)m
)− rk(i)
(ωmr(i)m
)].
Si vemos que ωk(i) = δkl ωl(i) entonces
Lk =∑i
m(i)
[δkl ω
l(rm(i)r(i)m
)− rk(i)
(ωmr(i)m
)]= ωl(i)
[∑i
m(i)
(δkl
(rm(i)r(i)m
)− rk(i)
(r(i)l
))]︸ ︷︷ ︸
Ikl
es decirLk = ωl(i)I
kl , donde Ikl =
∑i
m(i)
(δkl
(rm(i)r(i)m
)− rk(i)
(r(i)l
)).
El objeto Ikl se conoce como el tensor de inercia y corresponde a 9 cantidades (a pesar que solo 6 sonindependientes porque es un tensor simetrico)
Ikl =
Ixx Ixy Ixz
Iyx Iyy Iyz
Izx Izy Izz
=
∑im(i)
(y2
(i) + z2(i)
)−∑im(i)
(x(i)y(i)
)−∑im(i)
(x(i)z(i)
)−∑im(i)
(x(i)y(i)
) ∑im(i)
(x2
(i) + z2(i)
)−∑im(i)
(y(i)z(i)
)−∑im(i)
(x(i)z(i)
)−∑im(i)
(y(i)z(i)
) ∑im(i)
(z2
(i) + y2(i)
)
Por ahora, nos contentaremos en suponer que esta construccion es un tensor y lo demostraremos mas
adelante.La ilustracion mas sencilla de que la masa en rotacion se comporta como un tensor y no como un escalar
lo vemos en la rotacion de dos masas iguales: m1 y m2 (con lo cual m1 = m2 = m) unidas por una varillasin masa de longitud l. Si el sistema (masas + varillas) se encuentra girando alrededor su centro de masa yambas masas se encuentran sobre el plano xy, vale decir que la barra sin masa forma un angulo de α = π
2con el eje z, entoces tendremos que
r =l
2cos(θ) i +
l
2sen(θ)j ⇒ v =
dr
dt= − l
2
dθ
dtsen(θ) i +
l
2
dθ
dtcos(θ) j
con lo cual
L = m1 (r1 × v1) +m2 (r2 × v2) = m (r1 × v1) +m ((−r1)× (−v1)) = 2m (r1 × v1) =
(l
2
)2dθ
dtk
ya quem1 = m2 = m; r2 = −r1 y v2 = −v1 .
Borra
dor Pre
limin
ar
Ejercicios
1. En el caso 3D tenemos que si ei define un sistema de coordenadas (dextrogiro) no necesariamenteortogonal, entonces, demuestre que
ei =ej × ek
ej × ek · eii, j, k = 1, 2, 3 y sus permutaciones cıclicas
2. Demuestre quegij = ei · ej
3. Si la base ei es ortogonal, demuestre que
a) gij es diagonal.
b) gii = 1/gii (no hay suma).
c) |ei| = 1/|ei|.
3.4. Repensando los vectores nuevamente
3.4.1. Vectores, covectores y leyes de transformacion
Hemos visto que un determinado vector |a〉 ∈ V puede expresarse en una base ortogonal |ej〉 como:aj |ej〉 donde las aj son las componentes del vector contravariantes en la base que se ha indicado. En general,como es muy largo decir “componentes del vector contravariante” uno se refiere (y nos referiremos de ahoraen adelante) al conjunto
aj
como un vector contravariante obviando la precision de componente, perorealmente las aj son las componentes del vector.
Adicionalmente, en esta etapa pensaremos a las bases como distintos observadores o sistemas de referen-cias. Con ello tendremos (algo que ya sabıamos) que un vector se puede expresar en distintas bases y tendradistintas componentes referidas a esa base
|a〉 = aj |ej〉 = aj |ej〉 .
Ası una misma cantidad fısica vectorial se vera distinta (tendra distintas componentes) desde diferentessistemas de coordenadas. Las distintas “visiones” estan conectadas mediante un transformacion de sistemade referencia como veremos mas adelante.
Igualmente hemos dicho que una forma diferencial 〈b| ∈ V ∗ es susceptible de expresarse en una base⟨ei∣∣ del espacio dual V ∗ como bi
⟨ei∣∣ y, como el espacio esta equipado con un producto interno entonces
〈a |b〉 = 〈b |a〉 =(bi⟨ei∣∣) · (aj |ej〉) = bia
jδij = aibi
Con lo cual avanzamos otra vez en la interpretacion de cantidades fısicas: una cantidad fısica escalar se veraigual (sera invariante) desde distintos sistemas de referencia.
Ademas sabemos que unas y otras componentes se relacionan como⟨ei |a〉 = aj
⟨ei |ej〉 = ajδij = aj
⟨ei |ej〉⟨
ei |a〉 = aj⟨ei |ej〉 = ajδij = aj
⟨ei |ej〉
⇒
ai = Aij a
j
ai = Aijaj
donde claramente⟨ei |ej〉 = Aij ;
⟨ei |ej〉 = Aij y AikA
kj = δij ⇐⇒ Aij =
(Aij)−1
Borra
dor Pre
limin
ar
Diremos entonces que aquellos objetos cuyas componentes transforman como ai = Aij aj o equivalentemente
ai = Aijaj seran vectores, o en un lenguaje un poco mas antiguo, vectores contravariantes. Algunos autores
prefieren utilizar la siguiente notacion para las transformaciones: ai = Aij′aj′ y ai
′= Ai
′
j aj , por lo que
δij = Aik′Ak′
j .Tradicionalmente, e inspirados en la ley de transformacion, la representacion matricial de las componentes
contravariantes de un vector,⟨ei |a〉 = aj , para una base determinada |ej〉 se estructuran en una columna
|a〉 ⇒⟨ei |a〉 con i = 1, 2, 3, · · · , n ⇐⇒
a1
a2
...an
De la misma manera, en el espacio dual, V ∗, las formas diferenciales se podran expresar en termino de
una base de ese espacio vectorial como 〈b| = bi⟨ei∣∣ = bi
⟨ei∣∣. Las bi seran las componentes de las formas
diferenciales o las componentes covariantes de un vector |b〉, o dicho rapidamente un vector covariante ocovector. Al igual que en el caso de las componentes contravariantes las componentes covariantes transformande un sistema de referencia a otro mediante la siguiente ley de transformacion:
〈b |ej〉 = bi⟨ei |ej〉 = biδ
ij = bi
⟨ei |ej〉
〈b |ej〉 = bi⟨ei |ej〉 = biδ
ij = bi
⟨ei |ej〉
⇒
bj = biA
ij
bj = biAij
Otra vez, objetos cuyas componentes transformen como bj = biAij los denominaremos formas diferenciales o
vectores covariantes o covectores y seran representados matricialmente como un arreglo tipo fila
〈b| ⇒ 〈b |ei〉 con i = 1, 2, 3, · · · , n ⇐⇒(b1 b2 · · · bn
)3.4.2. Cartesianas y polares, otra vez
El ejemplo mas simple, y por ello, clasico y emblematico de lo anterior lo constituye las expresiones deun mismo vector en dos sistemas de coordenadas en el plano: Cartesianas |i〉 , |j〉 y polares |ur〉 , |uθ〉.Esto es
|a〉 = ax |i〉+ ax |j〉 = a1 |e1〉+ a2 |e2〉 y |a〉 = ar |ur〉+ aθ |uθ〉 = a1 |e1〉+ a2 |e2〉 .
Al expresar una base en terminos de la otra obtenemos
|ur〉 = cos(θ) |i〉+ sen(θ) |j〉 y |uθ〉 = − sen(θ) |i〉+ cos(θ) |j〉 ,
con lo cual ⟨ei |ej〉 = Aij ⇐⇒ Aij =
(〈i |ur〉 〈i |uθ〉〈j |ur〉 〈j |uθ〉
)≡(
cos(θ) − sen(θ)sen(θ) cos(θ)
)y⟨
ei |ej〉 = Aij ⇐⇒ Aij =
(〈ur |i〉 〈ur |j〉〈uθ |i〉 〈uθ |j〉
)≡(
cos(θ) sen(θ)− sen(θ) cos(θ)
)cumpliendo ademas(
cos(θ) − sen(θ)sen(θ) cos(θ)
)(cos(θ) sen(θ)− sen(θ) cos(θ)
)=
(1 00 1
)⇐⇒ AikA
kj = δij .
Borra
dor Pre
limin
ar
De este modo si
|a〉 = ar |ur〉+ aθ |uθ〉 = a1 |e1〉+ a2 |e2〉 = ax |i〉+ ax |j〉 = a1 |e1〉+ a2 |e2〉
tendremos que
ai = Aijaj ⇐⇒
(araθ
)=
(cos(θ) sen(θ)− sen(θ) cos(θ)
)(axay
)=
(ax cos(θ) + ay sen(θ)−ax sen(θ) + ay cos(θ)
)con lo cual
ar = ax cos(θ) + ay sen(θ) y aθ = −ax sen(θ) + ay cos(θ) .
Del mismo modo
ai = Aij aj ⇐⇒
(axay
)=
(cos(θ) − sen(θ)sen(θ) cos(θ)
)(araθ
)=
(ar cos(θ)− aθ sen(θ)ar sen(θ) + aθ cos(θ)
)y
ax = ar cos(θ)− aθ sen(θ) y ay = ar sen(θ) + aθ cos(θ) .
3.4.3. Repensando las componentes
En general, podemos pensar que las componentes de los vectores pueden ser funciones de las otras.Consideremos el ejemplo anterior con esta vision. Tendremos que un punto en el plano viene representadoen coordenadas cartesianas por dos numeros (x, y) y en coordenadas polares por otros dos numeros (r, θ).Siguiendo el ejemplo anterior un punto P , en el plano lo describimos como
|P 〉 = rP |ur〉 = xP |i〉+ yP |j〉 .
Veamos como estan relacionadas estas dos descripciones, para este caso las ecuaciones de transformacion son
xP = xP (r, θ) = x1 = x1(x1, x2
)yP = yP (r, θ) = x2 = x2
(x1, x2
) ⇐⇒ rP = rP (x, y) = x1 = x1
(x1, x2
)θ = θP (x, y) = x2 = x2
(x1, x2
)y explıcitamente
xP = rP cos(θ) ⇒ x1 = x1 cos(x2)yP = rP sen(θ) ⇒ x2 = x1 sen(x2)
y
rP =√x2P + y2
P ⇒ x1 =
√(x1)
2+ (x2)
2
θ = arctan(yPxP
)⇒ x2 = arctan
(x2
x1
)Es claro que ambas coordenadas estan relacionadas y que se puede invertir la relacion
x1 = x1(x1, x2
)x2 = x2
(x1, x2
) ⇐⇒x1 = x1
(x1, x2
)x2 = x2
(x1, x2
)Si se piden cosas razonables:
que las funciones xi = xi (xm) y xj = xj (xm) sean al menos C2 (funcion y derivada continua)
Borra
dor Pre
limin
ar
que el determinante de la matriz Jacobiana sean finito y distinto de cero, para garantizar que existe lafuncion inversa.
det
(∂xi
(xk)
∂xj
)6= 0.
Mas aun, si
xi = xi(xj(xk))⇒ ∂xi
∂xk=∂xi
∂xj∂xj
∂xk= δik ⇒ dxi =
∂xi
∂xjdxj ,
con lo cual intuimos dos cosas:
1. que las componentes de un vector, deben transformar bajo un cambio de coordenadas como
xi =∂xi
(xk)
∂xjxj .
2. Las matrices jacobianas ∂xi
∂xky ∂xi
∂xkson una la inversa de la otra.
Veamos si es cierto para el caso de vectores en el plano. Para ello calculamos la matriz jacobiana (matrizde derivadas) la cual sera(
∂xi(x1, x2
)∂xj
)=
∂x1(x1,x2)∂x1
∂x1(x1,x2)∂x2
∂x2(x1,x2)∂x1
∂x2(x1,x2)∂x2
=
(cos(x2) −x1 sen(x2)sen(x2) x1 cos(x2)
)
y seguidamente, identificando
xi =∂xi
(x1, x2
)∂xj
xj ⇒(x1
x2
)=
(cos(x2) −x1 sen(x2)sen(x2) x1 cos(x2)
)(x1
0
)Igualmente, si calculamos la inversa de la matriz jacobiana(
∂xi(x1, x2
)∂xj
)−1
=
(cos(x2) sen(x2)− sen(x2)
x1
cos(x2)x1
)=
x1√(x1)2+(x2)2
x2√(x1)2+(x2)2
−x2
(x1)2+(x2)2x1
(x1)2+(x2)2
tendremos (
x1
0
)=
x1√(x1)2+(x2)2
x2√(x1)2+(x2)2
−x2
(x1)2+(x2)2x1
(x1)2+(x2)2
( x1
x2
)⇒ xi =
∂xi(x1, x2
)∂xj
xj .
Es decir
x1 =
√(x1)
2+ (x2)
2 ⇒ r =√x2 + y2 y 0 = 0 .
Consideremos ahora el caso tridimensional en esos mismos dos sistemas de coordenadas: uno cartesiano(x1 = x, x2 = y, x3 = z
)y otro esferico
(x1 = r, x2 = θ, x3 = φ
).
Tal y como hemos supuesto anteriormente el punto P vendra descrito por
|P 〉 = rP |ur〉 = xP |i〉+ yP |j〉+ zP |k〉
Borra
dor Pre
limin
ar
de nuevo
x = x (r, θ, φ) = x1 = x1(x1, x2, x3
)y = y (r, θ, φ) = x2 = x2
(x1, x2, x3
)z = z (r, θ, φ) = x3 = x3
(x1, x2, x3
) ⇐⇒
r = r (x, y, z) = x1 = x1(x1, x2, x3
)θ = θ (x, y, z) = x2 = x2
(x1, x2, x3
)φ = φ (x, y, z) = x3 = x3
(x1, x2, x3
)Las ecuaciones de transformacion seran
xP = rP sen(θ) cos(φ) ⇒ x1 = x1 sen(x2) cos(x3)yP = rP sen(θ) sen(φ) ⇒ x2 = x1 sen(x2) sen(x3)zP = rP cos(θ) ⇒ x3 = x1 cos(x2)
y
rP =√x2P + y2
P + z2P ⇒ x1 =
√(x1)
2+ (x2)
2+ (x3)
2
φ = arctan(yPxP
)⇒ x2 = arctan
(x2
x1
)θ = arctan
(√x2P+y2PzP
)⇒ x3 = arctan
(√(x1)2+(x2)2
x3
),
con lo cual la matriz de las derivadas sera para esta transformacion en particular sera
∂xi(x1, x2, x3
)∂xj
=
sen (θ) cos (φ) −r sen (θ) sen (φ) r cos (θ) cos (φ)sen (θ) sen (φ) r sen (θ) cos (φ) r cos (θ) sen (φ)
cos (θ) 0 −r sen (θ)
es decir
∂xi(x1, x2, x3
)∂xj
=
sen(x2)
cos(x3)−x1 sen
(x2)
sen(x3)
x1 cos(x2)
cos(x3)
sen(x2)
sen(x3)
x1 sen(x2)
cos(x3)
x1 cos(x2)
sen(x3)
cos(x2)
0 −x1 sen(x2)
y su inversa
∂xi(x1, x2, x3
)∂xj
=
sen (θ) cos (φ) sen (θ) sen (φ) cos (θ)
− sen(φ)r sen(θ)
cos(φ)r sen(θ) 0
cos(θ) cos(φ)r
cos(θ) sen(φ)r − sen(θ)
r
o lo que es lo mismo
∂xi(x1, x2, x3
)∂xj
=
x√x2+y2+z2
y√x2+y2+z2
z√x2+y2+z2
−yx2+y2
xx2+y2 0
xz
(x2+y2+z2)√x2+y2
yz
(x2+y2+z2)√x2+y2
−√x2+y2
(x2+y2+z2)
Dejaremos al lector comprobar que, efectivamente,
xi =∂xi
(x1, x2, x3
)∂xj
xj ⇐⇒ xi =∂xi
(x1, x2, x3
)∂xj
xj .
Borra
dor Pre
limin
ar
3.5. Transformaciones, vectores y tensores
En general las afirmaciones anteriores se pueden generalizar considerando que las coordenadas que definenun determinado punto, P, expresado en un sistema de coordenadas particular, son
(x1, x2, · · · , xn
)y las
coordenadas de ese mismo punto P, expresado en otro sistema de coordenadas es(x1, x2, · · · , xn
)ambas
coordenadas estaran relacionadas por
x1 = x1(x1, x2, · · · , xn
)x2 = x2
(x1, x2, · · · , xn
)...
xn = xn(x1, x2, · · · , xn
) ⇐⇒
x1 = x1
(x1, x2, · · · , xn
)x2 = x2
(x1, x2, · · · , xn
)...
xn = xn(x1, x2, · · · , xn
)es decir xi = xi
(xj)⇐⇒ xi = xi
(xj)
con i, j = 1, 2, 3, · · · , n. Otra vez, solo exigiremos (y es bastante)que:
1. las funciones xi = xi (xm) y xj = xj (xm) sean al menos C2 (funcion y derivada continua)
2. que el determinante de la matriz jacobiana sean finito y distinto de cero, esto es
det
(∂xi
(x1, x2
)∂xj
)6= 0 ⇒
∣∣∣∣∣∣∣∣∣∣∣
∂x1
∂x1∂x1
∂x2 · · · ∂x1
∂xn
∂x2
∂x1∂x2
∂x2 · · · ∂x2
∂xn
......
...∂xn
∂x1∂xn
∂x2 · · · ∂xn
∂xn
∣∣∣∣∣∣∣∣∣∣∣6= 0 ⇒ xi = xi (xm) ⇐⇒ xj = xj (xm)
Ahora bien, una vez mas, derivando y utilizando la regla de la cadena
xi = xi(xj (xm)
)⇒ ∂xi
∂xl=∂xi
∂xk∂xk
∂xl= δil ⇒ dxi =
∂xi
∂xkdxk ,
como hemos comprobado para los dos casos particulares estudiados con anterioridad. De ahora en adelantetendremos las siguientes ReDefiniciones:
Un conjunto de cantidadesa1, a2, · · · , an
se denominaran componentes contravariantes de un vector
|a〉 ∈ V en un punto P de coordenadas(x1, x2, · · · , xn
)si
1. dada dos bases ortonormales de vectores coordenados. |e1〉 , |e2〉 , · · · |en〉 y∣∣ˆe1
⟩,∣∣ˆe2
⟩, · · ·
∣∣ˆen⟩se cumple que
|a〉 = ai |ei〉 = ai∣∣ˆei⟩ ⇒ ⟨
ei∣∣ a〉 = ai⟨
ˆei∣∣ a〉 = ai
⇒ ai = aj
⟨ˆei |ej〉
2. o equivalentemente, bajo una transformacion de coordenadas xi = xi(xj)
con i, j = 1, 2, 3, · · · , n.,estas cantidades transforman como
ai =∂xi
∂xkak ⇐⇒ ai =
∂xi
∂xkak con
∂xi
∂xk∂xk
∂xl= δil
y donde las cantidades ∂xi
∂xky ∂xi
∂xkdeberan ser evaluadas en el punto P .
Borra
dor Pre
limin
ar
Un conjunto de cantidades b1, b2, · · · , bn se denominaran componentes covariantes de un vector〈b| ∈ V∗ en un punto P de coordenadas
(x1, x2, · · · , xn
)si
1. dada dos bases de formas⟨
e1∣∣ , ⟨e2
∣∣ , · · · 〈en| y⟨
ˆe1∣∣ , ⟨ˆe2
∣∣ , · · · ⟨ˆen∣∣ se cumple que
〈b| = bi⟨ei∣∣ = bi
⟨ˆei∣∣ ⇒
〈b| ei⟩
= bi
〈b| ˆei⟩
= bi
⇒ bi = bj 〈ej
∣∣ˆei⟩ .2. o equivalentemente, bajo una transformacion de coordenadas xi = xi
(xj)
(con i, j = 1, 2, 3, · · · , n)estas cantidades transforman como
bk =∂xi
∂xkbi ⇐⇒ bk =
∂xi
∂xkbi con
∂xi
∂xk∂xk
∂xl= δil
y donde las cantidades: ∂xi
∂xky ∂xi
∂xkdeberan ser evaluadas en el punto P .
Generalizamos los conceptos anteriores de la siguiente manera. Dado un conjunto bases para de formasdiferenciales 〈xm(1)| , 〈yn(2)| hemos definido las componentes contravariantes de un tensor
T ij = T
〈xi(1)|↓• ,
〈yj(2)|↓•
∈ V ⇐⇒T ij≡T 11, T 12, · · · , T 1n, T 21, T 22, · · · , T 2n, · · · , Tnn
ahora, en esta vision, las componentes contravariantes en un punto P de coordenadas
(x1, x2, · · · , xn
),
seran aquella que bajo una transformacion de coordenadas xi = xi(xj)
(con i, j = 1, 2, 3, · · · , n)transforman como
T ij =∂xi
∂xk∂xj
∂xmT km ⇐⇒ T ij =
∂xi
∂xk∂xj
∂xmT km con
∂xi
∂xk∂xk
∂xl= δil ,
donde ∂xi
∂xky ∂xi
∂xkdeberan ser evaluadas en el punto P . Esta generalizacion nos permite construir el
caso mas general.
Si |ti(1)〉 , |uj(2)〉 , · · · , |vk(m)〉 y〈xe(1)| ,
⟨yf (2)
∣∣ , · · · , 〈zg(n)|
son bases para los vectores y lasformas, respectivamente. Las componentes de un tensor
Tmnijk = T
|ti(1)〉↓ ,
|uj(2)〉↓, , · · · ,
|vk(m)〉↓ ;
〈xe(1)|↓• ,
〈yf (2)|↓• , · · · ,
〈zg(n)|↓•
seran un conjunto de cantidades
T 1···1
1···1 , T2···11···1 , · · · , T ···11···1, T
n···11···1 , T
n···12···1 , · · · , T 1···1
m···1, · · · , T n···nm···m
que sedenominaran las componentes contravariantes y covariantes respectivamente, de un tensor mixto enun punto P de coordenadas
(x1, x2, · · · , xn
)si bajo una transformacion de coordenadas xi = xi
(xj)
(con i, j = 1, 2, 3, · · · , n) estas cantidades transforman como
T i···ke···g =∂xi
∂xp· · · ∂x
j
∂xq∂xa
∂xe· · · ∂x
d
∂xgT p···qa···d ⇐⇒ T i···ke···g =
∂xi
∂xp· · · ∂x
j
∂xq∂xa
∂xe· · · ∂x
d
∂xgT p···qa···d
nuevamente con: ∂xi
∂xk∂xk
∂xl= δil y donde las cantidades ∂xi
∂xky ∂xi
∂xkdeberan ser evaluadas en el punto P .
Borra
dor Pre
limin
ar
3.6. Un ejemplo detallado
Ilustremos ahora las transformaciones de tensores bajo cambios de la base del espacio vectorial. Unavez mas consideremos dos bases de vectores coordenados |e1〉 , |e2〉 , |e3〉 y |e1〉 , |e2〉 , |e3〉 para elespacio vectorial R3 La expresion de un determinado tensor en la base sera
|e1〉 , |e2〉 , |e3〉 ≡ |i〉 , |j〉 , |k〉 ⇒ T ij =
2 1 32 3 41 2 2
Si consideramos una nueva base: |w1〉 , |w2〉 , |w3〉
|w1〉 = |i〉
|w2〉 = |i〉+ |j〉
|w3〉 = |i〉+ |j〉+ |k〉
⇐⇒
⟨w1 |w1〉 = 1
⟨w1 |w2〉 = 1
⟨w1 |w3〉 = 1⟨
w2 |w1〉 = 1⟨w2 |w2〉 = 2
⟨w2 |w3〉 = 2⟨
w3 |w1〉 = 1⟨w3 |w2〉 = 2
⟨w3 |w3〉 = 3
para ese mismo espacio R3 encontraremos una nueva expresion para T ij en esa base.
Encontraremos ahora las expresiones para los siguientes tensores: T ji , Tij y T ij . Notese que esta nuevabase no es ortogonal ,
⟨wk |wi〉 6= δki , con lo cual no se cumplen muchas cosas, entre ellas: |wk〉
⟨wk∣∣ 6=
1.
Para encontrar T ij expresamos los vectores base: |e1〉 = |i〉 , |e2〉 = |j〉 , |e3〉 = |k〉 en terminos de labase |w1〉 , |w2〉 , |w3〉, esto es:
|e1〉 = |i〉 = |w1〉
|e2〉 = |j〉 = |w2〉 − |w1〉
|e3〉 = |k〉 = |w3〉 − |w2〉
Recordamos que un vector generico transforma de la siguiente manera
|a〉 = aj |ej〉 = aj |wj〉
por lo tanto
|a〉 = aj |ej〉 = a1 |w1〉+ a2 |w2〉+ a3 |w3〉 = a1 |e1〉+ a2 (|e1〉+ |e2〉) + a3 (|e1〉+ |e2〉+ |e3〉)
con lo cuala1 |e1〉+ a2 |e2〉+ a3 |e3〉 =
(a1 + a2 + a3
)|e1〉+
(a2 + a3
)|e2〉+ a3 |e3〉
y podemos ver que
a1 = a1 + a2 + a3
a2 = a2 + a3
a3 = a3
⇒ ai =∂xi
∂xkak ⇒
∂x1
∂x1 = 1; ∂x1
∂x2 = 1; ∂x1
∂x3 = 1
∂x2
∂x1 = 0; ∂x2
∂x2 = 1; ∂x2
∂x3 = 1
∂x3
∂x1 = 0; ∂x3
∂x2 = 0; ∂x3
∂x3 = 1
Borra
dor Pre
limin
ar
Es de hacer notar que dado que la base ortonormal |e1〉 , |e2〉 , |e3〉 ≡ |i〉 , |j〉 , |k〉 se tiene que
|a〉 = aj |ej〉 = ai |wi〉 ⇒⟨ei∣∣ a〉 = aj
⟨ei |ej〉 = ajδij = ai = ak
⟨ei |wk〉 ⇒
∂xi
∂xk=⟨ei |wk〉
Este mismo procedimiento se puede aplicar para expresar el vector |a〉 como una combinacion linealde los vectores |wj〉:
|a〉 = aj |ej〉 = aj |ej〉 = a1 |we1〉+ a2 |e2〉+ a3 |e3〉 = a1 |w1〉+ a2 (|w2〉 − |w1〉) + a3 (|w3〉 − |w2〉)
esto es
a1 = a1 − a2
a2 = a2 − a3
a3 = a3
⇒ ak = ai∂xk
∂xi⇒
∂x1
∂x1 = 1; ∂x1
∂x2 = −1; ∂x1
∂x3 = 0
∂x2
∂x1 = 0; ∂x2
∂x2 = 1; ∂x2
∂x3 = −1
∂x3
∂x1 = 0; ∂x3
∂x2 = 0; ∂x3
∂x3 = 1
Notese que, como era de esperarse,
∂xi
∂xk∂xk
∂xj= δij ⇒
1 1 10 1 10 0 1
1 −1 00 1 −10 0 1
=
1 0 00 1 00 0 1
.
Con las expresiones matriciales para las transformaciones, estamos en capacidad de calcular, compo-nente a componente, las representacion del tensor en la nueva base
T km =∂xk
∂xi∂xj
∂xmT ij
con lo cual
T 11 =
∂x1
∂xi∂xj
∂x1T ij
=∂x1
∂x1
(∂x1
∂x1T 1
1 +∂x2
∂x1T 1
2 +∂x3
∂x1T 1
3
)+∂x1
∂x2
(∂x1
∂x1T 2
1 +∂x2
∂x1T 2
2 +∂x3
∂x1T 2
3
)+
∂x1
∂x3
(∂x1
∂x1T 3
1 +∂x2
∂x1T 3
2 +∂x3
∂x1T 3
3
)Es decir
T 11 = 1 ·
(1 T 1
1 + 0 T 12 + 0 T 1
3
)− 1 ·
(1 T 2
1 + 0 T 22 + 0 T 2
3
)+ 0
(1 T 3
1 + 0 T 32 + 0 T 3
3
)= T 1
1 − T 21 = 2− 2 = 0
Del mismo modo
T 12 =
∂x1
∂xi∂xj
∂x2T ij
=∂x1
∂x1
(∂x1
∂x2T 1
1 +∂x2
∂x2T 1
2 +∂x3
∂x2T 1
3
)+∂x1
∂x2
(∂x1
∂x2T 2
1 +∂x2
∂x2T 2
2 +∂x3
∂x2T 2
3
)+
∂x1
∂x3
(∂x1
∂x2T 3
1 +∂x2
∂x2T 3
2 +∂x3
∂x2T 3
3
)
Borra
dor Pre
limin
ar
resultando
T 12 = 1 ·
(1 T 1
1 + 1 T 12 + 0 T 1
3
)− 1 ·
(1 T 2
1 + 1 T 22 + 0 T 2
3
)+ 0
(1 T 3
1 + 1 T 32 + 0 T 1
3
)=
(T 1
1 + T 12
)−(T 2
1 + T 22
)= (2 + 1)− (2 + 3) = −2
Se puede continuar termino a termino o realizar la multiplicacion de las matrices ∂xk
∂xi , Tij y ∂xj
∂xm pro-venientes de la transformacion de componentes de tensores. Vale decir
T km =∂xk
∂xiT ij
∂xj
∂xm⇔
1 −1 00 1 −10 0 1
2 1 32 3 41 2 2
1 1 10 1 10 0 1
=
0 −2 −31 2 41 3 5
Hay que resaltar el especial cuidado que se tuvo en la ubicacion de las matrices para su multiplicacion.
Si bien en la expresion T km = ∂xk
∂xi∂xj
∂xm T ij las cantidades ∂xk
∂xi son numeros y no importa el orden con elcual se multipliquen, cuando se escriben como matrices debe respetarse la “concatenacion interna deındices”. Esto es, cuando querramos expresar T km como una matriz, donde el ındice contravariante kindica filas y el ındice covariante m las columnas, fijamos primero estos ındices y luego respetamos la“concatenacion de ındices” covariantes con los contravariantes. Esta es la convencion para expresar lamultiplicacion de matrices en la notacion de ındices2. Esto es
T km =∂xk
∂xi∂xj
∂xmT ij ⇒ T km =
∂xk
∂xiT ij
∂xj
∂xm
Ahora los objetos ∂xk
∂xi , Tij y ∂xj
∂xm pueden ser sustituidos (en sus puestos correspondientes) por surepresentacion matricial.
Con lo cual hemos encontrado la respresentacion matricial T km de las componentes del tensor T en labase |w1〉 , |w2〉 , |w3〉; T 1
1 T 12 T 1
2
T 21 T 2
2 T 23
T 31 T 3
2 T 33
=
0 −2 −31 2 41 3 5
.
Para encontrar la expresion para Tkm recordamos que Tkm = gknTnm, es decir, requerimos las compo-
nentes covariantes y contravariantes del tensor metrico gkn que genera esta base. Para ello recordamosque para para una base generica, |wj〉, no necesariamente ortogonal, de un espacio vectorial con
producto interno, podemos definir la expresion de un tensor
(02
)que denominaremos tensor metrico
como
gij =∂xm
∂xi∂xn
∂xjgmn ≡ 〈em |wi〉 〈en |wj〉 gmn
Recordemos tambien que la metrica covariante gij de una base ortonormal |e1〉 , |e2〉 , |e3〉 ≡ |i〉 , |j〉 , |k〉es
g11 = 1; g12 = 0; g13 = 0;
g21 = 0; g22 = 1; g23 = 0;
g31 = 0; g32 = 0; g33 = 1.
2Quiza una forma de comprobar si los ındices estan bien concatenados se observa si se “bajan” los ındices contravariantespero se colocan antes que los covariantes. Esto es, T ij → Tij . Ası, la multiplicacion de matrices queda representada de la siguiente
forma: Cij = AikBkj → Cij = AikBkj y aquı es claro que ındices consecutivos estan “concatenados” e indican multiplicacion.
Borra
dor Pre
limin
ar
Con lo cual, para el caso de la base generica no ortonormal |wj〉 tenemos dos formas de calcular lascomponentes covariantes y contravariantes del tensor metrico. La primera es la forma directa
g11 = 〈en |w1〉 〈em |w1〉 gnm =⟨e1 |w1〉
⟨e1 |w1〉+
⟨e2 |w1〉
⟨e2 |w1〉+
⟨e3 |w1〉
⟨e3 |w1〉 =
⟨e1 |w1〉2 = 1
g12 = 〈en |w1〉 〈em |w2〉 gnm =⟨e1 |w1〉
⟨e1 |w2〉+
⟨e2 |w1〉
⟨e2 |w2〉+
⟨e3 |w1〉
⟨e3 |w2〉 =
⟨e1 |w1〉
⟨e1 |w2〉 = 1
g13 = 〈en |w1〉 〈em |w3〉 gnm =⟨e1 |w1〉
⟨e1 |w3〉+
⟨e2 |w1〉
⟨e2 |w3〉+
⟨e3 |w1〉
⟨e3 |w3〉 =
⟨e1 |w1〉
⟨e1 |w3〉 = 1
g21 = 〈en |w2〉 〈em |w1〉 gnm =⟨e1 |w2〉
⟨e1 |w1〉+
⟨e2 |w2〉
⟨e2 |w1〉+
⟨e3 |w2〉
⟨e3 |w1〉 =
⟨e1 |w2〉
⟨e1 |w1〉 = 1
g22 = 〈en |w2〉 〈em |w2〉 gnm =⟨e1 |w2〉
⟨e1 |w2〉+
⟨e2 |w2〉
⟨e2 |w2〉+
⟨e3 |w2〉
⟨e3 |w2〉 ⇒
g22 =⟨e1 |w2〉
⟨e1 |w2〉
⟨e2 |w2〉
⟨e2 |w2〉 = 2
g23 = 〈en |w2〉 〈em |w3〉 gnm =⟨e1 |w2〉
⟨e1 |w3〉+
⟨e2 |w2〉
⟨e2 |w3〉+
⟨e3 |w2〉
⟨e3 |w3〉 ⇒
g23 =⟨e1 |w2〉
⟨e1 |w3〉+
⟨e2 |w2〉
⟨e2 |w3〉 = 2
g31 = 〈en |w3〉 〈em |w1〉 gnm =⟨e1 |w3〉
⟨e1 |w1〉+
⟨e2 |w3〉
⟨e2 |w1〉+
⟨e3 |w3〉
⟨e3 |w1〉 =
⟨e1 |w3〉
⟨e1 |w1〉 = 1
g32 = 〈en |w3〉 〈em |w2〉 gnm =⟨e1 |w3〉
⟨e1 |w2〉+
⟨e2 |w3〉
⟨e2 |w2〉+
⟨e3 |w3〉
⟨e3 |w2〉 ⇒
g32 =⟨e1 |w3〉
⟨e1 |w2〉+
⟨e2 |w3〉
⟨e2 |w2〉 = 2
g33 = 〈en |w3〉 〈em |w3〉 gnm =⟨e1 |w3〉
⟨e1 |w3〉+
⟨e2 |w3〉
⟨e2 |w3〉+
⟨e3 |w3〉
⟨e3 |w3〉 ⇒
g33 =⟨e1 |w3〉
⟨e1 |w3〉+
⟨e2 |w3〉
⟨e2 |w3〉+
⟨e3 |w3〉
⟨e3 |w3〉 = 3
g11 = 1; g12 = 1; g13 = 1;
g21 = 1; g22 = 2; g23 = 2;
g31 = 1 g32 = 2; g33 = 3.
y, consecuentemente podemos “arreglarlo como una matriz”3 de la siguiente forma
gij ≡ gji ⇐⇒
1 1 11 2 21 2 3
⇒ gij ≡ gij = (gij)−1 ⇐⇒
2 −1 0−1 2 −1
0 −1 1
Con lo cual, en terminos “matriciales” tendremos
gij ⇐⇒
1 0 00 1 00 0 1
; gij ⇐⇒
1 0 00 1 00 0 1
; gij ⇐⇒
1 0 00 1 00 0 1
;
y
gkm =∂xi
∂xkgij
∂xj
∂xm⇒
1 0 01 1 01 1 1
1 0 00 1 00 0 1
1 1 10 1 10 0 1
=
1 1 11 2 21 2 3
Notese que para conservar la convencion de ındices y poder representar la multipicacion de matrices,los ındices deben estar consecutivos, por tanto hay que trasponer la represetacion matricial para podermultiplicarlas.
gkm =∂xi
∂xkgij
∂xj
∂xm−→ gkm = Πik gij Πjm −→ gkm = Πki gij Πjm .
3Recordemos que hemos insistido que las matrices representan tensores mixtos
Borra
dor Pre
limin
ar
Finalmente, estamos en capacidad de obtener las representaciones matriciales para los tensores: T ji , Tij , Tij .
T ji = (T ij )T ⇐⇒
0 −2 −31 2 41 3 5
T
=
0 1 1−2 2 3−3 4 5
⇒ T ji
Tkm = gknTnm ⇐⇒
1 1 11 2 21 2 3
0 −2 −31 2 41 3 5
=
2 3 64 8 155 11 20
⇒ Tkm
T kn = Tnmgmk ⇐⇒
0 −2 −31 2 41 3 5
1 1 11 2 21 2 3
=
−5 −10 −137 13 179 17 22
⇒ T km
Antes de pasar a la proxima seccion, quisieramos ejemplificar una forma “rapida y furiosa” (pero sucia)de calcular la metrica generada por una determinada base generica de vectores base. La idea es queviolentando toda nuestra notacion e idea de tensores construimos la metrica a partir de los vectoresbase definiendola como gij = 〈wi |wi〉, de esta manera
g11 = 〈w1 |w1〉 = 〈i |i〉 = 1; g12 = 〈w1 |w2〉 = 〈ji| (|i〉+ |j〉) = 1;
g21 = 〈w2 |w1〉 = (〈i|+ 〈j|) |i〉 = 1; g22 = 〈w2 |w2〉 = (〈i|+ 〈j|) (|i〉+ |j〉) = 2
g31 = 〈w3 |w1〉 = (〈i|+ 〈j|+ 〈k|) |i〉 = 1; g32 = 〈w3 |w2〉 = (〈i|+ 〈j|+ 〈k|) (|i〉+ |j〉) = 2;
yg13 = 〈w1 |w3〉 = 〈i| (|i〉+ |j〉+ |k〉) = 1;
g23 = 〈w2 |w3〉 = (〈i|+ 〈j|) (|i〉+ |j〉+ |k〉) = 2
g33 = 〈w3 |w3〉 = (〈i|+ 〈j|+ 〈k|) (|i〉+ |j〉+ |k〉) = 3
Dejamos al lector, la reflexion si esta forma “rapida de calcular la metrica” a partir de unos vectoresbase es general o, si en su defecto, es una coincidencia unicamente valida para este caso.
3.7. Teorema del cociente
Al igual que existe el producto directo entre tensores, cabe preguntarse si es posible multiplicar una com-ponente de un tensor por otra de otro tensor y el producto: ¿sera un tensor? Existe importantes situacionesfısicas en las cuales es aplicable esta pregunta. Si Tij son las componentes de un tensor de rango 2 y V i las deun vector ¿el producto TijV
i = Bj seran componentes de un vector? La respuesta no es siempre afirmativa, ypuede ser utilizado como un criterio de cuando una componente es la componente de un tensor. Este criteriose denomina el Teorema del Cociente.
La respuesta a esta pregunta surge de la respuesta a una pregunta distinta pero equivalente. Supongamosque nos dan n2 numeros aij y un (una componente de un) vector generico V i, si la cantidad aijV
iV j es un
escalar entonces la parte simetrica a(ij) = 12 (aij + aji) sera un (una componente de) tensor del tipo:
(02
).
La demostracion involucra algunos de las ideas antes expuestas y la haremos para fijar conceptos.
Borra
dor Pre
limin
ar
Dados dos sistemas de coordenadas xi = xi (xm) y xj = xj (xm) (con i, j = 1, 2, 3, · · · , n) se cumple que
aij xixj = ψ = ψ = aij x
ixj donde ψ = ψ constituye un escalar
y por lo tanto, derivando y utilizando la regla de la cadena
xi = xi(xj (xm)
)⇒ ∂xi
∂xl=∂xi
∂xk∂xk
∂xl= δil ,
por lo que
(aij x
ixj − aij xixj)≡(aij − akl
∂xk
∂xi∂xl
∂xj
)xixj = 0 ,
como hay una suma en ij no se puede afirmar que la cantidad del parentesis se anula. Como esta afirma-cion vale para cualquier sistema de coordenadas, seleccionaremos las componentes coordenadas en la basecanonica.
x1 = (1, 0, 0, · · · , 0) ; x2 = (0, 1, 0, · · · , 0) ; · · · · · ·xn = (0, 0, 0, · · · , 1)
con lo cual
a11 − akl∂xk
∂ x1
∂xl
∂x1= 0; a22 − akl
∂xk
∂x2
∂xl
∂x2= 0; · · · · · · ann − akl
∂xk
∂xn∂xl
∂xn= 0 ,
Como siempre podemos hacer a(kl) = 12 (akl + alk) y a[kl] = 1
2 (akl − alk) y separar el tensor
akl = a(kl) + a[kl] ⇒ a(mm) −(a(kl) + a[kl]
) ∂xk
∂xm∂xl
∂xm= 0 ⇒ a(mm) = a(kl)
∂xk
∂xm∂xl
∂xm,
con lo cual se garantiza que la parte simetrica de un tensor transforma como un verdadero tensor una vezque se contrae con un par de vectores.
3.8. Vectores, tensores y espacios pseudo-euclideanos
Hasta este punto ha sido casi estetica la descripcion de formas representadas por bra: 〈a| ≡ ak⟨ek∣∣, en las
cuales sus componentes tienen subındices, mientras que los vectores bases,⟨ek∣∣, deben tener superındices.
Quiza el ejemplo mas emblematico y simple, donde se observa la diferencia entre formas (bras) y vectores(kets) es el caso de los espacios minkowskianos. Estos espacios, tambien llamados pseudoeuclideanos, presen-tan una variante en la definicion de producto interno, de tal forma que: 〈x| x〉 no necesariamente es positivo,y si 〈x| x〉 = 0 no necesariamente implica que |x〉 ≡ |0〉.
La consecuencia inmediata es que la definicion de norma N (|vi〉) ≡ ‖|vi〉‖, que vimos anteriormente, nonecesariamente es positiva. Vale decir que tendremos vectores con norma positiva, ‖|vi〉‖ > 0, pero tambienvectores con norma negativa o cero: ‖|vi〉‖ ≤ 0. Con lo cual la definicion de distancia, entendida como lanorma de la resta de vectores, d (|x〉 , |y〉) ≡ ‖|x〉 − |y〉‖, tampoco sera necesariamente positiva. Esto es, quelas distancias seran negativas, positivas o nulas: d (|x〉 , |y〉) < 0, d (|x〉 , |y〉) = 0 y d (|x〉 , |y〉) > 0.
Si extendemos la nocion de distancia para que albergue las posibilidades de distancias nula y negativas,entonces la definicion del tensor metrico para espacios pseudo-euclideanos debe cambiar tambien.
g [|xi〉 , |xj〉] = gij ≡ gji
< 0= 0> 0
Borra
dor Pre
limin
ar
En resumen
〈x| x〉 =
< 0= 0> 0
⇒ d (|x〉 , |y〉) =
< 0= 0> 0
⇒ g [|xi〉 , |xj〉] =
< 0= 0> 0
Este tipo de espacios luce como un excentricidad mas de los matematicos. Una curiosidad de estudio dever como organizar los conceptos que aprendimos de los espacios euclidianos y extenderlos a otros espacios.Quiza se hubiera quedado ası, como una curiosidad matematica si la Fısica no hubiera sacado partido deestas particularidades para describir el comportamiento de la naturaleza. En la proxima seccion analizaremosel caso de espacios minkowskianos de dimension 4: M4.
3.8.1. Espacios minkowskianos
Consideremos un espacio tetradimensional expandido por una base ortonormal |e0〉 , |e1〉 , |e2〉 , |e3〉. Losvectores |e1〉 , |e2〉 , |e3〉 corresponden con la base canonica de R3.
Este espacio vectorial M4 tendra asociado un espacio dual⟨
e0∣∣ , ⟨e1
∣∣ , ⟨e2∣∣ , ⟨e3
∣∣ a traves de una metrica
ηαβ 〈eα| ⊗⟨eβ∣∣ ≡ ηβα ⟨eβ∣∣⊗ 〈eα| y ηαβ |eα〉 ⊗ |eβ〉 ≡ ηβα |eβ〉 ⊗ |eα〉
con α, β = 0, 1, 2, 3 y donde: η00 = η00 = 1, η11 = η11 = −1, η22 = η22 = −1, η33 = η33 = −1 (con ηαβ = 0para α 6= β), con lo cual se dice que η tiene signo −2.4
Tal y como presentamos en (3.2.6), podemos asociar componentes covariantes y contravariantes a travesde la metrica de la forma(ηαβ 〈eα| ⊗
⟨eβ∣∣) |a〉 = aσ
(ηαβ 〈eα| ⊗
⟨eβ∣∣) |eσ〉 = aσηαβ
⟨eβ |eσ〉 〈eα| = aσηαβδ
βσ 〈eα| = aσηασ 〈eα| ≡ aα 〈eα|
Lo intereante del caso es que
aσησα = aα ⇒ a0 = a0, a1 = −a1, a2 = −a2, a3 = −a3.
Es decir, en este caso, porque la metrica tiene signo −2, entonces bajar los ındices espaciales (µ = i = 1, 2, 3)le cambia de signo a las componentes5. Dicho con mas propiedad, las componentes espaciales contravariantes(µ = i = 1, 2, 3) tienen signos contrarios a las componentes covariantes.
De la misma manera que se expuso anteriormente en (3.2.6)
〈a|(ηαj |eα〉 ⊗ |eβ〉
)= 〈a|
(ηαβ |eα〉 ⊗ |eβ〉
)= ηαβ 〈a |eα〉 ⊗ |ej〉 = aση
αj 〈eσ |eα〉 |eβ〉 = aσησβ |eβ〉 ≡ aβ |eβ〉
y otra vez, aσ = ησαaα, y habrıa cambio de signo cuando se bajan los ındices 1, 2, 3 para la metrica consigno −2 que hemos considerado anteriormente. Del mismo modo se “suben” y se “bajan” ındices paracomponentes de tensores
ηαβP γσεα ≡ P βγσε
Por su parte, el producto interno de dos vectores en un espacio de Minkowski involucra, de maneranatural, la metrica del espacio. Esto es
〈x |y〉 = 〈y |x〉 = xαyα = yαxα = xαyβηαβ = xαyβηαβ = x0y0−x1y1−x2y2−x3y3 = x0y0−x1y1−x2y2−x3y3
4Realmente el signo −2 es una convencion, se puede tambien considerar ηµν de signo +2, con η00 = −1, η11 = +1, η22 = +1,η33 = +1.
5Otra vez, para la metrica con signo −2, el cambio de signo entre componentes covariantes y contravariantes se da para lacomponente, µ = 0
Borra
dor Pre
limin
ar
Una vez mas, la norma de un vector, tambien incluira al tensor metrico:
‖|x〉‖2 = 〈x |x〉 = xαxβ 〈eα |eβ〉 = xαx
α = xαxβ ηαβ = xαxβ ηαβ = x0x0 − x1x1 − x2x2 − x3x3
El caso mas conocido lo constituye la norma de un desplazamiento infinitesimal, en un espacio tetradimen-sional. Para una base generica, |uβ〉 (no necesariamente ortogonal) de un espacio vectorial con productointerno, el desplazamiento infinitesimal puede expresarse como
(ds)2 ≡ 〈dr |dr〉 = (dxα 〈uα|)
(dxβ |uβ〉
)= dxβ dxβ = ηαβ dxαdxβ = dt2 − dx2 ,
con dx2 =(dx1)2
+(dx2)2
+(dx3)2
3.8.2. Un toque de Relatividad Especial
La genialidad de Einstein fue haber entendido que tenıa que incorporar el tiempo como otra coorde-nada mas, vale decir, que los eventos que ocurren en la naturaleza estan etiquetados por cuatro numeros:(t, x, y, z) ≡ (x0, x1, x2, x3). El rapido desarrollo de la comprension de las ideas relativistas, muestra queestaban en el ambiente de la epoca de comienzos de 1900. Una vez mas la simplicidad como prejuicio seimpuso. Solo dos suposiciones estan en el corazon de la Relatividad Especial:
1. El principio de la Relatividad: Esto es que las leyes de la Fısica son identicas en todos los sistemas dereferencias inerciales.
2. La universalidad de la velocidad de la luz en el vacıo: La velocidad de la luz en el vacıo es siempre lamisma, y es independiente de la velocidad de la fuente de luz respecto a un observador en particular.
En terminos matematicos estas dos audaces suposiciones se concretan en una simple suposicion matematica:el producto interno entre dos elementos de este espacio tetradimensional, debe conservarse para una familia devectores base. Luego vendra la asociacion de observadores fısicos -o sistemas de coordenadas- con los miembrosde la familia de vectores base, pero la idea es la misma que planteamos para los espacios euclideanos en 2.2.3:el producto interno -y consecuentemente, la norma de los elementos del espacio vectorial y la distancia entreestos - en el mismo independientemente de la base en la cual expanda el espacio vectorial.
La primera de las interpretaciones es el como representamos los eventos en el espacio-tiempo. Supongamosel caso unidimensional en el espacio, vale decir los eventos ocurren en un punto de la recta real x = x1 y enun tiempo determinado, por lo tanto podremos asociar al evento un vector Evento→ (x0, x1).
A continuacion nos preguntamos que representan las distancias (espacio-temporales) entre estos doseventos. Tal y como vimos, las distancias entre dos elementos de un espacio vectorial puede ser construida apartir de la norma de la resta y la norma a partir del producto interno:
|| |y − x〉 ||2 ≡ 〈y − x |y − x〉
< 0 conexion tipo espacio ⇒ eventos desconectados causalmente= 0 conexion tipo luz ⇒ posible conexion causal a traves de rayos de luz> 0 conexion tipo tiempo ⇒ posible conexion causal
Con esta primera interpretacion de los valores de la norma y la vision tetradimensional, el espacio-tiempo,dividido en pasado, presente y futuro, se puebla de eventos que pueden estar o no relacionados causalmentetal y como muestra la figura 3.3.
La preservacion del producto interno para todos los observadores6 era intuitiva en los espacios euclideanosy, al mantenerla para los pseudo-euclideanos nos traera consecuencias nada intuitivas en nuestra idea intuitiva
6Estamos suponiendo que observadores, sistemas de coordenadas y sistemas de referencia son conceptos equivalentes.
Borra
dor Pre
limin
arFigura 3.3: Cono de luz, espacio-tiempo y eventos
de “realidad”. Para el caso de la formulacion de la Relatividad Especial, anadimos un supuesto mas: lascomponentes del tensor metricos son invariantes bajo transformaciones de coordenadas, esto es
g [|eµ〉 , |eν〉] ≡ g [|eµ〉 , |eν〉] ⇔ ηαβ = ηαβ , con |eµ〉 y |eµ〉
dos bases que se conectan a traves de una transformacion de coordenadas xµ = xµ (xα)⇔ xµ = xµ (xα)Construyamos el tipo de transformacion de coordenadas que mantiene estos dos supuestos:
el producto interno de dos vectores es independiente de la base que expanda el espacio vectorial y
las componentes del tensor metricos son invariantes bajo transformaciones de coordenadas.
Si el producto interno de dos vectores es independiente de la base que expanda el espacio vectorial, tendremos
〈x |y〉 = 〈x |y〉 ⇔ xαyα = xαyα ⇔ xαyβηαβ = xαyβ ηαβ ,
y como lo vimos en 3.5 las componentes de vectores, bajo cambio de coordenadas, transforman como
ai =∂xi
∂xkak ⇒ xαyα = xαyα ⇔ xαyβηαβ =
∂xν
∂xαxα∂xµ
∂xβyβ ηνµ = xαyβ
∂xν
∂xα∂xµ
∂xβηνµ ,
con lo cual concluimos que
ηαβ =∂xν
∂xα∂xµ
∂xβηνµ ≡
∂xν
∂xα∂xµ
∂xβηνµ .
Si derivamos respecto a xγ tendremos que
0 = ηνµ
(∂2xν
∂xα∂xγ∂xµ
∂xβ+∂xν
∂xα∂2xµ
∂xβ∂xγ
).
Como la cantidad dentro del parentesis se anula podemos jugar con esta para descubrir algunas consecuenciasocultas. Es de hacer notar que esa cantidad tiene tres ındices libres y por lo tanto son 64 ecuaciones que se
Borra
dor Pre
limin
ar
anulan. Eso significa que le podemos anadir y sustraer cualesquieras otras con los ındices intercambiados. Su-pongamos que al parentesis anulado le anadimos una con los ındices α y γ intercambiados y, adicionalmente,le sustraemos una con los ındices γ y β intercambiados. Claramente, estamos anadiendo y sustrayendo ceros.
0 = ηνµ
(∂2xν
∂xα∂xγ∂xµ
∂xβ+∂xν
∂xα∂2xµ
∂xβ∂xγ+
∂2xν
∂xγ∂xα∂xµ
∂xβ+∂xν
∂xγ∂2xµ
∂xβ∂xα− ∂2xν
∂xα∂xβ∂xµ
∂xγ− ∂xν
∂xα∂2xµ
∂xγ∂xβ
).
Con este truco, vemos que el ultimo termino anula el segundo y el penultimo el cuarto, de forma y maneraque nos queda
0 = 2ηνµ∂2xν
∂xα∂xγ∂xµ
∂xβ,
Con lo cual la unica posibilidad que nos queda es
0 =∂2xν
∂xα∂xγ⇒ xν = Λνµx
µ + aν con Λνµ y aν constantes .
Estas transformaciones lineales se conocen como las transformaciones (inhomogeneas) de Lorentz o tambienlas transformaciones de Poincare. Estas transformaciones forman grupo y, uno de los posibles subgrupos loconstituye el conjunto de transformaciones propias de Lorentz de la forma
Λ00 = 1, Λi0 = Λ0
j = 0, y Λij = Rij con i, j = 1, 2, 3; y
donde Rij es una matriz de rotacion.Supongamos el caso mas sencillo de este grupo de transformaciones: aν = 0. Explıcitamente hemos
identificado una transformacion de la forma
xα = Λα0x0 + Λα1x
1 + Λα2x2 + Λα3x
3 ,
la cual, por construccion, deja invariante el intervalo tedra dimensional
ds2 = dt2 − dx2 = ηµνdxµdxν con dx = dx0 ı + dx1 + dx3 k y
con ηµν el tensor metrico. Es inmediato demostrar que este tipo de transformaciones deja invariante elintervalo. Primero, notemos que
ηµν = ΛµαΛνβηαβ ⇒ ηµνηνγ = δµγ = ΛµαΛνβη
αβηνγ ⇒ ΛµαΛαγ = δµγ
entonces, como
dxµ = Λµαdxα ⇒ ds2 = ηµνdxµdxν ≡ ηµνΛµαdxαΛνβdxβ = ηαβdxαdxβ = ds2 .
Para construir una de las expresiones mas utilizadas del grupo de Lorentz consideramos la siguiente situacionfısica. Un observador, xµ, ve moverse una partıcula con una velocidad v, mientras que un segundo observador,xµ, la percibe en reposo. Entonces, para el observador que registra la partıcula en reposo dx = dxi = 0
dxµ = Λµαdxα ⇒
dt = Λ00 dt
dxi = Λiαdxα = Λi0 dt con i = 1, 2, 3.
Ahora bien, como
v =dx
dt⇒ vi =
dxi
dt⇒ Λi0 = vi Λ0
0 ,
Borra
dor Pre
limin
ar
y
ηαβ = ΛµαΛνβηµν ⇒ 1 = Λµ0 Λν0ηµν =(Λ0
0
)2 − (Λ10
)2 − (Λ20
)2 − (Λ30
)2,
con una solucion de la forma
Λ00 = γ , Λi0 = γ vi donde γ =
1√1− (v)2
≡ 1√1− vivi
≡ 1√1−
((v1)
2+ (v2)
2+ (v3)
2) ,
los otros terminos Λij no quedan unıvocamente determinados porque esta de por medio la arbitrariedad de
una rotacion Rij . Por ello, una seleccion arbitraria pero razonable de todos los terminos Λij es
Λij = δij + vivjγ − 1
(v)2≡ δij + vivj
γ − 1
vkvk
De esta forma quedan determinados todos los elementos de las transformaciones de Lorentz.Los observadores lorentzianos son los equivalentes a los observadores galileanos en las teorıas newtonianas:
son observadores que se mueven uno respecto al otro con una velocidad constante y, desempenan el mismopapel que los observadores inerciales. Quiza la consecuencia mas impactante de la necesidad de vincularmediciones de distintos observadores lorentzianos a traves de transformaciones de Lorentz, lo ilustra laevolucion distinta del tiempo medido por los diferentes observadores. Un observador en reposo respecto a unreloj, ve avanzar el tiempo con tic separados dt = ∆t ya que su reposo respecto al reloj implica dx = dxi = 0,por lo tanto la separacion espacio temporal sera:
ds2 = dt2 − dx2 = (∆t)2
mientras que un segundo observador tendra el mismo elemento de lınea pero expresado como
ds2 = dt2 − dx2 =(1− v2
)dt ⇒ dt =
∆t√1− v2
y claramente indica que tiempo evoluciona mas lento para relojes en movimento.
3.8.3. Ejercicios
1. Si Aijk es un tensor covariante de orden 3 y Blmno un tensor contravariante de orden 4, pruebe queAijkB
jkno es un tensor mixto de orden 3.
2. En el espacio euclideano 3D y en coordenadas cartesianas no distinguimos entre vectores y uno-formasdebido a que sus componentes transforman de la misma manera. Demuestre que
a) ai = Λijaj ∧ bj = Λijbi son la misma transformacion si la matriz Λij es igual a la transpuesta de
su inversa, es decir, si es ortogonal.
b) Considere dos observadores O → x, y ↔ x1, x2 y O → x, y ↔ x1, x2 y sus sistemas de coordenadasasociados.
1) Considere la siguiente transformacion de coordenadas de Galileo
x1 = V 1t+
√2
2x1 −
√2
2x2 y x2 =
√2
2x1 +
√2
2x2
con V 1 una constante que representa la velocidad relativa entre O−O y t al tiempo, parametrode esta transformacion. A continuacion suponga una partıcula que describe un movimientorespecto a O siguiendo una trayectoria recta. Esto es x2 = αx1, donde α es una constante yencuentre como lo describirıa el observador O respecto a sus coordenadas x1, x2 (3ptos).
Borra
dor Pre
limin
ar
2) Considere ahora la generalizacion de la transformacion de coordenadas anterior
x1 = V 1t+
√2
2x1 −
√2
2x2 y x2 = V 2t+
√2
2x1 +
√2
2x2
con V 1 y V 2 las componentes de una velocidad relativa entre O− O y t al tiempo, parametrode esta transformacion. Muestre que este tipo de transformaciones de coordenadas forman ungrupo (3ptos)
3) Muestre que la norma de cualquier vector queda invariante respecto a una transformacion decoordenadas como la anterior y encuentre la matriz de transformacion (3ptos).
c) Dado un espacio minkowskiano y un observador O que describe los eventos en el espacio-tiemporespecto a un sistema de coordenadas xα donde α = 0, 1, 2 y η = diag[−1, 1, 1, ] el tensormetrico. Considere entonces la siguiente transformacion de coordenadas
x0 = γ(x0 − βx1) x1 = γ(x1 − βx0) y x2 = x2 con γ =1√
1− β2
y β = v/c es la velocidad relativa entre O y O.
1) Otra vez suponga que una partıcula describe una linea recta respecto a O: x2 = αx1, dondeα es una constante. Esta vez encuentre como lo describirıa el otro observador O respecto asus coordenadas x0, x1, x2 (3ptos)
2) Encuentre la expresion para la transformacion de coordenadas, ∂xα
∂xβ= Λαβ (transformacion
de Lorentz) entre estos sistemas relativistas y muestre como la norma, xαxα = xαxβηαβ , decualquier vector se conserva (3ptos)
3) Considere el Tensor de Maxwell definido como
Fµα =
0 Ex Ey
−Ex 0 Bz
−Ey −Bz 0
otra vez con ηµν =
−1 0 00 1 00 0 1
donde ~E = (Ex, Ey) y ~B = (Bx, By) son los campos electricos y magneticos (respectivamente)
medidos por un observador O. Si un observador mide un campo electrico ~E = Ex ı y ninguncampo magnetico. ¿Cuales campos, Fµα medira otro observador que viaja con una velocidad~β = vı, ? (3ptos)
4) Muestre que las ecuaciones de Maxwell
∇× ~B − ∂
∂t~E = 4π ~J , ∇× ~E − ∂
∂t~B = 0 , ∇ · ~B = 0 , y ∇ · ~E = 4πρ
se pueden escribir como
∂
∂xνFµν = Fµν ,ν = 4πJµ donde Jµ = (ρ, J1, J2) y ~J = (J1, J2)
(4ptos)
Borra
dor Pre
limin
ar
3.9. Bases continuas
Haremos una digresion para fijar conceptos y extender algunos de los razonamientos que hemos desa-rrollado hasta aquı. Tal y como vimos anteriormente, la representacion de un vector |F 〉 en un espa-cio vectorial abstracto V puede darse en termino de una base ortonormal de vectores (discreta y finitaBDF = |e1〉 , |e2〉 , |e3〉 , · · · |en〉 o discreta e infinita BDI = |e1〉 , |e2〉 , |e3〉 · · · |en〉 · · · ) de la forma:
|F 〉 =
ci |ei〉 =⟨ei∣∣ F 〉 |ei〉 ⇐ BDF = |e1〉 , |e2〉 , |e3〉 · · · |en〉
ci |ei〉 =⟨ei∣∣ F 〉 |ei〉 ⇐ BDI = |e1〉 , |e2〉 , |e3〉 · · · |en〉 · · ·
donde en ambos casos:ci =
⟨ei∣∣ F 〉 = cj
⟨ei |ej〉 = cj δij
Ahora bien, si estamos tratando el espacio vectorial de funciones de cuadrado integrable L2, definidas en R3
tendremos que
|F 〉 = ci |ei〉 ≡⟨ei∣∣ F 〉 |ei〉 =
∞∑i=0
(∫ ∞−∞
d3r′ξ∗i (r′) f (r′)
)|ei〉
que se reescribe en terminos de funciones como
f (r) =
∞∑i=0
(∫ ∞−∞
d3r′ξ∗i (r′) f (r′)
)ξi (r)
Es claro que se pueden intercambiar los sımbolos de∫
y∑
, por lo cual
f (r) =
∫ ∞−∞
d3r′ f (r′)
[ ∞∑i=0
ξ∗i (r′) ξi (r)
]︸ ︷︷ ︸
G(r′,r)
la funcion G(r′, r) que depende de los argumentos, r′ y r, vive dentro de las integrales y convierte
f (r) =
∫ ∞−∞
d3r′ f (r′) G(r′, r)
Este tipo de funciones (transformadas integrales) se conoce como la funcion distribucion delta de Dirac
f (r) =
∫ ∞−∞
d3r′ f (r′) δ(r′ − r)
Esto sugiere la generalizacion de bases discretas a continua |wα〉 de tal forma que transformamos el ındicede la sumatoria en la variable de una integral
|Ψ〉 =
∫dα c (α) |wα〉
donde
c (β) = 〈wβ |Ψ〉 =
∫dα c (α) 〈wβ |wα〉 =
∫dα c (α) δ (α− β)
donde δ (α− β) es la Delta de Dirac. Ası, los dos conceptos expresados hasta ahora tienen una expresion:
Borra
dor Pre
limin
ar
Propiedad\Base Discreta Continua
Ortogonalidad⟨ui |uj〉 = δij 〈wβ |wα〉 = δ (α− β)
Cierre 1 =∑∞j=0 |uj〉
⟨uj∣∣ 1 =
∫dα |wα〉 〈wα|
Expansion |F 〉 =∑∞i=0 c
i |ui〉 |Ψ〉 =∫
dα c (α) |wα〉Componentes ci =
⟨ui∣∣ F 〉 c (β) = 〈wβ |Ψ〉
Producto Interno 〈G| F 〉 =∑∞i=0 gi∗ fi 〈G| F 〉 =
∫dα g∗ (α) f (α)
Norma 〈F | F 〉 =∑∞i=0 |fi|
2 〈F | F 〉 =∫
dα |f (α)|2
3.9.1. Bases de ondas planas
Como un ejemplo de lo anterior consideraremos la base de las ondas planas. En el capıtulo de transforma-das integrales consideraremos un caso particular de las transformada de Fourier compleja para una funcion,vale decir
F (s) =
∫ ∞−∞
dt ei st f(t) f(t) =
∫ ∞−∞
ds e−i st F (s)
las cuales podemos re-escribir en terminos mas familiares a la comunidad de fısicos como
ψ (x) =1√2π~
∫ ∞−∞
dp ei px/~ ψ (p) ψ (p) =1√2π~
∫ ∞−∞
dx e−i px/~ ψ (x)
Hemos tenido cuidado de incluir los factores de normalizacion adecuados para el caso de las descripcionesen mecanica cuantica. Estas formulas pueden ser re-interpretadas en funcion de los conceptos anteriormenteexpuestos y podemos definir una base continua de la forma
ψ (x) =1√2π~
∫ ∞−∞
dp
(1√2π~
ei px/~)
︸ ︷︷ ︸vp(x)
ψ (p) ψ (p) =1√2π~
∫ ∞−∞
dx
(1√2π~
e−i px/~)
︸ ︷︷ ︸vxp (x)
ψ (x)
por lo cual
ψ (x) =
∫ ∞−∞
dp vp (x) ψ (p) ψ (p) =
∫ ∞−∞
dx v∗p (x) ψ (x)
Diremos que la funcion ψ (x) esta expresada en la base de ondas planas vp (x) = 1√2π~e
i px/~.
Notese:
El ındice p de vp (x) varıa de forma continua entre −∞ a ∞.
Que vp (x) = 1√2π~e
i px/~ /∈ L2, es decir, no pertenece al espacio vectorial de funciones de cuadrado
integrable ya que su norma diverge
〈vp| vp〉 =
∫ ∞−∞
dx |vp (x)|2 =
∫ ∞−∞
dx1
2π~→∞
Que las proyecciones de ψ (x) sobre la base de ondas planas es: ψ (p) = 〈vp| ψ〉
La relacion de cierre para esta base se expresa como
1=
∫dα |vα〉 〈vα|
∫ ∞−∞
dp v∗p (x′) vp (x) =
∫ ∞−∞
dp1
2π~ei p(x
′−x)/~ = δ (x′ − x)
Borra
dor Pre
limin
ar
mientras que de la definicion de producto interno uno obtiene
〈vp′ | vp〉 =
∫ ∞−∞
dx v∗p′ (x) vp (x) =
∫ ∞−∞
dp1
2π~ei x(p
′−p)/~ = δ (p′ − p)
En este mismo orden de ideas podemos construir otra base continua ξr0 (r) a partir de la utilizacion delas propiedades de la delta de Dirac. Esto es
ψ (r) =
∫ ∞−∞
d3r0 ψ (r0) δ(r0 − r)︸ ︷︷ ︸ξr0 (r)
ψ (r0) =
∫ ∞−∞
d3r ψ (r) δ (r− r0)
por lo cual la re-interpretacion es inmediata
ψ (r) =
∫ ∞−∞
d3r0 ψ (r0) ξr0 (r) con ψ (r0) = 〈ξr0 | ψ〉 =
∫ ∞−∞
d3r ξ∗r0 (r) ψ (r)
mas aun la ortogonalidad queda garantizada por la relacion de cierre
〈ξr0 | ξr0〉 =
∫ ∞−∞
d3r0 ξ∗r0 (r) ξr0 (r′) =
∫ ∞−∞
d3r0 δ (r− r0) δ (r′ − r0) = δ (r′ − r)
al igual que
〈ξr0 | ξr′0⟩
=
∫ ∞−∞
d3r ξ∗r0 (r) ξr′0 (r) =
∫ ∞−∞
d3r δ (r− r0) δ (r− r′0) = δ (r′0 − r0)
3.9.2. Las Representaciones |r〉 y |p〉A partir de las bases de ondas planas vp0 (x), y de distribuciones, ξr0 (r), construimos las llamadas
representaciones |r〉 y |p〉 de la forma siguiente. Asociamos
ξr0 (r) |r0〉
vp0 (x) |p0〉
De esta forma dada las bases ξr0 (r) y vp0 (x) para el espacio vectorial V definiremos dos “representacio-nes”, la representacion de coordenadas, |r0〉 , y la representacion de momentos |p0〉 de V, respectivamente.De tal modo que
〈r0| r′0〉 =
∫ ∞−∞
d3r ξ∗r0 (r) ξr′0 (r) = δ (r′0 − r0)
1 =
∫d3r0 |r0〉 〈r0|
〈p0| p′0〉 =
∫ ∞−∞
d3r v∗p′0 (r) vp0 (r) =
∫ ∞−∞
d3r1
2π~e−i r0·p0/~ = δ (p′0 − p0)
1 =
∫d3p0 |p0〉 〈p0|
Borra
dor Pre
limin
ar
Podemos, entonces expresar el producto interno para la representacion de coordenadas como
〈Φ |Ψ〉 = 〈Φ|(∫
d3r0 |r0〉 〈r0|)
︸ ︷︷ ︸1
|Ψ〉 =
∫d3r0 φ
∗(r0)ψ(r0)
y equivalentemente para la representacion de momentos
〈Φ |Ψ〉 = 〈Φ|(∫
d3p0 |p0〉 〈p0|)
︸ ︷︷ ︸1
|Ψ〉 =
∫d3p0 φ
∗(p0)ψ(p0)
por lo cual hemos encontrado que
|Ψ〉 =
∫d3r0 |r0〉 〈r0| Ψ〉 =
∫d3p0 |p0〉 〈p0| Ψ〉
ψ(r0) = 〈r0 |Ψ〉 y ψ(p0) = 〈p0 |Ψ〉
que es la representacion de |Ψ〉 en coordenadas, ψ(r0), y en momentos, ψ(p0).Adicionalmente cuando |Ψ〉 = |p〉 tendremos que
〈r0 |p0〉 = 〈r0|(∫
d3r′0 |r′0〉 〈r′0|)
︸ ︷︷ ︸1
|p0〉 = (2π~)−3/2∫
d3r′0 δ (r′0 − r0) ei~p0·r0
〈r0 |p0〉 = (2π~)−3/2ei~p0·r0
con lo cual ψ(p0) puede considerarse la transformada de Fourier de ψ(r0), y denotaremos de ahora en adelantelas bases |r0〉 ≡ |r〉 y |p0〉 ≡ |p〉.
Estos ındices continuos, r0 y p0, representan tres ındices continuos r (x, y, z) y p (px, py, pz). Laproyeccion de un vector abstracto |Ψ〉 en la representacion |r〉 sera considerada como su expresion en elespacio de coordenadas, igualmente su proyeccion 〈p |Ψ〉 sera su expresion en el espacio de los momentos.Eso nos permitira hacer corresponder los elementos de espacios vectoriales abstractos con, con elementos deun espacio vectorial de funciones. Por lo tanto todas las formulas de proyeccion quedan como
〈r |Ψ〉 = ψ(r) y 〈p |Ψ〉 = ψ(p)
mientras que las relaciones de cierre y ortonormalizacion
〈r| r′〉 = δ (r′ − r) y 1 =
∫d3r |r〉 〈r|
〈p| p〉 = δ (p′ − p) y 1 =
∫d3p |p〉 〈p| ,
por su parte, la relacion de cierre hara corresponder a la expresion de el producto interno de dos vectores,tanto en la representacion de las coordenadas como en la representacion de momentos, en la forma
〈Φ|(∫
d3r |r〉 〈r|)|Ψ〉 =
∫d3r φ∗(r) ψ(r)
m〈Φ |Ψ〉m
〈Φ|(∫
d3p |p〉 〈p|)|Ψ〉 =
∫d3p φ∗(p) ψ(p)
Borra
dor Pre
limin
ar
donde φ∗(p) y ψ(p) son las transformadas de Fourier de φ∗(r) y ψ(r), respectivamente. La afirmacion anteriorqueda evidentemente demostrada del cambio entre las bases |r〉 y |p〉. Esto es
〈r |p〉 = 〈p |r〉∗ = (2π~)−3/2ei~p·r
por lo cual
ψ(r) = 〈r |Ψ〉 = 〈r|(∫
d3p |p〉 〈p|)|Ψ〉 =
∫d3p 〈r |p〉 〈p| Ψ〉 = (2π~)−3/2
∫d3p e
i~p·r ψ(p)
e inversamente
ψ(p) = 〈p |Ψ〉 = 〈p|(∫
d3r |r〉 〈r|)|Ψ〉 =
∫d3r 〈p |r〉 〈r| Ψ〉 = (2π~)−3/2
∫d3r e
−i~ p·rψ(r) .
Borra
dor Pre
limin
ar
3.10. Ejercicios propuestos
1. Dado Fijk un tensor totalmente antisimetrico respecto a sus ındices ijk, demuestre que
rot [Fijk] = ∂mFijk − ∂iFjkm + ∂jFkmi − ∂kFmij ≡∂Fijk∂xm
− ∂Fjkm∂xi
+∂jFkmi∂xj
− ∂kFmij∂xk
rot [Fijk] = Fijk,m − Fjkm,i + Fkmi,j − Fmij,k ≡ ∂mFijk − ∂iFjkm + ∂jFkmi − ∂kFmij
2. El momento de inercia se define como
Iij =
∫V
dvρ (r)(δij(xkxk
)− xixj
)con xi = x, y, z y dv = dx dy dz
a) Muestre que Iij es un tensor
b) Encuentre la representacion matricial para Iij
c) Considere un cubo de lado l y masa total M tal que tres de sus aristas coinciden con un sistemade coordenadas cartesiano. Encuentre el tensor momento de inercia, Iij .
3. Para un sistema de n partıculas rıgidamente unidas, la cantidad de movimiento p y cantidad demovimiento angular L vienen definidas por
pα = mα vα = mα (ω × rα) ≡ εijkωjxk |ei〉
L =∑α
(r× p)α ≡ εijkxkpk |ei〉 ;
con α = 1, 2, · · · , n, |ei〉 = i, j,k y xi = x, y, zMuestre que:
a) L =∑αmα [(r · r)α ω − rα (rα · ω)].
b) Li = Iijωj , donde Iij =
∑αmα
(δij(xkxk
)− xixj
)es el tensor momento de inercia para un sistema
de n partıculas rı gidamente unidas.
4. Dado un tensor generico de segundo orden Tij . Demostrar
a) Que el determinante det [T] ≡ det[T ij]
= T y la traza tr[T ij]
= T ii son invariantes, en otras
palabras, det[T ij]
y tr[T ij]
son escalares respecto a transformaciones de coordenadas.
b) Si definimos la matriz adjunta adj [A], como la traspuesta de la matriz de cofactores
adj [A] = (Ac)T ⇒ adj
[Aij]
=(
(Ac)ij
)T= (Ac)
ji
donde la matriz de cofactores (Ac)ij viene dada por
Aij =
a11 a1
2 a13
a21 a2
2 a23
a31 a3
2 a33
⇒ (Ac)ij =
(Ac)11 (Ac)
12 (Ac)
13
(Ac)21 (Ac)
22 (Ac)
23
(Ac)31 (Ac)
32 (Ac)
33
Borra
dor Pre
limin
ar
y los cofactores son
(Ac)11 = (−1)
1+1
∣∣∣∣ a22 a2
3
a32 a3
3
∣∣∣∣ (Ac)12 = (−1)
1+2
∣∣∣∣ a21 a2
3
a31 a3
3
∣∣∣∣ (Ac)13 = (−1)
1+3
∣∣∣∣ a22 a2
3
a32 a3
3
∣∣∣∣(Ac)
21 = (−1)
2+1
∣∣∣∣ a12 a1
3
a32 a3
3
∣∣∣∣ (Ac)22 = (−1)
2+2
∣∣∣∣ a11 a1
3
a31 a3
3
∣∣∣∣ (Ac)23 = (−1)
2+3
∣∣∣∣ a11 a1
2
a31 a3
2
∣∣∣∣(Ac)
31 = (−1)
3+1
∣∣∣∣ a12 a1
3
a22 a2
3
∣∣∣∣ (Ac)32 = (−1)
3+2
∣∣∣∣ a11 a1
3
a21 a2
3
∣∣∣∣ (Ac)33 = (−1)
3+3
∣∣∣∣ a11 a1
2
a21 a2
2
∣∣∣∣Para la transformacion xi = a xi con a un escalar constante, muestre que
1) τ ij =adj[T ij ]T es un tensor
2) Su determinante det[τ ij]
= τ y su traza tr[τ ij]
= τ ii , tambien seran invariantes.
3) T ij =adj[τ ij ]τ
4) τT = 1
5. Dados dos sistemas de coordenadas ortogonales O (x, y, z) y O (x, y, z), donde el sistema decoordenas O se obtiene a rotando O, π
6 alrededor del eje z, para rotarlo π2 alrededor del eje x con lo
cual los ejes y y z coinciden.
a) Si tenemos los vectoresA = i + 2j + 3k B = i + 2j + 3k
Expreselos en el sistema de coordenadas O (x, y, z).
b) El tensor de esfuerzos (tensiones normales y tangenciales a una determinada superficie) se expresaen el sistema O (x, y, z) como
P ij =
P1 0 P4
0 P2 00 0 P3
¿Cual sera su expresion en el sistema de coordenadas O (x, y, z)?
6. Suponga un sistema de coordenadas ortogonales generalizadas(q1, q2, q3
)las cuales tienen las siguiente
relacion funcional con las coordenadas cartesianas
q1 = x+ y; q2 = x− y; q3 = 2z;
a) Compruebe que el sistema(q1, q2, q3
)conforma un sistema de coordenadas ortogonales
b) Encuentre los vectores base para este sistema de coordenadas
c) Encuentre el tensor metrico y el elemento de volumen en estas coordenadas.
d) Encuentre las expresiones en el sistema(q1, q2, q3
)para los vectores
A = 2j ; B = i + 2j ; C = i + 7j + 3k
Borra
dor Pre
limin
ar
e) Encuentre en el sistema(q1, q2, q3
)la expresion para las siguientes relaciones vectoriales
A×B ; A ·C ; (A×B) ·C
¿Que puede decir si compara esas expresiones en ambos sistemas de coordenadas?
7. La relacion entre las coordenadas cartesianas (x, y) y las coordenadas bipolares (ξ, ζ) viene dada por
x =a sinh(ξ)
cosh(ξ) + cos(ζ); y =
a sin(ζ)
cosh(ξ) + cos(ζ); con a = const
a) Compruebe si los vectores base para las coordenadas bipolares son ortogonales
b) Encuentre el tensor metrico para las coordenadas bipolares
c) Escriba las componentes covariantes y contravariantes para los vectores i, j y i + 2j.
Borra
dor Pre
limin
arBibliografıa
[1] Arfken, G. B.,Weber, H., Weber, H.J. (2000) Mathematical Methods for Physicists 5ta Edicion(Academic Press, Nueva York)
[2] Borisenko, A.I, y Tarapov I.E. (1968) Vector and Tensor Analisys (Dover Publications Inc, NuevaYork)
[3] Dennery, P. y Krzywicki, A. (1995) Mathematics for Physicists (Dover Publications Inc, Nueva York)
[4] Harper, C. (1971) Introduction to Mathematical Physics (Prentice Hall, Englewood Cliff, N.J:)
[5] Hassani, S. (1991) Foundations of Mathematical Physics (Prentice Hall, International Edition,London:
[6] Hauser, W (1971) Introduction to Principles of Electromagnetism (Addison-Wesley Pub CoReading)
[7] Riley, K.F., Hobson, M.P. y Bence, S.J. (2002) Mathematical Methods for Physics and Enginee-ring (Cambridge University Press)
[8] Santalo, L.A (1969) Vectores y Tensores (Editorial Universitaria, Buenos Aires)
[9] Schutz, B. (1980) Geometrical Methods in Mathematical Physics (Cambridge University Press,Londres)
[10] Spiegel, M. (1959) Vector Analysis (Schaums Outline Series, McGraw Hill New York)
146
Borra
dor Pre
limin
arCapıtulo 4Matrices, Determinantes y Autovectores
147
Borra
dor Pre
limin
ar
4.1. Operadores Lineales
Definiremos como operador lineal (o transformaciones lineales) a una operacion que asocia un vector|v〉 ∈ V1 un vector |v′〉 ∈ V2 y que respeta la linealidad, es decir esta funcion de V1→V2 cumple con
|v′〉 = A |v〉 / A [α |v1〉+ β |v2〉] = α A |v1〉+ β A |v2〉 ∀ |v〉 , |v1〉 y |v2〉 ∈ V1
Sencillamente, algo que actue sobre una suma de vectores y que sea equivalente a la suma de sus actuacionessobre los vectores suma.
Ejemplos
1. Las siguientes transformaciones
|x′〉 = T |x〉 → (x′, y′, z′) = T (x, y, z)
claramente son lineales
T (x, y, z) = (x, 2y, 3z)→
T a (x, y, z) + b (m,n, l) = aT (x, y, z)+ bT (m,n, l)T (ax+ bm, ay + bn, az + bl) = a (x, 2y, 3z) + b (m, 2n, 3l)
(ax+ bm, 2 [ay + bn] , 3 [az + bl]) = (ax+ bm, 2 [ay + bn] , 3 [az + bl])
T (x, y, z) = (z, y, x)→
T a (x, y, z) + b (m,n, l) = aT (x, y, z)+ bT (m,n, l)T (ax+ bm, ay + bn, az + bl) = a (z, y, x) + b (l, n,m)
(az + bl, ay + bn, ax+ bm) = (az + bl, ay + bn, ax+ bm)
2. Cosas tan sencillas como multiplicacion por un escalar es una transformacion (u operador) linealT : V→V tal que
T |v〉 = |v′〉 = α |v〉
Claramente,T [a |v〉+ b |w〉] = aT |v〉+ bT |w〉 = aα |v〉+ bα |w〉
Obviamente, si α = 1 tenemos la transformacion identidad que transforma todo vector en sı mismo; siα = 0 tendremos la transformacion cero, vale decir que lleva a todo |v〉 ∈ V a al elemento cero |0〉
3. La definicion de producto interno tambien puede ser vista como una transformacion (operador) linealT : V→ R
T |v〉 = α 〈c |v〉 ≡ α
Otra vez:T [a |v〉+ b |w〉] = 〈c| [a |v〉+ b |w〉] = a 〈c |v〉+ b 〈c |w〉
por lo tanto es lineal. Esto implica que tambien la proyeccion de un determinado |v〉 ∈ V sobre unsubespacio S es un operador lineal, y lo denotaremos como
[|s〉 〈s|] |v〉 = 〈s |v〉 |s〉 = |vs〉 con |s〉 y |vs〉 ∈ S
Borra
dor Pre
limin
ar
esta idea se extiende facil si para un proyector T : Vm→ Sn con m > n de tal modo que para un vector|v〉 ∈ Vm
Pm |v〉 ≡(|ui〉
⟨ui∣∣m
)|v〉 =
⟨ui |v〉m |ui〉 = |vm〉
con 〈ui| base de Sn. Es claro que estamos utilizando la convencion de Einstein para la suma deındices.
4. Las ecuaciones lineales tambien pueden verse como transformaciones lineales. Esto es, considere unatransformacion lineal T : Vn→ Vm. Por lo tanto asociaremos
|y〉 = T |x〉 ⇒(y1, y2, y3, · · · , ym
)= T
(x1, x2, x3, · · · , xn
)a traves de n×m numeros, aij , organizados de la siguiente forma
yi = aij xj con
i = 1, 2, · · · ,mj = 1, 2, · · · , n
una vez mas,
T [α |v〉+ β |w〉] = Tα(v1, v2, v3, · · · , vn
)+ β
(w1, w2, w3, · · · , wn
)= αaij v
j + βaij wj
= T(αv1 + βw1, αv2 + βw2, αv3 + βw3, · · · , αvn + βwn
)= aij (αv + βw)
j= αaij v
j + βaij wj = aij
(αvj + βwj
)5. La derivada es un operador lineal. Ası podemos representar el operador lineal diferenciacion como
|v′〉 = T |v〉 → |y′〉 = D |y〉 → D [y (x)] ≡ d
dx[y (x)] ≡ dy (x)
dx≡ y′ (x)
es claro queD [αf (x) + βg (x)] = αD[f (x)] + βD[g (x)] ≡ αf ′ (x) + βg′ (x)
igualmente podemos asociar un operador diferencial de cualquier orden a una derivada del mismoorden, esto es
|y′′〉 = D2 |y〉 → D2 [y (x)] ≡ d2
dx2[y (x)] ≡ d2y (x)
dx2≡ y′′ (x)
|y′′′〉 = D3 |y〉 → D3 [y (x)] ≡ d3
dx3[y (x)] ≡ d3y (x)
dx3≡ y′′′ (x)
...∣∣∣y(n)⟩
= Dn |y〉 → Dn [y (x)] ≡ dn
dxn[y (x)] ≡ dny (x)
dxn≡ y(n) (x)
6. Igualmente, cualquier ecuacion diferencial lineal es un ejemplo de operador lineal, esto es
y′′ − 3 y′ + 2 y =(D2 − 3D+ 2
)y (x)
es claro que si y (x) = αf (x) + g (x) la linealidad es evidente
(αf (x) + g (x))′′ − 3 (αf (x) + g (x))
′+ 2 (αf (x) + g (x)) = α (f ′′ − 3 f ′ + 2 f) + g′′ − 3 g′ + 2 g
↑↓(D2 − 3D+ 2
)(αf (x) + g (x)) =
(D2 − 3D+ 2
)αf (x) +
(D2 − 3D+ 2
)g (x) .
Borra
dor Pre
limin
ar
7. La integral tambien es un operador lineal
g (x) =
∫ x
a
f(t)dt T f(t)
8. Otro ejemplo tıpico son los operadores de transformaciones integrales
F (s) =
∫ b
a
K (s, t) f(t)dt T f(t)
donde K (s, t) es una funcion conocida de s y t, denominada el nucleo de la transformacion. Si a y bson finitos la transformacion se dira finita, de lo contrario infinita.
Ası, si f(t) = αf1(t) + f2(t) con f1(t) y f2(t) ∈ C∞[a,b] es obvio que
F (s) =
∫ b
a
K (s, t) [αf1(t) + f2(t)] dt T [αf1(t) + f2(t)]
F (s) = α
∫ b
a
K (s, t) f1(t)dt+
∫ b
a
K (s, t) f2(t)dt
⇓F (s) = αF (s1) + F (s2) T [αf1(t) + f2(t)] = αT f1(t)+ T f2(t)
Dependiendo de la seleccion del nucleo y los limites tendremos distintas transformaciones integrales.En Fısica las mas comunes son:
Nombre F (s) = T f(t) f(t) = T−1 F (s)
Laplace F (s) =∫∞
0e−stf(t)dt f(t) = 1
2πi
∫ γ+i∞γ−i∞ estF (s)ds
Fourier de senos y cosenos F (s) =
∫ ∞0
sen(st)cos(st)
f(t)dt f(t) = 2π
∫ ∞0
sen(st)cos(st)
F (s)ds
Fourier compleja F (s) =
∫ ∞−∞
eistf(t)dt f(t) = 2π
∫ ∞−∞
e−istF (s)ds
Hankel F (s) =
∫ ∞0
tJn(st)f(t)dt f(t) =
∫ ∞0
sJn(ts)F (s)ds
Mellin F (s) =
∫ ∞0
ts−1 f(t)dt f(t) = 12πi
∫ γ+i∞γ−i∞ s−t F (s)ds
4.1.1. Espacio Vectorial de Operadores Lineales
Un conjunto de operadores lineales A,B,C · · · : V1→V2 puede constituir un espacio vectorial linealsi se dispone entre ellos de la operacion suma y la multiplicacion por un escalar. Ası, claramente, dadoA,B,C · · · , y definida
(χA+ B) |v〉 ≡ χA |v〉+ B |v〉 /
A [α |v1〉+ β |v2〉] = α A |v1〉+ β A |v2〉
B [α |v1〉+ β |v2〉] = α B |v1〉+ β B |v2〉
Borra
dor Pre
limin
ar
es directo comprobar que
(χA+ B) [α |v1〉+ β |v2〉] = χA [α |v1〉+ β |v2〉] + B [α |v1〉+ β |v2〉]= χ (α A |v1〉+ β A |v2〉) +α B |v1〉+ β B |v2〉= χ (α A |v1〉+α B |v1〉) + β A |v2〉+ β B |v2〉⇓
(χA+ B) [α |v1〉+ β |v2〉] = χA [α |v1〉+ β |v2〉] + B [α |v1〉+ β |v2〉]
Igualmente, se cumple que[(A+ B) + C] = [A+ (B+ C)]
con A+ B+ C lineales en V
[(A+ B) + C] |v〉 = (A+ B) |v〉+ C |v〉 ∀ |v〉 ∈ V1
= A |v〉+ B |v〉+ C |v〉= A |v〉+ (B+ C) |v〉= [A+ (B+ C)] |v〉 ,
del mismo modo se puede comprobar facilmente
A+ B = B+ A
Ahora bien, si definimos la transformacion cero de V1→V2 tal que
|0〉 = O |v〉 ∀ |v〉 ∈ V1
se le asigna a el vector |0〉 ∈ V2 ∀ |v〉 ∈ V1, entonces el operador lineal O sera el elemento neutro respectoa la suma de operadores. Finalmente, el elemento simetrico queda definido por
(−A) |v〉 = −A |v〉 ⇒ (A− A) |v〉 = O |v〉 = |0〉
Con ello queda demostrado que los operadores lineales forman un espacio vectorial el cual de ahora enadelante denominaremos L (V1,V2) .
4.1.2. Composicion de Operadores Lineales
El producto o composicion de dos operadores lineales, A y B se denotara AB y significara que primero seaplica B y al resultado se aplica A. Esto es
AB |v〉 = A (B |v〉) = A |v〉 = |v′〉
La composicion de funciones cumple con las siguientes propiedades
(AB)C = A (BC) ; α (AB) = (αA)B = A (αB) ;
(A1 + A2)B = A1B+ A2B ; A (B1 + B2) = AB1 + AB2
Es decir, que la composicion de operadores es asociativa y distributiva a la suma y que conmuta respecto ala multiplicacion por escalares.
Por otro lado si I es el operador Identidad
I |v〉 = |v〉 ⇒ AI = IA = A .
Borra
dor Pre
limin
ar
En general AB 6= BA, por lo tanto podemos construir el conmutador de estos operadores como
[A,B] = AB− BA / [AB− BA] |v〉 = AB |v〉 − BA |v〉
Es inmediato comprobar algunas de las propiedades mas utiles de los conmutadores:
[A,B] = − [B,A]
[A, (B+ C)] = [A,B] + [A,C]
[A,BC] = [A,B]C+ B [A,C]
0 = [A, [B,C]] + [B, [C,A]] + [C, [A,B]]
Dados dos vectores |v1〉 y |v2〉 definiremos como el elemento de matriz del operador A al producto internode dos vectores
〈v2| (A |v1〉) ≡ A(|v1〉,|v2〉)
es claro que A(|v1〉,|v2〉) sera en general un numero complejo, pero esto lo veremos detalladamente en la seccion4.2, mas adelante.
Ejemplos
1. Potencias de Operadores: Uno de los ejemplos mas utiles en la composicion de operadores loconstituyen las potencias de los operadores, las cuales provienen de la aplicacion consecutiva de unmismo operador,
A0 = I ; A1 = A ; A2 = AA ; A3 = A2A = AAA ; · · ·
Es claro que las potencias de operadores cumplen las propiedades estandares de las potencias denumeros
An+m = AnAm; (An)m
= Anm
Llamaremos operadores nilpotentes de grado n a los operadores An 6= 0 del tipo An |v〉 = |0〉 ∀ |v〉 ∈ V1
y |0〉 ∈ V2. Es decir, un operador que lleva cualquier vector |v〉 al elemento neutro de V2. El ejemplomas notorio es el operador diferencial
Dn∣∣Pn−1
⟩= |0〉
dn
dxnPn−1(x) =
dn
dxn[aix
i]
= 0
con∣∣Pn−1
⟩perteneciente al espacio de polinomios de grado n− 1.
2. Operador Ecuaciones Diferenciales. Si consideramos el espacio de funciones f(x) ∈ C∞[a,b] podemosconstruir un operador diferencial
[a0 + a1D+ a2D2 + · · ·+ anDn
]|f〉 ⇒
(a0 + a1
d
dx+ a2
d2
dx2+ · · ·+ an
dn
dxn
)f(x)
con a0, a1, a2, · · · an coeficientes constantes. De este modo
(D2 − 3D+ 2
)y = (D− 1) (D− 2) y ⇒
(d2
dx2− 3
d
dx+ 2
)y (x) = y′′ − 3 y′ + 2 y
con r = 1 y r = 2 las raıces del polinomio caracterıstico.
Borra
dor Pre
limin
ar
4.1.3. Funciones de Operadores
Basandonos en el primero de los ejemplos anteriores se puede construir un “polinomio” en potencias delos operadores:
Pn(x) = a0 + a1x+ a2x2 + · · ·+ anx
n = aixi
Pn(A) |v〉 =[a0 + a1A+ a2
2A+ · · ·+ annAn]|v〉 =
[aiAi
]|v〉 ∀ |v〉 ∈ V1
Lo anterior nos permite extender la idea de operadores a funciones de operadores, es decir, si nos saltamostodos los detalles de convergencia de la serie anterior, los cuales dependeran de los autovalores de A y desu radio de convergencia; entonces, ası como podemos expresar cualquier funcion F (z) como una serie depotencias de z en un cierto dominio, podremos expresar la funcion de un operador, F (A), como una seriede potencias del operador A, esto es
F (z) = aixi F (A) |v〉 =
[aiAi
]|v〉
Por ejemplo, podemos expresar
eA |v〉 =
[ ∞∑n=0
An
n!
]|v〉 =
[I+ A+
A2!
+ · · ·+ An
n!· · ·]|v〉
En este caso hay que hacer una acotacion, dado que, en general, [A,B] 6= 0 =⇒ eAeB 6= eBeA 6= eA+B. Estaafirmacion se corrobora de manera inmediata al desarrollar las exponenciales
eAeB |v〉 =
[ ∞∑n=0
An
n!
][ ∞∑m=0
Bm
m!
]|v〉 =
[ ∞∑n=0
∞∑m=0
An
n!
Bm
m!
]|v〉
eBeA |v〉 =
[ ∞∑n=0
Bn
n!
][ ∞∑m=0
Am
m!
]|v〉 =
[ ∞∑n=0
∞∑m=0
Bn
n!
Am
m!
]|v〉
eA+B |v〉 =
[ ∞∑n=0
(A+ B)n
n!
]|v〉
solo en el caso que [A,B] = 0 ⇒ eAeB = eBeA = eA+B. La demostracion es inmediata pero requiere expandiry rearreglar las sumatorias arriba expuestas. En general mas adelante, en la seccion 4.4.2 demostraremos condetalle la relacion de Glauber:
eAeB = eA+Be12 [A,B] .
4.1.4. Proyectores
La notacion de Dirac se hace particularmente conveniente para representar proyectores. Hasta ahora,hemos relacionado un funcional lineal, un bra 〈w| del espacio dual V∗, con un vector ket |v〉 del espaciovectorial V a traves de su producto interno 〈w| v〉 ∈ C, el cual es, en general, un numero complejo. Ahorapodemos escribimos esta relacion entre vectores y formas diferenciales de una manera diferente: la relacionentre 〈w| y |v〉 un ket |Ψ〉 o un bra 〈Φ| arbitrarios puede ser
|v〉 〈w| ⇒
|v〉 〈w| Ψ〉〈Φ |v〉 〈w|
Borra
dor Pre
limin
ar
La primera sera la multiplicacion del vector |v〉 por el numero complejo 〈w| Ψ〉, mientras que la segundarelacion sera la multiplicacion de la forma 〈w| por el complejo 〈Φ |v〉. Es imperioso senalar que el orden enla escritura de los vectores y formas es crıtico, solo los numeros complejos λ se pueden mover con impunidada traves de estas relaciones
λ |v〉 = |λv〉 = |v〉λ, λ 〈w| = 〈λw| = 〈w|λ〈w|λ |v〉 = λ 〈w| v〉 = 〈w| v〉λ y A |λv〉 = Aλ |v〉 = λA |v〉 .
Por lo tanto, dado un vector |v〉, podemos construir un proyector P|v〉 a lo largo del vector |v〉
P|v〉 ≡ |v〉 〈v| , con 〈v| v〉 = 1
siempre y cuando este operador lineal cumpla
P|v〉 [α |z1〉+ β |z2〉] = α P|v〉 |z1〉+ β P|v〉 |z2〉|v〉 〈v| [α |z1〉+ β |z2〉] = |v〉 〈v|α |z1〉+ |v〉 〈v|β |z2〉 = α |v〉 〈v |z1〉+ β |v〉 〈v |z2〉
P2|v〉 = P|v〉 ⇐⇒ (|v〉 〈v|) (|v〉 〈v|) = |v〉 〈v|
P|v〉 P|v〉 |z〉 = (|v〉 〈v|) (|v〉 〈v|) |z〉 = |v〉 〈v |v〉︸ ︷︷ ︸1
〈v |z〉 = |v〉 〈v |z〉 = P|v〉 |z〉 .
Ası, el operador P|v〉 actuando sobre el vector |Ψ〉 representara la proyeccion de |Ψ〉 a lo largo de |v〉
P|v〉 |Ψ〉 = |v〉 〈v| Ψ〉 ≡ 〈v| Ψ〉 |v〉 .
Es inmediato construir un proyector de un vector sobre un subespacio Sq. Sea |e1〉 , |e2〉 , |e3〉 , · · · , |eq〉un conjunto ortonormal de vectores que expande Sq. Por lo tanto, definiremos el proyector Pq al proyectorsobre el subespacio Sq de la forma
Pq = |ei〉⟨ei∣∣q
es claro que P2q = Pq:
P2q |v〉 = PqPq |v〉 ⇒ P2
q |v〉 =(|ei〉
⟨ei∣∣q
)(|ej〉
⟨ej∣∣q
)|v〉 = |ei〉
⟨ei |ej〉︸ ︷︷ ︸δij
⟨ej |v〉
P2q |v〉 = |ej〉
⟨ej |v〉 ≡ Pq |v〉 ∀ |v〉 ∈ V .
4.1.5. Espacio Nulo e Imagen
El conjunto de todos los |v〉 ∈ V1 / A |v〉 = |0〉, se denomina espacio nulo, nucleo o kernel (nucleo enaleman) de la transformacion A y lo denotaremos como ℵ (A), en sımbolos diremos que
ℵ (A) = |v〉 | |v〉 ∈ V1 ∧ A |v〉 = |0〉 .
Adicionalmente, ℵ (A) ⊂ V1 sera un subespacio de V1. La prueba de esta afirmacion es inmediata. Dados|v1〉 , |v2〉 ∈ ℵ (A), con A un operador lineal, es claro que
A |v1〉 = |0〉
A |v2〉 = |0〉
⇒ α1 A |v1〉+ α2 A |v2〉 = |0〉 = A (α1 |v1〉+ α2 |v2〉) ,
Borra
dor Pre
limin
ar
por la misma razon se tiene que el elemento neutro contenido en ℵ (A), esto es
A |α v〉 = |0〉 ∀ |v〉 ∈ V1 ∧ ∀ α ∴ A |0〉 = |0〉 si α = 0
por lo tanto, queda demostrado que ℵ (A) es un subespacio de V1 .Definiremos imagen (rango o recorrido) de A, y la denotaremos como
= (A) = |v′〉 | |v′〉 ∈ V2 ∧ A |v〉 = |v′〉
igualmente = (A) ⊂ V2 tambien sera un subespacio de V2 ya que si |v〉 = α1 |v1〉 + α2 |v2〉 y dado que Aes un operador lineal, se cumple que
A
α1 |v1〉+ α2 |v2〉︸ ︷︷ ︸|v〉
= α1 A |v1〉︸ ︷︷ ︸|v′1〉
+ α2 A |v2〉︸ ︷︷ ︸|v′2〉
= α1 |v′1〉+ α2 |v′2〉︸ ︷︷ ︸|v′〉
.
Es claro que si V es de dimension finita, A V = n tambien sera de dimension finita n y tendremos que
dim [ℵ (A)] + dim [= (A)] = dim [V]
vale decir, que la dimension del nucleo mas la dimension del recorrido o imagen de una transformacion lineales igual a la dimension del dominio.
Para demostrar esta afirmacion supongamos que dim [V] = n y que |e1〉 , |e2〉 , |e3〉 · · · |ek〉 ∈ V es unabase de ℵ (A), donde k = dim [ℵ (A)] ≤ n.
Como |e1〉 , |e2〉 , |e3〉 · · · |ek〉 ∈ V estos elementos forman base, y por lo tanto, son linealmente inde-pendientes, necesariamente ellos formaran parte de una base mayor de V.
Esto es: |e1〉 , |e2〉 , |e3〉 , · · · , |ek〉 , |ek+1〉 , · · · , |ek+r−1〉 , |ek+r〉 ∈ V sera una base de V donde k+r = n.El esquema de la demostracion sera:
primero probaremos que A |ek+1〉 ,A |ek+2〉 , · · · ,A |ek+r−1〉 ,A |ek+r〉 forman una base paraA V
luego demostraremos que dim [A V] = r y como hemos supuesto que k+r = n habremos demostradola afirmacion anterior.
Si los r elementos A |ek+1〉 ,A |ek+2〉 , · · · ,A |ek+r−1〉 ,A |ek+r〉 expanden A V entonces cual-quier elemento
|w〉 ∈ A V 3 |w〉 = A |v〉 = Ci |Aei〉 , con |Aei〉 = A |ei〉
Ahora bien, analicemos con cuidado los lımites de la suma implıcita del ındice i = 1, 2, · · · , k + r
|w〉 = Ci |Aei〉 = C1 |Ae1〉+ C2 |Ae2〉+ · · ·+ Ck |Aek〉︸ ︷︷ ︸=|0〉 ya que A|e1〉=A|e2〉=A|e3〉···=A|ek〉=|0〉
+ Ck+1 |Aek+1〉+ · · ·+ Ck+r |Aek+r〉
Por lo tanto A |ek+1〉 ,A |ek+2〉 , · · · ,A |ek+r−1〉 ,A |ek+r〉 expanden A V. Ahora bien, para de-mostrar que son base, demostraremos que son linealmente independientes, para ello supondremos que
∃Ck+1, Ck+2, · · · , Ck+r
/ Ci |Aei〉 = 0 con i = k + 1, k + 2, · · · , k + r
y tenemos que demostrar que Ck+1 = Ck+2 = · · · = Ck+r = 0. Entonces
Ci |Aei〉 = CiA |ei〉 = A(Ci |ei〉
)= 0 con i = k + 1, k + 2, · · · , k + r
Borra
dor Pre
limin
ar
por lo tanto el elemento |v〉 = Ci |ei〉 ∈ ℵ (A) con i = k + 1, k + 2, · · · , k + r. Con lo cual, dado que∀ |v〉 ∈ ℵ (A) , |v〉 = Ci |ei〉 con i = 1, 2, · · · , r, entonces se puede hacer la siguiente resta
|v〉 − |v〉 =
k∑i=1
Ci |ei〉 −k+r∑i=k+1
Ci |ei〉
y como los |e1〉 , |e2〉 , |e3〉 , · · · , |ek〉 , |ek+1〉 , · · · , |ek+r−1〉 , |ek+r〉 son una base de V entonces las Ck+1 =Ck+2 = · · · = Ck+r = 0.
Ejemplos
1. Transformaciones Identidad: Sea I : V1→V2, la transformacion identidad,
∀ |v〉 ∈ V1 / I |v〉 = |v〉 ⇒ ℵ (I) = |0〉 ⊂ V1 ∧ = (I) ≡ V1
2. Sistemas de ecuaciones lineales: En Vn los sistemas de ecuaciones lineales representan el espacionulo, ℵ (A), para vectores de Vn
A |x〉 = |0〉
A11 A12 · · · A1n
A21 A22 · · ·...
. . .
An1 An2 Ann
x1
x2
...xn
=
00...0
Aijxi = 0
con j ecuaciones (j = 1, 2, · · · , n). Recordemos que estamos utilizando la convencion de Einstein parasuma de ındices. Esto es
∑ni=1A
ijxi = 0.
3. Ecuaciones diferenciales ordinarias: Sea C2[−∞,∞] el espacio vectorial de todas las funciones con-
tinuas doblemente diferenciables. Definimos A : C2[−∞,∞] → C[−∞,∞] como la transformacion lineal(
D2 − 1)
tal que para todas las y(x) ∈ C2[−∞,∞] se cumple
A |x〉 = |0〉 (D2 − 1
)y(x) = 0
(d2
dx2− 1
)y (x) = y′′ − y = 0
por lo tanto, el nucleo o espacio nulo de A, ℵ (A), lo constituyen el conjunto de soluciones para lamencionada ecuacion diferencial. Por lo tanto, el problema de encontrar las soluciones de la ecuaciondiferencial es equivalente a encontrar los elementos del nucleo de A.
4.1.6. Operadores Biyectivos e Inversos
Se dice que A : V1→V2 es biyectivo (uno a uno o biunıvoco) si dados |v1〉 , |v2〉 ∈ V1, ∧ |v′〉 ∈ V2, setiene que
A |v1〉 = |v′〉 ∧ A |v2〉 = |v′〉 ⇒ |v1〉 = |v2〉
es decir, sera biyectiva si A transforma vectores distintos de V1 en vectores distintos de V2. Mas aun, sepuede afirmar que una transformacion lineal A, sera biyectiva si y solo si ℵ (A) = |0〉. Vale decir, si elsubespacio nulo esta constituido, unicamente por el elemento neutro del espacio vectorial. La demostracion
Borra
dor Pre
limin
ar
es sencilla. Supongamos que A es biyectiva y que A |v〉 = |0〉, entonces |v〉 = |0〉, es decir, A |0〉 = |0〉, porconsiguiente ℵ (A) = |0〉. Recıprocamente, si
ℵ (A) = |0〉∧
A |v1〉 = A |v2〉
⇒ A |v1〉 − A |v2〉 = |0〉 = A
|v1〉 − |v2〉︸ ︷︷ ︸|v1〉−|v2〉=0
⇒ |v1〉 = |v2〉
La importancia de las transformaciones lineales uno a uno o biyectivas reside en la posibilidad de definirinversa, debido a que siempre existe en V2 un vector |v′〉 asociado a traves de A con un vector |v〉 ∈ V1.Diremos que A−1: V2→V1 es el inverso de A, si A−1A = I = AA−1.
Habrıa que hacer un par de comentarios al respecto. El primero es que, tal y como hemos enfatizadoarriba, en general, los operadores no conmutan entre si, y los inversos no son una excepcion. Es decir, deberıanexistir (y de hecho existen) inversas por la izquierda A−1A e inversas por la derecha AA−1. Por simplicidade importancia en Fısica obviaremos esta dicotomıa y supondremos que A−1A = I = AA−1. El segundocomentario tiene que ver con la existencia y unicidad del inverso de un operador lineal. Algunos operadorestienen inverso, otros no, pero aquellos quienes tienen inverso, ese inverso es unico. Veamos, supongamos que
A−11 A |v〉 = |v〉
∧A−1
2 A |v〉 = |v〉
=⇒ A−11 A |v〉 − A−1
2 A |v〉 = |0〉 =(A−1
1 − A−12
)︸ ︷︷ ︸A−1
1 =A−12
A |v〉 =⇒ A−11 = A−1
2
Ahora bien, un operador lineal A tendra inverso sı y solo sı para cada vector |v′〉 ∈ V2 ∃ |v〉 ∈V1 / A |v〉 = |v′〉. Es decir, cada vector |v′〉 esta asociado con uno y solo un vector |v〉 a traves de latransformacion lineal A. Dejaremos sin demostracion esta afirmacion pero lo importante es recalcar que paraque exista inverso la transformacion lineal A, tiene que ser biyectiva y esto implica que se asocia uno y soloun vector de V1 con otro de V2.
Todavıa podemos anadir algunas demostraciones consecuencias de las afirmaciones anteriores. Sea latransformacion lineal T : V1 → V2 y supongamos ademas que T ∈ L (V1,V2). Entonces las siguientesafirmaciones son validas y equivalentes
1. T es biyectiva en V1
2. T es invertible y su inversa T−1 : T V1 → V1 es lineal
3. ∀ |v〉 ∈ V1, T |v〉 = |0〉 ⇒ |v〉 = |0〉 esto es, el espacio nulo ℵ (T) unicamente contiene al elementoneutro de V1.
Si ahora suponemos que V1 tiene dimension finita, digamos dim [V1] = n, las siguientes afirmacionesseran validas y equivalentes
1. T es biyectiva en V1
2. Si |u1〉 , |u2〉 , |u3〉 , · · · |un〉 ∈ V1 son linealmente independientes, entonces,T |u1〉 , T |u2〉 , T |u3〉 , · · ·T |un〉 ∈ T V1 tambien seran linealmente independientes.
3. dim [T V1] = n
4. Si |e1〉 , |e2〉 , |e3〉 · · · |en〉 ∈ V1 es una base de V1, entonces T |e1〉 , T |e2〉 , T |e3〉 · · ·T |en〉 ∈T V1 es una base de T V1
Borra
dor Pre
limin
ar
4.1.7. Operadores Hermıticos Conjugados
Definiremos la accion de un operador A sobre un bra de la forma siguiente
(〈w|A)︸ ︷︷ ︸〈w′|
|v〉 = 〈w| (A |v〉)︸ ︷︷ ︸|v′〉
por lo cual, lo que estamos diciendo es que el elemento de matriz para el operador A es el mismo, y noimporta donde opere A. De esta manera, dado cada vector en V, tiene asociado un vector en V∗. Podemosdemostrar que A operando sobre los bra es lineal. Esto es dado
〈w| = λ1 〈z1|+ λ2 〈z2|(〈w|A) |v〉 ≡ (λ1 〈z1|+ λ2 〈z2|A) |v〉 = (λ1 〈z1|+ λ2 〈z2|) (A |v〉) = λ1 〈z1| (A |v〉) + λ2 〈z2| (A |v〉)
= λ1 (〈z1|A) |v〉+ λ2 (〈z2|A) |v〉
Siguiendo con esta logica podemos construir la accion del operador hermıtico conjugado, A†. Para ellorecordamos que igual que a cada vector (ket) |v〉 le esta asociado una forma lineal (bra) 〈v|, a cada kettransformado A |v〉 = |v′〉 le correspondera un bra transformado 〈v′| = 〈v|A†. Por lo tanto
|v〉 ⇐⇒ 〈v||v′〉 = A |v〉 ⇐⇒ 〈v′| = 〈v|A†
ahora bien, si A es lineal, A† tambien lo sera, dado que a un vector |w〉 = λ1 |z1〉+λ2 |z2〉 le corresponde unbra 〈w| = λ∗1 〈z1|+λ∗2 〈z2| (la correspondencia es antilineal). Por lo tanto, |w′〉 = A |w〉 = λ1 A |z1〉+λ2 A |z2〉 ,por ser A lineal, entonces
|w′〉 ⇐⇒ 〈w′| ≡ 〈w|A† = (λ∗1 〈z1|+ λ∗2 〈z2|)A† ≡ λ∗1 〈z′1|+ λ∗2 〈z′2| = λ∗1 〈z1|A† + λ∗2 〈z2|A†
Es claro que de la definicion de producto interno en la notacion de Dirac, se desprende
〈x′| y〉 = 〈y| x′〉∗ ∀ |x′〉 = A |x〉 , |y〉 ∈ V ⇒ 〈x|A† |y〉 = 〈y|A |x〉∗ ∀ |x〉 , |y〉 ∈ V .
Igualmente se pueden deducir las propiedades de los operadores hermıticos conjugados(A†)†
= A; (λA)†
= λ∗A†; (A+ B)†
= A† + B†; (AB)†
= B†A†
Esta ultima propiedad es facilmente demostrable y es educativa su demostracion. Dado que |v′〉 = AB |v〉, yademas se tiene que
|v〉 = B |v〉
|v′〉 = A |v〉
⇒ 〈v′| = 〈v|A† = 〈v|B†A† = 〈v| (AB)†
A partir de las propiedades anteriores se deriva una mas util relacionada con el conmutador de dos operadoreshermıticos
[A,B]†
= −[A†,B†
]=[B†,A†
]La conclusiones a las que llegamos son:Para obtener el hermıtico conjugado de una expresion proceda de la siguiente manera:
Cambie constantes por sus complejas conjugadas λ λ∗
Borra
dor Pre
limin
ar
Cambie los kets por sus bras asociados y viceversa (bras por kets): |v〉 〈v|
Cambie operadores lineales por sus hermıticos conjugados A† A;
Invierta el orden de los factores
De este modo(|v〉 〈w|)† = |w〉 〈v|
que se deduce facilmente de la consecuencia de la definicion de producto interno
〈x|(|v〉 〈w|
)†|y〉 = 〈y| (|v〉 〈w|) |x〉∗ = 〈y| |v〉∗ 〈w| |x〉∗ = 〈x| |w〉 〈v| |y〉
Existe un conjunto de operadores que se denominan hermıticos a secas o autoadjunto. Un operadorhermıtico (o autoadjunto) sera aquel para el cual A† = A. Con esto
〈x|A† |y〉 = 〈x|A |y〉 = 〈y|A |x〉∗
Claramente los proyectores son autoadjuntos por construccion
P†|v〉 ≡ (|v〉 〈v|)† = |v〉 〈v| .
4.1.8. Operadores Unitarios
Por definicion, un operador sera unitario si su inversa es igual a su adjunto. Esto es
U−1= U† ⇒ U†U = UU† = I
De estos operadores podemos decir varias cosas
Las transformaciones unitarias dejan invariantes al producto interno y consecuentemente la norma devectores. Esto se demuestra facilmente. Dados dos vectores |x〉 , |y〉 sobre los cuales actua un operadorunitario
|x〉 = U |x〉
|y〉 = U |y〉
⇒ 〈y |x〉 = 〈y|U†U |x〉 = 〈y |x〉
Es claro que si A es hermıtico, A† = A, el operador T = eiA es unitario.
T = eiA ⇒ T† = e−iA†
= e−iA ⇒ TT† = eiAe−iA = I = T†T = e−iAeiA
El producto de dos operadores unitarios tambien es unitario. Esto es, si U y V son unitarios entonces
(UV) † (UV) = V†U†U︸︷︷︸I
V = V†V = I
(UV) (UV) † = UVV†︸︷︷︸I
U† = UU† = I
Borra
dor Pre
limin
ar
4.1.9. Ejercicios
1. Cual de las siguientes transformaciones definidas sobre V3 son lineales
a) T |x〉 = |x〉+ |a〉 donde |a〉 es un vector constante diferente de cero.
b) T |x〉 = |a〉c) T |x〉 = 〈a |x〉 |a〉d) T |x〉 = 〈a |x〉 |x〉
2. Considere las siguientes operaciones en el espacio de los polinomios en x y diga si corresponden atransformaciones lineales
a) La multiplicacion por x.
b) La multiplicacion por x2.
c) La diferenciacion.
3. Dado un operador hermıtico A y uno unitario U, pruebe las siguientes afirmaciones
a) En general(C†)−1
=(C−1
)†, con C un operador generico.
b) A = U−1AU es tambien un operador hermıtico
c) Si A es antihermıtico entonces A = iAd) La composicion de dos operadores, A y B hermıticos sera hermıtica si y solo si A y B conmuntan.
e) Si S es un operador real y antisimetrico, pruebe que el operador A = (I− S) (I+ S)−1
es unoperador ortogonal.1
f ) Si
A =
(cos(θ) sen(θ)−sen(θ) cos(θ)
)Encuentre la expresion para S.
4. Un operador, C, lineal NO es hermıtico, entonces(C+ C†
)y i(C− C†
), con i =
√−1, seran hermıti-
cos. Esto, obviamente implica que siempre podremos separar un operador lineal como
C =1
2
(C+ C†
)+
1
2
(C− C†
).
donde(C+ C†
)representa su parte hermıtica y
(C− C†
)su parte antihermıtica
5. Suponga que un operador L puede ser escrito como la composicion de otros dos operadores L = L−L+
con [L−,L+] = I. Demostrar que
Si L|x >= λ|x > y |y >= L+|x > entonces L|y >= (λ+ 1)|y >
y, del mismo modo, demuestre que
Si L|x >= λ|x > y |z >= L−|x > entonces L|z >= (λ− 1)|z >
Por ello es costumbre denominar a L+ y L− los operadores de “subidas” y de “bajada” respectivamente,ya que ellos construyen otros vectores con autovalores mayores (menores) en una unidad al vectoroperado.
1Esto es AT = A−1 con AT el traspuesto de A.
Borra
dor Pre
limin
ar
4.2. Representacion Matricial de Operadores
Supongamos un operador lineal A en el espacio vectorial de transformaciones lineales L (V,W) dondedim (V) = n y dim (W) = m y sean |e1〉 , |e2〉 , |e3〉 , · · · |en〉 y |e1〉 , |e2〉 , |e3〉 , · · · |em〉 las bases paraV y W respectivamente. Entonces A |ej〉 ∈W
A |ei〉 = Aαi |eα〉 con i = 1, 2, .., n y α = 1, 2, ..,m
las Aαi son las componentes de la expansion de A |ei〉 en la base |e1〉 , |e2〉 , |e3〉 , · · · |em〉.Para un vector generico |x〉 tendremos que
|x〉 = A |x〉 = xα |eα〉 pero, a su vez |x〉 = xi |ei〉
con lo cual
|x〉 = A |x〉 = xα |eα〉 = A(xi |ei〉
)= xiA |ei〉 = xiAαi |eα〉 ⇒
(xα − xiAαi
)|eα〉 = 0
para finalmente concluir quexα = Aαi x
i
Varias cosas se pueden concluir hasta este punto
1. Si acordamos que los ındices de arriba indican filas podemos representar los vectores como un arreglovertical de sus componentes
|x〉 →
x1
x2
...xn
y las cantidades
Aαi →
A11 A1
2 · · · A1j · · · A1
n
A21 A2
2 A2j A2
n...
. . ....
Aα1 Aα2 Aαj Aαn...
.... . .
Am1 Am2 Amj Amn
de tal modo que se cumpla
|x〉 →
x1
x2
...xα
xm
=
A11 A1
2 · · · A1j · · · A1
n
A21 A2
2 A2j A2
n...
. . ....
Aα1 Aα2 Aαj Aαn...
.... . .
Am1 Am2 Amj Amn
x1
x2
...xj
xn
Notese que los ındices arriba indican fila y los de abajo columnas. Las cantidades Aαj es la represen-tacion del operador A en las bases |e1〉 , |e2〉 , |e3〉 , · · · |en〉 y |e1〉 , |e2〉 , |e3〉 , · · · |em〉 de V y W
Borra
dor Pre
limin
ar
respectivamente. Es decir una matriz Aij es un arreglo de numeros
Aij =
A1
1 A12 · · · A1
n
A21 A2
2 A2n
.... . .
An1 An2 Ann
donde el superındice, i, indica fila
A11
A21
...An1
y el subındice j columna (
A11 A1
2 · · · A1n
)2. Diremos que las componentes de los vectores transforman como
xα = Aαi xi
3. Si suponemos |e1〉 , |e2〉 , |e3〉 , · · · |en〉 y |e1〉 , |e2〉 , |e3〉 , · · · |em〉 bases ortonormales
xα = 〈eα |x〉 = 〈eα|A |x〉 = 〈eα|A(xi |ei〉
)= xi 〈eα|A |ei〉
queda claro que Aαi ≡ 〈eα|A |ei〉 sera la representacion matricial.
4. Los vectores |ek〉 transforman de la siguiente manera
A |ei〉 = Aji |ej〉
donde |e1〉 , |e2〉 , |e3〉 , · · · |en〉 y |e1〉 , |e2〉 , |e3〉 , · · · |en〉 son las bases para V y W respectivamen-te.
Definitivamente, las matrices son uno de los objetos mas utiles de las Matematicas. Ellas permiten aterri-zar conceptos y calcular cantidades. La palabra matriz fue introducida en 1850 por James Joseph Sylvester2
y su teorıa desarrollada por Hamilton3 y Cayley4. Si bien los fısicos las consideramos indispensables, nofueron utilizadas de manera intensiva hasta el aparicion de la Mecanica Cuantica alrededor de 1925.
2James Joseph Sylvester (1814-1897 Londres, Inglaterra) Ademas de sus aportes con Cayley a la Teorıa de las Matrices,descubrio la solucion a la ecuacion cubica y fue el primero en utilizar el termino discriminante para categorizar cada una de lasraıces de la ecuacion. Para vivir tuvo que ejercer de abogado durante una decada. Por fortuna, otro matematico de la epoca(Arthur Cayley) frecuentaba los mismos juzgados y tribunales y pudieron interactuar. Por ser judıo tuvo cantidad de dificultadespara conseguir trabajo en la Academia.
3Sir William Rowan Hamilton (1805 - 1865, Dublin, Irlanda) Sus contribuciones en el campo de la Optica, Dinamica delcuerpo Rıgido, Teorıa de ecuaciones algebraicas y Teorıa de Operadores Lineales.
4Arthur Cayley (1821, Richmond, 1895, Cambridge, Inglaterra) En sus cerca de 900 trabajos cubrio cası la totalidad delas areas de las Matematicas de aquel entonces. Sus mayores cotribuciones se centran el la Teorıa de Matrices y la Gemetrıa noeuclideana. No consiguio empleo como Matemetico y tuvo que graduarse de abogado y ejercer durante mas de 15 anos, durantelos cuales publico mas de 250 trabajos en Matematicas.
Borra
dor Pre
limin
ar
4.2.1. Bases y Representacion Matricial de Operadores
Es importante recalcar que la representacion matricial de un operador depende de las bases|e1〉 , |e2〉 , |e3〉 , · · · |en〉 y |e1〉 , |e2〉 , |e3〉 , · · · |em〉 de V y W respectivamente. Si tenemos otras bases or-tonormales para V y W vale decir, |e1〉 , |e2〉 , |e3〉 , · · · |en〉 y |e1〉 , |e2〉 , |e3〉 , · · · |em〉 su representacionsera distinta. Esto es
〈eα|A |ej〉 = Aαj =⇒
A11 A1
2 · · · A1j · · · A1
n
A21 A2
2 A2j A2
n...
. . ....
Aα1 Aα2 Aαj Aαn...
.... . .
Am1 Am2 Amj Amn
Cambiando el orden en el cual se presenta una base, cambia la representacion matricial del operador. Lossiguientes ejemplos trataran de ilustrar estas situaciones
Si tenemos un matriz 2× 3, B de la forma
B =
(3 1 −21 0 4
)y supongamos las bases canonicas para V3y V2 : |e1〉 , |e2〉 , |e3〉 y |e1〉 , |e2〉. Entonces la matriz Brepresentan la transformacion B : V3 → V2 que lleva un vector generico |x〉 = (x1, x2, x3) en un vectorgenerico |y〉 = (y1, y2) tal que
B =
(3 1 −21 0 4
)⇒ B |x〉 = |y〉 ⇒
(3 1 −21 0 4
) x1
x2
x3
=
(y1
y2
)
y esto es
y1 = 3x1 + x2 − 2x3
y2 = x1 + 0x2 + 4x3
La representacion matricial dependera de la base en la cual se exprese. Si suponemos el operador dife-
rencial D (·) = d(·)dx y consideramos el dominio un espacio vectorial de los polinomios de grado ≤ 3, entonces
tendremos que: D (·) : P3 → P2, al consideramos las bases
1, x, x2, x3
y
1, x, x2
de P3 y P2 respectiva-mente. Si el producto interno esta definido como
⟨P i |Pj〉 →
∫ 1
−1
dx Pi (x)Pj (x)
La representacion matricial del operador diferencial sera
⟨P i∣∣∣D |Pj〉 =
⟨P i∣∣∣Pj⟩ =
0 1 0 00 0 2 00 0 0 3
como siempre i indica las filas y j las columnas.
Borra
dor Pre
limin
ar
Otra manera de verlo es operar (diferenciar) sobre el |Pj〉 ∈ P3 y expresar ese resultado en la base de P2
D |Pj〉 ⇒
d(1)dx = 0 = 0 · 1 + 0 · x+ 0 · x2
d(x)dx = 1 = 1 · 1 + 0 · x+ 0 · x2
d(x2)dx = 2x = 0 · 1 + 2 · x+ 0 · x2
d(x3)dx = 3x2 = 0 · 1 + 0 · x+ 3 · x2
y los coeficientes de esa expansion seran las columnas de la matriz que los representa.Para enfatizar, los elementos de una matrız, no solo dependen de la base sino del orden en el cual la base
se presente. Consideremos que la base de P2 viene representadas porx2, x, 1
. La representacion matricial
del operador D (·) = d(·)dx sera
⟨P i∣∣D |Pj〉 =
⟨P i∣∣∣Pj⟩ =
0 0 0 30 0 2 00 1 0 0
aunque 0 1 0 0
0 0 2 00 0 0 3
1111
=
123
⇒ 1 + 2x+ 3x2
equivalentemente 0 0 0 30 0 2 00 1 0 0
1111
=
321
⇒ 1 + 2x+ 3x2
¡Es el mismo polinomio!Recuerde que las componentes del vector multiplican a los vectores bases en el mismo orden.
Construyamos la respresentacion para el mismo operador D (·) = d(·)dx en las siguientes bases
1, 1 + x, 1 + x+ x2, 1 + x+ x2 + x3
y
1, x, x2
de P3 y P2, respectivamente.
D |Pj〉 =∣∣∣Pj⟩ =⇒
d(1)dx = 0 = 0 · 1 + 0 · x+ 0 · x2
d(1+x)dx = 1 = 1 · 1 + 0 · x+ 0 · x2
d(1+x+x2)dx = 1 + 2x = 1 · 1 + 2 · x+ 0 · x2
d(1+x+x2+x3)dx = 1 + 2x+ 3x2 = 1 · 1 + 2 · x+ 3 · x2
con lo cual ⟨P i∣∣D |Pj〉 =
⟨P i∣∣∣Pj⟩ =
0 1 1 10 0 2 20 0 0 3
Borra
dor Pre
limin
ar
4.2.2. Algebra de Matrices
Por comodidad supongamos que dim (V) = dim (W) = n y consideremos la base ortogonal |en〉. Deeste modo, es claro que se reobtienen las conocidas relaciones para matrices cuadradas⟨
ei∣∣A+ B |ej〉 =
⟨ei∣∣A |ej〉+
⟨ei∣∣B |ej〉 = Aij +Bij
con lo cual tenemos la suma de matrices. Esto esA1
1 A12 · · · A1
n
A21 A2
2 A2n
.... . .
An1 An2 Ann
+
B1
1 B12 · · · B1
n
B21 B2
2 B2n
......
Bn1 Bn2 Ann
=
A1
1 +B11 A1
2 +B12 · · · A1
n +B1n
A21 +B2
1 A22 +B2
2 A2n +B2
n...
.... . .
An1 +Bn1 Ann +Bnn
en forma compacta puede demostrarse Aij + Bij = (A+B)
ij con lo cual es directo la demostrar la igualdad
de matricesA1
1 +B11 A1
2 +B12 · · · A1
n +B1n
A21 +B2
1 A22 +B2
2 A2n +B2
n...
.... . .
An1 +Bn1 Ann +Bnn
= 0 ⇒
A1
1 A12 · · · A1
n
A21 A2
2 A2n
.... . .
An1 An2 Ann
=
B1
1 B12 · · · B1
n
B21 B2
2 B2n
......
Bn1 Bn2 Ann
de donde Aij = Bij .
De igual modo para la representacion de composicion de operadores⟨ei∣∣AB |ej〉 =
⟨ei∣∣A I B |ej〉 =
⟨ei∣∣A (|ek〉 ⟨ek∣∣)B |ej〉 =
⟨ei∣∣A |ek〉 ⟨ek∣∣B |ej〉 = AikB
kj
para multiplicacion de matrices. Esto esA1
1 A12 · · · A1
n
A21 A2
2 A2n
.... . .
An1 An2 Ann
×
B11 B1
2 · · · B1n
B21 B2
2 B2n
......
Bn1 Bn2 Ann
=
A1kB
k1 A1
kBk2 · · · A1
kBkn
A2kB
k1 A2
kBk2 A2
kBkn
......
. . .
AnkBk1 AnkB
kn
como ya sabıamos AB 6= BA→AikBkj 6=BikAkj .
De la misma manera, la multiplicacion de un numero por una matriz es la multiplicacion de todos suselementos por ese numero ⟨
ei∣∣αA |ej〉 = α
⟨ei∣∣A |ej〉 = αAij .
4.2.3. Representacion Diagonal
Finalmente mostraremos que dado un operador lineal A ∈ L (V,W) donde dim (V) = dim (W) = n ysea |e1〉 , |e2〉 , |e3〉 , · · · |en〉 una base ortonormal para V y W. Si adicionalmente se da el caso que
A |ei〉 = |ei〉
la representacion matricial es diagonal⟨ej∣∣A |ei〉 = Aji =
⟨ej |ei〉 = δji
Borra
dor Pre
limin
ar
Esta afirmacion tambien es valida para dim (V) 6= dim (W) pero por simplicidad seguimos trabajando conmatrices cuadradas.
En leguaje de ındices estaremos diciendo que
Dij = D(k)δ
kl δljδik =
D1 0 0 00 D2 0 00 0 D3 00 0 0 D4
4.2.4. Sistemas de ecuaciones lineales
Una de las aplicaciones mas utiles del algebra de matrices es la resolucion de los sitemas de ecuacioneslineales. El cual puede ser expresado de la siguiente forma
Aαi xi = cα con i = 1, 2, .., n y α = 1, 2, ..,m
por lo tanto, tendremos m ecuaciones lineales para n incognitas(x1, x2, · · ·xn
). Las cantidades Aαi resultan
ser las componentes de la matriz de los coeficientes. Este problema puede ser pensado como un problemade un operador A en el espacio vectorial de transformaciones lineales L (V,W) donde dim (V) = n ydim (W) = m, con las cα las componentes del vector transformado
|c〉 = A |x〉 → cα = Aαi xi
Concretemos en un ejemplo
2x+ 3y − z = 54x+ 4y − 3z = 3−2x+ 3y − z = 10
⇒
2 3 −14 4 −3−2 3 −1
xyz
=
531
el metodo mas utilizado es la eliminacion de Gauss Jordan, el cual se basa en el intercambio de ecuacionesy la multiplicacion apropiada e inteligente por constantes y resta de ecuaciones. La idea es construir unamatriz triangular superior para poder luego despejar desde abajo. Veamos:
abc
2 3 −14 4 −3−2 3 −1
∣∣∣∣∣∣531
entonces para eliminar x de la fila c (o la ecuacion c) sumamos la fila a con la c, a+ c y esta nueva ecuacionsera la nueva c
abc′
2 3 −14 4 −30 6 −2
∣∣∣∣∣∣536
ahora −2a+ b sera la nueva b
ab′
c′
2 3 −10 −2 −10 6 −2
∣∣∣∣∣∣5−76
finalmente 3b′ + c′
ab′
c′′
2 3 −10 −2 −10 0 −5
∣∣∣∣∣∣5−7−15
Borra
dor Pre
limin
ar
Este sistema es equivalente al primer sistema de ecuaciones. La solucion emerge rapidamente:
−5z = −15→ z = 3 − 2y − z = −7→ −2y − 3 = −7→ y = 2 2x+ 3 (2)− 3 = 5→ x = 1
Es bueno recalcar que los sistemas de ecuaciones lineales no necesariamente tienen solucion y a veces tienenmas de una solucion.
4.2.5. Operadores hermıticos
La representacion matricial de un operador hermıtico:(A†)ij
=⟨ei∣∣A† |ej〉 =
⟨ej∣∣A |ei〉∗ =
(Aji
)∗vale decir: el hermıtico conjugado de una matriz, es su traspuesta conjugada. Si la matriz es hermıtica, i.e.
A† = A ⇒(A†)ij
= Aij
por lo tanto, las matrices hermıticas son simetricas respecto a la diagonal y los elementos de la diagonal sonnumeros reales. Un operador hermıtico estara representado por una matriz hermıtica.
Aquı vale la pena probar algunas de las propiedades que arriba expresamos para operadores hermıticosconjugados, vale decir(
A†)†
= A; (λA)†
= λ∗A†; (A+ B)†
= A† + B†; (AB)†
= B†A†
Es claro que (A†)† → (⟨
ei∣∣A† |ej〉)† =
((A†)ij
)†=((Aji
)∗)†= Aij
y(λA)
† →⟨ei∣∣λA† |ej〉 =
⟨ej∣∣λA |ei〉∗ = λ∗
⟨ej∣∣A |ei〉∗ = λ∗
⟨ei∣∣A† |ej〉 = λ∗A†
pero mas interesante es
(AB)† →
⟨ei∣∣ (AB)
† |ej〉 =(AikB
kj
)†= (Ajk)∗(Bki )∗ = (Akj )∗(Bik)∗ = (Bik)∗(Akj )∗ → B†A† .
4.2.6. Inversa de una matriz
Hemos visto que dada una transformacion lineal biyectiva, podemos definir una inversa para esa trans-formacion lineal. Esa transformacion lineal tendra como representacion un matriz. Por lo tanto dado unoperador lineal A diremos que otro operador lineal B sera su inverso (por la derecha) si
AB = I→⟨ei∣∣AB |ej〉 = δij → AikB
kj = δij
ahora bien, como conocemos la matriz Aik y la suponemos no singular (esto es, y como veremos mas adelante,significa que el determinante se anule: det
∣∣Aik∣∣ 6= 0) y si tomamos un j fijo tendremos un sistema de necuaciones lineales inhomogeneo con n incognitas: B1
j , B2j , B
3j , · · ·Bnj . Al resolver el sistema tendremos la
solucion.El procedimiento para encontrar la inversa es equivalente al metodo de eliminacion de Gauss Jordan.
Veamos como funciona, supongamos una matriz 3× 3 A11 A1
2 A13
A21 A2
2 A23
A31 A3
2 A33
∣∣∣∣∣∣1 0 00 1 00 0 1
Gauss Jordan→
1 0 00 1 00 0 1
∣∣∣∣∣∣B1
1 B12 B1
3
B21 B2
2 B23
B31 B3
2 B33
Borra
dor Pre
limin
ar
Como un ejemplo 2 3 42 1 1−1 1 2
∣∣∣∣∣∣1 0 00 1 00 0 1
→ 2 3 4
0 2 3−1 1 2
∣∣∣∣∣∣1 0 01 −1 00 0 1
→ 2 3 4
0 2 30 5 8
∣∣∣∣∣∣1 0 01 −1 01 0 2
→ · · · →
1 0 00 1 00 0 1
∣∣∣∣∣∣−1 2 1
5 −8 −6−3 5 4
4.2.7. Cambio de bases para vectores
Dada una representacion (una base) particular, un bra, un ket o un operador quedara representadopor una matriz. Si cambiamos la representacion, ese mismo bra, ket u operador tendra otra matriz comorepresentacion. Mostraremos como estan relacionadas esas matrices.
Dadas dos base discretas ortonormales |ei〉 y |ei〉, entonces un vector cualquiera
|Ψ〉 =(∣∣ek⟩ 〈ek|) |Ψ〉 =
⟨ek∣∣ Ψ〉︸ ︷︷ ︸ck
|ek〉
|Ψ〉 = (|em〉 〈em|) |Ψ〉 = 〈em| Ψ〉︸ ︷︷ ︸cm
|em〉
=⇒
〈em |Ψ〉 =
⟨ek∣∣ Ψ〉 〈em |ek〉︸ ︷︷ ︸
Smk⟨ek |Ψ〉 = 〈em| Ψ〉
⟨ek |em〉︸ ︷︷ ︸Skm
con lo cual, una vez mas, tendremos que la expresion de transformacion de componentes de un vector
cm = Smk ck ⇐⇒ ck = Skmc
m
y Smk (o Skm) sera la matriz de transformacion, cambio de base o cambio de representacion. Ahora bien, pordefinicion de producto interno
〈em |ek〉 =⟨ek |em〉∗ =⇒ Smk = Sk∗m ≡ S
m†k
por lo tanto, la matriz de transformacion entre bases es hermıtica o autoadjunta y la relacion anterior quedaescrita como
cm = Smk ck =⇒ 〈em| Ψ〉 = Smk⟨ek∣∣ Ψ〉
ck = Sk†m cm =⇒
⟨ek |Ψ〉 = Sk†m 〈em| Ψ〉
Igualmente la regla de transformacion de las representaciones matriciales de operadores quedan expresa-das como ⟨
ei∣∣A |ej〉 =
⟨ei∣∣ (|ek〉 ⟨ek∣∣)A (|em〉 〈em|) |ej〉 =
⟨ei |ek〉︸ ︷︷ ︸Sik
⟨ek∣∣A |em〉 〈em |ej〉︸ ︷︷ ︸
Sm†j
por lo tanto,Aij = Sik A
km Sm†j
donde Aij es la representacion del operador A respecto a la base |ej〉 y Akm su representacion en la base|em〉.
Borra
dor Pre
limin
ar
4.2.8. Ejercicios
1. Dada una matriz hermıtica
H =
(10 3i−3i 0
)construya la matriz unitaria U, tal que U†HU = D donde D es un operador real y diagonal.
2. Considere la representacion matricial de un operador en la base canonica de la forma
A =
(1 a0 1
)¿ Existira algun operador B, no singular, tal que D = B−1AB, con D un operador diagonal? Si ese fuerael caso, ¿Cual serıa la representacion matricial de ese operador B, en la base canonica? Justifique surespuesta
3. Considere matrices ortogonales, reales 3 × 3 (esto es: MTM = I) las cuales, adicionalmente cumplencon: det[M] = 1.
a) ¿Cuantos parametros reales son necesarios para caracterizar unıvocamente a este tipo de matrices?
b) ¿Este tipo de matrices forman grupo baja la multiplicacion de matrıces?
c) Si ahora considera la matrices ortogonales reales con det[M] = −1 ¿Este tipo de matrices formarangrupo bajo la multiplicacion? Justifique su respuesta.
4. Considere el siguiente “operador vectorial” σ = σx i + σy j + σz k donde las matrices σx,σy, σz seconocen como operadores de Pauli y su representacion matricial en la base canonica es:
σx =
(0 11 0
); σy =
(0 −ii 0
); σz =
(1 00 −1
); I =
(1 00 1
);
el vector direccion puede escribirse como
n = sen(θ) cos(φ)i + sen(θ)sen(φ)j + cos(θ)k = nxi + nyj + nzk ,
con lo cual: σ · n = nxσx + nyσy + nzσz.
A partir de todo lo anterior calcule la representacion matricial del siguiente operador en la base canonica
exp
(i
2ψ σ · n
).
4.3. Traza de Operadores
La traza, Tr (A), de un operador A es la suma de los elementos diagonales de su representacion matricialA. Esto es dado un operador A y una base ortogonal |ei〉 para Vn
Tr (A) =⟨ek∣∣A |ek〉 = Aii
Ası
Aij =
1 2 34 5 67 8 9
⇒ Tr (A) = Aii = 15 .
Borra
dor Pre
limin
ar
4.3.1. Invariancia de la Traza
La traza de una matriz no depende de la base que seleccionemos, es un invariante que caracteriza al opera-dor independientemente de la base en la cual se represente. Entonces, dadas dos base discretas ortonormales|ei〉 y |ei〉,
Akk =⟨ek∣∣A |ek〉 =
⟨ek |em〉 〈em|A |ek〉 = 〈em|A|ek〉
⟨ek∣∣︸ ︷︷ ︸
I
em〉 = 〈em|A |em〉 = Amm
Donde una vez mas hemos utilizado las dos relaciones de cierre |em〉 〈em| = |ek〉⟨ek∣∣ = I. Es claro que el
numero que representa esta suma sera el mismo independientemente de su representacion matricial.
4.3.2. Propiedades de la Traza
Claramente la traza es linealTr (A+λB) = Tr (A) + λTr (B)
ya queTr (A+ λB) =
⟨ek∣∣A+ λB |ek〉 =
⟨ek∣∣A |ek〉+ λ
⟨ek∣∣B |ek〉 = Tr (A) + λTr (B)
La traza de un producto conmuta, esto es
Tr (AB) = Tr (BA)
y es facilmente demostrable
Tr (AB) =⟨ek∣∣AB |ek〉 =
⟨ek∣∣A|em〉 〈em|︸ ︷︷ ︸
I
B |ek〉 =⟨ek∣∣B|em〉 〈em|︸ ︷︷ ︸
I
A |ek〉 = Tr (BA)
Recuerde que⟨ek∣∣B |em〉 y
⟨ek∣∣A |ek〉 son numeros que pueden ser reordenados.
Del mismo modo es facil demostrar que la traza de un triple producto de matrices respeta la ciclicidaddel orden de la matrices en el producto
Tr (ABC) = Tr (BCA) = Tr (CAB) .
4.4. Diferenciacion de Operadores
Dado un operador A (t) el cual supondremos dependiente de una variable arbitraria t podremos definirla derivada como
dA (t)
dt= lım
∆t→0
A (t+ ∆t)− A (t)
∆t
por lo tanto si⟨uk∣∣A |ui〉 = Aki entonces
⟨uk∣∣ dA (t)
dt|ui〉 =
(dA (t)
dt
)ki
=d
dt
⟨uk∣∣A (t) |ui〉 =
dAkidt
=
dA1
1
dtdA1
2
dt · · · dA1n
dtdA2
1
dtdA2
2
dtdA2
n
dt...
. . .dAn1dt
dAn2dt
dAnndt
Borra
dor Pre
limin
ar
con lo cual la regla es simple, la representacion matricial de la derivada de un operador sera la derivada decada uno de sus elementos. Por ejemplo
d
dx
x x2 21 e−x 5x
3x3 3 cos(x)
=
1 2x 00 −e−x 5
9x2 0 − sen(x)
4.4.1. Reglas de diferenciacion de operadores lineales
Las reglas usuales de la diferenciacion se cumpliran con la diferenciacion de operadores. Esto se demuestracon la representacion matricial
d (A (t) + B (t))
dt=
d (A (t))
dt+
d (B (t))
dt
⟨uk∣∣ d (A (t) + B (t))
dt|ui〉 =
d
dt
⟨uk∣∣ (A (t) + B (t)) |ui〉
=d
dt
(⟨uk∣∣A (t) |ui〉+
⟨uk∣∣B (t) |ui〉
)=
d
dt
⟨uk∣∣A (t) |ui〉+
d
dt
⟨uk∣∣B (t) |ui〉
=⟨uk∣∣ dA (t)
dt|ui〉+
⟨uk∣∣ dB (t)
dt|ui〉 =
d (A (t))
dt+
d (B (t))
dt
Del mismo modo se cumplira que
d (A (t)B (t))
dt=
dA (t)
dtB (t) + A (t)
dB (t)
dt
con la precaucion que no se puede modificar el orden de aparicion de los operadores. Es facil ver que⟨uk∣∣ d (A (t)B (t))
dt|ui〉 =
d
dt
⟨uk∣∣A (t)B (t) |ui〉 =
d
dt
⟨uk∣∣A (t) I B (t) |ui〉
=(⟨uk∣∣A (t) |um〉 〈um|B (t) |ui〉
)=
d⟨uk∣∣A (t) |um〉
dt〈um|B (t) |ui〉+
⟨uk∣∣A (t) |um〉
d 〈um|B (t) |ui〉dt
=⟨uk∣∣ dA (t)
dt|um〉 〈um|B (t) |ui〉+
⟨uk∣∣A (t) |um〉 〈um|
dB (t)
dt|ui〉
Otras propiedades de la derivacion de operadores se demuestran a partir de la expansion en series de los
operadores. Por ejemplo, si queremos conocer la expresion para deAt
dt , con A 6= A (t) recordemos que
eAt |v〉 =
[ ∞∑n=0
(At)n
n!
]|v〉 =
[I+ At+
(At)2
2!+ · · ·+ (At)n
n!· · ·
]|v〉
tendremos que
deAt
dt|v〉 =
d
dt
[ ∞∑n=0
(At)n
n!
]|v〉 =
[ ∞∑n=0
d
dt
((At)n
n!
)]|v〉 =
[ ∞∑n=0
ntn−1An
n!
]|v〉 =
[ ∞∑n=0
tn−1An−1
(n− 1)!
]︸ ︷︷ ︸
eAt
A |v〉
Borra
dor Pre
limin
ar
Notese que la suma es hasta infinito, por lo tanto al cambiar de ındice p = n − 1, p sigue variando hastainfinito y la serie es la misma que la anterior. Entonces
deAt
dt|v〉 = eAtA |v〉 ≡ AeAt |v〉 .
Si un solo operador esta siendo derivado el orden de presentacion de los operadores es indiferente. Ahorabien, cuando se presenta la siguiente situacion
d(eAteBt
)dt
|v〉 =deAt
dteBt |v〉+ eAt
deBt
dt|v〉 = AeAteBt |v〉+ eAtBeBt |v〉 = eAtAeBt |v〉+ eAteBtB |v〉
con A 6= A (t) y B 6= B (t) y siempre[eBt,B
]= 0. Con lo cual, solo para el caso en el que [A,B] = 0 podremos
factorizar eAteBt yd(eAteBt
)dt
|v〉 = (A+ B) eAteBt |v〉
Si [A,B] 6= 0 el orden de aparicion de los operadores es MUY importante.
Para el caso en el cual A = A (t) no necesariamente[A (t) , e
dA(t)dt
]= 0. Veamos:
deA(t)
dt|v〉 =
d
dt
[ ∞∑n=0
(A (t))n
n!
]|v〉 =
[ ∞∑n=0
(1
n!
d (A (t))n
dt
)]|v〉
=
[ ∞∑n=0
(1
n!
d (A (t))
dtA (t)
n−1+ A (t)
d (A (t))
dtA (t)
n−2 · · ·A (t)n−1 d (A (t))
dt
)]|v〉
Adicionalmente
si [A, [A,B]] = [B, [A,B]] = 0 ⇒ [A,F (B)] = [A,B]dF (B)
dBEsta relacion es facilmente demostrable para el caso en el cual [A,B] = I el operador identidad, en ese casotenıamos que ABn − BnA = nBn−1
ABn − BnA = ABB · · ·B︸ ︷︷ ︸n
−BB · · ·B︸ ︷︷ ︸n
A = (I+ BA)BB · · ·B︸ ︷︷ ︸n−1
− BB · · ·B︸ ︷︷ ︸n
A
= I Bn−1 + B (I+ BA)BB · · ·B︸ ︷︷ ︸n−2
− BB · · ·B︸ ︷︷ ︸n
A
= 2Bn−1 + B2(I+ BA)BB · · ·B︸ ︷︷ ︸n−3
− BB · · ·B︸ ︷︷ ︸n
A = · · · = nBn−1 .
Obviamente, para este caso, se cumple que
[A,B] = I ⇒ [A, [A,B]] = [B, [A,B]] = 0 .
Para demostrar esta relacion “desarrollemos en Serie de Taylor” la funcion F (B). Esto es
[A, F (B)] =
[A,∞∑n=0
fnBn
n!
]=
∞∑n=0
fn[A,Bn]
n!= [A,B]
∞∑n=0
fnnBn−1
n!= [A,B]
∞∑n=0
fnBn−1
(n− 1)!
= [A,B]dF (B)
dB.
Borra
dor Pre
limin
ar
Para el caso mas general se procede del mismo modo.
Si [A,C] = [B,C] = 0 , con C = [A,B] ⇒ [A,F (B)]?= [A,B]
dF (B)
dB.
Probaremos primero que
si [A,C] = [B,C] = 0 , con C = [A,B] ⇒ [A,Bn] = ABn − BnA = n [A,B]Bn−1 .
Tendremos que
ABn − BnA = ABB · · ·B︸ ︷︷ ︸n
−BB · · ·B︸ ︷︷ ︸n
A = (C+ BA)BB · · ·B︸ ︷︷ ︸n−1
− BB · · ·B︸ ︷︷ ︸n
A
= CBn−1 + B (C+ BA)BB · · ·B︸ ︷︷ ︸n−2
− BB · · ·B︸ ︷︷ ︸n
A
= 2CBn−1 + B2(C+ BA)BB · · ·B︸ ︷︷ ︸n−3
− BB · · ·B︸ ︷︷ ︸n
A = · · · = nCBn−1 = n[A,B]Bn−1,
con lo cual es inmediato demostrar que
[A, F (B)] =
[A,∞∑n=0
fnBn
n!
]=
∞∑n=0
fn[A,Bn]
n!= [A,B]
∞∑n=0
fnnBn−1
n!= [A,B]
∞∑n=0
fnBn−1
(n− 1)!
= [A,B]dF (B)
dB.
4.4.2. La formula de Glauber
Ahora estamos en capacidad de demostrar limpiamente la formula de Glauber. Esta es
eAeB = eA+Be12 [A,B]
Para demostrarla, procedemos a considerar un operador F (t) = eAteBt, por lo tanto
dF (t)
dt|v〉 =
deAteBt
dt|v〉 = AeAt eBt |v〉+ eAt BeBt |v〉 =
(A+ eAt Be−At
)eAteBt |v〉
=(A+ eAtBe−At
)F (t) |v〉
Ahora bien, dado que
si [A, [A,B]] = [B, [A,B]] = 0 ⇒ [A,F (B)] = [A,B]dF (B)
dBentonces [
eAt,B]
= t [A,B] eAt ⇒ eAtB = BeAt + t [A,B] eAt
por lo cualdF (t)
dt|v〉 =
(A+ eAtBe−At
)F (t) |v〉 = (A+ B+ t [A,B])F (t) |v〉
por tanteo uno puede darse cuenta que
F (t) = e
(A+B)t+ t2
2 [A,B]
cumple con la ecuacion anterior, por lo tanto absorbiendo t en los operadores correspondientes llegamos a laformula de Glauber
eAeB = eA+Be12 [A,B] .
Borra
dor Pre
limin
ar
4.4.3. Ejercicios
1. Considere el espacio P(t) de polinomios de grado N en t, vale decir |f〉t ↔∑Nn=0 a0t
n, considereademas un operador T = exD ≡ exp(xD), con D = d
dt
a) Muestre que T |p〉t = |p〉t+x, esto es que el operador T puede ser considerado un operador traslacionespacial para los polinomios P(t) de grado N .
b) Considere que el espacio de polinomios esta definido en el intervalo [−1, 1], que definimos un
producto interno de la forma 〈f | g〉 =∫ 1
−1fg dt y un espacio de polinomios de grado N = 2.
¿Cual es la representacion matricial de T en la base de polinomios de Legendre P0, P1, P2?
2. Heredando el formalismo de Mecanica Clasica, uno construye en Mecanica Cuantica el Operador Ha-miltoniano, hermıtico, para un sistema unidimensional como
H =P2
2m+ V(X)
donde H,P y X son operadores, y V(X) un operador que es una funcion de otro operador. Adicional-mente, uno puede construir el siguiente operador [X,P] = i~I.
a) Determine los siguientes conmutadores [H,P], [H,X] y [H,XP]
b) Suponga que H|ψn >= En|ψn > y entonces calcule la representacion matricial del siguienteoperador < ψm|[A,H]|ψn >, para un operador arbitrario A.
4.5. Un parentesis determinante
4.5.1. Definicion
El determinante se define comola siguiente aplicacion: det |A| : Mn×n → R, es decir, asocia un numeroreal con cada matriz del espacio vectorial Mn×n de matrices n× n
Ası, dada una matriz
A =
A1
1 A12 · · · A1
n
A21 A2
2 A2n
.... . .
An1 An2 Ann
⇒ det |A| = εijk···A1iA
2jA
3k · · · =
∣∣∣∣∣∣∣∣∣A1
1 A12 · · · A1
n
A21 A2
2 A2n
.... . .
An1 An2 Ann
∣∣∣∣∣∣∣∣∣Hemos generalizado los ındices de Levi Civita de tal forma que
εijk··· = εijk··· =
0, si cualesquiera dos ındices son iguales1, si los ındices i, j, k · · · constituyen una permutacion cıclica de 1, 2, 3 · · ·n−1, si los ındices i, j, k · · · constituyen una permutacion anticıclica de 1, 2, 3 · · ·n
Esta situacion es clara para el caso de matrices 3× 3, veamos.
A =
A11 A1
2 A13
A21 A2
2 A23
A31 A3
2 A33
⇒ det |A| = εijkA1iA
2jA
3k =
∣∣∣∣∣∣A1
1 A12 A1
3
A21 A2
2 A23
A31 A3
2 A33
∣∣∣∣∣∣con lo cual
det |A| = ε123A11A
22A
33 + ε312A1
3A21A
32 + ε231A1
2A23A
31 + ε132A1
1A23A
32 + ε321A1
3A22A
31 + ε213A1
2A21A
33
= A11A
22A
33 +A1
3A21A
32 +A1
2A23A
31 −A1
1A23A
32 −A1
3A22A
31 −A1
2A21A
33 .
Borra
dor Pre
limin
ar
4.5.2. Propiedades determinantes
1. det |A| = det |AT | donde AT es la traspuesta de A. Esta propiedad proviene de la definicion del ındicede Levi Civita
det |A| = εijk···A1iA
2jA
3k · · · = εijk···A
i1A
j2A
k3 · · · = det |AT |
que se traduce en que si se intercambian filas por columnas el determinante no se altera∣∣∣∣∣∣A1
1 A12 A1
3
A21 A2
2 A23
A31 A3
2 A33
∣∣∣∣∣∣ =
∣∣∣∣∣∣A1
1 A21 A3
1
A12 A2
2 A32
A13 A2
3 A33
∣∣∣∣∣∣2. Si dos filas o dos columnas son identicas el determinante se anula
εiik···A1iA
2iA
3k · · · = εiik···A
i1A
i2A
k3 · · · = 0∣∣∣∣∣∣
A11 A1
2 A13
A11 A1
2 A13
A31 A3
2 A33
∣∣∣∣∣∣ = 0
3. Si multiplicamos una fila o una columna por un numero, el determinante queda multiplicado por elnumero
εijk···A1i
(λA2
j
)A3k · · · = λεijk···A1
iA2jA
3k · · · = λ det[A]
εijk···Ai1A
j2
(λAk3
)· · · = λεijk···A
i1A
j2A
k3 · · · = λ det[A]
de aquı claramente se desprende que si una fila o una columna es cero (λ = 0) el determinante seanula. Mas aun, si dos filas o dos columnas son proporcionales A1
i = λA2j el determinante se anula, por
cuanto se cumple la propiedad anterior∣∣∣∣∣∣A1
1 λA12 A1
3
A21 λA2
2 A23
A31 λA3
2 A33
∣∣∣∣∣∣ =
∣∣∣∣∣∣A1
1 A12 A1
3
A21 A2
2 A23
λA31 λA3
2 λA33
∣∣∣∣∣∣ = λ
∣∣∣∣∣∣A1
1 A12 A1
3
A21 A2
2 A23
A31 A3
2 A33
∣∣∣∣∣∣Obvio que ∣∣∣∣∣∣
A11 0 A1
3
A21 0 A2
3
A31 0 A3
3
∣∣∣∣∣∣ =
∣∣∣∣∣∣A1
1 A12 A1
3
A21 A2
2 A23
0 0 0
∣∣∣∣∣∣ = 0
al igual que∣∣∣∣∣∣A1
1 λA11 A1
3
A21 λA2
1 A23
A31 λA3
1 A33
∣∣∣∣∣∣ =
∣∣∣∣∣∣A1
1 A12 A1
3
λA11 λA1
2 λA13
A31 A3
2 A33
∣∣∣∣∣∣ = λ
∣∣∣∣∣∣A1
1 A11 A1
3
A21 A2
1 A23
A31 A3
1 A33
∣∣∣∣∣∣ = λ
∣∣∣∣∣∣A1
1 A12 A1
3
A11 A1
2 A13
A31 A3
2 A33
∣∣∣∣∣∣ = 0
4. Si se intercambian dos filas o dos columnas cambia de signo el determinante.
det |A| = εijk···A1iA
2jA
3k · · · =
∣∣∣∣∣∣∣∣∣A1
1 A12 · · · A1
n
A21 A2
2 A2n
.... . .
An1 An2 Ann
∣∣∣∣∣∣∣∣∣ ⇒ εijk···A1jA
2iA
3k · · · = −det[A]
Borra
dor Pre
limin
ar
donde en la matriz A se han intercambiando un par de columnas. Claramente las propiedades del ındicede Levi Civita, obliga al cambio de signo
det |A| = − det |A|
Notese que una sıntesis de las propiedades anteriores nos lleva a reescribir el determinante de unamatriz de la forma
det |A| = εαβγ··· det |A| = εijk···AiαA
jβA
kγ · · · ⇐⇒ det |A| = εαβγ··· det |A| = εijk···Aαi A
βjA
γk · · ·
claramente, si αβγ · · · ⇐⇒ 123 · · · reobtenemos la definicion anterior. Si se intercambian dos filas o doscolumnas, el determinante cambia de signo debido al intercambio de dos ındices griegos. Si dos filaso dos columnas son iguales el determinante se anula debido a la propiedad de sımbolo de Levi Civitacon ındices griegos.
5. El determinante de un producto es el producto de los determinantes
det |AB| = det |A|det |B|
Antes de proceder a la demostracion de este importante propiedad jugaremos un poco mas con laspropiedades de las matrices. Queremos senalar que si A es una matriz m× n y B es una matriz n× p,entonces tendremos que
(AB)α
= AαBesto es, que la α-esima fila de AB es igual a la multiplicacion de la α-esima fila de A, por toda la matrizB. Veamos
Cij = (AB)ij = AilB
lj
por lo tanto la α-esima fila
Cαj = Aαl Blj ⇒ Cαj = (Aα1 , A
α2 , A
α3 , · · ·Aαn, )
B1
1 B12 · · · B1
n
B21 B2
2 B2n
.... . .
Bn1 Bn2 Bnn
det |A|det |B| = det |A|
(εijk···B
i1B
j2B
k3 · · ·
)=(εijk···A
iαA
jβA
kγ · · ·
) (εabc···B
a1B
b2B
c3 · · ·
)que siempre puede ser rearreglado a(
εijk···Aαi AβjA
γk · · ·
)(εijk···B
i1B
j2B
k3 · · ·
)= Aαi B
i1A
βjB
j2A
γkB
k3 · · · = det [AB] .
Veamos este desarrollo en el caso de matrices 3× 3(ε123A1
1A22A
33 + ε312A1
3A21A
32 + ε231A1
2A23A
31 + ε132A1
1A23A
32 + ε321A1
3A22A
31 + ε213A1
2A21A
33
)×(ε123B1
1B22B
33 + ε312B1
3B21B
32 + ε231B1
2B23B
31 + ε132B1
1B23B
32 + ε321B1
3B22B
31 + ε213B1
2B21B
33
)con lo cual
= A11A
22A
33
(B1
1B22B
33 +B1
3B21B
32 +B1
2B23B
31 −B1
1B23B
32 −B1
3B22B
31 −B1
2B21B
33
)+A1
3A21A
32
(B1
1B22B
33 +B1
3B21B
32 +B1
2B23B
31 +B1
1B23B
32 +B1
3B22B
31 +B1
2B21B
33
)+A1
2A23A
31
(B1
1B22B
33 +B1
3B21B
32 +B1
2B23B
31 +B1
1B23B
32 +B1
3B22B
31 +B1
2B21B
33
)−A1
1A23A
32
(B1
1B22B
33 +B1
3B21B
32 +B1
2B23B
31 +B1
1B23B
32 +B1
3B22B
31 +B1
2B21B
33
)−A1
3A22A
31
(B1
1B22B
33 +B1
3B21B
32 +B1
2B23B
31 +B1
1B23B
32 +B1
3B22B
31 +B1
2B21B
33
)−A1
2A21A
33
(B1
1B22B
33 +B1
3B21B
32 +B1
2B23B
31 +B1
1B23B
32 +B1
3B22B
31 +B1
2B21B
33
)
Borra
dor Pre
limin
ar
como son numeros se pueden arreglar de la siguiente forma
= A11A
22A
33
(B1
1B22B
33 +B2
1B32B
13 +B3
1B12B
23 −B1
1B32B
23 −B3
1B22B
13 −B2
1B12B
33
)+A1
3A21A
32
(B1
1B22B
33 +B2
1B32B
13 +B3
1B12B
23 −B1
1B32B
23 −B3
1B22B
13 −B2
1B12B
33
)+A1
2A23A
31
(B1
1B22B
33 +B2
1B32B
13 +B3
1B12B
23 −B1
1B32B
23 −B3
1B22B
13 −B2
1B12B
33
)−A1
1A23A
32
(B1
1B22B
33 +B2
1B32B
13 +B3
1B12B
23 −B1
1B32B
23 −B3
1B22B
13 −B2
1B12B
33
)−A1
3A22A
31
(B1
1B22B
33 +B2
1B32B
13 +B3
1B12B
23 −B1
1B32B
23 −B3
1B22B
13 −B2
1B12B
33
)−A1
2A21A
33
(B1
1B22B
33 +B2
1B32B
13 +B3
1B12B
23 −B1
1B32B
23 −B3
1B22B
13 −B2
1B12B
33
)= εijkA
iαB
α1 A
jλB
λ2A
kµB
µ3
4.5.3. Formula de Laplace
La formula de Laplace permite expresar el determinate de una matriz en terminos de sus matrices menoreso cofactores
det |A] =
n∑j=1
Aij(Ac)ij , para cualquier i
Por ejemplo, para la matriz
A =
3 −2 21 2 −34 1 2
el desarrollo de Laplace para la primera fila (i = 1) es:
det [A] = A11(Ac)1
1 +A12(Ac)1
2 +A13(Ac)1
3
= 3
∣∣∣∣ 2 −31 2
∣∣∣∣− (−2)
∣∣∣∣ 1 −34 2
∣∣∣∣+ 2
∣∣∣∣ 1 24 1
∣∣∣∣= 3(7) + 2(14) + 2(−7) = 35 .
4.6. Un zoologico de matrices cuadradas
A continuacion presentaremos un conjunto de matrices que seran de utilidad mas adelante.
La matriz nula
Aij = 0 ∀ i, j ⇒ Aij =
0 0 · · · 00 0 0...
. . .
0 0 0
Diagonal a bloques
Podremos tener matrices diagonales a bloques, vale decir
Dij =
D1
1 D12 0 0
D21 D2
2 0 00 0 D3
3 D34
0 0 D43 D4
4
Borra
dor Pre
limin
ar
Triangular superior e inferior
Dij =
D1
1 D12 D1
3 D14
0 D22 D2
3 D24
0 0 D33 D3
4
0 0 0 D44
y Dij =
D1
1 0 0 0
D21 D2
2 0 0
D31 D3
2 D33 0
D41 D4
2 D43 D4
4
Matriz de cofactores
Aij =
a11 a1
2 a13
a21 a2
2 a23
a31 a3
2 a33
y (Ac)ij =
(Ac)11 (Ac)
12 (Ac)
13
(Ac)21 (Ac)
22 (Ac)
23
(Ac)31 (Ac)
32 (Ac)
33
donde los (Ac)
ij forman la matriz de cofactores, y los cofactores son
(Ac)11 = (−1)
1+1
∣∣∣∣ a22 a2
3
a32 a3
3
∣∣∣∣ (Ac)12 = (−1)
1+2
∣∣∣∣ a21 a2
3
a31 a3
3
∣∣∣∣ (Ac)13 = (−1)
1+3
∣∣∣∣ a21 a2
2
a31 a3
2
∣∣∣∣(Ac)
21 = (−1)
2+1
∣∣∣∣ a12 a1
3
a32 a3
3
∣∣∣∣ (Ac)22 = (−1)
2+2
∣∣∣∣ a11 a1
3
a31 a3
3
∣∣∣∣ (Ac)23 = (−1)
2+3
∣∣∣∣ a11 a1
2
a31 a3
2
∣∣∣∣(Ac)
31 = (−1)
3+1
∣∣∣∣ a12 a1
3
a22 a2
3
∣∣∣∣ (Ac)32 = (−1)
3+2
∣∣∣∣ a11 a1
3
a21 a2
3
∣∣∣∣ (Ac)33 = (−1)
3+3
∣∣∣∣ a11 a1
2
a21 a2
2
∣∣∣∣Matriz Adjunta
Llamaremos matriz adjunta, adj [A], a la traspuesta de la matriz de cofactores de una determinada matriz:
adj [A] = (Ac)T ⇒ adj[Aij]
=(
(Ac)ij
)T= (Ac)
ji
Por ejemplo
A =
1 2 34 5 67 8 9
⇒ adj [A] =
−3 6 −36 −12 6−3 6 −3
Una matriz sera autoadjunta si adj [A] = A.
Matriz inversa
La matriz inversa de A se puede calcular de la siguiente manera
A−1 =adj [A]
det [A]
Por ejemplo, para la matriz
A =
3 −2 21 2 −34 1 2
Borra
dor Pre
limin
ar
A−1 =adj [A]
det [A]=
1
35
7 6 2−14 −2 11−7 −11 8
Algunas propiedades(A−1
)−1= A(
AT)−1
=(A−1
)T(A†)−1
=(A−1
)†(AB)
−1= B−1A−1
Matriz singular
A es singular si det[A] = 0. Ademas, si el determinate de la matriz A es diferente de cero, entonces
det∣∣A−1
∣∣ =1
det |A|= det |A|−1
.
Ejercicios
1. Evaluar los siguiente determinantes
(a)
∣∣∣∣∣∣∣∣1 0 2 30 1 −2 13 −3 4 −2−2 1 −2 0
∣∣∣∣∣∣∣∣ (b)
∣∣∣∣∣∣∣∣gc ge a+ ge gb+ ge0 b b bc e e b+ ea b b+ f b+ d
∣∣∣∣∣∣∣∣2. Utilizando las propiedades de los terminantes resuelva para x∣∣∣∣∣∣
x+ 2 x+ 4 x− 3x+ 3 x x+ 5x− 2 x− 1 x+ 1
∣∣∣∣∣∣ = 0
3. Considere las matrices
A =
0 −i ii 0 −i−i i 0
B =1√8
√3 −√
2 −√
3
1√
6 −12 0 2
Diga si son: (a) reales, (b) diagonales, (c) simetricas, (d) antisimetricas, (e) singulares, (f) ortogonales,(g) hemıticas, (h) antihermıticas, (i) unitarias o (j) normales.
4. Encuentre la matriz inversa de
A =
2 4 31 −2 −2−3 3 2
Borra
dor Pre
limin
ar
4.7. Autovectores y Autovalores
4.7.1. Definiciones y Teoremas Preliminares
Llamaremos a |ψ〉 un autovector del operador A si se cumple que
A |ψ〉 = λ |ψ〉
en este caso λ (que, en general sera un numero complejo) se denomina el autovalor correspondiente alautovector |ψ〉 . La ecuacion A |ψ〉 = λ |ψ〉 en conocida en la literatura como la ecuacion de autovalores y secumple para algunos valores particulares de los autovalores λ. El conjunto de los autovalores se denomina elespectro del operador A.
Supongamos que A : V → V y que dim V = n, supongamos ademas que una base ortogonal para V es|e1〉 , |e2〉 , |e3〉 , · · · |en〉. Por lo tanto la repercusion de esta ecuacion sobre la representacion matricial esla siguiente ⟨
ei∣∣A |ej〉 ⟨ej∣∣ |ψ〉 =
⟨ei∣∣λ |ψ〉 = λ
⟨ei |ψ〉 ⇒ Aij c
j = λci
claramente, si |e1〉 , |e2〉 , |e3〉 , · · · |en〉 genera una representacion diagonal de A entonces
Aij ∝ δij ⇒ Aij cj ∝ δij cj = λci ⇒ Aij ∝ λδij .
Esto lo podemos resumir en el siguiente teorema que presentaremos sin demostracion.
Teorema: Dado un operador lineal A : Vn → Vn, si la representacion matricial de A es diagonal,⟨ei∣∣A |ej〉 = Aij ∝ δij , entonces existe una base ortogonal |e1〉 , |e2〉 , |e3〉 , · · · |en〉5 y un conjunto de
cantidades λ1, λn, · · · , λn tales que se cumple
A |ei〉 = λi |ei〉 con i = 1, 2, · · ·n . J
Igualmente se cumple que si existe una base ortogonal |e1〉 , |e2〉 , |e3〉 , · · · |en〉 y un conjunto de can-tidades λ1, λn, · · · , λn tales que satisfagan
A |ei〉 = λi |ei〉 con i = 1, 2, · · ·n
entonces se cumple que la representacion matricial de A es diagonal,⟨ei∣∣A |ej〉 = Aij = diag (λ1, λn, · · · , λn) .
4.7.2. Algunos comentarios
1. Notese que si |ψ〉 es autovector de A para un determinado autovalor λ entonces |φ〉 = α |ψ〉 (un vectorproporcional a |ψ〉, con α un numero complejo) tambien es un autovector para el mismo autovalor.Esto representa una incomoda ambiguedad: dos autovectores que corresponden al mismo autovalor. Unintento de eliminarla es siempre considerar vectores |ψ〉 normalizados, i.e. 〈ψ |ψ〉 = 1. Sin embargo, nodeja de ser un intento que no elimina la ambiguedad del todo porque siempre queda el angulo de fasearbitrario. Esto es, el vector eiθ |ψ〉, con θ un numero real arbitrario, tiene la misma norma del vector|ψ〉. Sin embargo esta arbitrariedad es inofensiva. En Mecanica Cuantica las predicciones obtenidascon |ψ〉 son las mismas que con eiθ |ψ〉.
5Realmente un conjunto de vectores linealmente independientes, pero como siempre se puede ortogonalizar mediante elmetodo de Gram Smith, consideraremos que es una base ortogonal de entrada
Borra
dor Pre
limin
ar
2. Un autovalor λ sera no degenerado o simple si esta asociado a un unico autovector |ψ〉6 de lo contrariosi denominara degenerado si existen dos o mas autovectores de A, linealmente independientes asociadosal mismo autovalor λ. El grado (o el orden ) de la degeneracion es el numero de vectores linealmenteindependientes que esten asociados al mencionado autovalor λ.
3. El orden de degeneracion de un autovalor λ expande un espacio vectorial S (λ) ⊂ Vn (denominadoautoespacio) cuya dimension es el orden de la degeneracion. Esto es si λ es g−degenerado, entoncesexisten
|ψ1〉 , |ψ2〉 , |ψ3〉 , · · · |ψg〉 ⇒ A |ψi〉 = λ |ψi〉
adicionalmente un autovector correspondiente al autovalor λ puede ser expresado como
|ψ〉 = ci |ψi〉 con i = 1, 2, · · · , g
con lo cualA |ψ〉 = ciA |ψi〉 = λ ci |ψi〉 = λ |ψ〉 .
4.7.3. Algunos Ejemplos
1. Reflexion respecto al plano xy : Si R : V3 → V3 es tal que R |ψ〉 =∣∣∣ψ⟩ donde se ha realizado una
reflexion en el plano xy. Esto es
R |i〉 = |i〉 ; R |j〉 = |j〉 ; R |k〉 = − |k〉
con |i〉 , |j〉 , |k〉 los vectores unitarios cartesianos. Es claro que cualquier vector en el plano xy seraautovector de R con un autovalor λ = 1, mientras que cualquier otro vector |ψ〉 ∈ V3 y que no esteen el mencionado plano cumple con |ψ〉 = c |k〉 y tambien sera autovector de R pero esta vez con unautovalor λ = −1.
2. Dos visiones de Rotaciones de angulo fijo θ: La rotaciones de un vector en el plano pueden versede dos maneras.
a) Se considera el plano como un espacio vectorial real V2 con una base cartesiana canonica:|i〉 = (1, 0) , |j〉 = (0, 1), esto es si
R |a〉 = λ |a〉 ⇒ el angulo de rotacion = nπ con n entero.
b) Igualmente si consideramos el plano complejo unidimensional, expresemos cualquier vector en elplano en su forma polar |z〉 = reiθ por lo cual
R |z〉 = rei(θ+α) = eiα |z〉
si queremos λ = eiα reales necesariamente α = nπ con n entero.
3. Autovalores y Autovectores de Proyectores. Es interesante plantearse la ecuacion de autovalorescon la definicion del proyector para un determinado autoespacio. Esto es dado Pψ = |ψ〉 〈ψ| si esteproyector cumple con una ecuacion de autovalores para un |ϕ〉 supuestamente arbitrario
Pψ |ϕ〉 = λ |ϕ〉 ⇒ Pψ |ϕ〉 = (|ψ〉 〈ψ|) |ϕ〉 ⇒ |ϕ〉 ∝ |ψ〉6Con la arbitrariedad del calibre antes mencionado
Borra
dor Pre
limin
ar
es decir, necesariamente |ϕ〉 es colineal con |ψ〉 . Mas aun, si ahora el |ϕ〉 no es tan arbitrario sino quees ortogonal a |ψ〉 , 〈ψ |ϕ〉 = 0 ⇒ λ = 0, entonces el espectro del operador Pψ = |ψ〉 〈ψ| es 0 y 1, elprimer de los cuales es infinitamente degenerado y el segundo es simple. Esto nos lleva a reflexionarque si existe un autovector de un determinado operador, entonces su autovalor es distinto de cero, peropueden existir autovalores nulos que generan un autoespacio infinitamente degenerado.
4. El operador diferenciacion D |f〉 → D (f) = f ′. Los autovectores del operador diferenciacionnecesariamente deben satisfacer la ecuacion
D |f〉 = λ |f〉 → D (f) (x) = f ′ (x) = λf (x) ,
la solucion a esta ecuacion sera una exponencial. Esto es
|f〉 → f (x) = ceλx , con c 6= 0 ,
las f (x) se denominaran autofunciones del operador.
4.7.4. Autovalores, autovectores e independencia lineal
Uno de los teoremas mas utiles e importantes tiene que ver con la independencia lineal de los autovecto-res correspondientes a distintos autovalores de un determinado operador lineal. Este importante teorema sepuede concretar en.
Teorema: Sean |ψ1〉 , |ψ2〉 , |ψ3〉 , · · · |ψk〉 autovectores del operador A : Vm → Vn. Supongamos queexisten k autovalores: λ1, λ2, · · · , λk, distintos correspondientes a cada uno de los autovectores |ψj〉, en-tonces los |ψ1〉 , |ψ2〉 , |ψ3〉 , · · · , |ψk〉 son linealmente independientes.
Demostracion La demostracion de este teorema es por induccion y resulta elegante y sencilla.
Primeramente demostramos que j = 1.Obvio que el resultado se cumple y es trivial para el caso k = 1 (un autovector |ψ1〉 que corresponde aun autovalor λ1 es obvia y trivialmente linealmente independiente).
Seguidamente supondremos que se cumple para j = k − 1.Si existen |ψ1〉 , |ψ2〉 , |ψ3〉 , · · · |ψk−1〉 autovectores de A correspondientes a λ1, λ2, · · · , λk−1 en-tonces los |ψ1〉 , |ψ2〉 , |ψ3〉 , · · · |ψk−1〉 son linealmente independientes.
Ahora lo probaremos para j = k.Por lo cual si tenemos k autovectores |ψ1〉 , |ψ2〉 , |ψ3〉 , · · · |ψk〉, podremos construir una combinacionlineal con ellos, y si esa combinacion lineal se anula seran linealmente independientes.
cj |ψj〉 = 0 con j = 1, 2, · · · , k
al aplicar el operador A a esa combinacion lineal, obtenemos
cjA |ψj〉 = 0 ⇒ cjλj |ψj〉 = 0
multiplicando por λk y restando miembro a miembro obtenemos
cj (λj − λk) |ψj〉 = 0 con j = 1, 2, · · · , k − 1
Borra
dor Pre
limin
ar
(notese que el ultimo ındice es k−1) pero, dado que los k−1 vectores |ψj〉 son linealmente independiente,entonces tendremos k − 1 ecuaciones cj (λj − λk) = 0, una para cada j = 1, 2, · · · , k − 1. Dado queλj 6= λk necesariamente llegamos a que cj = 0 para j = 1, 2, · · · , k − 1 y dado que
cj |ψj〉 = 0 con j = 1, 2, · · · , k ⇒ cj 6= 0
con lo cual sicj |ψj〉 = 0 ⇒ cj = 0 con j = 1, 2, · · · , k
y los |ψ1〉 , |ψ2〉 , |ψ3〉 , · · · |ψk〉 son linealmente independientes y queda demostrado el teorema. J
Es importante acotar que el inverso de este teorema NO se cumple. Esto es, si A : Vm → Vn tiene|ψ1〉 , |ψ2〉 , |ψ3〉 , · · · , |ψn〉 autovectores linealmente independientes, NO se puede concluir que existan nautovalores λ1, λ2, · · · , λn distintos correspondientes a cada uno de los autovectores |ψj〉.
El teorema anterior lo complementa el siguiente que lo presentaremos sin demostracion. Este teoremasera de gran utilidad en lo que sigue.
Teorema: Si la dim (Vn) = n cualquier operador lineal A : Vn → Vn tendra un maximo de n autovaloresdistintos. Adicionalmente, si A tiene precisamente n autovalores, λ1, λ2, · · · , λn, entonces los correspon-dientes n autovectores, |ψ1〉 , |ψ2〉 , |ψ3〉 , · · · , |ψn〉, forman una base para Vn y la representacion matricial,en esa base, del operador sera diagonal⟨
ψi∣∣A |ψj〉 = Aij = diag (λ1, λ2, · · · , λn) . J
4.8. Autovalores y Autovectores de un operador
Una vez mas, supongamos que A : V→ V y que dim V = n, y ademas |e1〉 , |e2〉 , |e3〉 , · · · |en〉 es unabase ortogonal para V. Por lo tanto, la representacion matricial de la ecuacion de autovalores es la siguiente⟨
ei∣∣A |ej〉 ⟨ej∣∣ |ψ〉 = λ
⟨ei |ψ〉 ⇒ Aij c
j = λci ⇒(Aij − λδij
)cj = 0
con j = 1, 2, · · · , n. El conjunto de ecuaciones(Aij − λδij
)cj = 0 puede ser considerado un sistema (lineal y
homogeneo) de ecuaciones con n incognitas cj .
4.8.1. El polinomio caracterıstico.
Dado que un sistema lineal y homogeneo de ecuaciones con n incognitas tiene solucion si el determinantede los coeficientes se anula, tendremos que(
Aij − λδij)cj = 0 ⇒ det [A−λ1] = 0 ⇒ P (λ) = det
[Aij − λδij
]= 0
Esta ecuacion se denomina ecuacion caracterıstica (o secular) y a partir de ella emergen todos los autovalores(el espectro) del operador A, esto es:
det[Aij − λδij
]=
∣∣∣∣∣∣∣∣∣A1
1 − λ A12 · · · A1
n
A21 A2
2 − λ A2n
.... . .
An1 An2 Ann − λ
∣∣∣∣∣∣∣∣∣ = 0
Borra
dor Pre
limin
ar
y tendra como resultado un polinomio de grado n (el polinomio caracterıstico). Las raıces de este polinomioseran los autovalores que estamos buscando. Es claro que estas raıces podran ser reales y distintas, algunasreales e iguales y otras imaginarias.
Es importante senalar que el polinomio caracterıstico sera independiente de la base a la cual este referidala representacion matricial
⟨ui∣∣A |uj〉 del operador A.
4.8.2. Primero los autovalores, luego los autovectores
El procedimiento es el siguiente. Una vez obtenidos (los autovalores) las raıces del polinomio carac-terıstico, se procede a determinar el autovector, |ψj〉 , correspondiente a ese autovalor. Distinguiremos enesta determinacion casos particulares dependiendo del tipo de raız del polinomio caracterıstico. Ilustraremosestos casos con ejemplos especıficos para el caso especıfico de matrices 3× 3.
1. Una matriz 3× 3 con 3 autovalores reales distintos
⟨ei∣∣A |ej〉 =
2 1 31 2 33 3 20
⇒ det[Aij − λδij
]=
∣∣∣∣∣∣2− λ 1 3
1 2− λ 33 3 20− λ
∣∣∣∣∣∣ = 0
con lo cual el polinomio caracterıstico queda expresado como
λ3 − 24λ2 + 65λ− 42 = (λ− 1) (λ− 2) (λ− 21) = 0
y es claro que tiene 3 raıces distintas. Para proceder a calcular los autovectores correspondientes a cadaautovalor resolvemos la ecuacion de autovalores para cada autovalor. Esto es
a) λ1 = 1 2 1 31 2 33 3 20
x1
x2
x3
=
x1
x2
x3
⇐⇒2x1 + x2 + 3x3 = x1
x1 + 2x2 + 3x3 = x2
3x1 + 3x2 + 20x3 = x3
que constituye un sistema de ecuaciones algebraicas de 3 ecuaciones con 3 incognitas. Resolviendoel sistema tendremos que
ε(λ1) =
x1
x2
x3
= α
−110
con α un escalar distinto de cero.
b) λ2 = 2 2 1 31 2 33 3 20
x1
x2
x3
= 2
x1
x2
x3
⇐⇒2x1 + x2 + 3x3 = 2x1
x1 + 2x2 + 3x3 = 2x2
3x1 + 3x2 + 20x3 = 2x3
Resolviendo el sistema tendremos que
ε(λ2) =
x1
x2
x3
= α
−3−3
1
Borra
dor Pre
limin
ar
c) λ3 = 21 2 1 31 2 33 3 20
x1
x2
x3
= 21
x1
x2
x3
⇐⇒2x1 + x2 + 3x3 = 21x1
x1 + 2x2 + 3x3 = 21x2
3x1 + 3x2 + 20x3 = 21x3
Resolviendo el sistema
ε(λ3) =
x1
x2
x3
= α
116
2. Una matriz 3× 3 con 2 autovalores reales distintos, es decir, una matriz con autovalores repetidos
⟨ei∣∣A |ej〉 =
4 −3 14 −1 01 7 −4
⇒ det[Aij − λδij
]=
∣∣∣∣∣∣4− λ −3 1
4 −1− λ 01 7 −4− λ
∣∣∣∣∣∣ = 0
con lo cual el polinomio caracterıstico queda expresado como
λ3 + λ2 − 5λ− 3 = (λ+ 3) (λ− 1)2
= 0
y es claro que tiene 2 raıces iguales y una distinta. En este caso λ = 1 es un autovalor degeneradode orden 2. Para proceder a calcular los autovectores correspondientes a cada autovalor resolvemos laecuacion de autovalores para cada autovalor. Esto es:
a) λ1 = −3 4 −3 14 −1 01 7 −4
x1
x2
x3
= −3
x1
x2
x3
⇐⇒4x1 − 3x2 + x3 = −3x1
4x1 − x2 = −3x2
x1 + 7x2 − 4x3 = −3x3
Resolviendo
ε(λ1) =
x1
x2
x3
= α
−12
13
b) λ2 = 1 (autovalor degenerado de orden 2) 4 −3 1
4 −1 01 7 −4
x1
x2
x3
=
x1
x2
x3
⇐⇒4x1 − 3x2 + x3 = x1
4x1 − x2 = x2
x1 + 7x2 − 4x3 = x3
Resolviendo el sistema tendremos el segundo autovector
ε(λ2) =
x1
x2
x3
= α
123
3. Otra matriz 3× 3 con 2 autovalores reales distintos, es decir, otra matriz con autovalores repetidos
⟨ei∣∣A |ej〉 =
2 1 12 3 23 3 4
⇒ det[Aij − λδij
]=
∣∣∣∣∣∣2− λ 1 1
2 3− λ 23 3 4− λ
∣∣∣∣∣∣ = 0
Borra
dor Pre
limin
ar
con lo cual el polinomio caracterıstico es
λ3 + λ2 − 5λ− 3 = (λ− 7) (λ− 1)2
= 0
que tiene 2 raıces iguales y una distinta. En este caso λ = 1 vuelve a ser un autovalor degenerado deorden 2. Volvemos a calcular los autovectores correspondientes a cada autovalor resolviendo la ecuacionde autovalores para cada autovalor.
a) λ1 = 7 2 1 12 3 23 3 4
x1
x2
x3
= 7
x1
x2
x3
⇐⇒2x1 + x2 + x3 = 7x1
2x1 + 3x2 + 3x3 = 7x2
3x1 + 3x2 + 4x3 = 7x3
Al resolver el sistema
ε(λ1) =
x1
x2
x3
= α
123
b) λ2 = 1. En este caso el autovalor degenerado de orden 2 presenta una pequena patologıa. Veamos 2 1 1
2 3 23 3 4
x1
x2
x3
=
x1
x2
x3
⇐⇒2x1 + x2 + x3 = x1
2x1 + 3x2 + 3x3 = x2
3x1 + 3x2 + 4x3 = x3
Resolviendo
ε(λ2) =
x1
x2
x3
= α
10−1
x1
x2
x3
= β
01−1
con lo cual el autovector ε(λ2) correspondiente al autovalor λ2 = 1 se podra escribir como
ε(λ2) = αε1(λ2) + βε2
(λ2) =
x1
x2
x3
= α
10−1
+ β
01−1
4. Una matriz 3× 3 con 1 autovalor real y dos autovalores complejos
⟨ei∣∣A |ej〉 =
1 2 33 1 22 3 1
⇒ det[Aij − λδij
]=
∣∣∣∣∣∣1− λ 2 3
3 1− λ 22 3 1− λ
∣∣∣∣∣∣ = 0
con lo cual el polinomio caracterıstico queda expresado como
λ3 − 3λ2 − 15λ− 18 = (λ− 6)(λ2 + 3λ+ 3
)= 0 ,
y es claro que tiene 2 raıces iguales y una distinta. En este caso λ = 6 es un autovalor real. Adicio-nalmente existen dos autovalores complejos, uno el complejo conjugado del otro: λ∗ = − 1
2
(3 + i
√3)
Borra
dor Pre
limin
ar
y λ∗ = − 12
(3− i
√3). Para proceder a calcular los autovectores correspondientes a cada autovalor re-
solvemos la ecuacion de autovalores para cada autovalor real. En este caso existe un unico autovalorreal λ = 6. 1 2 3
3 1 22 3 1
x1
x2
x3
= 6
x1
x2
x3
⇐⇒4x1 − 3x2 + x3 = 6x1
4x1 − x2 = 6x2
x1 + 7x2 − 4x3 = 6x3
Tendremos que para λ = 6
ε(λ=6) =
x1
x2
x3
= α
111
.
4.8.3. Ejercicios
1. Encuentre los autovalores y autovectores de la siguiente matriz
A =
1 3 −13 4 −2−1 −2 2
y verifique si los autovectores son ortogonales entre ellos.
2. Demuestre que la matriz
A =
2 0 0−6 4 43 −1 0
no tiene tres autovectores linealmente independientes y que cualquier autovector tiene la forma: λ
3λ− 2νν
3. Construimos un sistema con tres partıculas rıgidamente unidas, colocadas en tres puntos distintos de
la siguiente forma
m1 = 1→
11−2
m2 = 2→
−1−1
0
y m3 = 1→
112
a) Encuentre la matriz del tensor de inercia.
b) Diagonalice esa matriz y encuentre los ejes principales de inercia.
4. Suponga que un operador L puede ser escrito como la composicion de otros dos operadores L = L−L+
con [L−,L+] = I. Demostrar que
Si L|x >= λ|x > y |y >= L+|x > entonces L|y >= (λ+ 1)|y >
y, del mismo modo, demuestre que
Si L|x >= λ|x > y |yz >= L−|x > entonces L|z >= (λ− 1)|z >
Por ello es costumbre denominar a L+ y L− los operadores de “subidas” y de “bajada” respectivamente,ya que ellos construyen otros vectores con autovalores mayores (menores) en una unidad al vectoroperado.
Borra
dor Pre
limin
ar
5. En Mecanica Cuantica, el problema del oscilador armonico simple puede ser representado por unproblema de autovalores
L|ψ >= λ|ψ > ⇒ < x|L|ψ >= λ < x|ψ >↔ Lψ(x) = λψ(x) donde L ↔ d2
dx2+x2
4+
1
2
Si construimos un par de operadores
L+ =x
2+
d
dxy L− =
x
2− d
dx
Utilice los resultados del problema anterior y construya las nuevas autofunciones de L con sus autova-lores.
4.9. Autovalores y Autovectores de Matrices Importantes
En esta seccion presentaremos ejemplos de autovalores y autovectores de matrices de importancia en elcampo de la Fısica.
4.9.1. Autovalores y Autovectores de Matrices Similares
Supongamos la representacion matricial de un determinado operador lineal A : V → V (dim V = n),y ademas que |e1〉 , |e2〉 , |e3〉 , · · · |en〉 y |w1〉 , |w2〉 , |w3〉 , · · · |wn〉 son dos bases ortogonales para V.Entonces
A |ej〉 = Alj |el〉 con Aij =⟨ei∣∣A |ej〉
y
A |wj〉 = Alj |wl〉 con Aij =⟨wi∣∣A |wj〉 .
Ahora bien, cada uno de los vectores base |ej〉 y |wj〉 puede ser expresado en las otras bases |wj〉 y|ej〉 respectivamente como
|wj〉 = αlj |el〉
|el〉 = βml |wm〉
⇒ |wj〉 = αlj βml |wm〉 ⇒ αlj β
ml = βml α
lj = δmj ⇒ βml = (αml )
−1
Las cantidades αlj son escalares que pueden ser “arreglados” como una matriz. Esa matriz, adicionalmente es
no singular7 por ser una la representacion de una transformacion lineal que aplica una base en otra. Entoncesademas
|wj〉 = αlj |el〉 ⇒ A |wj〉 = αljA |el〉 ⇒ Alj |wl〉 = αmj Akm |ek〉 = αmj A
kmβ
hk︸ ︷︷ ︸
δhj
|wh〉
con lo cualAlj = αmj A
kmβ
lk ⇒ Alj = βlkA
kmα
mj ⇒ Alj =
(αlk)−1
Akmαmj
que puede ser expresada en el lenguaje de operadores, finalmente como
A = C−1AC ⇐⇒
⟨wi∣∣A |wj〉 =
(αik)−1 ⟨
ek∣∣A |em〉αmj
7det(αij
)6= 0
Borra
dor Pre
limin
ar
De esta manera hemos demostrado el siguiente teorema.
Teorema: Dadas dos matrices, n× n, Alj y Aij las cuales corresponden a la representacion matricial deun operador A en las bases ortogonales |e1〉 , |e2〉 , |e3〉 , · · · |en〉 y |w1〉 , |w2〉 , |w3〉 , · · · |wn〉, respectiva-mente. Entonces existe una matriz αlj , no singular, tal que
A = C−1AC ⇐⇒
⟨wi∣∣A |wj〉 =
(αik)−1 ⟨
ek∣∣A |em〉αmj . J
El inverso de este teorema tambien se cumple. Vale decir
Teorema: Si dos matrices n× n, Alj y Aij , estan relacionadas por la ecuacion
A = C−1AC ⇐⇒
⟨wi∣∣ A |wj〉 =
(αik)−1 ⟨
wk∣∣A |wm〉αmj
donde C es una matriz no singular, entonces A y A representan el mismo operador lineal.
Demostracion: Para proceder a demostrarlo supondremos A : V → V y que dim V = n, supongamosademas que |e1〉 , |e2〉 , |e3〉 , · · · |en〉 y |w1〉 , |w2〉 , |w3〉 , · · · |wn〉 son bases de V de tal forma
|wj〉 = αlj |el〉
|el〉 = βml |wm〉
⇒ |wj〉 = αlj βml |wm〉 ⇒ αlj β
ml = βml α
lj = δmj ⇒ βml = (αml )
−1
dondeαlj =
⟨el |wj〉 y βml = (αml )
−1= 〈wm |el〉
Supongamos que
A |ej〉 = Alj |el〉 con Aij =⟨ei∣∣A |ej〉
y
A |wj〉 = Alj |wl〉 con Aij =⟨wi∣∣ A |wj〉
al actuar A sobre |wj〉 tendremos
A |wj〉 = αljA |el〉 = αlj Akl |ek〉 = αlj A
kl β
mk |wm〉 = βmk Akl α
lj |wm〉 = (αmk )
−1Akl α
lj︸ ︷︷ ︸
〈wi|A|wj〉
|wm〉
que es exactamente la representacion matricial de A. Con lo cual A ≡ A y queda demostrado el teorema. J
Definicion: Dos matrices, Akl y Aij , n× n, se denominaran similares si existe una matriz no singular αiktal que
A = C−1AC ⇐⇒
⟨wi∣∣ A |wj〉 =
(αik)−1 ⟨
wk∣∣A |wm〉αmj . J
Podemos juntar los dos teoremas anteriores y afirmar que
Teorema: Dos matrices, Akl y Aij , n× n, similares representan la misma transformacion lineal.
Teorema: Dos matrices, Akl y Aij , n× n, similares tienen el mismo determinante.
Borra
dor Pre
limin
ar
Demostracion: La demostracion es inmediata y proviene de las propiedades del determinante de unproducto:
det[A]
= det[C−1AC
]= det
[C−1
]det [A] det [C] = det [A] . J
Con lo cual es inmediato el siguiente Teorema.
Teorema: Dos matrices, Akl y Aij , n×n, similares tienen el mismo polinomio caracterıstico y con ello elmismo conjunto de autovalores
Demostracion: Es inmediato verificar que
A− λ1 = C−1
AC− λ1 = C−1 (A−λ1) C
y dado que
det[A− λ1
]= det
[C−1(A−λ1) C
]= det
[C−1
]det [A−λ1] det [C] = det [A−λ1]
ambas matrices, A y A, tendran el mismo polinomio caracterıstico y con ello el mismo conjunto de autova-lores. J
Todos los teoremas de esta seccion pueden ser resumidos en el siguiente teorema
Teorema: Sea un operador lineal A : V → V y dim V = n, supongamos ademas que el polinomiocaracterıstico tiene n raıces distintas, λ1, λ2, . . . , λn. Entonces tendremos que:
Los autovectores |u1〉 , |u2〉 , · · · , |un〉 correspondientes a los a λ1, λ2, . . . , λn, forman una base paraV.
La representacion matricial del operador⟨uk∣∣A |um〉 en la base de autovectores |u1〉 , |u2〉 , · · · , |un〉,
sera diagonalAkm = Λkm =
⟨uk∣∣A |um〉 = diag (λ1, λ2, . . . , λn)
Cualquier otra representacion matricial,⟨ek∣∣A |em〉, del operador A en otra base de V, estara relacio-
nada con la representacion diagonal mediante una transformacion de similaridad
Λ = C−1AC ⇐⇒ diag (λ1, λ2, . . . , λn) =(αik)−1 ⟨
ek∣∣A |em〉 αmj
donde αmj es la matriz, no singular y por lo tanto invertible, de cantidades que relacionan ambas bases
|uj〉 = αlj |el〉
|el〉 = βml |um〉
⇐⇒ βml = (αml )−1 ⇒ βml α
lj = δmj
La demostracion, en terminos de los teoremas anteriores es inmediata y se la dejamos como ejercicio al lector.Una clase importante de transformaciones de similaridad son aquellas en las que C es unitaria, en esta
caso se tiene que Λ = C−1AC = C†AC. Ademas, si la base original ei es ortonormal y la matriz C esunitaria, entonces, la nueva base sera ortonormal. Las siguientes propiedades pueden ser de gran utilidad:
Si A es hermıtica (anti-hermıtica) entonces Λ es hermıtica (anti-hermıtica).
Λ† = (C†AC)† = C†A†C = ±C†AC = ±Λ
Borra
dor Pre
limin
ar
Si A es unitaria, es decir A† = A−1, entonces Λ es unitaria.
Λ†Λ = (C†AC)†(C†AC) = C†A†CC†AC = C†A†AC = C†IC = I
Veamos el siguiente ejemplo, dada la matriz
A =
1 0 30 −2 03 0 1
Al ser A simetrica, podemos diagonalizarla a traves de la transformacion C†AC, donde C se construye conlos vectores normalizados de A como columnas.
C =1√2
1 0 −1
0√
2 01 0 1
A pesar que los autovalores de A son degenerados (λ = 4,−2,−2) sus tres autovectores son linealmenteindependentes, por lo tanto:
C†AC =1
2
1 0 1
0√
2 0−1 0 1
1 0 30 −2 03 0 1
1 0 −1
0√
2 01 0 1
=
4 0 00 −2 00 0 −2
4.9.2. Autovalores y Autovectores de matrices Hermıticas
Tal y como mencionamos con anterioridad, un operador hermıtico cumple con
A† = A ⇒(A†)ij
=⟨ei∣∣A† |ej〉 =
⟨ej∣∣A |ei〉∗ =
(Aji
)∗Esto es: el hermıtico conjugado de una matriz, es su traspuesta conjugada. Por lo tanto las matrices hermıticasson simetricas respecto a la diagonal y los elementos de la diagonal son numeros reales.
Por su parte, llamaremos antihermıtico a un operador que cumpla con
A† = −A ⇒(A†)ij
=⟨ei∣∣A† |ej〉 = −
⟨ej∣∣A |ei〉∗ = −
(Aji
)∗
Teorema: Suponga un operador Hermıtico A = A† tiene por autovalores λ1, λ2, . . . , λn. Entonces:
Los autovalores λ1, λ2, . . . , λn son reales.
Los autovectores |u1〉 , |u2〉 , · · · , |un〉, correspondientes a cada uno de los autovalores, seran ortogo-nales.
Demostracion:
Para demostrar que los autovalores λ1, λ2, . . . , λn son reales, proyectamos la ecuacion de autovaloresen cada uno de los autovectores:
A |ψ〉 = λ |ψ〉 ⇒ 〈ψ|A |ψ〉 = λ 〈ψ |ψ〉
Borra
dor Pre
limin
ar
Ahora bien, dado que 〈ψ |ψ〉 es real, si demostramos que 〈ψ|A |ψ〉 estara demostrado que λ lo seratambien. Pero como A es hermıtico
〈ψ|A |ψ〉∗ = 〈ψ|A† |ψ〉 = 〈ψ|A |ψ〉 ⇒ 〈ψ|A |ψ〉 ∈ R
y por consiguiente los autovalores λ1, λ2, . . . , λn son reales. Mas aun, si A es hermıtico, y como susautovalores son reales entonces
〈ψ|A† = λ∗ 〈ψ| = λ 〈ψ| ⇒ 〈ψ|A |φ〉 = λ 〈ψ |φ〉
Para demostrar que los autovectores |u1〉 , |u2〉 , · · · , |un〉 son ortogonales, consideremos dos auto-vectores con sus correspondientes autovalores de tal forma que se cumplen las siguientes ecuaciones
A |ψ〉 = λ |ψ〉 y A |ϕ〉 = µ |ϕ〉
pero como A es hermıtico entonces se cumple que 〈ϕ|A = µ 〈ϕ|, multiplicando a la izquierda por |ψ〉y a 〈ψ|A = λ 〈ψ| por 〈ϕ| a la derecha.
(〈ϕ|A = µ 〈ϕ|) |ψ〉
〈ϕ| (A |ψ〉 = λ |ψ〉)
⇒
〈ϕ|A |ψ〉 = µ 〈ϕ |ψ〉
〈ϕ|A |ψ〉 = 〈ϕ |ψ〉
⇒ (λ− µ) 〈ϕ |ψ〉 = 0
y como hemos supuesto que λ 6= µ con lo cual 〈ϕ |ψ〉 = 0 los autovectores correspondientes a dosautovalores son ortogonales. J
Existen situaciones en las cuales un determinado autovalor λ = λ0 es degenerado. Consideremos una ma-triz n×n, Aij , por lo cual el polinomio caracterıstico P (λ) = det
[Aij − λδij
]= 0 tendra una raız degenerada
de orden k ≤ n. Entonces el siguiente teorema garantiza la existencia de al menos un subespacio S (λ0) ⊂ Vn.
Teorema: Sea un operador lineal A : Vn → Vn con una representacion matricial n × n tal que supolinomio P (λ) = det
[Aij − λδij
]= 0 tiene al menos una raız degenerada λ = λ0, de orden k ≤ n. Entonces
existen k autovectores, no triviales, que cumplen con
A |ψj〉 = λ0 |ψj〉 con j = 1, 2, · · · , k .
Demostracion:
La demostracion tambien emerge de una variante del Metodo de Induccion Completa. Para ello, pro-bamos que se cumple para j = 1. Esta afirmacion es obvia. Si existe un λ = λ0 existe un λ0 existe un|ψj〉, tal que cumple con la ecuacion anterior el es linealmente independiente con el mismo.
Suponemos que se cumple para 1 ≤ j = m ≤ k. Es decir, existen m autovectores |ψj〉 de A para elautovalor λ0. Definamos un subespacio Sλ0 = S (λ0) ⊂ Vn donde
|ψj〉 ∈ Sλ0/ A |ψj〉 = λ0 |ψj〉 ⇒ A |ψj〉 ∈ Sλ0
con j = 1, 2, · · · ,m
por lo tanto, podremos separar Vn como una suma directa entre el subespacio Sλ0y, N su complemento
ortogonalVn = Sλ0 ⊕N / A |ψj〉 = λ0 |ψj〉 ∧ |φ〉 ∈N ⇒ 〈φ |ψj〉 = 0
Borra
dor Pre
limin
ar
claramente Sλ0 es un subespacio invariante de A por cuanto su accion se circunscribe dentro del mismosubespacio Sλ0
. Mostraremos que se cumple para operadores hermıticos, por cuanto no es verdad engeneral. Entonces
〈φ |ψj〉 = 0∧
A |ψj〉 = λ0 |ψj〉
⇒ 〈ψj |φ〉 = 0 = 〈ψj |A† |φ〉 = 〈ψj |A |φ〉
de donde se concluye que el vector es ortogonal a Sλ0y por lo tanto esta en el complemento ortogo-
nal, A |φ〉 ∈ N como, por hipotesis |φ〉 ∈ N . Esto implica que N tambien es un espacio invariantedel operador hermıtico A. Entonces, el espacio Vn puede expresarse como una suma directa de losdos subespacios invariantes respecto al operador lineal A y su representacion matricial en la base deautovectores tendra la forma de una matriz diagonal a bloques:
⟨uj∣∣A |ui〉 = Aji →
Q11 · · · Q1
m 0 · · · 0...
. . ....
. . ....
Qm1 Qmm 0 · · · 00 · · · 0 1 0 0...
. . ....
.... . .
...0 · · · 0 0 · · · 1
1 · · · 0 0 · · · 0...
. . ....
.... . . 0
0 · · · 1 0 · · · 00 · · · 0 Rm+1
m+1 · · · Rm+1n
.... . .
......
. . ....
0 · · · 0 Rnm+1 · · · Rnn
donde Qαβ y Rµυ son matrices m ×m y (n−m) × (n−m) , respectivamente. La matriz Qαβ opera enSλ0 mientras que Rµυ actua sobre el complemento ortogonal N . El polinomio caracterıstico de A puedeexpresarse como
P (λ) = det[Aij − λδij
]= 0 ⇒ P (λ) = det
[Qij − λδij
]det[Rij − λδij
]= 0
y como λ = λ0 es la raız multiple del polinomio caracterıstico que anula el det[Qij − λδij
]tendremos
quedet[Qij − λ0δ
ij
]= 0 ⇒ P (λ) = (λ− λ0)
m F (λ) con F (λ0) 6= 0
donde λ0 no es raız del polinomio F (λ). Ahora bien, para que se cumpla para j = k el polinomiocaracterıstico es
j = k ⇒ P (λ) = (λ− λ0)kR (λ) ⇒ (λ− λ0)
m F (λ) = (λ− λ0)kR (λ)
otra vez λ0 no es raız del polinomio R (λ). La ecuacion anterior se cumple para todo λ en particularpara λ = λ0. Por lo tanto,
1 = (λ− λ0)k−m R (λ)
F (λ)
Es claro que λ = λ0 obliga a k = m. J
4.9.3. Autovalores y Autovectores de matrices Unitarias
Tal y como mencionamos anteriormente, un operador sera unitario si su inversa es igual a su adjunto.Esto es
U−1= U† ⇒ U†U = UU† = I .
Borra
dor Pre
limin
ar
Dado que los operadores unitarios conservan la norma de los vectores sobre los cuales ellos actuan, i.e.
|x〉 = U |x〉
|y〉 = U |y〉
⇒ 〈y |x〉 = 〈y|U†U |x〉 = 〈y |x〉
son elementos naturales para representar cambios de base dentro de un espacio vectorial. De lo anteriorse deduce que si |e1〉 , |e2〉 , |e3〉 , · · · |en〉 es una base ortonormal, el conjunto de vectores transformados,|ej〉 = U |ej〉, tambien son ortonormales:
|ej〉 = U |ej〉 ⇒⟨ei |ej〉 =
⟨ei∣∣U |ej〉 =
⟨ei∣∣U†U |ej〉 = δij
Bases y operadores unitarios
Los operadores unitarios aplican vectores base de un espacio vectorial en otra. El siguiente teorema loilustra.
Teorema: La condicion necesaria y suficiente para que un operador U : Vn → Vn sea unitario es queaplique vectores de una base ortonormal |e1〉 , |e2〉 , |e3〉 , · · · |en〉 en otra de |e1〉 , |e2〉 , |e3〉 , · · · |en〉 tam-bien ortonormal.
Demostracion: Demostremos primero la condicion necesaria. Si es unitario aplica una base en otra.Esto es, supongamos que los vectores |ej〉 forman una base ortonormal para Vn. Sean |ψ〉, y U† |ψ〉 ∈ Vn.Estos vectores pueden ser expresados en terminos de la base |ej〉 de Vn. Por lo tanto, si seleccionamosU† |ψ〉 se cumple que
U† |ψ〉 = cj |ej〉 ⇒ UU† |ψ〉 = cjU |ej〉 = cj |ej〉 ⇒ |ψ〉 = cj |ej〉
donde hemos aplicado el operador U a la ecuacion U† |ψ〉 = cj |ej〉 y el resultado es que el otro vector, |ψ〉,tambien se pudo expresar como combinacion lineal de los vectores transformados |ej〉 de la base |ej〉.Y por lo tanto, los |ej〉 tambien constituyen una base. Es decir, los operadores unitarios aplican una baseortonormal en otra.
La condicion de suficiencia (Si aplica una base en otra es unitario) se puede demostrar como sigue. Si|ej〉 y |ej〉 son bases ortonormales de V n y una es la transformada de la otra implica que
|ej〉 = U |ej〉 ; y 〈ej | = 〈ej |U†
con ⟨ei |ej〉 = δij ; |ej〉
⟨ej∣∣ = I
⟨ei |ej〉 = δij ; |ej〉
⟨ej∣∣ = I
por lo tanto,U†U |ej〉 = U† |ej〉 = |ek〉
⟨ek∣∣U† |ej〉 = |ek〉
⟨ek |ej〉 = |ek〉 δkj = |ej〉
Esto significa que U†U = I. JDe un modo equivalente, se puede demostrar que UU† = I. Veamos:
U† |ej〉 = |ek〉⟨ek∣∣U† |ej〉 = |ek〉
⟨ek |ej〉
y ahora, aplicando el operador U a esta ecuacion, tenemos
UU† |ej〉 = U |ek〉⟨ek |ej〉 = |ek〉
⟨ek |ej〉 = |ej〉
Esto significa que esta demostrado que U es unitario: U†U = UU† = I.
Borra
dor Pre
limin
ar
Matrices unitarias
La representacion de una matriz unitaria en una base |ej〉 implica
Ukj =⟨ek∣∣U |ej〉 ; 〈em|U† |ej〉 =
⟨ej∣∣U |em〉∗ =
(U jm)∗
δkj =⟨ek |ej〉 =
⟨ek∣∣ I |ej〉 =
⟨ek∣∣UU† |ej〉 =
⟨ek∣∣U |em〉 〈em|U† |ej〉 =
∑m
Ukm(U jm)∗
δkj =⟨ek |ej〉 =
⟨ek∣∣ I |ej〉 =
⟨ek∣∣U†U |ej〉 =
⟨ek∣∣U† |em〉 〈em|U |ej〉 =
∑m
(Umk )∗Umj
Una vez mas, dado un operador lineal A, la representacion matricial del hermıtico conjugado de eseoperador A† es la traspuesta conjugada de la matriz que representa al operador A. En el caso de operadoresunitarios.
Con lo cual es facilmente verificable que una matriz sea unitaria. Basta comprobar que la suma de losproductos de los elementos de una columna (fila) de la matriz con los complejos conjugados de otra columna(fila). Esa suma de productos sera
1. cero si las columnas (filas) son distintas
2. uno si las columnas (filas) son iguales
Ejemplos de matrices unitarias son las llamadas matrices de rotacion. Alrededor del eje z tendremos que
R (θ) =
cos(θ) − sen(θ) 0sen(θ) cos(θ) 0
0 0 1
y tambien la matriz de rotacion de una partıcula de espın 1
2 en el espacio de estados
R(1/2) (α, β, γ) =
(e−
i2 (α+γ) cos(β) −e i2 (α−γ) sen(β)
e−i2 (α−γ) sen(β) e
i2 (α+γ) cos(β)
)claramente se cumple la regla expuesta arriba.
Autovalores y Autovectores de matrices Unitarias
Si |ψu〉 es un autovector, normalizado del operador U correspondiente a un autovalor u tendremos quenorma al cuadrado sera igual a
U |ψu〉 = u |ψu〉 ⇒ 〈ψu|U†U |ψu〉 = 1 = u∗u 〈ψu |ψu〉 = u∗u ⇒ u = eiϕu
con ϕu una funcion real. Por lo cual podemos concluir que, necesariamente, los autovalores de los operadoresunitarios seran numeros complejos de modulo 1. Cuando los autovalores son diferentes, digamos w 6= u,entonces 〈ψw |ψu〉 = 0. Con lo cual los autovectores de un operador unitarios son ortogonales.
Borra
dor Pre
limin
ar
Transformacion unitaria de operadores
Hemos visto como las transformaciones unitarias permiten construir bases ortogonales |em〉 para el es-pacio vectorial Vn partiendo de otra base |em〉 tambien ortogonal. En esta subseccion mostraremos comotransforman los operadores lineales bajo transformaciones unitarias.
Definicion: Dadas dos bases ortonormales |ej〉 y |ek〉 en Vn con |ej〉 = U |ej〉, un operador linealunitario U : Vn → Vn y un operador lineal A : Vn → Vn.
Definiremos al operador transformado A : Vn → Vn como aquel cuya representacion matricial en la base|ek〉 es la misma que en la base |ej〉:
⟨ej∣∣ A |ei〉 =
⟨ej∣∣A |ei〉. J
A partir de esta definicion es facil concluir que⟨ej∣∣ A |ei〉 =
⟨ej∣∣U†AU |ei〉 =
⟨ej∣∣A |ei〉 ⇒ U†AU = A ⇐⇒ A = UAU
†
Por lo tanto, la ecuacion A = UAU†
corresponde a la definicion de la transformacion de un operador Amediante un operador unitario U†.
Es facil identificar las propiedades de estos operadores transformados:
Hermıtico conjugado y funciones de un operador transformado:(A)†
=(UAU†
)†= U†A†U =(A†)
en particular se sigue de esta propiedad que si A = A†, es hermıtico tambien lo sera A
A = A† ⇐⇒ A =(A)†
Del mismo modo (A)2
=(UAU†
)(UAU†
)= UA2U†=(A2)
con lo cual (A)n
=(UAU†
)n−2· · ·
(UAU†
)= UAnU†=(An) ⇒ F (A) = F
(A)
donde F (A) es una funcion del operador A.
Autovalores y autovectores de un operador transformado
Sera un autovector |φχ〉 de A correspondiente a un autovalor χ, y sea∣∣∣φχ⟩ el transformado de |φχ〉
mediante el operador unitario U. Entonces
A |φχ〉 = χ |φχ〉 ⇒ A∣∣∣φχ⟩ =
(UAU†
)U |φχ〉 = UA |φχ〉 = χU |φχ〉 = χ
∣∣∣φχ⟩ ,con lo cual es claro que
∣∣∣φχ⟩ es un autovector de A con el mismo autovalor χ :∣∣∣φχ⟩ = χ
∣∣∣φχ⟩.
Equivalentemente podemos afirmar que los autovectores transformados de A, seran autovectores deloperador transformado A.
Borra
dor Pre
limin
ar
4.10. Conjunto completo de observables que conmutan
Definicion: Diremos que un operador A : Vn → Vn es un observable si el conjunto de autovectores∣∣ui(µ)
⟩de un operador hermıtico A, forman una base de Vn.
A∣∣ui(µ)
⟩= ai
∣∣ui(µ)
⟩⇒
∣∣ui(µ)
⟩ ⟨ui(µ)
∣∣∣ = 1 ⇐⇒⟨ui(µ)
∣∣∣ uj(ν)
⟩= δijδ
µν
donde el ındice µ indica el grado de degeneracion del autovalor ai. JUn ejemplo trivial de un observable lo constituyen los proyectores, P|ψ〉 = |ψ〉 〈ψ| con 〈ψ| ψ〉 = 1.
Claramente, la ecuacion de autovalores para un proyector obliga a que tenga dos autovalores 0 y 1. Elautovalor nulo es infinitamente degenerado y esta asociado a todos los vectores ortogonales a |ψ〉, mientrasque el autovalor 1 corresponde a un autovalor simple y esta asociado a todos los vectores colineales al mismovector |ψ〉. Esto es
P|ψ〉 |ψ〉 = |ψ〉 y P|ψ〉 |φ〉 = 0 si 〈ψ| φ〉 = 0
Mas aun, sea un vector arbitrario |ϕ〉 ∈ Vn. Siempre se podra expresar como
|ϕ〉 = P|ψ〉 |ϕ〉+(I− P|ψ〉
)|ϕ〉 ⇒ P|ψ〉
(|ϕ〉 = P|ψ〉 |ϕ〉+
(I− P|ψ〉
)|ϕ〉)
P|ψ〉 |ϕ〉 = P|ψ〉(P|ψ〉 |ϕ〉
)+(P|ψ〉 − P2
|ψ〉
)|ϕ〉 = P|ψ〉 |ϕ〉 =⇒ P|ψ〉
(P|ψ〉 |ϕ〉
)= P|ψ〉 |ϕ〉 ,
ya que P2|ψ〉 = P|ψ〉, por definicion de proyector. Entonces, se deduce que P|ψ〉 |ϕ〉 es un autovector de P|ψ〉
con autovalor 1. Igualmente(I− P|ψ〉
)|ϕ〉 es un autovector de P|ψ〉 con autovalor 0, y la demostracion es
inmediataP|ψ〉
(I− P|ψ〉
)|ϕ〉 =
(P|ψ〉 − P2
|ψ〉
)|ϕ〉 = 0 .
Para el caso de autoespacios correspondientes a autovalores degenerados se puede definir un observable Ade la forma
A =∑i
aiPi con Pi =(∣∣ψ·(µ)
⟩ ⟨ψ·(µ)
∣∣∣)i
y µ = 1, 2, · · · , k .
4.10.1. Observables que Conmutan
Teorema: Si dos operadores lineales A y B, operadores hermıticos, conmutan, [A,B] = 0, y |ψ〉 esautovector de A con autovalor a, entonces B |ψ〉 tambien sera autovector de A con el mismo autovalor a.
Demostracion: La demostracion es sencilla
A |ψ〉 = a |ψ〉 ⇒ B (A |ψ〉 = a |ψ〉) ⇒ BA |ψ〉 = A (B |ψ〉) = a (B |ψ〉) J
Ahora bien, de esta situacion se pueden distinguir un par de casos:
si el autovalor a es no degenerado los autovectores asociados con este autovalor son, por definicion,colineales con |ψ〉 . Por lo tanto B |ψ〉 , sera necesariamente colineal con |ψ〉. La conclusion a estaafirmacion es que NECESARIAMENTE |ψ〉 es autovector de B.
si el autovalor a se degenerado, B |ψ〉 ∈ Sa, es decir B |ψ〉 esta en el autoespacio Sa con lo cual Sa esglobalmente invariante bajo la accion de B.
Borra
dor Pre
limin
ar
Teorema: Si dos observables A y B conmutan, [A,B] = 0, y si |ψ1〉 y |ψ2〉 son autovectores de A paraautovalores distintos, entonces el elemento de matriz
⟨ψ1∣∣B |ψ2〉 = 0
Demostracion: Si A |ψ1〉 = a1 |ψ1〉 y A |ψ2〉 = a2 |ψ2〉 entonces
0 =⟨ψ1∣∣ [A,B] |ψ2〉 =
⟨ψ1∣∣AB− BA |ψ2〉 =
(⟨ψ1∣∣A)B |ψ2〉 −
⟨ψ1∣∣B (A |ψ2〉)
= a1
⟨ψ1∣∣B |ψ2〉 − a2
⟨ψ1∣∣B |ψ2〉 = (a1 − a2)
⟨ψ1∣∣B |ψ2〉 ⇒
⟨ψ1∣∣B |ψ2〉 = 0 . J
Teorema: Si dos observables A y B, operadores hermıticos, conmutan, [A,B] = 0, los autovectores |ψi〉comunes a A y B constituyen una base ortonormal para Vn.
Demostracion: Denotemos los autovectores de A como∣∣ψi(µ)
⟩, de tal modo
A∣∣ψi(µ)
⟩= ai
∣∣ψi(µ)
⟩donde i = 1, 2, .., n− kn + 1 y µ = 1, 2, .., kn
kn indica el orden de la degeneracion de un determinado autovalor an. Dado que A es un observable los∣∣ψi (µ)
⟩forman una base, claramente, ⟨
ψi(µ)∣∣ψj(ν)
⟩= δijδ
µν
y dado que los elementos de matriz⟨ψi(ν)
∣∣B ∣∣ψj(ν)
⟩= δij esto quiere decir que los elementos
⟨ψi(µ)
∣∣B ∣∣ψj(ν)
⟩=
Bi(µ)j(ν) seran nulos para i 6= j pero no podemos decir nada a priori para el caso µ 6= υ y i = j. Entonces, al
ordenar la base, en general∣∣ψ1(1)
⟩,∣∣ψ1(2)
⟩, · · ·
∣∣ψ1(k1)
⟩,∣∣ψ2(1)
⟩,∣∣ψ2(2)
⟩, · · · ,
∣∣ψ2(k2)
⟩, · · · ,
∣∣ψ3(1)
⟩, · · ·
∣∣ψn−kn(1)
⟩para el caso que consideraremos sera∣∣ψ1(1)
⟩,∣∣ψ1(2)
⟩,∣∣ψ1(3)
⟩,∣∣ψ2(1)
⟩,∣∣ψ2(2)
⟩,∣∣ψ3(1)
⟩,∣∣ψ4(1)
⟩,∣∣ψ4(2)
⟩,∣∣ψ5(1)
⟩. J
La representacion matricial de B en esa base,⟨ψi(µ)
∣∣B ∣∣ψj(ν)
⟩, tendra la forma de una matriz diagonal a
bloques
B1 (1)1 (1) B
1 (1)1 (2) B
1 (1)1 (3) 0 0 0 0 0 0
B1 (2)1 (1) B
1 (2)1 (2) B
1 (2)1 (3) 0 0 0 0 0 0
B1 (3)1 (1) B
1 (3)1 (2) B
1 (3)1 (3) 0 0 0 0 0 0
0 0 0 B2 (1)2 (1) B
2 (1)2 (2) 0 0 0 0
0 0 0 B2 (2)2 (1) B
2 (2)2 (2) 0 0 0 0
0 0 0 0 0 B3 (1)3 (1) 0 0 0
0 0 0 0 0 0 B4 (1)4 (1) B
4 (1)4 (2) 0
0 0 0 0 0 0 B4 (2)4 (1) B
4 (2)4 (2) 0
0 0 0 0 0 0 0 0 B5 (1)5 (1)
Tal y como hemos mencionado los subespacios: e1, e2, y e4 corresponden a los autovalores degenerados
a1, a2, y a4 (de orden 3, 2 y 2 respectivamente).Una vez mas surgen dos casos a analizar:
Si an es un autovalor no degenerado, entonces existe un unico autovector asociado a este autovalor (ladimension del autoespacio es 1 esto es kj = 1 y no hace falta). Esto corresponde al ejemplo hipoteticode arriba para los autovalores simples a3, y a5.
Borra
dor Pre
limin
ar
Si an es un autovalor degenerado, entonces existe un conjunto de autovectores asociados a este autovaloran (en este caso la dimension del autoespacio es kn). Como los
∣∣ψj(µ)
⟩son autovectores de A su
representacion matricial sere diagonal a bloques. Ahora bien, como el autoespacio Sa es globalmente
invariante bajo la accion de B y Bi (µ)j(µ) =
⟨ψi(µ)
∣∣B ∣∣ψj(µ)
⟩es hermıtico, por ser B hermıtico entonces
B es diagonalizable dentro del bloque que la define. Es decir, se podra conseguir una base∣∣χj(µ)
⟩tal
que la representacion matricial de B en esa base es diagonal
Bi(µ)j =
⟨ψi(µ)
∣∣∣B ∣∣ψj(µ)
⟩=⇒
⟨χi(µ)
∣∣∣B ∣∣χj(µ)
⟩= B
i(µ)j(µ) = bj(µ)δ
ij
que no es otra cosa que los vectores∣∣χj (µ)
⟩seran autovectores de B
B∣∣χj(µ)
⟩= bj(µ)
∣∣χj(µ)
⟩.
Es importante recalcar que los autovectores∣∣ψj(µ)
⟩de A asociados con un autovalor degenerado NO
son necesariamente autovectores de B. Solo que como B es hermıtico puede ser diagonalizado dentro delautoespacio.
De ahora en adelante denotaremos los autovectores comunes a dos operadores A y B con distintos auto-valores como
∣∣u i|j(µ)
⟩tal que
A∣∣un|m(µ)
⟩= an
∣∣un|m(µ)
⟩y B
∣∣un|m(µ)
⟩= bm
∣∣un|m(µ)
⟩donde hemos dejado “espacio” para permitir la degeneracion la cual sera indicada por el ındice µ.
La prueba del inverso del teorema anterior es bien simple
Teorema: Si existe una base de autovectores∣∣uj(µ)
⟩comunes a A y B, entonces A y B conmutan,
[A,B] = 0
Demostracion: Es claro que
AB∣∣un|m(µ)
⟩= bmA
∣∣un|m(µ)
⟩= bman
∣∣un|m(µ)
⟩BA∣∣un|m(µ)
⟩= anB
∣∣un|m(µ)
⟩= anbm
∣∣un|m(µ)
⟩restando miembro a miembro obtenemos de manera inmedita
(AB− BA)∣∣un|m(µ)
⟩= [A,B]
∣∣un|m(µ)
⟩= (bman − anbm)
∣∣un|m(µ)
⟩= 0 . J
Definicion: Diremos que A,B,C,D · · · constituye un conjunto completo de observables que conmuntansi:
1. Obviamente los operadores del conjunto conmuntan entre ellos:
[A,B] = [A,C] = [A,D] = [B,C] = [B,D] = [C,D] = · · · = 0
2. Al especificar el conjunto de autovalores para los operadores
an, bm, ck, dl, · · ·
se especifica de manera unıvoca un unico autovetor comun a todos estos operadores
an, bm, ck, dl, · · · ⇒∣∣un|m|k|l··· (µ)
⟩. J
Borra
dor Pre
limin
ar
4.10.2. Ejemplos
Analicemos los siguientes ejemplos.
1. Considere, que el espacio de estados para un determinado sistema fısico viene expandido por una baseortonormal |ξ1〉 , |ξ2〉 , |ξ3〉. Definimos dos operadores Lz y S de la siguiente manera
Lz |ξ1〉 = |ξ1〉 ; Lz |ξ2〉 = 0; Lz |ξ3〉 = − |ξ3〉S |ξ1〉 = |ξ3〉 ; S |ξ2〉 = |ξ2〉 ; S |ξ3〉 = |ξ1〉
En la base ortonormal |ξ1〉 , |ξ2〉 , |ξ3〉 las representaciones matriciales para Lz,L2z,S y S2 seran las
siguientes
⟨ξi∣∣Lz |ξj〉 =
1 0 00 0 00 0 −1
,⟨ξi∣∣L2
z |ξj〉 =
1 0 00 0 00 0 1
⟨ξi∣∣S |ξj〉 =
0 0 10 1 01 0 0
,⟨ξi∣∣ S2 |ξj〉 =
1 0 00 1 00 0 1
Es claro que estas matrices son reales y simetricas y, por lo tanto, son hermıticas y, al ser el espaciode dimension finita, deben ser diagonalizables y sus autovectores formaran base para ese espacio. Porlo tanto, Lz,L2
z,S y S2 son observables.
¿Cual sera la forma mas general de una representacion matricial de un operador que conmunte conLz?Notamos que los vectores de la base ortonormal |ξ1〉 , |ξ2〉 , |ξ3〉 son autovectores para Lz con au-tovalores 1, 0,−1, con lo cual su representacion matricial tiene que ser diagonal. Recuerde que sidos observables A y B conmutan, [A,B] = 0, y si |ψ1〉 y |ψ2〉 son autovectores de A para autovaloresdistintos, entonces el elemento de matriz
⟨ψ1∣∣B |ψ2〉 = 0, con lo cual
[M,Lz] = 0 ⇔⟨ξi∣∣M |ξj〉 =
M11 0 0
0 M22 0
0 0 M33
,
Esto se desprende de manera directa de
0 =⟨ξi∣∣ [M,Lz] |ξj〉 =
⟨ξi∣∣MLz − LzM |ξj〉 = (λj − λi)
⟨ξi∣∣M |ξj〉 con (λj − λi) 6= 0 para i 6= j
Si nos planteamos la misma pregunta para L2z, vemos que sus autovalores son 1, 0. Esto es
L2z |ξ1〉 = |ξ1〉 ; L2
z |ξ2〉 = 0; L2z |ξ3〉 = |ξ3〉 ;
con lo cual tendremos que la representacion matricial para ese operador que conmute con L2z, no es
diagonal. Esto es
[N,L2z] = 0 ⇔
⟨ξi∣∣N |ξj〉 =
N11 0 N1
3
0 N22 0
N31 0 N3
3
,
Borra
dor Pre
limin
ar
ya que0 =
⟨ξ1∣∣ [N,L2
z] |ξ3〉 ⇒⟨ξ1∣∣N |ξ3〉 =
⟨ξ1∣∣N |ξ3〉
y vale para cualquier elemento N13 (y equivalentemente para N3
1 ).
Adicionalmente, si ordenamos la base de autovectores de Lz, como |ξ1〉 , |ξ3〉 , |ξ2〉 tendremos comorepresentacion matricial diagonal a bloques, correspondiente a un autorvalor degenerado 1
⟨ξi∣∣ N |ξj〉 =
N11 N1
3 0N3
1 N22 0
0 0 N33
.
Finalmente, la representacion matricial, mas general, de un operador que conmute con S2 es
[P,S2] = 0 ⇔⟨ξi∣∣P |ξj〉 =
P 11 P 1
2 P 13
P 21 P 2
2 P 23
N31 P 3
2 P 33
.
Ahora intentaremos construir una base comun de autovectores para L2z y S. Para ello notamos que |e2〉
es un autovector comun a L2z y S, por lo tanto existira un subespacio expandido por |e1〉 , |e3〉. En
ese subespacio las respresentaciones matriciales para L2z y S, seran
⟨ξi∣∣L2
z |ξj〉S13 =
(1 00 1
),⟨ξi∣∣S |ξj〉S13 =
(0 11 0
)Acto seguido planteamos el problema de autovalores para S, esto es
S |qj〉 = λj |uj〉 ⇒(
0 11 0
)(q1
q2
)= λ
(q1
q2
)⇒
|q2〉 = 1√
2(|ξ1〉+ |ξ3〉)
|q3〉 = 1√2
(|ξ1〉 − |ξ3〉)
con lo cual tendremos
Autovectores Autovalor L2z Autovalor S
|q1〉 = |e2〉 0 1|q2〉 = 1√
2(|ξ1〉+ |ξ3〉) 1 1
|q3〉 = 1√2
(|ξ1〉 − |ξ3〉) 1 -1
Cuadro 4.1: Dado que no hay lıneas repetidas L2z y S forman un CCOC.
Figura 4.1: Osciladores armonicos acoplados
Borra
dor Pre
limin
ar
2. Consideremos otro ejemplo proveniente de la Mecanica Clasica. Se trata de dos osciladores armonicos,de igual masa, acoplados con resortes con la misma constante elastica k. La ecuaciones de movimientopara este sistema son
mx1 + kx1 − k(x2 − x1) = 0 y mx2 + kx2 + k(x2 − x1) = 0
con lo cual podremos expresar esta ecuacion en forma de operadores
D |x〉 = 0 ⇔
(m d2
dt2 + 2k −k−k m d2
dt2 + 2k
)(x1
x2
)= 0
Si pensamos esta ecuacion como una ecuacion de autovalores, el autovalor es claramente λ = 0 y comolas masas y las constantes elasticas son iguales podemos intercambiar las partıculas y la fısica (lasecuaciones de movimiento) no cambian. Esto se puede expresar matematicamente como el operadorpermutacion de las partıculas
P =
(0 11 0
)⇒
(0 11 0
)(x1
x2
)=
(x2
x1
)Es inmediato comprobar que [D,P] = 0, con lo cual existira una combinacion lineal de autovectores deD (asociados con el autovalor λ = 0) los cuales tambien seran autovectores de P. Para ello procedamosa calcular los autovalores y autovectores de P
P |x〉 = λ |x〉 ⇒∣∣∣∣ −λ 1
1 −λ
∣∣∣∣ = 0 ⇒ λ± 1 ⇔ |e1〉 =1√2
(11
); |e2〉 =
1√2
(1−1
).
facilmente podemos expresar el vector posicion como una combinacion lineal de estos dos autovectoresde P. Esto es (
x1
x2
)=
ξ1√2
(11
)+
ξ2√2
(1−1
)⇒
ξ1 = 1√
2(x1 + x2)
ξ2 = 1√2
(x1 − x2)
Es claro que
|u1〉 =1√2
(x1 + x2)
(11
); y |u2〉 =
1√2
(x1 − x2)
(1−1
)son autovectores de P y D.
4.10.3. Ejercicios
Dado un observable A y un vector de estado |ψ〉 general, definiremos el valor de esperado de A a lacantidad 〈A〉 = 〈ψ|A |ψ〉 y la relacion de dispersion de A como⟨
(∆A)2⟩
=⟨
(A− 〈A〉 I)2⟩
=⟨A2⟩− 〈A〉2 ≡ 〈ψ|A2 |ψ〉 − 〈ψ|A |ψ〉2 ,
donde I es el operador identidad. Notese que el valor esperado es un numero que representa la dispersion deun observable y tiene la misma estructura e interpretacion de la variancia en estadıstica.
1. Muestre que la dispersion siempre es positiva, i.e⟨
(∆A)2⟩> 0.
Para ello:
Borra
dor Pre
limin
ar
a) Inicie mostrando que para cualquier operador hermıtico C se cumple⟨C2⟩> 0
b) y, termine mostrando que A− 〈A〉 I es un operador hermıtico
2. Muestre que la dispersion se anula para el caso en que |ψ〉 es autovector de A con autovalor 〈A〉
3. Utilizando la desigualdad de Cauchy-Schwarz muestre que las relaciones de dispersion entre dos obser-vables A y B siempre cumplen⟨
(∆A)2⟩⟨
(∆B)2⟩>
1
4|〈[A,B]〉|2 con [A,B] = AB− BA,
(4ptos) Esta es la forma general de la relacion de incertidumbre
4. En Mecanica Cuantica uno define el operador de spin como Si = ~2σi donde σi son las matrices de
Pauli e i = 1, 2, 3 representan las direcciones x, y, z, respectivamente
a) Encuentre la expresion para el conmutador [Si,Sj ], con i, j = 1, 2, 3.
b) Considere un vector de estado general |ψ〉 = a |+〉+ b |−〉, donde a y b son numeros complejos quecumplen con a2 + b2 = 1 y |+〉 , |−〉 la base de autovectores de Sz. Muestre que⟨
(∆Sz)2⟩⟨
(∆Sx)2⟩> ~4[Im(ab∗)]2
con Im() la parte imaginaria del argumento
4.11. Sistemas de ecuaciones lineales: segunda revision
Revisemos nuevamente la solucion de sistemas de ecuaciones lineales, queremos resolver:
A11x1 +A12x2 + · · ·A1nxn = c1
A21x1 +A22x2 + · · ·A2nxn = c2...
Am1x1 +Am2x2 + · · ·Amnxn = cm
donde los coeficientes Aij y ci son valores conocidos. Si todos los ci son cero el sistema se denomina ho-mogenero, en caso contrario inhomogeneo. Puede resultar que el conjunto de las incognitas xi representeuna solucion, infinitas soluciones o que simplemente no exista una solucion para el sistema. El analisis matri-cial nos puede ayudar a investigar sobre las posibles soluciones. En notacion de matrices, el sistema anteriorse puede escribir de la manera siguiente:
A11 A12 · · · A1n
A21 A22 · · · A2n
......
Am1 Am2 · · · Amn
x1
x2
...xn
=
c1c2...cm
De manera mas compacta, la ecuacion anterior se puede escribir tambien como:
AX = C
Recordemos que se puede interpretar AX = C como la trasformacion lineal A[X] = C de un vector X deVn a un vector C en algun otro espacio vectorial Wm. (Note que hemos cambiado ligeramente la notacion
Borra
dor Pre
limin
ar
que hemos venido utilizando donde: A |v〉 = |v′〉). Vimos que el operador A aplicara todo vector de Vn enalgun subespacio (o todo el espacio) de Wm. A este subespacio se le denomina el rango o recorrido de A ysu dimension es igual al rango de la matriz A.
Notemos que si A (o A) es singular, esto significa que existe algun subespacio de Vn que es aplicado alvector cero de Wm, es decir, se cumple que A[X] = 0, donde los vectores X pertenecen a este subespacio deVn el cual se llama el espacio nulo de A, como ya lo indicamos.
En cuanto al rango de la matriz A, podemos hacer la siguiente interpretacion: consideremos a cadacolumna de la matriz A como un vector, entonces tendremos el conjunto v1,v2, . . .vn de vectores. Elrango de la matriz A sera igual al numero de vectores linealmente independientes del conjunto, recordemosque este numero es tambien la dimension del espacio vectorial que expanden estos vectores. En terminos delconjunto de esos vectores tenemos que:
x1v1 + x2v2 + · · ·+ xnvn = C
por lo tanto, el rango de A sera la dimension r de esta expansion: rank[A] = r.Para el caso de un vector que pertenezca al espacio nulo A[X] = 0, resulta
x1v1 + x2v2 + · · ·+ xnvn = 0
y como solo r ≤ n de estos vectores son linealmente independientes podemos entonces considerar al conjuntov1,v2, . . .vr linealmente independiente y los sobrantes como posibles combinaciones lineales de los vr.Esto significa que la dimension del espacio nulo es n− r como lo indicamos con anterioridad.
En cuanto a las posibles soluciones del sistema podemos decir:
1. Si C pertenece al rango de A y ademas r = n, entonces todos los vectores v1,v2, . . .vn son linealmenteindependientes y el sistema tendra como unica solucion al conjunto x1, x2, . . . xn.
2. Si C pertenece al rango de A y ademas r < n, entonces unicamente r de los vectores v1,v2, . . .vn sonlinealmente independientes. Esto significa que podremos escoger los coeficientes de los n−r vectores demanera arbitraria sin dejar de satisfacer el sistema para algun conjunto de coeficientes x1, x2, . . . xn.Por tanto, existira un numero infinito de soluciones, que expanden un espacio vectorial tridimensionalde dimension n− r. Matemaaticamente es lo siguiente: Si X es algun vector que satisface A[X] = C y[X] cualquier vector del espacio nulo de A que satisface A[X] = 0, entonces
A[X + X] = A[X] + A[X] = A[X] + 0 = C
de manera que X + X tambien es solucion.
3. La otra posibilidad es que el sistema no tenga solucion, en este caso C NO pertenece al rango de A.
En el caso de un sistema homogeneo, C = 0, claramente existe una solucion que viene a ser la trivial:x1 = x2 = · · · = xn = 0, ademas, si r = n esta sera la unica solucion. Por otro lado, si r < n existe unnumero infinito de soluciones. Es bueno anotar que si hay menos ecuaciones que incognitas (m < n) entoncesautomaticamente r < n. Por lo tanto un conjunto de ecuaciones lineales homogneas con menos ecuacionesque incognitas siempre tiene una infinidad de soluciones.
Debemos considerar el importante caso cuando m = n, de decir, la matriz A es cuadrada y existe igualnumero de ecuaciones como de incognitas. Al ser cuadrada la matriz se tiene que la condicion r = n implicaque la matriz es no singular (det[A] 6= 0). El caso r < n se corresponde a que det[A] = 0 y la matriz Aresulta ser singular.
Borra
dor Pre
limin
ar
Ya hablamos del metodo de eliminacion de Gauss para resolver el sistema de ecuaciones, pero quedaahora por ver otra posibilidad que consiste en lo siguiente: al ser A una matriz n × n y si de paso es nosingular, entonces existe la matriz inversa, por lo tanto:
AX = C ⇒ X = A−1C
Un ejemplo: Resolver el sistema
2x1 + 4x2 + 3x3 = 4
x1 − 2x2 − 2x3 = 0
−3x1 + 3x2 + 2x3 = −7
esto es igual a 2 4 31 −2 −2−3 3 2
x1
x2
x3
=
40−7
al calcular la matriz inversa de A entonces resulta que x1
x2
x3
=1
11
2 1 −24 13 7−3 −18 −8
40−7
=
2−34
Existe una unica solucion al sistema, que es: x1 = 2, x2 = −3, x3 = 4.
Ejercicios
1. Resuelva
2x+ 3y + z = 11
x+ y + z = 6
5x− y + 10z = 34
2. Resuelva
x1 + 2x2 + 3x3 = 1
3x1 + 4x2 + 5x3 = 2
x1 + 3x2 + 4x3 = 3
3. Demuestre que el siguiente sistema solo tiene solucion si η = 1 o η = 2
x+ y + z = 1
x+ 2y + 4z = η
x+ 4y + 10z = η2
4. Encuentre las condiciones sobre η para que al resolver el sistema
x1 + ηx2 = 1
x1 − x2 + 3x3 = −1
2x1 − 2x2 + ηx3 = −2
Borra
dor Pre
limin
ar
a) tenga una solucion
b) no tenga solucion
c) tenga infinitas soluciones
Encuentre todas las soluciones que puedan existir.
Borra
dor Pre
limin
ar
4.12. Algunos ejemplos resueltos
1. Dados dos operadores lineales tales que:
AB = −BA; A2 = I; B2 = I; y [A,B] = 2iC
a) Muestre que C2 = I y que [B,C] = 2iA.
Solucion:
[A,B] = AB− BA = 2iC ⇒ 2AB = 2iC ⇒ ABAB = −C2 ⇒ −AABB = −C2 ⇒ I = C2
[B,C] = −i (BAB− ABB) = 2iA ⇒ −i (BAB− A) = 2iA ⇒ −i (−BBA− A) = 2iA
b) Evalue [[[A,B] , [B,C]] , [A,B]].
Solucion:
[[[A,B] , [B,C]] , [A,B]] = [[2iC, 2iA] , 2iC] = 8 [[AB, iA] ,AB] = 8i [(ABA− AAB) ,AB]
= 8i [−2B,AB] = 16i (BAB− ABB) = 32iA .
2. Sean A y B dos operadores hermıticos, con autovalores no degenerados y un operador unitario definidocomo: U = A+ iB. Muestre que :
a) [A,B] = 0 y A2 + B2 = 1.
Solucion: Como
UU† = U†U = (A+ iB) (A+ iB)†
= (A+ iB)†
(A+ iB)⇒ (A+ iB) (A− iB) = (A− iB) (A+ iB)
BA− AB = −BA+ AB ⇒ [B,A] = −[B,A] ⇒ [B,A] = 0
La segunda de las afirmaciones se puede demostrar, a partir de
UU† = I ⇒ (A+ iB) (A+ iB)†
= (A+ iB) (A− iB) =(A2 + B2 + i (BA− AB)
)⇒ I = A2 +B2
b) Los autovectores de A tambien lo son de BSolucion: Si |ui〉 son autovectores de A entonces
A |ui〉 = λi |ui〉 ⇒ BA |ui〉 = λiB |ui〉 como [B,A] = 0 , entonces AB |ui〉 = λiB |ui〉
por lo tanto, B |ui〉 es un autovector de A. Pero la solucion para la ecuacion de autovectores(A− λiI) |ui〉 = 0 es unica, por lo cual todos los autovectores de A son proporcionales. Esto esB |uj〉 = µj |uj〉, con lo cual que damostrado que los autovectores de A son autovalores de B.
c) Si U |vi〉 = νi |vi〉 entonces |µi| = 1.
Solucion: Es claro que⟨vj∣∣U†U |vi〉 =
⟨vj∣∣ I |vi〉 ⇒ µ∗jµi
⟨vj |vi〉 =
⟨vj∣∣ I |vi〉 ⇒ µ2
i = 1
3. Dada una matriz de la forma
A =
1 α 0β 1 00 0 1
y A |vi〉 = λi |vi〉
con α y β numeros complejos distintos de cero. Encuentre:
Borra
dor Pre
limin
ar
a) las relaciones que deben cumplir α y β para que λi sea real.
Solucion: El Polinomio caracterıstico y la condicion para que λ sea real sera:
(1− λ)(1− 2λ+ λ2 − αβ) = 0 ⇒ λ = 1±√αβ ⇒ αβ > 0 ∧ αβ ∈ R
b) Las relaciones que deben cumplir α y β para que⟨vj |vi〉 = δji .
Solucion: Los autovalores y autovectores para esta matriz seran
λ1 = 1⇒ |v1〉 =
001
; λ2 = 1+√αβ ⇒ |v2〉 =
β√αβ
10
; λ3 = 1+√αβ ⇒ |v3〉 =
−β√αβ
10
con lo cual ⟨
v2 |v3〉 = 0 ⇒ β2
αβ= 1 ⇒ |α| = |β|
c) Suponga que A es hermıtica, encuentre las relaciones que deben cumplir α y β.
Solucion: Si A es hermıtica, entonces α∗ = β, con lo cual se cumplen automaticamente ambasaseveraciones.
4. Dadas las siguientes matrices:
A =
(6 −2−2 9
)B =
(1 88 −11
)
C =
(−9 −10−10 5
)D =
(14 22 11
)Determine cuales conmutan entre ellas y encuentre la base de autovectores comunes.
Solucion: Notamos que [A,B] = [A,D] = [D,B] = 0 y
[A,C] =
(0 2−2 0
), [B,C] =
(0 −88 0
), [D,C] =
(0 −22 0
)Los autovectores comunes a A,B,D, seran
|u1〉 =
(− 1
21
), |u2〉 =
(21
)5. Dada la representacion matricial de dos operadores
A =
0 0 10 1 01 0 0
y B =
0 1 11 0 11 1 0
a) Evalue [A,B].
Solucion:
AB =
0 0 01 0 00 0 0
= BA ⇒ [A,B] = 0
Borra
dor Pre
limin
ar
b) Muestre que A tiene por autovalores λ1 = 1 y λ2 = −1 con λ1 un autovalor degenerado. Construyala base de autovectores para A.
Solucion: 0 0 10 1 01 0 0
xyz
= λ
xyz
⇒
−λ 0 10 1− λ 01 0 −λ
xyz
Entonces para ∣∣∣∣∣∣
−λ 0 10 1− λ 01 0 −λ
∣∣∣∣∣∣ = λ(1− λ)λ− (1− λ) =(λ2 − 1
)(1− λ) = 0
con lo cual tiene dos autovalores λ = 1 y λ = −1. Para el caso de λ = −1 se cumple que 0 0 10 1 01 0 0
xyz
= −
xyz
⇒z = −xy = −yx = −z
con lo cual el autovector asociado con el autovalor λ = −1 tendra la forma de
|u〉−1 = α
10−1
Para λ = 1 se cumple 0 0 1
0 1 01 0 0
xyz
=
xyz
⇒z = xy = yx = z
con lo cual hay dos vectores linealmente independientes asociados con λ = 1, a saber
|u〉1a = β
101
y |u〉1b =
0y0
con y arbitrario
Notese que estos tres autovectores |u〉1a , |u〉1b , |u〉−1 son ortogonales entre si
c) ¿Cual es la representacion matricial de A en la base de autovectores?
Solucion: Diagonal de la forma
Aij =
⟨u1∣∣A |u1〉
⟨u1∣∣A |u2〉
⟨u1∣∣A |u3〉⟨
u2∣∣A |u1〉
⟨u2∣∣A |u2〉
⟨u2∣∣A |u3〉⟨
u3∣∣A |u1〉
⟨u3∣∣A |u2〉
⟨u3∣∣A |u3〉
=
1 0 00 1 00 0 −1
ya que los autovectores forman una base ortogonal. Obviamente se cumple que
det[A] = det[A] = −1 y Tr[A] = Tr[A] = 1 .
Borra
dor Pre
limin
ar
d) A partir de los autovectores de A encuentre los autovalores y autovectores de B
Solucion: Claramente B |u−1〉 = − |u−1〉 con lo cual tenemos el primer autovector de B asociadoal autovalor λ = −1. Para encontrar los otros autovectores tendremos −λ 1 1
1 −λ 11 1 −λ
1y1
=
000
6. En mecanica clasica la cantidad de movimiento angular viene definida como L = r × p. Para pasar a
mecanica cuantica se asocia r y p con los operadores posicion y cantidad de movimiento los cuales, aloperar sobre la funcion de onda nos proveen
〈r|X |ψ〉 = x 〈r |ψ〉 = x ψ (r) 〈r|Px |ψ〉 =
(−i~ ∂
∂x
)〈r |ψ〉 = −i~ ∂
∂xψ (r)
〈r|Y |ψ〉 = y 〈r |ψ〉 = y ψ (r) 〈r|Py |ψ〉 =
(−i~ ∂
∂y
)〈r |ψ〉 = −i~ ∂
∂yψ (r)
〈r|Z |ψ〉 = z 〈r |ψ〉 = z ψ (r) 〈r|Pz |ψ〉 =
(−i~ ∂
∂z
)〈r |ψ〉 = −i~ ∂
∂zψ (r)
En coordenadas cartesianas, en la representacion de coordenadas |r〉 tendremos que
〈r|R |ψ〉 = r ψ (r) y 〈r|Px |ψ〉 = −i~ ∇ ψ (r)
De forma que en mecanica cuantica las componentes cartesianas del operador cantidad de movimientoangular son
〈r|L |ψ〉 = −i~ (r×∇)ψ (r)
〈r|L |ψ〉 = −i~(y∂
∂z− z ∂
∂y
)ψ (r) i− i~
(z∂
∂x− x ∂
∂z
)ψ (r) j− i~
(x∂
∂y− y ∂
∂x
)ψ (r) k
Utilizando las definiciones anteriores muestre que el conmutador de las componentes cartesianas de lacantindad de movimiento angular cumple con
[Lx,Ly] |ψ〉 = i~Lz |ψ〉
con L1 = L1 = Lx; L2 = L2 = Ly; L3 = L3 = Lz. En general: [Ll,Lm] = i~εlmnLn.
Solucion: Dado que
[L1,L2] |ψ〉 = [Lx,Ly] |ψ〉 = (LxLy − LyLx) |ψ〉
= −i~((
y∂
∂z− z ∂
∂y
)(z∂
∂x− x ∂
∂z
)−(z∂
∂x− x ∂
∂z
)(y∂
∂z− z ∂
∂y
))ψ (r)
Borra
dor Pre
limin
ar
Con lo cual
=
[(y∂
∂z
(z∂
∂x− x ∂
∂z
)− z ∂
∂y
(z∂
∂x− x ∂
∂z
))−(z∂
∂x
(y∂
∂z− z ∂
∂y
)− x ∂
∂z
(y∂
∂z− z ∂
∂y
))]ψ (r)
=
[(((yz
∂
∂z∂x+ y
∂
∂x
)− xy ∂
2
∂z2
)−(z2 ∂
∂y∂x− zx ∂
∂y∂z
))−
−((
zy∂
∂x∂z− z2 ∂
∂y∂x
)−(yx
∂
∂z2− zx ∂
∂z∂y− x ∂
∂y
))]ψ (r)
=
(y∂
∂x− x ∂
∂y
)ψ (r)
7. Dados dos Operadores Vectoriales A y B que conmutan entre ellos y con L tales que
[A,B] = [A,L] = [L,B] = 0
Demuestre entonces que[A · L,B · L] = i~ (A×B) · L
Solucion:
[A · L,B · L] = i~εklmAlBmLk == AlBmi~εklmLk = AlBm [Ll, Lm] = AlBmLlLm −AlBmLmbmLl= AlLlB
mLm −BmLmAlLl
8. Considere, que el espacio de estados para un determinado sistema fısico viene expandido por la baseortonormal |u1〉 , |u2〉 , |u3〉. Definimos dos operadores Lz y S de la siguiente manera
Lz |u1〉 = |u1〉 ; Lz |u2〉 = 0; Lz |u3〉 = − |u3〉S |u1〉 = |u3〉 ; S |u2〉 = |u2〉 ; S |u3〉 = |u1〉
a) Encuentre la representacion matricial en la base |u1〉 , |u2〉 , |u3〉 del operador: [Lz,S]
Solucion: La matriz sera⟨u1∣∣LzS− SLz |u1〉
⟨u1∣∣LzS− SLz |u2〉
⟨u1∣∣LzS− SLz |u3〉⟨
u2∣∣LzS− SLz |u1〉
⟨u2∣∣LzS− SLz |u2〉
⟨u2∣∣LzS− SLz |u3〉⟨
u3∣∣LzS− SLz |u1〉
⟨u3∣∣LzS− SLz |u2〉
⟨u3∣∣LzS− SLz |u3〉
con lo cual⟨u1∣∣LzS |u1〉 −
⟨u1∣∣SLz |u1〉
⟨u1∣∣LzS |u2〉 −
⟨u1∣∣SLz |u2〉
⟨u1∣∣LzS |u3〉 −
⟨u1∣∣ SLz |u3〉⟨
u2∣∣LzS |u1〉 −
⟨u2∣∣SLz |u1〉
⟨u2∣∣LzS |u2〉 −
⟨u2∣∣SLz |u2〉
⟨u2∣∣LzS |u3〉 −
⟨u2∣∣ SLz |u3〉⟨
u3∣∣LzS |u1〉 −
⟨u3∣∣SLz |u1〉
⟨u3∣∣LzS |u2〉 −
⟨u3∣∣SLz |u2〉
⟨u3∣∣LzS |u3〉 −
⟨u3∣∣SLz |u3〉
Borra
dor Pre
limin
ar
de donde
⟨ui∣∣ [Lz,S] |uj〉 =
0− 0 0− 0 1− (−1)
0− 0 0− 0 0− 0
(−1)− 1 0− 0 0− 0
=
0 0 2
0 0 0
−2 0 0
b) ¿Lz,S y [Lz,S] seran biyectivas?
Solucion: Por definicion S es biyectiva ya que cada vector tiene su imagen, Lz no lo es por cuantoel vector |u2〉 no tiene imagen y, finalmente [Lz,S] tampoco sera biyectiva dado que
⟨ui∣∣ [Lz,S] |uj〉
no tiene inversa ya que del det[⟨ui∣∣ [Lz,S] |uj〉
]= 0
c) Encuentre la dimension del Dominio, del Rango y del nucleo de la transformaciones Lz,S y [Lz,S]
Solucion:Dominio Rango Nucleo
Lz 3 2 1S 3 3 0[Lz,S] 3 2 2
dado que [Lz,S] |u2〉 = 0 .
9. Encuentre la expresion matricial para los operadores lineales de Pauli: R2 7−→ R2 dado que actuancomo
σz |+〉 = |+〉 , σz |−〉 = − |−〉σx |+〉x = |+〉x , σx |−〉x = − |−〉xσy |+〉y = |+〉y , σy |−〉y = − |−〉y
con
|+〉(
10
), |−〉
(01
)|+〉x =
1√2
[|+〉+ |−〉] , |−〉x =1√2
[|+〉 − |−〉]
|+〉y =1√2
[|+〉+ i |−〉] , |−〉y =1√2
[|+〉 − i |−〉]
Solucion: Ahora bien
x 〈+ |+〉x = 1 x 〈+ |−〉x =x 〈− |+〉x = 0 x 〈− |−〉x = 1
y 〈+ |+〉y = 1 y 〈+ |−〉y =y 〈− |+〉y = 0 y 〈− |−〉y = 1
Es decir, los vectores |+〉x , |−〉x y|+〉y , |−〉y
forman bases ortonormales, por lo que los vectores
|+〉 , |−〉 se pueden expresar en termino de esas bases como
|+〉 =1√2
[|+〉x + |−〉x] |−〉 =1√2
[|+〉x − |−〉x]
|+〉 =1√2
[|+〉y + |−〉y
]|−〉 =
−i√2
[|+〉y − |−〉y
]
Borra
dor Pre
limin
ar
Ası las expresiones matriciales seran
(σz)ij =
〈+|σz |+〉 〈+|σz |−〉
〈−|σz |+〉 〈−|σz |−〉
=
1 0
0 −1
y
(σx)ij =
〈+|σx |+〉 〈+|σx |−〉
〈−|σx |+〉 〈−|σx |−〉
=
1
2[x 〈+|+x 〈−|]σx [|+〉x + |−〉x]
1
2[x 〈+|+x 〈−|]σx [|+〉x − |−〉x]
1
2[x 〈+| −x 〈−|]σx [|+〉x + |−〉x]
1
2[x 〈+| −x 〈−|]σx [|+〉x − |−〉x]
=
1
2[x 〈+|+x 〈−|] [|+〉x − |−〉x]
1
2[x 〈+|+x 〈−|] [|+〉x + |−〉x]
1
2[x 〈+| −x 〈−|] [|+〉x − |−〉x]
1
2[x 〈+| −x 〈−|] [|+〉x + |−〉x]
(σx)ij =
0 1
1 0
(σy)ij =
〈+|σy |+〉 〈+|σy |−〉
〈−|σy |+〉 〈−|σy |−〉
=
1
2[y 〈+|+y 〈−|]σy
[|+〉y + |−〉y
] −i2
[y 〈+|+y 〈−|]σy[|+〉y − |−〉y
]i
2[y 〈+| −y 〈−|]σy
[|+〉y + |−〉y
] 1
2[y 〈+| −y 〈−|]σy
[|+〉y − |−〉y
]
=
1
2[y 〈+|+y 〈−|]
[|+〉y − |−〉y
] −i2
[y 〈+|+y 〈−|][|+〉y + |−〉y
]i
2[y 〈+| −y 〈−|]
[|+〉y − |−〉y
] −1
2[y 〈+| −y 〈−|]
[|+〉y + |−〉y
]
(σy)ij =
0 −i
i 0
Borra
dor Pre
limin
ar
10. Un operador Cantidad de Movimiento Generalizado se define como aquel conjunto de operadoreshermıticos que cumplen con
[Jx, Jy] = i~Jz [Jy, Jz] = i~Jx [Jz, Jx] = i~Jy , es decir [Ji, Jj ] = i~εijkJk
con εijk el sımbolo de Levy Civita (Los ındices repetidos NO indican suma). Adicionalmente, definimoslos siguientes operadores
J2 = J2x + J2
y + J2z; J+ = Jx + iJy J− = Jx − iJy
Muestre que [J2, J+
]=[J2, J−
]=[J2, Jz
]= 0
Solucion: Para probar esta propiedad se puede demostrar de forma generica que[J2k, Jm
]= 0 con
k,m = 1, 2, 3 ≡ x, y, z esto es[J2k, Jm
]= [JkJk, Jm] = JkJkJm − JmJkJk = JkJkJm − (i~εmklJl + JkJm) Jk
con lo cual [J2k, Jm
]= JkJkJm − i~εmklJlJk − Jk (i~εmknJn + JkJm)
y claramente se anula por cuanto los ’indices no suman pero si son mudos, y εmkl = −εmlk[J2k, Jm
]= JkJkJm − i~εmklJlJk − i~εmknJkJn − JkJkJm
al conmutar los cuadrados de las componentes con cualquiera de las componentes, y dado que loscomutadores son lineales entonces queda demostrado que[
J2, J±]
=[J2x + J2
y + J2z, Jx ± iJy
]=[J2y, Jx
]+[J2z, Jx
]± i[J2x, Jy
]± i[J2z, Jy
]= 0
11. Si definimos los autovectores comunes a J2 y Jz como |j,m〉 como
J2 |j,m〉 = j (j + 1) ~2 |j,m〉 Jz |j,m〉 = m~ |j,m〉 con 〈j,m |j′,m′〉 = δjj′δmm′
adicionalmente tenemos que
J− |j,m〉 = ~√j(j + 1)−m(m− 1) |j,m− 1〉 J+ |j,m〉 = ~
√j(j + 1)−m(m+ 1) |j,m+ 1〉
y si suponen (es facil demostrarlo) que −j ≤ m ≤ j esto quiere decir que dado el valor un j, m varıaentre −j y j de uno en uno, esto es m = −j,−j + 1,−j + 2, · · · , j − 2, j − 1, j. Suponga ahora quej = 1
2 . Encuentre:
a) la representacion matricial para: Jz, J−, J+, J2, en la base de autovectores de Jz, J2.
Solucion: Si |j,m〉 son autovectores de J2 y Jz su representacion matricial sera diagonal y comom varıa entre −j y j con incrementos de 1 tendremos que seran matrices 2× 2. La base ortogonalde autovectores sera
∣∣ 12 ,−
12
⟩,∣∣ 1
2 ,12
⟩ ⟨
12 ,
12
∣∣ Jz ∣∣ 12 , 12
⟩ ⟨12 ,
12
∣∣ Jz ∣∣ 12 ,− 12
⟩⟨
12 ,−
12
∣∣ Jz ∣∣ 12 , 12
⟩ ⟨12 ,−
12
∣∣ Jz ∣∣ 12 ,− 12
⟩ ≡ ~
2
1 0
0 −1
Borra
dor Pre
limin
ar
⟨12 ,
12
∣∣ J2∣∣ 1
2 ,12
⟩ ⟨12 ,
12
∣∣ J2∣∣ 1
2 ,−12
⟩⟨
12 ,−
12
∣∣ J2∣∣ 1
2 ,12
⟩ ⟨12 ,−
12
∣∣ J2∣∣ 1
2 ,−12
⟩ ≡ 3
4~2
1 0
0 1
La representacion matricial para J−, J+ obviamente no sera diagonal ⟨
12 ,
12
∣∣ J+
∣∣ 12 ,
12
⟩ ⟨12 ,
12
∣∣ J+
∣∣ 12 ,−
12
⟩⟨
12 ,−
12
∣∣ J+
∣∣ 12 ,
12
⟩ ⟨12 ,−
12
∣∣ J+
∣∣ 12 ,−
12
⟩ ≡ ~
0 1
0 0
⟨
12 ,
12
∣∣ J− ∣∣ 12 , 12
⟩ ⟨12 ,
12
∣∣ J− ∣∣ 12 ,− 12
⟩⟨
12 ,−
12
∣∣ J− ∣∣ 12 , 12
⟩ ⟨12 ,−
12
∣∣ J− ∣∣ 12 ,− 12
⟩ ≡ ~
0 0
1 0
b) Encuentre los autovalores y autovalores para Jz, J−, J+, J2 .
Solucion: Otra vez, ∣∣ 1
2 ,−12
⟩,∣∣ 1
2 ,12
⟩ son autovectores de J2 y Jz. En el caso de J2 con un auto-
valor de 34~
2 para ambos autovectores y en el caso de Jz los autovalores seran ±~2 respectivamente.
Para J−, J+ no tendran autovalor distinto de cero en esta base.
Borra
dor Pre
limin
arCapıtulo 5Coordenadas Curvilıneas, Campos yOperadores Diferenciales
216
Borra
dor Pre
limin
ar
5.1. Disgrecion derivativa
Los vectores podran ser constantes o variables. Ahora bien esa caracterıstica se verificara tanto en lascomponentes como en la base. Esto quiere decir que cuando un vector es variable podran variar su modulo, sudireccion, su sentido o todo junto o separado. Obviamente esta variabilidad del vector dependera de la baseen la cual se exprese, por lo cual un vector podra tener una componente constante en una base y constanteen otra.
|a〉(t) = ak (t) |ek〉(t) = ak |ek〉(t) = ak (t) |ek〉
De esta manera, cuando uno piensa en un vector variable
|a〉(t) ⇐⇒ a (t)
uno rapidamente piensa en establecer un cociente incremental, en dos notaciones diferentes es:
lım∆t→0
|a〉(t+∆t) − |a〉(t)∆t
= lım∆t→0
∆ |a〉(t)∆t
=d(|a〉(t)
)dt
⇐⇒ lım∆t→0
a (t+ ∆t)− a (t)
∆t= lım
∆t→0
∆a (t)
∆t=
da (t)
dt
La misma propuesta se cumplira para las formas diferenciales (t) 〈a|. Como siempre, las propiedades deesta operacion seran
d(|a〉(t) + |b〉(t)
)dt
=d(|a〉(t)
)dt
+d(|b〉(t)
)dt
d(α (t) |a〉(t)
)dt
=d (α (t))
dt|a〉(t) + α (t)
d(|a〉(t)
)dt
d(
(t) 〈a |b〉(t))
dt=
d(
(t) 〈a|)
dt|b〉(t) + 〈a|(t)
d(|b〉(t)
)dt
Ahora bien, esto implica que
|a〉(t) = ak (t) |ek〉(t) ⇒d(|a〉(t)
)dt
=d(ak (t) |ek〉(t)
)dt
=dak (t)
dt|ek〉(t) + ak (t)
d(|ek〉(t)
)dt
con lo cual hay que tener cuidado al derivar vectores y cerciorarse de la dependencia funcional de la basey componentes. Habra sistemas de coordenadas (bases de vectores) que sean constantes y otros con basesvariables.
5.2. Curvas y parametros
Podemos generalizar esta afirmacion y considerar un parametro λ, en este caso, si
|r〉 = r = r (x (λ) , y (λ) , z (λ))
entonces
|dr〉 = dr (x (λ) , y (λ) , z (λ)) =
(∂x (λ)
∂λ
∂r
∂x (λ)+∂y (λ)
∂λ
∂r
∂y (λ)+∂z (λ)
∂λ
∂r
∂z (λ)
)dλ
Borra
dor Pre
limin
ar
con lo cuald ( )
dλ=∂x (λ)
∂λ
∂ ( )
∂x (λ)+∂y (λ)
∂λ
∂ ( )
∂y (λ)+∂z (λ)
∂λ
∂ ( )
∂z (λ).
Podemos considerar las cantidades(∂x(λ)∂λ , ∂y(λ)
∂λ , ∂z(λ)∂λ
)como las componentes del vector dr (λ) (y en general
del operador d( )dλ ) tangente a la trayectoria parametrizada con λ. Mas aun, las cantidades
(∂( )∂x(λ) ,
∂( )∂x(λ) ,
∂( )∂z(λ)
)seran los vectores base en esas coordenadas.
Ası al considerar coordenadas generalizadas(q1 (λ) , q2 (λ) , q3 (λ)
), tendremos
|r〉 = r = r(q1 (λ) , q2 (λ) , q3 (λ)
)por lo tanto
dr(q1 (λ) , q2 (λ) , q3 (λ)
)=∂q1 (λ)
∂λdλ
∂r
∂q1 (λ)+∂q2 (λ)
∂λdλ
∂r
∂q2 (λ)+∂q3 (λ)
∂λdλ
∂r
∂q3 (λ)
ydr
dλ=∂q1 (λ)
∂λ
∂r
∂q1 (λ)︸ ︷︷ ︸u1
+∂q2 (λ)
∂λ
∂r
∂q2 (λ)︸ ︷︷ ︸u2
+∂q3 (λ)
∂λ
∂r
∂q3 (λ)︸ ︷︷ ︸u3
donde
u1 = ∂r∂q1(λ) ,u2 = ∂r
∂q2(λ) ,u3 = ∂r∂q3(λ)
, son la base del vector.
Por otro lado, el modulo del vector ‖dr (λ)‖ representara la longitud de arco ds para esa curva. Porconsiguiente
ds2 = dr(λ) · dr(λ) =d (dr(λ))
dλ
d (dr(λ))
dλ(dλ)2 =
∂qi
∂λ
∂ (dr(λ))
∂qi∂qj
∂λ
∂ (dr(λ))
∂qj(dλ)2
=∂ (dr(λ))
∂qi∂ (dr(λ))
∂qj∂qi
∂λdλ︸ ︷︷ ︸
dqi
∂qj
∂λdλ︸ ︷︷ ︸
dqj
=∂ (dr(λ))
∂qi∂ (dr(λ))
∂qjdqidqj
donde dr(λ)dλ es el vector tangente a la curva. Dado que
(ds)2
= gij dxi dxj = gij dxi dxj = gij dqi dqj =∂ (dr(λ))
∂qi∂ (dr(λ))
∂qj︸ ︷︷ ︸gij
dqidqj
identificamos claramente a las componentes del tensor gij :
gij ≡∂ (dr(λ))
∂qi∂ (dr(λ))
∂qj.
5.3. Ejemplo
Dado un sistema generico de coordenadas oblicuas
|e1〉 = a |i〉+ b |j〉 ; |e2〉 = c |i〉+ d |j〉
Borra
dor Pre
limin
ar
Figura 5.1: Coordenadas Curvilıneas en 2D
1. Encuentre la expresion para un vector generico |v〉 = vx |i〉+ vy |j〉 en estas coordenadas.
Solucion:|e1〉 = a |i〉+ b |j〉
|e2〉 = c |i〉+ d |j〉
⇔
|i〉 = 1∆ (d |e1〉 − b |e2〉)
|j〉 = 1∆ (c |e1〉 − a |e2〉)
con ∆ = bc− ad por lo cual
|v〉 = vx |i〉+ vy |j〉 =vx∆
(d |e1〉 − b |e2〉) +vy∆
(c |e1〉 − a |e2〉)
=(dvx∆
+ cvy∆
)|e1〉 −
(bvx∆
+ avy∆
)|e2〉
2. Suponga ahora una base y un tensor concreto
|e1〉 = |i〉 ; |e2〉 =
√2
2|i〉+
√2
2|j〉 ; T ij =
(4 21 4
)
Borra
dor Pre
limin
ar
Encuentre la expresion matricial para el tensor Tij1
Solucion: En general,
Tij = gikTkj = gik
∂xk
∂xmTmn
∂xn
∂xj
Identificando
vx = v1 =∂x1
∂xjvj =
∂x1
∂x1v1 +
∂x1
∂x2v2 =
d
∆︸︷︷︸∂x1
∂x1
vx +c
∆︸︷︷︸∂x1
∂x2
vy
vy = v2 =∂x2
∂xjvj =
∂x2
∂x1v1 +
∂x2
∂x2v2 =
−b∆︸︷︷︸∂x2
∂x1
vx +−a∆︸︷︷︸∂x2
∂x2
vy
como
a = 1b = 0
c =√
22
d =√
22
⇒
gik ⇒
(1
√2
2√2
2 1
), ∂xk
∂xm ⇒(−1 −10 1
)
∂xn
∂xj =(∂xn
∂xj
)−1 ⇒(−1 −10 1
)−1
=
(−1 −10 1
)Finalmente:
Tij =
(1
√2
2√2
2 1
)(−1 −10 1
)(4 21 4
)(−1 −10 1
)=
(5− 1
2
√2 −1 + 3
2
√2
52
√2− 1 − 1
2
√2 + 3
).
5.4. Coordenadas curvilıneas generalizadas
Como hemos visto, siempre se podra definir un sistema de coordenadas generalizadas(q1, q2, q3
)tales
que
|r〉 = r = r(q1, q2, q3
)⇒ dr =
∂r
∂q1dq1 +
∂r
∂q2dq2 +
∂r
∂q3dq3
y por consiguiente
(ds)2
= gij dxi dxj ≡ 〈dr |dr〉 =∂ |r〉∂qi
∂ |r〉∂qj
dqidqj ⇒
gij=
∂|r〉∂qi
∂|r〉∂qj
|ξj〉 = 1∥∥∥ ∂|r〉∂qj
∥∥∥ ∂|r〉∂qj
Se genera entonces una trıada de vectors base |ξj〉 ortonormales, de manera que
|ξ1〉 =1∥∥∥∂|r〉∂q1
∥∥∥ ∂ |r〉∂q1; |ξ2〉 =
1∥∥∥∂|r〉∂q2
∥∥∥ ∂ |r〉∂q2; |ξ3〉 =
1∥∥∥∂|r〉∂q3
∥∥∥ ∂ |r〉∂q3;
1Ayuda: dada una mantriz generica Aij =
(A BC D
), su inversa sera
(D
AD−BC − BAD−BC
− CAD−BC
AAD−BC
).
Borra
dor Pre
limin
ar
los cuales son vectores tangentes a las curvas que define el radio vector |r〉. Claramente si el sistema esortogonal los factores de escala son importantes para su categorizacion
h1 =
∥∥∥∥∂ |r〉∂q1
∥∥∥∥ ; h2 =
∥∥∥∥∂ |r〉∂q2
∥∥∥∥ ; y h3 =
∥∥∥∥∂ |r〉∂q3
∥∥∥∥Con lo cual podemos definir el elemento de lınea como
ds2 =(h1 dq1
)2+(h2 dq2
)2+(h3 dq3
)2=∂ 〈dr|∂qi
∂ |dr〉∂qj
dqi dqj = gij dqi dqj
Es decir, que identificamos la metrica como
h1 =∂x
∂q1=∂x1
∂q1=√g11; h2 =
∂y
∂q2=∂x2
∂q2=√g22; h3 =
∂z
∂q3=∂x3
∂q3=√g33.
De tal forma que los casos particulares se recuperan facilmente.En la Figura 5.1 podemos ver algunos ejemplos de sistemas de coordenadas: en el cuadrante I coordenadas
polares: x = ρ cos(ϕ); y = ρ sen(ϕ). En el cuadrante II coordenadas elıpticas: x = a cosh(u) cos(v); y =a senh(u) sen(v). En III coordenadas parabolicas: x = 1
2
(u− v2
); y = uv y en el cuadrante IV coordenadas
bipolares: x2 + [y − a cot(u)]2
= a2 csc2(u);[x− a senh(v)
cosh(v)
]2+ y2 = a2
senh2(v).
5.4.1. Coordenadas generalizadas, vectores y formas
Recordando como construimos el desplazamiento para una base generica ortogonal, |ej〉 de un espaciovectorial con producto interno, el desplazamiento infinitesimal puede expresarse como
ds2 ≡ 〈dr |dr〉 =(dxk
⟨ek∣∣) (dxm |em〉) =
⟨ek |em〉 dxk dxm = dxm dxm = gkm dxkdxm
Donde hemos utilizado el hecho de que la metrica nos permite asociar componentes contravariantes a cova-riantes y viceversa, es decir, establece una relacion entre formas y vectores.
Si las bases de formas y vectores son ortogonales la metrica sera diagonal y como en general∥∥∥∂|dr〉∂qj
∥∥∥ 6= 1,
entoces surgen los llamados factores de escala hi = giiUna vez mas, una forma 〈b| o, un vector |a〉 cualquiera puede expresarse como una combinacion lineal de
formas o vectores base|a〉 = aj |ej〉 = aj |ej〉 ↔ 〈b| = bj
⟨ej∣∣ = bj
⟨ej∣∣
conaj =
⟨ej |a〉 ; aj =
⟨ej |a〉 ; bj = 〈b |ej〉 ; y bj = 〈b |ej〉 .
De esta manera las componentes covariantes y contravariantes estaran relacionadas como
aj = gjkak ⇒ ai = h[i]a
[i]
aquı h[i]a[i] NO indica suma. En otras palabras, en aquellos sistemas de coordenadas en los cuales la metrica
es diagonal pero no viene representada por la matriz unidad, subir y bajar indices puede incluir los cambiosde escala.
Borra
dor Pre
limin
ar
5.4.2. Velocidades y aceleraciones
Antes de pasar a analizar los casos particulares haremos un alto para revisar las expresiones de lasvelocidades y las aceleraciones en coordenadas generalizadas. Para ello recordamos que los vectores velocidady aceleracion se representan como
|v〉 = vj |ej〉 = xj |ej〉 = vj |ej〉 = ˙xj |ej〉 y |a〉 = aj |ej〉 = xj |ej〉 = aj |ej〉 = ¨xj |ej〉
respectivamente.Para determinar las expresiones de estos vectores en cualquier sistema de coordenadas, es suficiente
con encontrar las expresiones de sus componentes covariantes o contravariantes. Como sabemos, podremosencontrar una a partir de las otras con la ayuda de la metrica del sistema de coordenadas.
Entonces, el vector velocidad en la base cartesiana se puede expresar como
|v〉 = vx |i〉+vy |j〉+vz |k〉 = x |i〉+ y |j〉+ z |k〉 = xj |ej〉 = qj |ej〉 , con : |e1〉 = |i〉 ; |e2〉 = |j〉 ; y |e3〉 = |k〉
Claramente las componentes contravariantes del vector velocidad en un sistema de coordenadas genera-lizado son vj = qj .
Recordamos que para cualquier base generalizada de vectores o formas las componentes covariantes seexpresan en termino de la base cartesiana (de vectores o formas) como
|ej〉 =∂xi
∂qj|ei〉 y
⟨ei∣∣ =
∂qi
∂xj⟨ej∣∣
Entoces las componentes covariantes del vector velocidad en una base generalizada seran
vj = 〈v |ej〉 = (xm 〈em|)(∂xi
∂qj|ei〉)
= xm∂xm
∂qj= xm
∂xm
∂t∂qj
∂t
= xm∂xm
∂qj=∂(vmv
m
2
)∂qj
Resulta facil expresar las componentes covariantes una vez que conocemos el modulo del vector expresadoen ese sistema de coordenadas. El cual siempre viene escrito a partir del diferencial
d |r〉 ⇒ d |r〉dt
Para encontrar la expresion para la aceleracion se procede de manera analoga.
aj = 〈a |ej〉 = (xm 〈em|)(∂xi
∂qj|ei〉)
= xm∂xm
∂qj≡ d
dt
(xm
∂xm
∂qj
)− xm
∂xm
∂qj
y otra vez
∂xm
∂qj=∂xm
∂qj⇒ aj =
d
dt
(xm
∂xm
∂qj
)− xm
∂xm
∂qj=
d
dt
[∂
∂qj
(xmx
m
2
)]− ∂
∂qj
(xmx
m
2
)para finalmente
aj =d
dt
[∂
∂qj
(vmv
m
2
)]− ∂
∂qj
(vmv
m
2
)
Borra
dor Pre
limin
ar
5.4.3. Coordenadas cartesianas
El primer caso, el mas trivial, lo constituyen las coordenadas cartesianas.(q1, q2, q3
)⇐⇒ (x, y, z)
|r〉 = x |i〉+ y |j〉+ z |k〉 ⇐⇒ r = xi + yj + zk
dr ⇒ |dr〉 =
(∂ |r〉∂x
)dx+
(∂ |r〉∂y
)dy +
(∂ |r〉∂z
)dz = dx |i〉+ dy |j〉+ dz |k〉
Consecuentemente
hx =
∥∥∥∥∂ |r〉∂x
∥∥∥∥ = 1 , hy =
∥∥∥∥∂ |r〉∂y
∥∥∥∥ = 1 , hz =
∥∥∥∥∂ |r〉∂z
∥∥∥∥ = 1
y
|i〉 =1∥∥∥∂|r〉∂x ∥∥∥
∂ |r〉∂x
, |j〉 =1∥∥∥∂|r〉∂y ∥∥∥
∂ |r〉∂x
, |k〉 =1∥∥∥∂|r〉∂z ∥∥∥
∂ |r〉∂z
El elemento de lınea viene definido como
(ds)2
=(h1 dx1
)2+(h2 dx2
)2+(h3 dx3
)2 ⇐⇒ ds2 = dx2 + dy2 + dz2
y el tensor metrico serag11 = gxx = 1; g22 = gyy = 1; g22 = gzz = 1.
El hecho de que para las coordenadas cartesianas: hx = hy = hz = 1 significara que las tomaremos comocoordenadas base respecto a las cuales expresaremos las demas.
5.4.4. Coordenadas cilındricas
Las coordenadas cilındricas se expresan de la siguiente forma(q1, q2, q3
)⇐⇒ (ρ, ϕ, z)
|r〉 = x (ρ, ϕ) |i〉+ y (ρ, ϕ) |j〉+ z |k〉 ⇐⇒ r = x (ρ, ϕ) i + y (ρ, ϕ) j + zk
Con: ρ ≥ 0, 0 ≤ ϕ < 2π y −∞ < z <∞.
dr ⇒ |dr〉 =
(∂ |r〉∂ρ
)dρ+
(∂ |r〉∂ϕ
)dϕ+
(∂ |r〉∂z
)dz
Estas cantidades pueden ser identificadas a partir de las leyes de transformacion respecto a las coordenadascartesianas:
x = x (ρ, ϕ) = ρ cos(ϕ)
y = y (ρ, ϕ) = ρ sen(ϕ)
z = z
⇒
dx = cos(ϕ)dρ− ρ sen(ϕ)dϕ
dy = sen(ϕ)dρ+ ρ cos(ϕ)dϕ
dz = dz
Por lo que el vector posicion en estas coordenadas es
|r〉 = ρ cos(ϕ) |i〉+ ρ sen(ϕ) |j〉+ z |k〉
Borra
dor Pre
limin
ar
Es facil identificar∂x (ρ, ϕ)
∂ρ= cos(ϕ) ,
∂y (ρ, ϕ)
∂ρ= sen(ϕ) ,
∂z
∂ρ= 0
∂x (ρ, ϕ)
∂ϕ= −ρ sen(ϕ) ,
∂y (ρ, ϕ)
∂ϕ= ρ cos(ϕ) ,
∂z
∂ϕ= 0
∂x (ρ, ϕ)
∂z= 0 ,
∂y (ρ, ϕ)
∂z= 0 ,
∂z
∂z= 1
y de allı calcular los factores de escala:
hρ =
∥∥∥∥∂ |r〉∂ρ
∥∥∥∥ =
∥∥∥∥∂ [x (ρ, ϕ) |i〉+ y (ρ, ϕ) |j〉+ z |k〉]∂ρ
∥∥∥∥ =
∥∥∥∥∂x (ρ, ϕ)
∂ρ|i〉+
∂y (ρ, ϕ)
∂ρ|j〉∥∥∥∥
= ‖cos(ϕ) |i〉+ sen(ϕ) |j〉‖ = 1
Del mismo modo
hϕ =
∥∥∥∥∂ |r〉∂ϕ
∥∥∥∥ = ρ ; hz =
∥∥∥∥∂ |r〉∂z
∥∥∥∥ = 1.
mientras que los vectores unitarios seran
|ξρ〉 = 1
‖ ∂|r〉∂ρ ‖∂|r〉∂ρ = ∂x(ρ,ϕ)
∂ρ |i〉+ ∂y(ρ,ϕ)∂ρ |j〉 = cos(ϕ) |i〉+ sen(ϕ) |j〉
|ξϕ〉 = 1
‖ ∂|r〉∂ϕ ‖∂|r〉∂ϕ = 1
ρ
(∂x(ρ,ϕ)∂ϕ |i〉+ ∂y(ρ,ϕ)
∂ϕ |j〉)
= − sen(ϕ) |i〉+ cos(ϕ) |j〉
|ξz〉 = 1
‖ ∂|r〉∂z ‖∂|r〉∂z = ∂(z)|k〉
∂z = |k〉
La expresion para el vector desplazamiento infinitesimal sera
d |r〉 =
(∂ |r〉∂ρ
)dρ+
(∂ |r〉∂ϕ
)dϕ+
(∂ |r〉∂z
)dz = dρ |ξρ〉+ ρdϕ |ξϕ〉+ dz |ξz〉 .
Notemos que en este caso y a diferencia de las coordenadas cartesianas, si ϕ varıa en una cantidad dϕ, conρ y z constantes, entonces el desplazamiento no sera dϕ sino ρdϕ.
El elemento de lınea viene definido como
(ds)2
=(h1dq1
)2+(h2dq2
)2+(h3dq3
)2 ⇐⇒ ds2 = dρ2 + ρ2 dϕ2 + dz2
y el tensor metrico:g11 = gρρ = 1; g22 = gϕϕ = ρ2; g33 = gzz = 1.
Ejercicios
1. Exprese el vectorr = yzi− yj + xz2k
en coordenadas cilındricas.Nota: Antes, se deben expresar los vectores base i, j,k en terminos de los vectores base ξρ, ξϕ, ξz.
Borra
dor Pre
limin
ar
5.4.5. Coordenadas esfericas
Para construir el sistema de coordenadas esfericas tenemos:(q1, q2, q3
)⇐⇒ (r, θ, ϕ)
|r〉 = x (r, θ, ϕ) |i〉+ y (r, θ, ϕ) |j〉+ z (r, θ, ϕ) |k〉 ⇐⇒ r = x (r, θ, ϕ) i + y (r, θ, ϕ) j + z (r, θ, ϕ) k
Con: r ≥ 0, 0 ≤ θ ≤ π y 0 ≤ ϕ < 2π.
dr ⇒ |dr〉 =
(∂ |r〉∂r
)dr +
(∂ |r〉∂θ
)dθ +
(∂ |r〉∂ϕ
)dϕ
Estas cantidades pueden ser identificadas de las leyes de transformacion respecto a las coordendas carte-sianas
x = x (r, θ, ϕ) = r cos(ϕ) sen(θ)
y = y (r, θ, ϕ) = r sen(ϕ) sen(θ)
z = z (r, θ, ϕ) = r cos(θ)
⇒
dx = cos(ϕ) sen(θ)dr − r sen(ϕ) sen(θ)dϕ+ r cos(ϕ) cos(θ)dθ
dy = sen(ϕ) sen(θ)dr + r cos(ϕ) sen(θ)dϕ+ r sen(ϕ) cos(θ)dθ
dz = cos(θ)dr − r sen(θ)dθ
El vector posicion es de la forma
|r〉 = r sen(θ) cos(ϕ) |i〉+ r sen(θ) sen(ϕ) |j〉+ r cos(θ) |k〉 .
Derivando:
∂x (r, θ, ϕ)
∂r= cos(ϕ) sen(θ) ,
∂y (r, θ, ϕ)
∂r= sen(ϕ) sen(θ) ,
∂z (r, θ, ϕ)
∂r= cos(θ)
∂x (r, θ, ϕ)
∂ϕ= −r sen(ϕ) sen(θ) ,
∂y (r, θ, ϕ)
∂ϕ= r cos(ϕ) sen(θ) ,
∂z (r, θ, ϕ)
∂ϕ= 0
∂x (r, θ, ϕ)
∂θ= r cos(ϕ) cos(θ) ,
∂y (r, θ, ϕ)
∂θ= r sen(ϕ) cos(θ) ,
∂z (r, θ, ϕ)
∂θ= −r sen(θ)
Los factores de escala son
hr =
∥∥∥∥∂ |r〉∂r
∥∥∥∥ = ‖cos(ϕ) sen(θ) |i〉+ sen(ϕ) sen(θ) |j〉+ cos(θ) |k〉‖
=√
cos2(ϕ) sen2(θ) + sen2(ϕ) sen2(θ) + cos2(θ) = 1 .
hθ =
∥∥∥∥∂ |r〉∂θ
∥∥∥∥ = ‖r cos(ϕ) cos(θ) |i〉+ r sen(ϕ) cos(θ) |j〉 − r sen(θ) |k〉‖
=
√(r cos(ϕ) cos(θ))
2+ (r sen(ϕ) cos(θ))
2+ (r sen(θ))
2= r
hϕ =
∥∥∥∥∂ |r〉∂ϕ
∥∥∥∥ = ‖−r sen(ϕ) sen(θ) |i〉+ r cos(ϕ) sen(θ) |j〉‖
=
√(r sen(ϕ) sen(θ))
2+ (r cos(ϕ) sen(θ))
2= r sen(θ)
Borra
dor Pre
limin
ar
Mientras que para los vectores unitarios tenemos
|ξr〉 = 1
‖ ∂|r〉∂r ‖∂|r〉∂r = cos(ϕ) sen(θ) |i〉+ sen(ϕ) sen(θ) |j〉+ cos(θ) |k〉
|ξθ〉 = 1
‖ ∂|r〉∂θ ‖∂|r〉∂θ = r cos(ϕ) cos(θ)|i〉+r sen(ϕ) cos(θ)|j〉−r sen(θ)|k〉
r = cos(ϕ) cos(θ) |i〉+ sen(ϕ) cos(θ) |j〉 − sen(θ) |k〉
|ξϕ〉 = 1
‖ ∂|r〉∂ϕ ‖∂|r〉∂ϕ = −r sen(ϕ) sen(θ)|i〉+r cos(ϕ) sen(θ)|j〉
r sen(θ) = − sen(ϕ) |i〉+ cos(ϕ) |j〉 .
El desplazamiento infinitesimal en estas coordenadas es de la forma
d |r〉 =
(∂ |r〉∂r
)dr +
(∂ |r〉∂θ
)dθ +
(∂ |r〉∂ϕ
)dϕ = dr |ξr〉+ rdθ |ξθ〉+ r sen(θ)dϕ |ξϕ〉 .
Por lo tanto, para el elemento de lınea tenemos
(ds)2
=(h1 dq1
)2+(h2 dq2
)2+(h3 dq3
)2 ⇐⇒ ds2 = dr2 + r2dθ2 + r2 sen2(θ)dϕ2
Y para el tensor metrico
g11 = grr = 1; g22 = gθθ = r2; g33 = gϕϕ = r2 sen2(θ) .
Ejercicios
1. Exprese los vectores base i, j,k en termino de los vectores base ξr, ξθ, ξϕ.
2. Encuentre las componentes de la velocidad y aceleracion, en coordenadas esfericas, de una partıculaen movimiento.
Por completidud, enumeraremos algunos otros sistemas de coordenadas y dejaremos al lector la labor decalcular los vectores unitarios y la metrica del espacio expresada en esas coordenadas.
Otros sistemas coordenados
Coordenadas Toroidales (q1, q2, q3
)⇐⇒ (σ, τ, φ)
|r〉 = x (σ, τ, φ) |i〉+ y (σ, τ, φ) |j〉+ z (σ, τ, φ) |k〉 ⇐⇒ r = x (σ, τ, φ) i + y (σ, τ, φ) j + z (σ, τ, φ) k .
Con 0 ≤ σ < 2π, 0 ≤ τ <∞ y 0 ≤ φ < 2π.
La transformacion de coordenadas esa definida de la siguiente forma
x = asenh(τ)
cosh(τ)− cos(σ)cos(φ) , y = a
senh(τ)
cosh(τ)− cos(σ)sen(φ) , z = a
sen(σ)
cosh(τ)− cos(σ)
con a constante.
Las superficies τ constante representan toros alrededor del eje z; las superficies σ constante son esferascon centro sobre el eje z y finalmente las superficies φ constante son planos que contiene al eje z.
La metrica en estas coordenadas es:
ds2 =(h1 dq1
)2+(h2 dq2
)2+(h3 dq3
)2=
(a
cosh(τ)− cos(σ)
)2
dσ2 +
(a
cosh(τ)− cos(σ)
)2
dτ2 +
(a senh(τ)
cosh(τ)− cos(σ)
)2
dφ2
Borra
dor Pre
limin
ar
Figura 5.2: Coordenadas cilındricas y esfericas
Coordenadas Elipsoidales
Dados tres numeros a, b y c, con a > b > c > 0, la ecuacion
x2
a2 + α+
y2
b2 + α+
z2
c2 + α= 1
representa las superficies cuadricas2 homofocales (es decir, con el mismo foco u origen en (x = 0, y = 0, z = 0)).Dependiendo del valor del parametro α, estas ecuaciones representaran superficies
Elipsoides si α > −c2Hiperboloides de una hoja si −c2 > α > −b2Hiperboloides de dos hojas si −b2 > α > −c2
Esto quiere decir que por cada punto (x, y, z) del espacio, pasan tres superficies cuadricas (dependiendodel valor de α). Conocidos a, b y c y el punto, (x = x0, y = y0, z = z0) , los valores de α vienen dadospor las raıces de la ecuacion cubica
x2
a2 + α+
y2
b2 + α+
z2
c2 + α= 1 ⇒ α3 + ∆ α2 + Φ α+ Ω = 0
2Notese que la proyeccion de estas superficies en el plano (x, y) representan curvas conicas homofocales
Borra
dor Pre
limin
ar
con
∆ = x20 + y2
0 + z20 − a2 − b2 − c2
Φ =(b2 + c2
)x2
0 +(a2 + c2
)y2
0 +(a2 + b2
)z2
0 − a2b2 −(a2 + b2
)c2
Ω = x20b
2c2 + y20a
2c2 + z20a
2b2 − a2b2c2
Las raıces de esta ecuacion (α1 = λ;α2 = µ;α3 = ν) definen las coordenadas elipsoidales del punto(x, y, z) = (x (λ, µ, ν) , y (λ, µ, ν) , z (λ, µ, ν)).
Tenemos entonces: (q1, q2, q3
)⇐⇒ (λ, µ, ν)
|r〉 = x (λ, µ, ν) |i〉+ y (λ, µ, ν) |j〉+ z (λ, µ, ν) |k〉 ⇐⇒ r = x (λ, µ, ν) i + y (λ, µ, ν) j + z (λ, µ, ν) k .
y la ley de transformacion:
x =
√(a2 + λ) (a2 + µ) (a2 + ν)
(a2 − b2) (a2 − c2), y =
√(b2 + λ) (b2 + µ) (b2 + ν)
(b2 − a2) (b2 − c2), z =
√(c2 + λ) (c2 + µ) (c2 + ν)
(c2 − b2) (c2 − a2)
por cual la metrica sera
ds2 =(λ− µ) (λ− ν)
4 (a2 + λ) (b2 + λ) (c2 + λ)dλ2 +
(µ− λ) (µ− ν)
4 (a2 + µ) (b2 + µ) (c2 + µ)dµ2 +
(ν − µ) (ν − λ)
4 (a2 + ν) (b2 + ν) (c2 + ν)dν2 .
5.5. Vectores, Tensores, metrica y transformaciones
Nos toca ahora construir expresiones de vectores y tensores a partir de sus leyes de transformacion. Hemosdicho que los vectores y los tensores son independientes del sistema de coordenadas (la base) en la cual seexprese.
5.5.1. Transformando vectores
Dada dos bases de vectores coordenados |e1〉 , |e2〉 , |e3〉 y |e1〉 , |e2〉 , |e3〉 para el espacio vectorial R3
Entonces, se cumple que:
|a〉 = ai |ei〉 = ai |ei〉 ⇒ ⟨
ei∣∣ a〉 = ai⟨
ei∣∣ a〉 = ai
⇒ ai = aj
⟨ei |ej〉 ⇐⇒ ai =
∂xi
∂xj︸︷︷︸〈ei |ej〉
aj
Para el caso de coordenadas cartesianas y cilındricasx1 = x = ρ cos(ϕ) , x2 = y = ρ sen(ϕ) , x3 = z = z
x1 = ρ =√x2 + y2 , x2 = ϕ = arctan
(yx
), x3 = z = z
Borra
dor Pre
limin
ar
se tiene que
∂xi
∂xj=
∂x1
∂x1 = ∂ρ∂x = x√
x2+y2∂x1
∂x2 = ∂ρ∂y = y√
x2+y2∂x1
∂x3 = ∂ρ∂z = 0
∂x2
∂x1 = ∂ϕ∂x = −y
x2+y2∂x2
∂x2 = ∂ϕ∂y = x
x2+y2∂x2
∂x3 = ∂ϕ∂z = 0
∂x3
∂x1 = ∂z∂x = 0 ∂x3
∂x2 = ∂z∂y = 0 ∂x3
∂x3 = ∂z∂z = 1
=
cos(ϕ) sen(ϕ) 0
− sen(ϕ)ρ
cos(ϕ)ρ 0
0 0 1
Entonces, para los vectores se tiene que
|a〉 = aj |ej〉 = a1 |e1〉+ a2 |e2〉+ a3 |e3〉 = ax |i〉+ ay |j〉+ az |k〉
|a〉 = ai |ei〉 = a1 |e1〉+ a2 |e2〉+ a3 |e3〉 = aρ |ξρ〉+ aϕ |ξϕ〉+ az |ξz〉
Recordemos que la relacion para los vectores ortonormales es:
|ξρ〉 = cos(ϕ) |i〉+ sen(ϕ) |j〉 , |ξϕ〉 = − sen(ϕ) |i〉+ cos(ϕ) |j〉 , |ξz〉 = |k〉
Por ejemplo, tenemos en concreto un vector: |a〉 = 5 |i〉 + 4 |j〉 + 3 |k〉 y queremos conocer su expresionen coordenadas cilındricas. Antes, hay que hacer la acotacion de que existe una familia de sistemas decoordenadas cilındricas parametrizados por el angulo ϕ y NO un unico sistema coordenado. Obviamente sepuede especificar el sistema coordenado y entonces tendremos un conjunto de componentes definido. Ası lafamilia de componentes en cilındricas del vector |a〉 seran
aj =⟨ej |a〉 =
⟨ej∣∣ (a1 |e1〉+ a2 |e2〉+ a3 |e3〉
)=⟨ej∣∣ (a1 |e1〉+ a2 |e2〉+ a3 |e3〉
)con lo cual, al expresar los vectores base se tienen las componentes
a1 = aρ = 〈ξρ| (5 |i〉+ 4 |j〉+ 3 |k〉) = (〈cos(ϕ) 〈i|+ sen(ϕ) 〈j|)| (5 |i〉+ 4 |j〉+ 3 |k〉) = 5 cos(ϕ) + 4 sen(ϕ)
a2 = aϕ = 〈ξϕ| (5 |i〉+ 4 |j〉+ 3 |k〉) = (〈− sen(ϕ) 〈i|+ cos(ϕ) 〈j|)| (5 |i〉+ 4 |j〉+ 3 |k〉) = −5 sen(ϕ) + 4 cos(ϕ)
a3 = az = 〈ξz| (5 |i〉+ 4 |j〉+ 3 |k〉) = 〈k| (5 |i〉+ 4 |j〉+ 3 |k〉) = 3
Esto es
|a〉 = 5 |i〉+ 4 |j〉+ 3 |k〉 = (5 cos(ϕ) + 4 sen(ϕ)) |ξρ〉+ (−5 sen(ϕ) + 4 cos(ϕ)) |ξϕ〉+ 3 |ξz〉
Es claro que existen infinitos sistemas cilındricos parametrizados por el angulo ϕ , digamos
ϕ = arctan
(4
5
)⇒
aρ = 5 cos
(arctan
(45
))+ 4 sen
(arctan
(45
))= 25
41
√41 + 16
41
√41 =
√41
aϕ = −5 sen(arctan
(45
))+ 4 cos
(arctan
(45
))= −
(2041
√41)
+(
2041
√41)
= 0
az = 3
con lo cual hemos alineado el eje |ξρ〉 a lo largo del vector |a〉. Ese es un sistema de coordenadas cilındricomuy particular.
Borra
dor Pre
limin
ar
5.5.2. Transformando tensores
Ilustremos ahora las transformaciones de tensores bajo cambios de la base del espacio vectorial.Consideremos el siguiente tensor
T ij =
2 1 32 3 41 2 2
, en la base: |e1〉 , |e2〉 , |e3〉 ≡ |i〉 , |j〉 , |k〉
Es decir, es un tensor que hemos expresado en coordenadas cartesianas y queremos pasarlo a cilındricas.Este tipo de tensor transforma de la siguiente forma
T km =∂xk
∂xi∂xj
∂xmT ij
Recordemos que anteriormente calculamos la matriz ∂xk
∂xi a partir de la transformacion de coordenadas.
Haciendo lo mismo para ∂xj
∂xm resulta
∂xj
∂xm=
∂x1
∂x1 = ∂x∂ρ
∂x1
∂x2 = ∂x∂ϕ
∂x1
∂x3 = ∂x∂z
∂x2
∂x1 = ∂y∂ρ
∂x2
∂x2 = ∂y∂ϕ
∂x2
∂x3 = ∂y∂z
∂x3
∂x1 = ∂z∂ρ
∂x3
∂x2 = ∂z∂ϕ
∂x3
∂x3 = ∂z∂z
=
cos(ϕ) −ρ sen(ϕ) 0
sen(ϕ) ρ cos(ϕ) 0
0 0 1
Por lo tanto
T km =∂xk
∂xiT ij
∂xj
∂xm⇒ T km =
cos(ϕ) sen(ϕ) 0
− sen(ϕ)ρ
cos(ϕ)ρ 0
0 0 1
T ij
cos(ϕ) −ρ sen(ϕ) 0
sen(ϕ) ρ cos(ϕ) 0
0 0 1
sustituyendo el tensor y multiplicando las matrices
T km =
cos(ϕ) sen(ϕ) 0
− sen(ϕ)ρ
cos(ϕ)ρ 0
0 0 1
2 1 32 3 41 2 2
cos(ϕ) −ρ sen(ϕ) 0sen(ϕ) ρ cos(ϕ) 0
0 0 1
se obtiene
T km =
− cos2(ϕ) + 3 cos(ϕ) sen(ϕ) + 3 ρ sen(ϕ) cos(ϕ)− 2ρ+ 3ρ cos2(ϕ) 3 cos(ϕ) + 4 sen(ϕ)
cos(ϕ) sen(ϕ)+3 cos2(ϕ)−1ρ −3 cos(ϕ) sen(ϕ) + cos2(ϕ) + 2 −3 sen(ϕ)
ρ + 4 cos(ϕ)ρ
cos(ϕ) + 2 sen(ϕ) −ρ sen(ϕ) + 2ρ cos(ϕ) 2
Si suponemos que el origen del sistema de coordenadas cilindrico esta en el vector anterior. Esto es
|a〉 = 5 |i〉+ 4 |j〉+ 3 |k〉 ⇒
ρ =√x2 + y2 ⇒ ρ =
√52 + 42 =
√41
ϕ = arctan(yx
)⇒ ϕ = arctan
(45
)= 0,67474 rad
Borra
dor Pre
limin
arFigura 5.3: Radio vector posicion r (t) en R2 que describe parametricamente una curva.
entonces
T km =
3,8537 2,030 3 4,841 40,20569 1. 146 3 0,195 122,030 3 6,0 2
.
Para ver un ejemplo de cambios de tensores bajo sistemas de coordenadas no ortogonales pueden consultarla seccion 3.6
5.6. Campos tensoriales y el concepto de campo
Cuando avanzamos en la derivacion de vectores vimos vectores que dependıan del tiempo. Luego cuandoconstruimos sistemas de coordenadas ortogonales vimos tambien vectores que variaban en modulo direcciony sentido.
|a〉(t) = ak (t) |ek〉(t) = ak |wk〉(t) = ak (t) |ek〉
Ahora podemos generalizar este concepto a tensores que dependen de una variable escalar
T [, , · · · , ; •, •, · · · , •](t) = Tmn···lij···k (t)
esto es
Tmn···lij···k (t)⟨ti(1)
∣∣⊗ ⟨uj(2)∣∣⊗ · · · ⊗ ⟨vk(m)
∣∣⊗ |xm(1)〉 ⊗ |yn(2)〉 ⊗ · · · ⊗ |zl(n)〉
Tmn···lij···k⟨ti(1)
∣∣(t)⊗⟨uj(2)
∣∣(t)⊗ · · · ⊗
⟨vk(m)
∣∣(t)⊗ |xm(1)〉(t) ⊗ |yn(2)〉(t) ⊗ · · · ⊗ |zl(n)〉(t)
y al igual que los vectores, la dependencia funcional de los tensores variara con la base en la cual se exprese.Ası, tendremos tensores cuyas componentes, en una determinada base, seran variables y en otra no.
Mientras que una de las bases sera variable y otra no.
Borra
dor Pre
limin
arFigura 5.4: Campo Vectorial en <3
Igualmente saltamos al cociente incremental para conocer la velocidad de variacion
lım∆t→0
T [, , · · · , ; •, •, · · · , •](t+∆t) −T [, , · · · , ; •, •, · · · , •](t)∆t
m
lım∆t→0
∆T [, , · · · , ; •, •, · · · , •](t)∆t
⇐⇒d(T [, , · · · , ; •, •, · · · , •](t)
)dt
Si la base es constante, la dependencia funcional y su variacion (derivada) recae sobre sus componentes.Ası podemos construir la derivada de las componentes como
lım∆t→0
Tmn···lij···k (t+ ∆t)− Tmn···lij···k (t)
∆t= lım
∆t→0
∆Tmn···lij···k (t)
∆t=
d(Tmn···lij···k (t)
)dt
Siguiendo con el proceso de generalizacion, podemos pensar en una dependencia funcional multilineal.Esto es que el argumento de la “funcion” tensorial es otro tensor,
T [, , · · · , ; •, •, · · · , •] = T [, , · · · , ; •, •, · · · , •]G[,,··· ,;•,•,··· ,•]
A ese objeto se le llama Campo Tensorial, pero vamos con calma.Analicemos lo casos mas simples los cuales son los verdaderamente utiles. Como era de esperarse, tendre-
mos varios casos que se pueden construir a partir de esta idea. Hemos visto funciones que ahora llamaremoscampos homogeneos
ϕ = ϕ (t) Funcion
|r〉(t) ⇐⇒ r = r (t) rk (t) Vector
T = T [, , · · · , ; •, •, · · · , •](t) Tmn···lij···k (t) Tensor
Borra
dor Pre
limin
arFigura 5.5: Ejemplo de Campo Escalar φ = φ (r)
y veremos campos constantes o estacionarios r 6= r (t)
ϕ = ϕ (r) Campo Escalar
|a〉(|r〉) ⇐⇒ a = a (r) ak (r) Campo Vectorial
T = T [, , · · · , ; •, •, · · · , •](|r〉) Tmn···lij···k (r) Campo Tensorial
Campos variables o no estacionarios
ϕ = ϕ (r (t) , t) Campo Escalar Variable
|a〉(|r〉) ⇐⇒ a = a (r (t) , t) ak (r (t) , t) Campo Vectorial
T = T [, , · · · , ; •, •, · · · , •](|r〉) Tmn···lij···k (r (t) , t) Campo Tensorial
La idea de los campos escalares, vectoriales, tensoriales, con argumento vectorial, es asociar un valor de lacomponente (escalar, vectorial o tensorial) a cada punto del espacio (si el vector esta en R3). Obviamente loscampos escalares asocian un numero a cada posicion y los campos vectoriales, ademas del numero (modulo)asocian una direccion y un sentido.
Ejemplos de campos escalares seran las distribuciones de densidad ρ (r (t)), presion P (r (t)) y temperaturaT (r (t)) de la atmosfera terrestre o la distribucion de intensidades del campo electrico en una superficie. Asıal considerar el potencial electrico
φ (r) = φ (x, y) = ln(
(x+ 1)2
+ y2)− ln
((x− 1)
2+ y2
)La representacion de este campo escalar sera el que se puede apreciar en la Figura 5.5
Borra
dor Pre
limin
arFigura 5.6: Ejemplo del Campo Escalar de Temperaturas T = T (x, y)
5.7. Campos escalares y superficies
Un campo escalar sera aquella funcion escalar de argumento vectorial. Con ello a cada punto del espaciose le asocia un numero. Esto es
φ : Rn → R φ = φ (r) ⇒ φ = φ(xi)
= φ(xi)⇔ φ = φ (x, y, z) = φ (x, y, z)
Estamos enfatizando el hecho que un campo escalar no variara bajo cambios de las coordenadas en suargumento. Adicionalmente recalcamos que es indistinto hablar de vectores φ = φ (r) o sus coordenadasφ = φ
(xi).
La Figura 5.6 ilustra un campo de temperaturas
T = T (x, y) = 70 + 180e−(x−3)2/10−(y−2)2/10
Si unimos los puntos con iguales temperaturas tendremos curvas isotermas tal y como se observan en laFigura 5.7
Un campo escalar φ = φ(x1, x2
)definira superficies si la representamos en R3 como x3 = φ
(x1, x2
), esto
es, curvas de nivel o isocurvas las cuales corresponden a soluciones de φ = φ(xi)
= cte. Tal y como se ilustraen la Figura 5.8, los planos z = k = cte. cortan la superficie y definen la curva g (x, y) = z = k.
5.8. Campos vectoriales y lıneas de flujo
Consideremos ahora un campo vectorial a (r) y estudiemos su representacion, y lo que es mas importante,su variacion.
Tal y como hemos dicho y volvemos a representar en la Figura 5.9, los campos vectoriales asocian unvector (con su modulo direccion y sentido) a cada punto del espacio. Comunmente, nos referimos a camposvectoriales segun el caso: campos de fuerza (el vector del campo es una fuerza), campo de velocidades (el vectordel campo es una velocidad). Del mismo modo, a aquellas lıneas a las cuales los vectores son tangentes se lesdominan lıneas de campo, curvas integrales o simplemente lıneas de flujo o de corriente. A las trayectorias
Borra
dor Pre
limin
arFigura 5.7: Curvas Isotermas T = T (x, y) = cte
ortogonales a estas lıneas, vale decir, a aquellas lıneas cuyos vectores tangentes son ortogonales al campo, seles denominaran lıneas equipotenciales. El ejemplo mas emblematico lo constituye el gradiente de un campoescalar ∇φ (x, y). Las lıneas equipotenciales las define el campo escalar mismo, φ (x, y) = z = cte (curva denivel) y construimos un campo vectorial con su gradiente, ∇φ (x, y). Como el gradiente es perpendicular a lacurva de nivel tendremos que las curvas integrales, (lıneas de flujo o lıneas de corriente) del campo vectorial∇φ (x, y) seran trayectorias ortogonales a las curvas equipotenciales.
5.8.1. Lıneas de flujo o curvas integrales
Supongamos el caso bidimensional3 en coordenadas cartesianas, y consideremos un desplazamiento dife-rencial dr en la direccion del campo vectorial, es facil convencerse que
dr ∝ a (x, y) = ax (x, y) i + ay (x, y) j ⇒ dx
ax (x, y)=
dy
ay (x, y)
con lo cual encontramos las lıneas de flujo o curvas integrales y (x) del campo a (x, y)
dy
dx=ay (x, y)
ax (x, y)⇒ y (x) =
∫ay (x, y)
ax (x, y)dx
ası dado un campo vectorial
a = −xi + yj ⇒ dy
dx= −y
x⇒
∫dy
y= −
∫dx
x+ C ⇒ y (x) =
1
xC
o lo que son lo mismo hiperbolas yx = C.Otra forma, equivalente de verlo es que
dr ∝ a (x (t) , y (t) , z (t) , t) ⇒ dr× a (x (t) , y (t) , z (t) , t) = 0
3El caso tridimensional solo anade complicaciones tecnicas y no riqueza conceptual.
Borra
dor Pre
limin
arFigura 5.8: Curvas de Nivel para una funcion z = g (x, y) = cte.
∥∥∥∥∥∥i j k
dx dy dzax (x (t) , y (t) , z (t) , t) ay (x (t) , y (t) , z (t) , t) az (x (t) , y (t) , z (t) , t)
∥∥∥∥∥∥ = 0
Por lo cual
[az (x (t) , y (t) , z (t) , t) dy − ay (x (t) , y (t) , z (t) , t) dz] i
+ [ax (x (t) , y (t) , z (t) , t) dz − az (x (t) , y (t) , z (t) , t) dx] j
+ [ay (x (t) , y (t) , z (t) , t) dx− ax (x (t) , y (t) , z (t) , t) dy] k = 0
y finalmente
dx
ax (x (t) , y (t) , z (t) , t)=
dy
ay (x (t) , y (t) , z (t) , t)=
dz
az (x (t) , y (t) , z (t) , t)
La integral de estas ecuaciones construira las lıneas de flujo o curvas integrales.
5.8.2. Trayectorias ortogonales a las lıneas de flujo
Para encontrar las trayectorias ortogonales al campo vectorial o las lıneas equipotenciales construimosun campo vectorial a⊥ (x, y) que sea ortogonal en todo punto a a (x, y)
a⊥ (x, y) · a (x, y) = 0 ⇒ ax (x, y) a⊥x (x, y) + ay (x, y) a⊥y (x, y) = 0 ⇒ ax (x, y)
ay (x, y)= −
a⊥y (x, y)
a⊥x (x, y)
dondea⊥ (x, y) = a⊥x (x, y) i− a⊥y (x, y) j
y ahora procedemos del mismo modo pero con el campo vectorial a⊥ (x, y)
dy
dx= −
a⊥y (x, y)
a⊥x (x, y)⇒ y (x) = −
∫a⊥y (x, y)
a⊥x (x, y)dx
Borra
dor Pre
limin
arFigura 5.9: Campos vectoriales
con lo cual las trayectorias ortogonales al campo
a = −xi + yj ⇒ a⊥ = yi + xj ⇒ dy
dx=x
y⇒ y (x) =
√C2 + x2
seran curvas.
5.9. Flujo de Campos Vectoriales
Podemos tambien imaginar flujo de campos vectoriales. Para ello, consideramos una superficie infinitesi-mal dS = ‖dS‖ ns, con ns el vector unitario normal esa superficie S. Entonces, la cantidad
dF = a · dS = a · ns dS ⇒ F =
∫∫s
a · dS =
∫∫s
a · ns dS =
∫∫s
an dS
representara el flujo del campo vectorial a traves de la superficie dS. Hemos denotado an como la componentede a a lo largo de ns . Hay que hacer notar que F =
∫∫sa · dS es independiente del sistema de coordenadas
y en cartesianas puede expresarse como
dF = a · ns dS = a1 cos(ns a1
)+ a2 cos
(ns a2
)+ a3 cos
(ns a3
)donde
a1, a2, a3
son las componentes cartesianas del vector a. La idea que esta cantidad representa flujo
puede tenerse si pensamos en un fluido incompresible que fluye con un campo de velocidades v = v (r). Elvolumen que atraviesa una determinada superficie en un intervalo de tiempo dt. Ası, dS definira la base
de un tubo de fluido y tendra como “altura” la ‖v‖ cos(ns v
)dt ya que la altura no tiene por que ser
perpendicular a la base4. Por lo tanto, la cantidad de fluido que atraviesa la superficie por unidad de tiempo
4Si lo es cos(n v
)= 1 porque la velocidad es paralela a la normal.
Borra
dor Pre
limin
ar
viene dada por
dF =(‖v‖ cos
(ns v
))dS = v · ns dS = v · dS ⇒ F =
∫∫s
v · dS =
∫∫s
v · ns dS =
∫∫s
vn dS
5.10. La fauna de los operadores vectoriales
A partir del concepto de campo escalar, presentaremos la fauna de objetos diferenciales en el espaciotridimensional. Salvo que se diga lo contrario, utilizaremos el sistema de coordenadas cartesianas, vale decir(
q1, q2, q3)⇐⇒ (x, y, z)
|r〉 = x |i〉+ y |j〉+ z |k〉 ⇐⇒ r = xi + yj + zk
dr ⇒ |dr〉 =
(∂ |r〉∂x
)dx+
(∂ |r〉∂y
)dy +
(∂ |r〉∂z
)dz = dx |i〉+ dy |j〉+ dz |k〉
hx =
∥∥∥∥∂ |r〉∂x
∥∥∥∥ = 1 , hy =
∥∥∥∥∂ |r〉∂y
∥∥∥∥ = 1 , hz =
∥∥∥∥∂ |r〉∂z
∥∥∥∥ = 1
ds2 = dx2 + dy2 + dz2 ⇐⇒ g11 = gxx = 1; g22 = gyy = 1; g22 = gzz = 1.
5.10.1. Derivada direccional, diferencial total y gradiente
Derivada direccional de Campos escalares
Para analizar los cambios en los campos escalares requerimos comparar dos “instantes de tiempo” paraello, parametrizamos las componentes del vector y tendremos que
z = φ (r (t)) = g (x (t) , y (t))
dφ (x (t) , y (t))
dt=∂φ (x (t) , y (t))
∂x
dx (t)
dt+∂φ (x (t) , y (t))
∂y
dy (t)
dt= ∇φ (x (t) , y (t)) · dr (t)
dt
donde hemos representado
∇φ (x (t) , y (t)) =∂φ (x, y)
∂xi +
∂φ (x, y)
∂yj = φx (x, y) i + φy (x, y) j = ∂iφ (x, y) |ii〉 = φ,i (x, y) |ii〉
y lo llamaremos el gradiente de la funcion. El gradiente de un campo escalar es uno de los objetos masutiles, el cual lo hemos utilizado de manera operacional y no nos hemos detenido a reflexionar sobre suspropiedades.
Es claro que para una curva de nivel
g (x, y) = z = φ (r (t)) = k = cte
dφ (x (t) , y (t))
dt=
dk
dt= 0 ⇒ dφ (x (t) , y (t))
dt= 0 = ∇φ (x (t) , y (t)) · dr (t)
dt
con lo cual dado que dr(t)dt es la tangente a la curva, el gradiente es perpendicular a la curva. La derivada
direccional indicara la tasa de cambio del campo escalar en la direccion que apuntemos.
Borra
dor Pre
limin
arFigura 5.10: Derivada Direccional
En una generalizacion de la idea que surge de parametizacion de la curva o de la derivada total respectoal tiempo
dφ
dt= ∇φ (x (t) , y (t)) · dr (t)
dt
Ası es claro que, dados dos puntos M y M ′ definiremos la derivada en la direccion de un vector unitario
u↔−−−→M ′M como
Duφ = ∇φ (x, y) · u =dφ
dλ= lımM ′→M
φ (M ′)− φ (M)∣∣∣−−−→M ′M∣∣∣
Tal y como se puede apreciar en la figura (5.10) la derivada direccional representa la pendiente de la rectatangente a la curva que surge como interseccion entre la superficie φ (x, y) = z = k = cte y el plano verticalformado por el eje z y el vector unitario u. Si se da el caso que la funcion φ dependa de manera explıcita delparametro tendremos que
φ = φ (x (t) , y (t) , t) ⇒ dφ
dt=∂φ (x (t) , y (t) , t)
∂t+ ∇φ (x (t) , y (t) , t) · dr (t)
dt
En este punto, varias conclusiones se pueden derivar del concepto de derivada total. La primera es quedado que, la norma de la derivada direccional a lo largo de u es
‖Duφ‖ = ‖∇φ (x, y) · u‖ = |∇φ (x, y)| cos (∇φ (x, y) , u)
(donde hemos denotado por ∇φ (x, y) u como el angulo que forman los vectores ∇φ (x, y) y u), el valormaximo del la norma de la derivada direccional sera
‖Duφ‖max = |∇φ (x, y)| =√∂iφ∂iφ ≡
√∂φ
∂xi
∂φ
∂xi≡
√(∂φ
∂x1
)2
+
(∂φ
∂x2
)2
+
(∂φ
∂x3
)2
Es decir, cuando u apunta en la direccion del gradiente, o lo que es lo mismo, en la direccion de la mayor tasade cambio el valor maximo lo indica la direccion del gradiente. O dicho de otro modo, en un determinado
Borra
dor Pre
limin
arFigura 5.11: Direccion de maxima variacion en una funcion. Gradiante y tangente de una funcion.
punto M de las superficie φ (x, y) = z el vector ∇φ apunta en la direccion de la maxima tasa de cambio, taly como podemos apreciar en la figura (5.11).
La segunda conclusion es dado que el gradiente es ortogonal a la superficie, los vectores perpendicularesa el conformaran el plano tangente a la superficie en un determinado punto.
Gradiente y flujo de un campo vectorial
Podemos utilizar la idea de flujo de un campo vectorial y generalizar la definicion de gradiente para quesea independiente de coordenadas.
∇φ = gradφ = lımV→0
1
V
∫∫s
φ (x, y, z) dS = lımV→0
1
V
∫∫s
φ (x, y, z) ns dS
Esto es, supongamos que construimos un campo vectorial de la forma siguiente
a (x, y, z) = c φ (x, y, z) con c = cte
con lo cual
F =
∫∫s
c φ (x, y, z) · dS =
∫∫s
c φ (x, y, z) · ns dS
Es claro que esta expresion vale para todos los sistemas de coordenadas. En particular, para un sistema decoordenadas cartesianas construimos un cubo diferencial con aristas que coincidan con los ejes coordenados.Entonces se tiene que las caras del cubo seran con
dSx+ = (dy dz) i ; dSx− = − (dy dz) i
dSy+ = (dx dz) j ; dSy− = − (dx dz) j
dSz+ = (dx dy) k ; dSz− = − (dx dy) k
Borra
dor Pre
limin
ar
con lo cual, el flujo por las seis caras sera
dF = c φ (x, y, z) · dSx+ + c φ (x, y, z) · dSx− + c φ (x, y, z) · dSy+
+ c φ (x, y, z) · dSy− + c φ (x, y, z) · dSz+ + c φ (x, y, z) · dSz−
por lo tanto
dF = c [φ (x+ dx, y, z) dy dz − φ (x, y, z) dy dz + φ (x, y + dy, z) dx dz − φ (x, y, z) dx dz
+φ (x, y, z + dz) dx dy − φ (x, y, z) dx dy]
dF = c [φ (x+ dx, y, z)− φ (x, y, z) dy dz + φ (x, y + dy, z)− φ (x, y, z) dx dz+
+ φ (x, y, z + dz)− φ (x, y, z) dx dy]
Desarrollando por Taylor hasta primer orden porque estamos considerando un “cubo diferencial” tendremosque
φ (x+ dx, y, z) ≈ φ (x, y, z) +∂φ (x, y, z)
∂xdx
φ (x, y + dy, z) ≈ φ (x, y, z) +∂φ (x, y, z)
∂ydy
φ (x, y, z + dz) ≈ φ (x, y, z) +∂φ (x, y, z)
∂zdz
Con lo cual
dF =∂φ (x, y, z)
∂xdx dy dz +
∂φ (x, y, z)
∂ydy dx dz +
∂φ (x, y, z)
∂zdz dx dy
=
(∂φ (x, y, z)
∂x+∂φ (x, y, z)
∂y+∂φ (x, y, z)
∂z
)dV ⇒ dF = ∇φ dV
∇φ =dF
dV= lım
∆V→0
F2 − F1
V2 − V1= lımV→0
1
V
∫∫s
φ (x, y, z) dS = lımV→0
1
V
∫∫s
φ (x, y, z) n dS
Notese que hemos supuesto que ∆V ≡ V2 ≡ V y que F2 =∫∫sφ (x, y, z) dS. Que quiere decir que tanto
V1 ∼ 0 con lo cual el flujo a traves de un punto se anula, F1 ∼ 0.
Gradiente y coordenadas curvilıneas
La generalizacion de la expresion del gradiente en coordenadas curvilıneas es inmediata a partir dediferencial total de una funcion φ
(q1, q2, q3
). Esto es
φ(q1, q2, q3
)= φ
(qj)⇒ dφ =
∂φ(q1, q2, q3
)∂qj
dqj = φ(q1, q2, q3
)· dr
con
∇φ(q1, q2, q3
)=
1∥∥∥∂|r〉∂q1
∥∥∥ ∂φ∂q1〈e1|+
1∥∥∥∂|r〉∂q2
∥∥∥ ∂φ∂q2〈e2|+
1∥∥∥∂|r〉∂q3
∥∥∥ ∂φ∂q3〈e3|
Borra
dor Pre
limin
ar
y
dr =
(∂r
∂q1dq1 +
∂r
∂q2dq2 +
∂r
∂q3dq3
)⇒
∥∥∥∥∂ |r〉∂q1
∥∥∥∥ |e1〉 dq1 +
∥∥∥∥∂ |r〉∂q2
∥∥∥∥ |e2〉 dq2 +
∥∥∥∥∂ |r〉∂q3
∥∥∥∥ |e3〉 dq3
ya que
|e1〉 =1∥∥∥∂|r〉∂q1
∥∥∥ ∂ |r〉∂q1; |e2〉 =
1∥∥∥∂|r〉∂q2
∥∥∥ ∂ |r〉∂q2; |e3〉 =
1∥∥∥∂|r〉∂q3
∥∥∥ ∂ |r〉∂q3;
Es decir, la forma general del gradiente para un sistema de coordenadas curvilıneas es
∇φ = gradφ =1
h1
∂φ
∂x1|e1〉+
1
h2
∂φ
∂x2|e2〉+
1
h3
∂φ
∂x3|e3〉
Donde denotamos hi =∥∥∥∂|r〉∂qi
∥∥∥ =√gii el factor de escala que acompana a la base |ei〉.
5.10.2. Divergencia y flujo en campos vectoriales
Viendo con un poco mas de cuidado la expresion para el gradiente tenemos
∇ (φ) = gradφ =
(|e1〉h1
∂
∂x1+|e2〉h2
∂
∂x2|e2〉+
|w3〉h3
∂
∂x3
)φ =
|ei〉(h)i
∂
∂xiφ
Donde hemos indicado por (h)i al factor de escala y no implica suma. La suma esta indicada entre lascomponentes ∂
∂xi ≡ ∂i y los elementos de la base |ei〉. Con esta inspiracion podemos construir un operadorvectorial
∇ ≡ 〈e1|H (h1, h2, h3)
∂
∂x1+
〈e2|F (h1, h2, h3)
∂
∂x2+
〈e3|G (h1, h2, h3)
∂
∂x3
con lo cual, si cuidamos el orden de operacion, podremos realizar un “producto escalar entre dos vectores”
∇ · a ≡(
〈e1|H (h1, h2, h3)
∂
∂x1+
〈e2|F (h1, h2, h3)
∂
∂x2+
〈e3|G (h1, h2, h3)
∂
∂x3
)(a1 |e1〉+ a2 |e2〉+ a2 |e3〉
)
∇ · a ≡ 〈e1|H (h1, h2, h3)
∂(a1 |e1〉+ a2 |e2〉+ a2 |e3〉
)∂x1
+〈e2|
F (h1, h2, h3)
∂(a1 |e1〉+ a2 |e2〉+ a2 |e3〉
)∂x2
+〈e3|
G (h1, h2, h3)
∂(a1 |e1〉+ a2 |e2〉+ a2 |e3〉
)∂x3
y hay que tener cuidado con la posible variacion de los vectores base. Consideremos en caso de coordenadascartesianas,
(x1, x2, x3
)→ (x, y, z), donde la base |ei〉 ≡ |i〉 , |j〉 , |k〉 es constante. Entonces tendremos
de forma inmediata que
∇ · a =∂ai
(xj)
∂xi≡ ∂iai
(xj)≡ ∂ax (x, y, z)
∂x+∂ay (x, y, z)
∂y+∂az (x, y, z)
∂z
Divergencia como medida de flujo
El significado fısico de la divergencia puede comprenderse si consideramos la siguiente definicion, inde-pendiente del sistema de coordenadas
div a ≡∇ · a =dF
dV= lımV→0
1
V
∫∫s
a · dS ≡ lımV→0
1
V
∫∫s
a · ns dS = lımV→0
1
V
∫∫s
an dS
Borra
dor Pre
limin
ar
Es decir, el flujo por unidad de volumen. Otra vez, para un sistema de coordenadas cartesianas construi-mos un cubo diferencial con aristas que coincidan con los ejes coordenados. Entonces se tiene que las carasdel cubo seran con
dSx+ = (dy dz) i ; dSx− = − (dy dz) i
dSy+ = (dx dz) j ; dSy− = − (dx dz) j
dSz+ = (dx dy) k ; dSz− = − (dx dy) k
El flujo por las seis caras sera
dF = a · dSx+ + a · dSx− + a · dSy+ + a · dSy− + a · dSz+ + a · dSz−
con lo cual
dF = ax (x+ dx, y, z) dy dz − ax (x, y, z) dy dz + ay (x, y + dy, z) dx dz − ay (x, y, z) dx dz
+ az (x, y, z + dz) dx dy − az (x, y, z) dx dy
= [ax (x+ dx, y, z)− ax (x, y, z)] dydz + [ay (x, y + dy, z)− ay (x, y, z)] dxdz
+ [az (x, y, z + dz)− az (x, y, z)] dxdy
Desarrollando por Taylor otra vez, tendremos
ax (x+ dx, y, z) ≈ ax (x, y, z) +∂ax (x, y, z)
∂xdx
ay (x, y + dy, z) ≈ ay (x, y, z) +∂ay (x, y, z)
∂ydy
az (x, y, z + dz) ≈ az (x, y, z) +∂az (x, y, z)
∂zdz
y obtendremos
dF =∂ax (x, y, z)
∂xdx dy dz +
∂ay (x, y, z)
∂ydy dx dz +
∂az (x, y, z)
∂zdz dx dy
= a · dS =
(∂ax (x, y, z)
∂x+∂ay (x, y, z)
∂y+∂az (x, y, z)
∂z
)dV
Consecuentemente
F =
∫∫S
a · dS =
∫∫∫V
(∂ax (x, y, z)
∂x+∂ay (x, y, z)
∂y+∂az (x, y, z)
∂z
)dV ≡
∫∫∫V
(∇ · a) dV
La primera conclusion es que podemos convertir una integral de superficie cerrada de un campo vectorial,en una integral de volumen encerrada por esa misma superficie. Lo hemos demostrado para el caso decoordenadas cartesianas, pero como el flujo F =
∫∫S
a ·dS es un escalar, esta afirmacion vale para cualquiersistema de coordenadas. Esto se conoce como el Teorema de la Divergencia el cual veremos mas adelante(ver seccion 5.12.1 en la pagina 263). A partir de este teorema tenemos que si la divergencia de un campovectorial en positiva lo interpretaremos como flujo hacia afuera (saliente) del volumen V encerrado por lasuperficie, S, y si la divergencia del campo es negativa tendremos flujo entrante. Como ilustracion puede verel ejemplo de la pagina 245.
Borra
dor Pre
limin
ar
Divergencia y coordenadas curvilıneas
Para encontrar la expresion para la divergencia en coordenadas curvilıneas generalizadas partimos de ladefinicion invariante de sistema de coordenadas
div a ≡∇ · a = lımV→0
1
V
∫∫s
a · dS ≡ lımV→0
1
V
∫∫s
a · ns dS = lımV→0
1
V
∫∫s
an dS
Al igual que procedimos en coordenadas cartesianas, ahora consideraremos un “paralelepıpedo curvilıneo”con tres de sus aristas alineadas con el sistema ortogonal curvilıneo. Las caras de este “paralelepıpedocurvilıneo podran ser representadas como
dSq1+ =(ds→q2 ds→q3
)dq1|e1〉 ; dSq1− = −
(ds→q2 ds→q3
)|e1〉
dSq2+ =(ds→q3 ds→q1
)dq2|e2〉 ; dSq2− = −
(ds→q3 ds→q1
)|e2〉
dSq3+ =(ds→q1 ds→q2
)dq3|e3〉 ; dSq3− = −
(ds→q1 ds→q2
)|e3〉
donde denotamos ds→qi el arco de curva a lo largo de la coordenadas curvilıneas generalizada qi. Losparentesis (·)dqi indican que esta superficie es evaluada en qi + dqi Adicionalmente, es de hacer notar que(
ds→qi)
=√giidq
i = hidqi , aquı los ındices repetidos NO indican suma
Ahora bien, dado que |a〉 ≡ a = aj |ej〉, el flujo por las seis caras sera
dF = a · dSq1+ + a · dSq1− + a · dSq2+ + a · dSq2− + a · dSq3+ + a · dSq3−
Para comenzar vemos que es el flujo del campo vectorial lo que esta siendo evaluado en dos puntos distintos.A lo largo de q1 vemos que
a · dSq1− =(a1(q1, q2, q3
)h2h3
)dq2dq3
a · dSq2− =(a2(q1, q2, q3
)h3h1
)dq3dq1
a · dSq3− =(a3(q1, q2, q3
)h1h2
)dq1dq2
con lo cual es el flujo lo que debemos desarrollar por Taylor.
a1(q1 + dq1, q2, q3
)h2h3 = a1
(q1, q2, q3
)h2h3 +
∂(a1(q1, q2, q3
)h2h3
)∂q1
dq1
a2(q1, q2 + dq2, q3
)h3h1 = a2
(q1, q2, q3
)h3h1 +
∂(a2(q1, q2, q3
)h3h1
)∂q2
dq2
a3(q1 + dq1, q2, q3
)h1h2 = a3
(q1, q2, q3
)h1h2 +
∂(a3(q1, q2, q3
)h1h2
)∂q3
dq3
Notese que el caso cartesiano no se hizo explıcito este hecho por cuanto h3 = h2 = h1 = 1. Entonces elflujo por el caso de coordenadas curvilıneas sera
dF =∂(a1(q1, q2, q3
)h2h3
)∂q1
dq1dq2dq3 +∂(a2(q1, q2, q3
)h3h1
)∂q2
dq2dq3dq1+
+∂(a3(q1, q2, q3
)h1h2
)∂q3
dq3dq1dq2
Borra
dor Pre
limin
ar
Si recordamos que
dV =(ds→q1
) (ds→q2
) (ds→q3
)=√g11 dq1√g22 dq2√g33 dq3 = h1h2h3 dq1dq2dq3
donde denotamos ds→qi el arco de curva a lo largo de la coordenadas curvilıneas generalizada qi.Tendremos que
dF
dV=
1
h1h2h3
(∂(a1(q1, q2, q3
)h2h3
)∂q1
+∂(a2(q1, q2, q3
)h3h1
)∂q2
+∂(a3(q1, q2, q3
)h1h2
)∂q3
)
con lo cual identificamos la forma generica de la divergencia en coordenadas curvilıneas
div a ≡∇ · a =1
h1h2h3
(∂(a1(q1, q2, q3
)h2h3
)∂q1
+∂(a2(q1, q2, q3
)h3h1
)∂q2
+∂(a3(q1, q2, q3
)h1h2
)∂q3
).
Un par de ejemplos
La ecuacion de continuidad
El primero de los ejemplos que consideraremos es la ecuacion de continuidad. Consideremos una su-perficie cerrada S que encierra un volumen V. Esta superficie esta inmersa en un fluido, de densidadρ (r, t) que fluye con un campo de velocidades v (r, t). Supondremos ademas que el volumen V queencierra la superficie S no cambia de posicion, con lo cual, la variacion de masa del fluido contenidoen este volumen es
∂
∂t
(∫∫∫V
ρ (r, t) dV
)=
∫∫∫V
∂ρ (r, t)
∂tdV
Entonces, la variacion de la cantidad de fluido encerrada por la superficie S sera igual a la cantidad defluido que escapa (o ingresa) a traves de esa superficie. Esto es∫∫∫
V
∂ρ (r, t)
∂tdV = −
∫∫s
ρ (r, t) v (r, t) · ns dS = −∫∫∫
V
∇ · (v (r, t) ρ (r, t)) dV
con lo cual∫∫∫V
(∂ρ (r, t)
∂t+ ∇ · (v (r, t) ρ (r, t))
)dV = 0 ⇔ ∂ρ (r, t)
∂t+ ∇ · (v (r, t) ρ (r, t)) = 0
y esta ultima representa la ecuacion de continuidad en dinamica de fluidos.
Fuentes y sumideros
El segundo ejemplo es un calculo explıcito que ilustra la interpretacion de la divergencia como medidade flujo de un campo vectorial. Consideremos un campo vectorial de la forma
a (r) = qr
r3≡ q
r2ur
∇ · a =1
hrhθhϕ
(∂ (ar (r, θ, ϕ)hθhϕ)
∂r+∂ (a (r, θ, ϕ)hϕhr)
∂θ+∂ (aϕ (r, θ, ϕ)hrhθ)
∂ϕ
)=
1
r2 sen(θ)
∂(qr2 r
2 sen(θ))
∂r= 0
Borra
dor Pre
limin
ar
ya que en coordenadas esfericas, hr = 1, hθ = r, hϕ = r sen θ.
Notese que el origen del sistema coordenado (el punto r = 0) no esta definido porque no lo estaba en elcampo vectorial original a (r) = q
r2 ur. Con lo cual, se tiene que si la superficie S no encierra a r = 0,entonces el flujo a traves de esa superficie sera nulo
F =
∫∫S
a · dS =
∫∫∫V
(∇ · a) dV = 0 .
Es decir, todo lo que entra sale. Sin embargo, si el volumen contiene al origen de coordenadas nopodemos decir nada por cuanto hay una indeterminacion en la expresion de la divergencia.
Consideremos con mas cuidado este caso de la aplicacion del Teorema de la Divergencia, en el cual lasuperficie S contenga el origen de coordenadas. Es claro que el volumen contenido entre dos esferasde distintos radio r < r, centradas en el origen y con superficies S y S respectivamente no contiene alorigen y por lo tanto el flujo sera nulo
F =
∫∫∫V
(∇ · a) dV = 0 =
∫∫s
a · ns dS +
∫∫s
a · ns dS
Pero el campo vectorial sobre la superficie S de la esfera de radio r es
a =q
r2ur , y ns ≡ −ur , con lo cual
∫∫s
a · ns dS =
∫∫s
q
r2ur · (−ur) dS = −
∫∫s
q
r2ds→θ ds→ϕ
es decir,∫∫s
a · ns dS =
∫∫s
q
r2ds→θ ds→ϕ =
∫∫s
q
r2r2 sen(θ)dθ dϕ = q
∫ π
0
sen(θ)dθ
∫ 2π
0
dϕ = 4πq
ya que: dS = hθdθ hϕdϕ ≡ rdθ r sen(θ)dϕ. Con lo cual, tenemos que el flujo de un campo singular enun punto (el origen de coordenadas), a (r) = q
r2 ur, a traves de una superficie que encierra ese puntosingular, no es nulo y es igual a 4πq. El campo vectorial a (r), se denominara campo de una partıculafuente si q > 0 y campo de un sumidero si q < 0.
5.10.3. Rotores, Lıneas de torbellino y Circulacion
Del mismo modo como hemos venido procediendo, haremos otra operacion vectorial con el operadornabla ∇. Tendremos entonces el rotor o rotacional actuando u operando sobre un campo vectorial ∇ × a.En coordenadas cartesianas podremos expresar esta operacion como
∇× a = εijk∂jak |ei〉 ≡ εijk∂ak∂xj|ei〉 = (∂2a3 − ∂3a2) |e1〉+ (∂3a1 − ∂1a3) |e2〉+ (∂1a2 − ∂2a1) |e3〉
∇× a = (∂yaz − ∂zay) i + (∂zax − ∂xaz) j + (∂xay − ∂yax) k ≡
∣∣∣∣∣∣i j k∂x ∂y ∂zax ay az
∣∣∣∣∣∣El rotor de un campo vectorial genera otro campo (pseudo) vectorial llamado campo rotor del campo
vectorial. Por razones que seran evidentes enseguida, las curvas integrales de este campo rotor se denominanlıneas de torbellino.
Borra
dor Pre
limin
ar
Lıneas de torbellino
Consideremos el siguiente campo vectorial en coordenadas cilındricas para z ≥ 0
a = z uϕ = z [− sen(ϕ) i + cos(ϕ) j] =−z y√x2 + y2
i +z x√x2 + y2
j
con lo cual el campo rotor del campo vectorial a sera
b = ∇× a (x, y, z) = ∇×(− z y√
x2 + y2i +
z x√x2 + y2
j
)=
∣∣∣∣∣∣∣i j k∂x ∂y ∂z
− z y√x2+y2
z x√x2+y2
0
∣∣∣∣∣∣∣= − x√
x2 + y2i− y√
x2 + y2j+
z√x2 + y2
k
Es claro que el campo vectorial y su campo rotor son ortogonales(− z y√
x2 + y2i +
z x√x2 + y2
j
)·
(− x√
x2 + y2i− y√
x2 + y2j+
z√x2 + y2
k
)= 0
Tal y como se detallo en la Seccion 5.8 de la pagina 234 las lıneas de flujo se construyen a partir de unvector diferencial paralelo a campo vectorial en cada punto. Esto es, si
b = ∇× a (x, y, z) =
∣∣∣∣∣∣i j k∂x ∂y ∂zax ay az
∣∣∣∣∣∣ = (∂yaz − ∂zay) i + (∂zax − ∂xaz) j + (∂xay − ∂yax) k
tendremos que
dr ∝ b = ∇× a (x, y, z) ⇒ dx
bx (x, y, z)=
dy
by (x, y.z)=
dz
bz (x, y.z)= dλ
o lo que es igual a
dλ =dx
(∂yaz − ∂zay)=
dy
(∂zax − ∂xaz)=
dz
(∂xay − ∂yax)
donde hemos parametrizado la curva con λ.Por lo tanto
dλ =
√x2 + y2dx
−x=
√x2 + y2dy
−y=
√x2 + y2dz
z
Las dos primeras ecuaciones proveen
dy
dx=y
x⇒ y (x) = xC1 ⇒
dxdλ = −x√
x2+y2= C1 ⇒ x (λ) = λC1
dydλ = −y√
x2+y2= C2 ⇒ y (λ) = λC2
con
C1 = cte ; C1 = − 1√1 + (C1)
2= cte ; C2 = − C1√
1 + (C1)2
= C1C1 = cte
Borra
dor Pre
limin
arFigura 5.12: Rotores de un campo vectorial, lıneas de torbellino
finalmente √x2 + y2dz
z= dλ ⇒ dz
dλ=
z√x2 + y2
=z
x
√1 + (C1)
2=
z
λC1
√1 + (C1)
2= − z
λ
con lo cualdz
dλ= − z
λ⇒ z (λ) =
1
λC3 .
Lıneas de campo ortogonales a superficies
Hemos visto como la condicion dr ∝ b = ∇× a (x, y, z) encuentra lıneas (de torbellino) perpendicularesal campo a (x, y, z). Uno tambien puede plantearse encontrar el conjunto de superficies para las cuales laslıneas de flujo del campo vectorial, a (x, y, z), sean perpendiculares. Para ello suponemos que existen estassuperficies y que se representan, matematicamente, como un funcion ϕ = ϕ (x, y, z). Por lo tanto:
∇ϕ ∝ a (x, y, z) ⇒ ∇× [γ (x, y, z) a (x, y, z)] = ∇γ (x, y, z)× a (x, y, z) + γ (x, y, z)∇× a (x, y, z) = 0
es decir, ∇ϕ es proporcional al campo a (x, y, z) y al aplicar el rotor a ambos miembros se anula. Mas aun,al proyectar sobre el mismo vector a la ecuacion de la derecha nos queda
a (x, y, z) · [∇γ (x, y, z)× a (x, y, z)] + a (x, y, z) · [γ (x, y, z)∇× a (x, y, z)] = 0
ambos sumandos se anula por definicion de producto vectorial, pero el segundo sumando
a (x, y, z) · [∇× a (x, y, z)] = 0
impone una condicion sobre el campo independiente de la funcion de proporcionalidad.Por lo tanto, la condicion necesaria y suficiente para que las lıneas de flujo de un campo vectorial a (x, y, z)
sean perpendiculares a un conjunto de superficies ϕ = ϕ (x, y, z) es
a (x, y, z) · [∇× a (x, y, z)] = 0 .
Borra
dor Pre
limin
arFigura 5.13: Idea sobre el significado fısico del rotor
Circulacion de un campo vectorial
La idea (y el nombre de rotor) surge de la idea de rotacion (¿circulacion?) que este operador descubreal ser “aplicado” a un campo vectorial. Como se muestra en la Figura 5.13, la idea intuitiva es colocar un“detector” de rotacion inmerso en el campo. En este caso es un par de aspas e imaginamos que el campovectorial representa un campo de velocidades de un fluido. Si el fluido hace girar las aspas en sentido horario(tirabuzon o sacacorchos derecho hacia arriba) diremos que el campo tiene una “circulacion” positiva y elrotor del campo siempre sera positivo en esa region. Si es a la inversa, diremos que el campo tiene una“circulacion” negativa y el rotor tambien lo sera en esa region. Finalmente, si el par de aspas no rota, elcampo tendra una circulacion nula o no tendra circulacion y su rotor sera tambien nulo en esa region.
Para concretar esta intuicion de forma matematica, procedemos de la siguiente forma. Suponga unacircunferencia con radio r = 2, la cual viene descrita parametricamente por el radio vector
r (ϕ) = 2 cos(ϕ)i + 2 sin(ϕ)j ⇒ dr = 2 [− sen(ϕ)i + cos(ϕ)j] dϕ
y nos planteamos “hacer circular el campo” a lo largo de la esa trayectoria. Esto es realizar la siguienteintegral
Γ =
∮a · dr =
∫ 2π
0
z (− sen(ϕ)i + cos(ϕ)j) · 2 (− sen(ϕ)i + cos(ϕ)j) dϕ = 4πz
El campo vectorial a = z (− sen(ϕ)i + cos(ϕ)j) esta representado en la Figura 5.12. Hemos utilizado elsımbolo
∮para denotar la integral de lınea en un circuito cerrado. Es la primera idea de integrales de
campos vectoriales que veremos con mas detalles en las seccion 5.11.1. Uno hace el producto escalar a · dr yluego integra.
Es interesante comparar este resultado con el flujo del campo de rotores a traves de la superficie que
Borra
dor Pre
limin
ar
delimita la circunferencia de radio r = 2. Vale decir∫∫(∇× a) · nsdS =
∫∫ (−x√x2 + y2
i− y√x2 + y2
j +z√
x2 + y2k
)· k dx dy
= z
∫∫dx dy√x2 + y2
= z
∫∫dr rdθ
r= z
∫ 2
0
dr
∫ 2π
0
dθ = 4zπ
Esta “coincidencia” no es tal, corresponde a otro Teorema Integral para campos vectoriales, el Teoremade Stokes (ver seccion 5.12.2 en la pagina 269) mediante el cual se convierte una integral cerrada de lınea deun campo vectorial en el flujo del campo de rotores. Este teorema lo estudiaremos con detalle en la seccion5.12.2
La idea de circulacion se puede generalizar a un campo vectorial generico,
a = ax (x, y, z) i+ay (x, y, z) j+az (x, y, z) k
con lo cual, la integral de lınea cerrada, a lo largo de una circunferencia de radio, r, en el plano xy sera
Γ =
∮a · dr =
∫ 2π
0
ax (x, y, z) i+ay (x, y, z) j+az (x, y, z) k · (−r sen(ϕ)i + r cos(ϕ)j) dϕ
y suponiendo r 1 podemos desarrollar por Taylor las componentes del campo vectorial en al plano xyalrededor del origen de coordenadas rx,y ∼ 0. Esto es
ax (x, y, 0) = ax|r=0 + x ∂ax∂x
∣∣r=0
+ y ∂ax∂y
∣∣∣r=0
+ · · · = ax|r=0 + r cos(ϕ) ∂ax∂x
∣∣r=0
+ r sen(ϕ) ∂ax∂y
∣∣∣r=0
+ · · ·
ay (x, y, 0) = ay|r=0 + x∂ay∂x
∣∣∣r=0
+ y∂ay∂y
∣∣∣r=0
+ · · · = ay|r=0 + r cos(ϕ)∂ay∂x
∣∣∣r=0
+ r sen(ϕ)∂ay∂y
∣∣∣r=0
+ · · ·
Por lo tanto, la integral de lınea nos queda como
Γ =
∮a · dr =
∫ 2π
0
−[ax|r=0 + r cos(ϕ)
∂ax∂x
∣∣∣∣r=0
+ rsen(ϕ)∂ax∂y
∣∣∣∣r=0
]rsen(ϕ)dϕ+
+
∫ 2π
0
[ay|r=0 + r cos(ϕ)
∂ay∂x
∣∣∣∣r=0
+ rsen(ϕ)∂ay∂y
∣∣∣∣r=0
]r cos(ϕ)dϕ
con los cual
Γ =
∮a · dr = πr2
∂ay∂x
∣∣∣∣r=0
− ∂ax∂y
∣∣∣∣r=0
+O
(r3)
Finalmente vemos que la componente del rotor en el origen del plano x, y es igual al lımite de la circulaciona lo largo de una curva cerrada, dividida entre el area de la superficie que encierra la curva cerrada.
∂ay∂x
∣∣∣∣r=0
− ∂ax∂y
∣∣∣∣r=0
= lımr→0
Γ
πr2.
Borra
dor Pre
limin
ar
Rotores y velocidades angulares
Considere un cuerpo rıgido que gira alrededor de un eje con velocidad angular ω. Entonces la velocidadtangencial de un punto P , con una posicion r medida a un origen O situado en ese eje, siempre es
v = ω × r = i (ωyz − ωzy) + j (ωzx− ωxz) + k (ωxy − ωyx)
y su rotor sera
∇× v = (∂yvz − ∂zvy) i + (∂zvx − ∂xvz) j + (∂xvy − ∂yvx) k ≡
∣∣∣∣∣∣i j k∂x ∂y ∂zvx vy vz
∣∣∣∣∣∣es decir, por ser un cuerpo rıgido la velocidad angular ω es independiente de r; o lo que es lo mismo, todoel cuerpo rıgido tiene la misma velocidad angular. Con ello tendremos que
∇× v = εijk∂jvkei = εijk∂jεklmωlrmei =
(δilδ
jm − δimδ
jl
)∂j(ωlrm
)ei
=(δilδ
jm − δimδ
jl
)ωlδmj ei =
(3ωi − ωi
)ei = 2ωiei = 2ω
sin ındices hubiera sido
(∇× v)x = (∂yvz − ∂zvy) = ∂y (ωxy − ωyx)− ∂z (ωzx− ωxz) = 2ωx
(∇× v)y = (∂zvx − ∂xvz) = ∂z (ωyz − ωzy)− ∂x (ωxy − ωyx) = 2ωy
(∇× v)z = (∂xvy − ∂yvx) = ∂x (ωzx− ωxz)− ∂y (ωyz − ωzy) = 2ωz
Otra vez, el rotor de un campo de velocidades de un cuerpo (que rota) “detecta” su velocidad angular.
Rotores y coordenadas curvilıneas
Una vez mas recurrimos a una definicion para el rotor independiente del sistemas de coordenada
∇× a = rot a = lımV→0
1
V
∫∫dS× a = lım
V→0
1
V
∫∫ns × a dS
y del mismo modo que calculamos el flujo a traves de las distintas capas de un volumen podremos (no loharemos y se lo dejaremos al lector) demostrar que
∇× a = rot a =1
hjhk
[εijk
∂(hkak
)∂qj
ei
]=
1
h1h2h3
∣∣∣∣∣∣h1e1 h2e2 h3e3∂∂q1
∂∂q2
∂∂q3
h1a1 h2a2 h3a3
∣∣∣∣∣∣donde los ındices repetidos i, j, k indican suma; j y k no indican suma sino que replican los valores de losındices j, k.
Explıcitamente
rot a =e1
h2h3
[∂ (h3a3)
∂q2− ∂ (h2a2)
∂q3
]+
e2
h1h3
[∂ (h1a1)
∂q3− ∂ (h3a3)
∂q1
]+
e3
h1h2
[∂ (h2a2)
∂q1− ∂ (h1a1)
∂q2
]
Borra
dor Pre
limin
ar
5.10.4. Formulario del Operador nabla, ∇El operador nabla, ∇, en las formulas anteriores actua como un operador lineal. Esto es, dadas ϕ (r) , χ (r) , ψ (r)
funciones escalares de variable vectorial y a y b dos campos vectoriales cuales quiera, se puede generar elsiguiente formulario, el cual debera ser demostrado por el lector
∇ (ϕ+ χψ) = ∇ϕ+ ∇ (χψ) = ∇ϕ+ ψ∇χ+ χ∇ψ
∇ · (a + ϕb) = ∇ · a + ϕ∇ · b + ∇ϕ · b
∇× (a + ϕb) = ∇× a + ~∇× (ϕb) = ∇× a + ~∇ϕ× b + ϕ∇× b
y tambien, si consideramos las cantidades a · b y a× b tendremos
∇ (a · b) =[∂i(ajbj
)]ei = (∇ · a) b + (∇ · b) a
∇ · (a× b) = ∂i(εijk a
jbk)
=(εijk∂
iaj)bk +
(εijk∂
ibk)aj = (∇× a) · b− a · (∇× b)
∇× (a× b) = (b ·∇) a− b (∇ · a) + a (∇ · b)− (a ·∇) b
es claro quea (∇ · b) 6= (b ·∇) a ⇐⇒ aj
(∂ibi
)6= bi∂
iaj
por cuanto en las partes izquierdas las derivadas actuan sobre las componentes de b, mientras que en laspartes derechas es sobre las componentes de a.
Otros casos importantes se presentan cuando los campos escalares y/o vectoriales son a su vez funcionesde un campo escalar. Es decir, funciones compuestas. Esto es
ψ = ψ (χ (r)) y a = a (χ (r)) .
En este caso, tendremos
∇ψ (χ (r)) =dψ
dχ∇χ; ∇ · a (χ (r)) = ∇χ · da
dχ; ∇× a (χ (r)) = (∇χ)× da
dχ
Para demostrar, por ejemplo, ∇ · a (χ (r)) = ∇χ · dadχ , utilizamos la estrategia de Taylor y expandimos el
campo vectorial alrededor de un determinado punto, digamos r = r0 arbitrario. Esto es
a = a (r0) +da
dχ
∣∣∣∣r0
(χ (r)− χ (r0)) +1
2
d2a
dχ2
∣∣∣∣M
(χ (r)− χ (r0))2
+ · · ·
aplicando la divergencia a ambos miembros queda como
∇ · a = ∇ · [a (r0)] + ∇ ·[
da
dχ
∣∣∣∣r0
(χ (r)− χ (r0))
]+
1
2∇ ·
[d2a
dχ2
∣∣∣∣M
(χ (r)− χ (r0))2
]+ · · ·
con lo cual
∇ · a =da
dχ
∣∣∣∣r0
·∇χ (r) + (χ (r)− χ (r0))d2a
dχ2
∣∣∣∣r0
·∇χ (r) +1
2(χ (r)− χ (r0))
2 d3a
dχ3
∣∣∣∣r0
·∇χ (r) + · · ·
esta relacion vale para todo r, en particular para r = r0. Con lo cual
∇ · a|r0 =da
dχ
∣∣∣∣r0
·∇χ (r0) =⇒ ∇ · a =da
dχ·∇χ (r)
ya que r0 es arbitrario, con lo cual queda demostrado.
Borra
dor Pre
limin
ar
5.10.5. Nabla dos veces y el Laplaciano
Formulario de Nabla dos veces
Considerando a Nabla, ∇, como un operador surge la pregunta de su aplicacion repetida sobre distintosobjetos. Consideremos primero las siguientes expresiones en coordenadas cartesianas. Esto es
∇ ·∇φ = ∇2φ = ∆φ = ∂i∂iφ
∇×∇φ = εijk∂j∂kφ ei = 0
∇ (∇ · a) = ∂i(∂jaj
)ei = ∂j∂iaj ei
∇× (∇ · a) = ∇ · (∇× a) = 0
∇× (∇× a) = εijk∂jεklm∂lam ei =
(δilδ
jm − δimδ
jl
)∂j∂
lam ei = ∂i∂jaj ei − ∂j∂jai ei
∇× (∇× a) = ∇ (∇ · a)−∆a
Laplaciano y campos escalares
Mas alla de la gimnasia de ındices para determinar la expresion de la relacion vectorial, quiza la masimportante de las aplicaciones es el Laplaciano, ∇2 = ∆, el cual en R3 y en coordenadas cartesianas puedeexpresarse como:
∇ ·∇φ = ∇2φ = ∆φ = ∂i∂iφ = ∂xxφ+ ∂yyφ+ ∂zzφ
La importancia el Laplaciano reside en que la mayor parte (casi todas) las ecuaciones de la fısica matematicason ecuaciones diferenciales (ordinarias y parciales) de segundo orden y el Laplaciano las genera en el espacio.Adicionalmente la solucion a la ecuacion armonica
∆φ = ∂i∂iφ = ∂xxφ+ ∂yyφ+ ∂zzφ = 0
es de importancias en varias areas de la fısica.Se puede demostrar facilmente que el Laplaciano cumple con
∆ (φ+ Cψ) = ∆φ+ C∆ψ; ∆ (φψ) = φ∆ψ + ψ∆φ+ 2∇ψ ·∇φ
considerando las expresiones para el gradiente y la divergencia en coordenadas curvilıneas
∇φ =1
h1
∂ φ
∂ q1e1 +
1
h2
∂ φ
∂ q2e2 +
1
h3
∂ φ
∂ q3e3
y
∇ · a =1
h1h2h3
(∂(a1(q1, q2, q3
)h2h3
)∂q1
+∂(a2(q1, q2, q3
)h3h1
)∂q2
+∂(a3(q1, q2, q3
)h1h2
)∂q3
)respectivamente, es facil llegar a la expresion para el Laplaciano en coordenadas curvilıneas
∇2φ ≡ ∆φ =1
h1h2h3
∂
∂q1
(h2h3
h1
∂φ
∂q1
)+
∂
∂q2
(h1h3
h2
∂φ
∂q2
)+
∂
∂ q3
(h2h1
h3
∂φ
∂q3
).
Borra
dor Pre
limin
ar
Laplaciano y campos vectoriales
Inspirado en la forma que toma un campo vectorial en coordenadas cartesianas, definiremos el Laplacianode un campo vectorial como la relacion
∆ a = ∇ (∇ · a)−∇× (∇×a)
Desarrollando esta expresion en coordenadas cartesianas tendremos que
∆ a =[∂i(∂jaj
)−(∂i∂ja
j − ∂j∂jai)]
ei =⇒ ∆a =(∂j∂
jai)ei ≡
(∆ai
)ei
Es decir, que el Laplaciano de un campo vectorial, expresado en coordenadas cartesianas, es igualal vector cuyas componentes son los Laplacianos de las componentes del campo original. Es importanteresaltar que la expresion ∆a =
(∆ai
)ei se cumple unicamente en coordenadas cartesianas pero la definicion
que hemos propuesto, ∆a = ∇ (∇ · a)−∇× (∇×a) , es una ecuacion vectorial y es, por lo tanto, valida encualquier sistema de coordenadas.
El Laplaciano de campos vectoriales no lleva construir un formulario de relaciones facilmente demostrables
∆ (∇φ) = ∇ (∆φ) ; ∇ · (∆a) = ∆ (∇ · a) ; ∇× (∆ a) = ∆ (∇×a) .
5.10.6. Derivadas Direccionales de Campos Vectoriales
El concepto
Formalmente y como siempre la misma idea de derivada como cociente incremental. Dados dos puntosP1 y P2 y un vector u que los une (va de P1 → P2), entonces por definicion
D|u〉 |a〉 ≡da
du= lımP2→P1
a (P2)− a (P1)
P2 − P1⇒
(da
du
)i=
(dai
du
)= lımP2→P1
ai (P2)− ai (P1)
P2 − P1
por consiguiente, si a, tiene por componentes cartesianas (en general cualquier sistema de coordenadas
ortogonales) (ax, ay, az) las componentes del vector derivado seran(
daxdu ,
daydu ,
dazdu
). De modo que inspirados
en la derivada direccional de un campo escalar que presentamos en la seccion 5.10.1, podemos construir laexpresion para la derivada direccional de cada una de las componentes del vector da
du . Esto es
dϕ
du= D|u〉φ = ∇φ · u = ui∂iϕ ⇒
dai
du= u ·∇ai = uj∂ja
i ⇒ D|u〉 |a〉 ≡da
du= (u ·∇) a
Otra vez, en coordenadas cartesianas se tiene que
D|u〉a = (u ·∇) a =(ui∂ia
j)ej ⇒ D|u〉 () ≡
d ()du
= (u ·∇) () ≡ ui∂i () .
Un ejemplo: el campo de aceleraciones de un fluido
El ejemplo mas estandar es la descripcion del campo de aceleraciones de un fluido en movimiento. Elcampo de aceleraciones de un fluido, como de costumbre, es la variacion del campo de velocidades respectoal tiempo. Esto es, a = dv
dt . Para escribir la expresion de este campo de aceleraciones, supongamos que unfluido se mueve y registra un campo de velocidades v = v (r, t) el cual, en general, sera inhomogeneo y noestacionario. Identificamos una porcion del fluido (partıcula) cualquiera y observamos que en un intervalo
Borra
dor Pre
limin
arFigura 5.14: Contribuciones a la variacion de la velocidad en un fluido
de tiempo dt esa porcion identificada se mueve de P1 → P2 y registra un incremento en su velocidad de ven P1 a v + dv en P2 :
v (P1) ≡ v (r, t) y v (P2) ≡ v (r + dr, t+ dt) .
Tal y como ejemplificamos en la Figura 5.14, este incremento proviene de dos contribuciones. Una, llamadalocal, debido a el cambio en la variable temporal y otra, por la comparacion del vector velocidad, v, en dosposiciones (traslacion espacial o contribucion convectiva).
dvt =∂v
∂tdt y dvu =
dv
dudu
Visto de otro modo un poco mas informal, dado que el campo es funcion de dos variables y una de ellasvectorial
v = v (r, t) ⇒ a =dv
dt=∂v
∂r+∂v
∂t
De la discusion anterior es claro que dvdu es la derivada direccional del campo de velocidades a lo largo del
vector unitario u que apunta de P1 → P2 Ahora bien, para este caso tenemos que:
du = ‖dr‖ , du = ‖v‖ dt y u =v
‖v‖con lo cual la derivada direccional queda como
dv
du=
1
‖v‖(v ·∇) v
y finalmente la aceleracion como
a =dv
dt=
1
‖v‖(v ·∇) v +
∂v
∂t⇒ ai =
1
‖v‖(v ·∇) vi +
∂vi
∂t
donde hemos representado las componentes cartesianas de los vectores velocidad y aceleracion como vi y ai,respectivamente.
Es importante hacer una reflexion un poco mas fısica de las contribuciones. La contribucion local provienede la variacion del vector (por la dependencia temporal) alrededor del punto, sin importar la direccion quesigue al partıcula y la contribucion convectiva proviene de la inhomogeneidad del campo de velocidades. Estoes de la variacion del campo de velocidades segun la direccion que siga la partıcula.
Borra
dor Pre
limin
ar
5.10.7. La Derivada Covariante
En un sistema de coordenadas generalizadas qi, las bases locales ei son funciones de las coordenadas,de decir
ei = ei(q1, q2, q3) , ei = ei(q1, q2, q3)
por lo que el diferencial de cualquier campo vectorial A = A(r) viene a ser:
dA = d(Aie
i)
= eidAi +Aidei , dA = d(Aiei
)= eidA
i +Aidei
por lo tanto, las bases de las coordenadas generalizadas tambien cambian punto a punto. Entonces resultaque
dA =∂A
∂qjdqj ⇒ ∂A
∂qj=∂Ai∂qj
ei +Ai∂ei
∂qj=∂Ai
∂qjei +Ai
∂ei∂qj
Las componentes covariantes o contravariantes del vector ∂A∂qj vienen a ser las componentes de un tensor de
segundo orden llamado la derivada covariante del vector dado. De esta manera, la derivada covariante de unvector covariante tiene como componentes:
Ai;j ≡∂A
∂qj· ei
mientras que la derivada covariante de un vector contravariante tiene componentes
Ai;j ≡∂A
∂qj· ei
Notemos que si el campo vectorial es homogeneo, es decir, tiene magnitud y direccion constante, entoncespodemos ver lo siguiente:
A = Aiei = (Ai + dAi)(ei + dei) ⇒ eidAi +Aidei + dAidei = 0
si nos quedamos solo con los terminos a primer orden:
dA = eidAi +Aidei = 0
esto significa que:∂A
∂qjdqj = Ai,jdq
j = 0 ⇒ Ai,j = 0
La derivada covariante de un campo vectorial homogenero es cero.Desde un punto de vista geometrico, un campo vectorial homogeno se puede interpretar como el resultado
de desplazar al vector A paralelo a si mismo por todos los puntos del espacio, esto significa que la condicionAi,j = 0 podrıa ser considerara como la condicion del desplazamiento paralelo.
Por otra parte, notemos que segun lo visto anteriormente
Ai;j =∂A
∂qj· ei =
∂Ai
∂qj+Al
∂el∂qj· ei y Ai;j =
∂A
∂qj· ei =
∂Ai∂qj
+Al∂el
∂qj· ei
donde hemos usado el hecho de que ei · ej = δji .
Se puede apreciar que∂ej∂qk
se puede escribir como una combinacion lineal de los vectores base
∂ej∂qk
=
(∂ej∂qk
)iei =
(ei · ∂ej
∂qk
)ei ≡ Γijkei
Borra
dor Pre
limin
ar
donde hemos introducido la siguiente notacion:
Γijk = ei · ∂ej∂qk
y de manera equivalente: Γjik = ei ·∂ej
∂qk
Estas cantidades se denominan Sımbolos de Christoffel del segundo tipo y en realidad viene representado por27 componentes.
Por lo tanto, podemos escribir ahora
Ai;j =∂Ai
∂qj+ ΓijkA
k = ∂jAi + ΓijkA
k y Ai;j =∂Ai∂qj− ΓkjiAk = ∂jAi − ΓkjiAk
el signo menos en la segunda ecuacion es debido a que
∂(ei · ej)∂qk
= 0 ⇒ ej · ∂ei∂qk
= −ei ·∂ej
∂qk
Ademas, se tiene el hecho de que los Sımbolos de Christoffel son simetricos bajo el cambio de los dos indicesinferiores
Γijk = Γikj .
En conclusion:∂A
∂qj≡ Ai;jei o
∂A
∂qj≡ Ai;jei
Tenemos entonces que la derivada covariante de un campo vectorial toma en cuenta no solo el cambioen el campo mismo, a medida que nos movemos a lo largo de las curvas coordenadas, sino que tambien dacuenta de como cambian las bases. Por lo tanto, si las bases no varıan al pasar de un punto a otro (basesrectangulares cartesianas) los Sımbolos de Christoffel se anulan y la derivada covariante no es mas que laderivada normal.
Los Sımbolos de Christoffel pueden calcularse a partir del tensor metrico y de su propiedad de simetrıa.
Γijk =1
2
(Γijk + Γikj
)=
1
2
(ei · ∂ek
∂qj+ ei · ∂ej
∂qk
)=
1
2
((gilel) ·
∂ek∂qj
+ (gilel) ·∂ej∂qk
)=
1
2gil[∂
∂qj(el · ek) +
∂
∂qk(el · ej)− ek ·
∂el∂qj− ej ·
∂el∂qk
]=
1
2gil[∂glk∂qj
+∂glj∂qk− ek ·
∂ej∂ql− ej ·
∂ek∂ql
]=
1
2gil[∂glk∂qj
+∂glj∂qk− ∂(ej · ek)
∂ql
]=
1
2gil[∂glk∂qj
+∂glj∂qk− ∂gjk
∂ql
]Hemos llegado entonces a la siguiente e importante relacion:
Γijk =1
2gil[∂glk∂qj
+∂glj∂qk− ∂gjk
∂ql
]Es importante tener en cuenta que la derivada covariante es un tensor, a pesar de que la derivada parcial
y los Sımbolos de Christoffel que conforman la suma no lo son, es decir, la combinacion de estos dos objetosque no son tensores forman un tensor. Es tambien importante definir los Sımbolos de Christoffel de primertipo
Γijk ≡ gilΓljk =1
2gilg
lm
[∂gmk∂qj
+∂gmj∂qk
− ∂gjk∂qm
]=
1
2δmi
[∂gmk∂qj
+∂gmj∂qk
− ∂gjk∂qm
]esto es
Γijk ≡ gilΓljk =1
2
[∂gik∂qj
+∂gij∂qk
− ∂gjk∂qi
]= ei ·
∂ej∂qk
Borra
dor Pre
limin
ar
A estas alturas, debe quedar claro que en el caso de utilizar coordenadas cartesianas todos los Sımbolosde Christoffel son iguales a cero ya que todas las componentes del tensor metrico son constantes, ademasse puede apreciar que en estas coordenadas las componentes covariantes y contravariantes de un vector soniguales. Y al hacer la siguiente contraccion
Ai;i = ∂iAi + ΓiikA
k ⇒ Ai;i = ∂iAi =
∑i
∂iAi ⇒ un escalar
Revisemos ahora como transforman los Sımbolos de Christoffel del primer tipo bajo un cambio de coorde-nadas. Recordemos que un tensor debe trasformar de la siguiente manera (usaremos una notacion ligeramentediferente a la usada anteriormente)
Ti′j′k′ = αli′αmj′α
nk′Tlmn , con αli′ =
∂ql
∂qi′
Por lo tanto:
Γi′j′k′ = ei′ ·∂ej′
∂qk′= αli′el ·
∂
∂qm(αnj′en)
∂qm
∂qk′
= αli′αmk′α
nj′el ·
∂en∂qm
+ αli′αmk′(el · en)
∂αnj′
∂qm
= αli′αmk′α
nj′Γlnm + αli′α
mk′gln
∂αnj′
∂qm
es decir, no transforma como un tensor.
Ejercicios
1. Demuestre que
Γi′
j′k′ = αi′
l αmj′α
nk′Γ
lmn + αi
′
nαmk′∂αnj′
∂qm
2. Demuestre queAi′
;j′ = αi′
l αmj′A
l;m
3. Demuestre queAi′;j′ = αli′α
mj′Al;m
Como una extension de todo lo anterior, podemos escribir las derivadas covariantes de tensores de rangomayor, por ejemplo: 5
T ij;k ≡ ∂T ij
∂qk+ ΓiklT
lj + ΓjklTil = T ij,k + ΓiklT
lj + ΓjklTil
Tij;k ≡ ∂Tij∂qk
− ΓlikTlj − ΓljkTil = Tij,k − ΓlikTlj − ΓljkTil
T ij;k ≡∂T ij∂qk
+ ΓiklTlj − ΓljkT
il = T ij,k + ΓiklT
lj − ΓljkT
il
5Las derivadas parciales las indicaremos con una coma: ∂Tij
∂qk= ∂kT
ij ≡ T ij,k
Borra
dor Pre
limin
ar
Es claro que si calculamos la derivada covariante de “una componente contravariante”ponemos un signo masy si lo que estamos es calculando la derivada covariante de una “componente covariante”podemos poner unsigno menos.
Para el caso de un tensor de orden cero, es decir, un escalar, la derivada covariante se reduce a la derivadaparcial con respecto a las coordenadas
φ;i =∂φ
∂qi
esto significa que la derivada covariante de un escalar es un vector covariante que tiene como componenteslas componentes covariantes del gradiente de φ.
Podemos averiguar ahora sobre la accion de la derivada covariante sobre el tensor metrico:
gij;k = gij,k − Γlikglj − Γljkgil = gij,k − Γjik − Γijk
= gij,k −1
2
[∂gjk∂qi
+∂gji∂qk
− ∂gik∂qj
]− 1
2
[∂gik∂qj
+∂gij∂qk
− ∂gjk∂qi
]= gij,k −
1
2[gjk,i + gji,k − gik,j + gik,j + gij,k − gjk,i] = 0
De este ultimo resultado de obtiene la siguiente igualdad
gij,k = Γjik + Γijk
Se dice que el tensor metrico es transparente a la derivada covariante, lo que se conoce como el Teorema deRicci. Esto significa que el tensor metrico es constante para la derivada covariante, por ejemplo:
gilAl;j =
(gilA
l)
;j= Ai;j
gilTlj;k =
(gilT
lj)
;k= T ji;k
Volviendo a tema del operador diferencial en coordenadas generalizadas tenemos entonces, y a modo derepaso lo siguiente:
Si tenemos un campo escalar φ = φ(q1, q2, q3), por gradiente entendemos a un vector cuyas componentescovariantes son
∂φ
∂qi⇒ grad φ =
∂φ
∂qiei
En el caso particular de la la derivada direccional de φ en la direccion del vector s se tiene
∂φ
∂s= s · grad φ , con s = siei
Si tenemos un campo vectorial A = A(q1, q2, q3), para la divergencia de A tendremos que es lacontraccion de la derivada covariante de A, esto es:
div A ≡ Ai;i = ∂iAi + ΓiijA
j
Para el caso de las componentes covariantes de A, tenemos
div A ≡ Ai;i =(gijAj
);i
= gijAj;i
Borra
dor Pre
limin
ar
El calculo de los diferentes Sımbolos de Christoffel suele ser un trabajo laborioso, pero se pueden buscarotros caminos como veremos a continuacion. Podemos ver que:
Γiik =1
2gil [∂iglk + ∂kgli − ∂lgik] =
1
2gil∂kgil
donde hemos intercambiado los ındices mudos i y l para que se cancelen el primer y el tercer termino entrelos corchetes.
Recurriendo a la reprentacion matricial del tensor metrico, podemos ver que:[GijG
]≡ [gij ] = [gji] = [gji]
−1 ,
donde G ≡ det[gij ] y Gij la matriz cofactor de los elementos de [gij ].De la definicion del determinante se tiene
G = gijGij , (no hay suma sobre i)
Como Gij es independiente de gij se tiene que
∂G
∂gij= Gij
y
gij =GijG
=1
G
∂G
∂gij
por lo tanto:
Γiik =1
2gil∂kgil =
1
2G
∂G
∂gil
∂gil∂xk
=1
2G
∂G
∂xk=
1√G
∂√G
∂xk≡ ∂k
√G√G
Con esto podemos ver que podemos obtener una expresion bien general para la divergencia:
div A ≡ Ai;i = ∂iAi +
∂i√G√G
Ai =∂i
(√GAi
)√G
Se define el Laplaciano de un campo escalar φ = φ(r) como la divergencia del gradiente
∆φ = div · grad φ =∂i
[√G(grad φ)i
]√G
=∂i
[√Ggij(grad φ)j
]√G
=∂i
[√Ggij∂jφ
]√G
Para finalizar, recordemos que podemos construir a partir de un tensor de segundo rango un tensorantisimetrico, por ejemplo, de Ai;j tenemos el tensor Ai;j −Aj;i. Ahora bien, de:
Ai;j = ∂jAi − ΓkijAk y Aj;i = ∂iAj − ΓkjiAk
resultaAi;j −Aj;i = ∂jAi − ∂iAj
por la simetrıa de los sımbolos de Christoffel. Aunque las derivadas parciales de un vector no son tensores,por eso fue que definimos la derivada covariante, la diferencia antisimetrica si que es un tensor. Los tensoresantisimetricos tienen unicamente tres componentes independientes (en todos los sistemas de coordenadas) yen este caso, pueden verse como las componentes de un vector relacionado con el rotor del vector A.
(rot A)i
=1√G
(∂jAk − ∂kAj) ⇒ rot A =1√G
det
∣∣∣∣∣∣e1 e2 e3
∂1 ∂2 ∂3
A1 A2 A3
∣∣∣∣∣∣ =1√GεijkAjek
con i, j, k una permutacion cıclica de 1, 2, 3.
Borra
dor Pre
limin
ar
5.11. Integrales y Campos Vectoriales
5.11.1. Integrales de Campos
Despues de haber diferenciado campos escalares y vectoriales, el siguiente paso es integrarlos. El primercaso de este tipo integrales es el trivial que siempre hemos utilizado:∫
V (u) du = i
∫Vx (u) du+ j
∫Vy (u) du+ k
∫Vz (u) du =
[∫V i (u) du
]ei
Ası integramos la aceleracion de un movimiento parabolico
dv
dt= a = −gk ⇒
∫a dt = k
∫−g dt = −kgt+ v0 = −kgt + iv0x + jv0y + kv0z
Ahora bien, existen sutilezas en este caso que debemos tener en cuenta. Por ejemplo considere la integral∫dt
(a× d2a
dt2
)=
∫dt
(d
dt
(a× da
dt
)− da
dt× da
dt
)=
∫dt
d
dt
(a× da
dt
)= a× da
dt+ c
Pero en general los casos quedan resueltos integrando componente a componente con la ayuda de la notacionde ındices ∫
dt (a× b) =
[∫dt(εijkajbk
)]ei
Quiza uno de los problemas que ilustra mejor esta situacion es el movimiento bajo fuerzas centrales. LaLey de Gravitacion de Newton nos dice que∑
F = m a = md
dt= m G
M
r2mM
ur ⇒d
dt= G
M
r2mM
ur
Es costumbre definir la velocidad aerolar, vA, como el area barrida por el radio vector posicion, r (t) quedescribe la trayectoria de la partıcula
2vA = r× dr
dt= r ur ×
d (r ur)
dt= r ur ×
(dr
dtur + r
durdt
)= r ur × r
durdt
= r2ur ×durdt
Notese que si c es un vector constante
d
dt
(ur ×
durdt
)= 0 ⇒ ur ×
durdt
= c ⇒ 2vA = r2ur ×durdt
= const
con lo cual
d
dt(v × vA) =
dv
dt× vA = G
M
r2mM
ur × vA =MG
2
ur ×
(ur ×
durdt
)
d
dt(v × vA) =
MG
2
(ur ·
durdt
)ur − (ur · ur)
durdt
=MG
2
durdt
integrando
v × vA =MG
2ur + p
Borra
dor Pre
limin
arFigura 5.15: Trayectorias de integracion y campos vectoriales
donde p es un vector arbitrario de constante de integracion. Finalmente nos damos cuenta que
r · (v × vA) = r ur ·(MG
2ur + p
)=MG
2r + rp cos(θ)
r · (v × vA) = εijkrivjvAk ≡ vA · (r× v) = vA · vA = v2A
y entonces
v2A =
MG
2r + rp cos(θ) ⇒ r =
v2A
MG2 + p cos(θ)
≡2v2AMG
1 + 2pMG cos(θ)
que constituye la ecuacion de una conica.
5.11.2. Integrales de lınea
Ahora nos detendremos con mas cuidado en integrales que tambien ya hemos utilizado, pero muy rapi-damente. Ası tendremos por delante algunos objetos del siguiente tenor:∫
C
φ dr,
∫C
V · dr y
∫C
V × dr
Este tipo de objetos se conoce como integrales de lınea y requieren la especificacion de la curva C, latrayectoria, a lo largo de la cual se lleva la integracion. Es clara la importancia de esa trayectoria para laintegracion de los campos por cuanto encontraran expresiones del campo vectorial que puebla la region atraves de la cual se integra. Esas trayectorias seran abiertas o cerradas dependiendo de la curva que se sigaen el proceso de integracion.
Ası para integrar un campo escalar φ = φ (r) en coordenadas cartesianas, tendremos que∫C
φ (x, y, z) dr =
∫C
φ (x, y, z) (dxi + dyj+dzk)
= i
∫C
φ (x, y (x) , z (x)) dx+ j
∫C
φ (x (y) , y, z (y)) dy + k
∫C
φ (x (z) , y (z) , z) dz
Borra
dor Pre
limin
ar
tal y como indicamos arriba, las tres integrales se podran realizar si conocemos, en cada caso, la expresiondel integrando en termino de la variable de integracion. Esa es la razon por la cual hay que especificar lacurva C que define la trayectoria de integracion.
5.11.3. Integrales de Superficie
Otros objetos que ya nos hemos encontrado son las integrales de superficie cuando evaluamos el flujo deun campo vectorial y lo relacionamos con la divergencia. Ası interpretamos que objetos∫∫
s
a · dS ≡∫∫
s
a · ns dS =
∫∫s
an dS
representaban el flujo de las lıneas de campo a traves del diferencial de superficie dS. Es costumbre quese separen el modulo, dS, de la direccion y el sentido, ns el cual es el vector normal (sentido positivo) ala superficie. Otra vez, las superficies podran ser abiertas (cuando disponen de una curva que limita susfronteras) y cerradas cuando no. Un cırculo sera una superficie abierta y una esfera cerrada. Por convencionsupondremos que el vector normal a una superficie cerrada tendra sentido positivo saliendo.
La utilizacion de integrales de superficie nos ha permitido definir, de manera invariante (independientedel sistema de coordenadas) las expresiones para los operadores diferenciales. Ası hemos podido definir:
∇φ ≡ gradφ = lımV→0
1
V
∫∫s
φ (x, y, z) dS = lımV→0
1
V
∫∫s
φ (x, y, z) ns dS
∇ · a ≡ div a = lımV→0
1
V
∫∫s
a · dS ≡ lımV→0
1
V
∫∫s
a · ns dS = lımV→0
1
V
∫∫s
an dS
∇× a ≡ rot a = lımV→0
1
V
∫∫dS× a = lım
V→0
1
V
∫∫ns × a dS
5.12. Campos Vectoriales y Teoremas integrales
En esta seccion presentaremos un conjunto de teoremas que relacionan las variaciones de un campovectorial con las fuentes que lo producen. En terminos tecnicos (matematicos) resultan fundamentales cuandoqueremos convertir un tipo de integral (lınea, superficie o volumen) en otra.
El primer teorema, el Teorema de Gauss permite expresar el valor de una integral de volumen, V, en-cerrado por una determinada superficie, S, (cerrada) en terminos de una integral sobre esa superficie, S.El otro teorema importante es el Teorema de Stokes, el cual permite relacionar el valor de una integral desuperficie con la integral de lınea sobre la curva que delimita esa superficie.
5.12.1. Teorema de Gauss
Presentacion y demostracion
La primera relacion que presentaremos entre una integral de superficie de un campo vectorial, a,y unade superficie de su derivada es el Teorema de Gauss el cual se expresa de forma vectorial como∫∫
s
a · dS ≡∫∫
s
a · ns dS =
∫V
∇ · a dV
Borra
dor Pre
limin
ar
Figura 5.16: Teoremas de Gauss
donde a = a (x, y, z) es el campo vectorial, dS ≡ nsdS es el diferencial de area y dV el diferencial de volumen.Tal y como vimos en su oportunidad el termino ∇ · a es interpretado como el flujo del campo a por
unidad de volumen, por lo tanto, el lado derecho de la ecuacion es la tasa de flujo neto que sale del volumensobre el cual estamos integrando.
La demostracion del Teorema de Gauss es como sigue. Supongamos un volumen encerrado por unasuperficie convexa, S, como se muestra en la Figura 5.16 en los cuadrantes I, II y III. Supongamos ademasque orientamos el sistema de coordenada de tal forma que una lınea paralela a uno de los ejes toca la superficieen dos puntos (Figura 5.16, cuadrante I). De este modo podemos trazar una superficie (perpendicular a esalınea) tal que divida la superficie, S, en dos superficies, S1 y S2 cada una de las cuales esta bordeada por lacurva C, (Figura 5.16, cuadrante II).
Al evaluar la integral∫S
axi · d S =
∫S1
axi · dS +
∫S2
axi · dS =
∫∫s′
[ax (x2, y, z)− ax (x1, y, z)] dS′
ya que las componentes x de los vectores normales a las dos superficies que contribuyen (Figura 5.16,cuadrante III) tienen signos opuestos
dS2x = i · dS2 = −i · dS1 = −dS1x = dydz = dS′
Ahora bien, dado que
∂ax∂x
= lımx2→x1
ax (x2, y, z)− ax (x1, y, z)
x2 − x1⇒ ax (x2, y, z)− ax (x1, y, z) =
∫ x2
x1
∂ax∂x
dx
con lo cual ∫S
axi · dS =
∫∫s′
[∫ x2
x1
∂ax∂x
dx
]dydz =
∫V
∂ax∂x
dV
Borra
dor Pre
limin
ar
y equivalentemente al hacerlo en las direcciones j y k, obtendremos∫S
ayj · dS =
∫V
∂ay∂y
dV y
∫S
azk · dS =
∫V
∂az∂z
dV .
Finalmente hemos demostrado el Teorema de la divergencia o Teorema de Gauss∫∫s
a · dS ≡∫∫
s
a · ns dS =
∫V
(∂ax∂x
+∂ay∂y
+∂az∂z
)dV =
∫V
(∂ia
i)
dV =
∫V
(∇ · a) dV
Expresiones equivalentes para el Teorema de Gauss
Si bien la expresion estandar es la que hemos presentado, existen algunas variantes que se derivan de ella.Por ejemplo si consideramos un campo escalar, φ (x, y, z), el teorema de Gauss nos conduce a∫∫
s
φ (x, y, z) dS =
∫∫∫V
∇φ (x, y, z) dV y
∫∫s
dS×B (x, y, z) =
∫∫∫V
∇×B (x, y, z) dV
donde B (x, y, z) es un campo vectorial.Para comprobar la primera de estas dos relaciones consideramos un vector c constante y construimos un
campo vectoriala (x, y, z) = cφ (x, y, z)
∫∫s
a · dS =
∫∫∫V
∇ · adV ⇒ c ·∫∫
s
φ (x, y, z) dS = c ·∫∫∫
V
∇φ (x, y, z) dV
0 = c ·[∫∫
s
φ (x, y, z) dS−∫∫∫
V
∇φ (x, y, z) dV
]es decir, para todo vector c siempre se cumple que∫∫
s
φ (x, y, z) d S =
∫∫∫V
∇φ (x, y, z) d V
Esa misma metodologıa se puede aplicar para demostrar la segunda relacion si consideramos un campovectorial a (x, y, z) = c×B (x, y, z), con c vector constante y se procede de una manera similar.
Ley de Gauss y Campo Electrico
La aplicacion mas emblematica del Teorema de Gauss lo constituyen el calculo de la divergencia delcampo electrico E y su relacion con las distribuciones de cargas existentes. Desde siempre sabemos que elcampo electrico producido por una carga Qi viene dado por
Ei (r) =1
4πε0
Qir2i
uri ; ⇒∫∫
Si
Ei · dSi =Qiε0⇔ ∇ ·E =
ρ (r)
ε0
En definitiva la “deduccion” de una de las ecuaciones de Maxwell. Si calculamos el flujo del campo electricoen una region sin cargas todas las lıneas del campo E (r) atraviesan el volumen: todas entran y todas salen.Sin embargo si tenemos un conjunto de cargas discretas distribuidas dentro de la region encerrada por la
Borra
dor Pre
limin
ar
superficie S, (ver Figura 5.16, cuadrante IVa) podemos encerrar cada una de las cargas con superficiesesfericas Si. Por lo tanto∫∫
S
E · d S +∑i
∫∫Si
E · d Si =
∫V
∇ ·EdV = 0 ⇒∫∫
S
E · dS = −∑i
∫∫Si
E · dSi
Con lo cual hemos definido una superficie con “huecos” alrededor de cada una de las cargas y llegamosa la conclusion que lo que entra sale. Por su parte, el campo electrico medido para cada superficie esfericainterior Si sera
E|Si =1
4πε0
Qir2i
uri + E′
donde E′ es el campo de todas las otras cargas presentes en e volumen encerrado por S. Es claro que estecampo E′ tiene flujo cero neto sobre cada esfera de superficie Si. Por lo tanto∫∫
S
E · dS = −∑i
∫∫Si
(1
4πε0
Qir2i
uri + E′)· nSi dSi =
∑i
1
4πε0
Qir2i
∫∫Si
dSi =
∑iQiε0
=Q
ε0
donde hemos utilizado que∫Vi
(∇ ·E′) dVi = 0 =∑i
∫∫Si
E′ · nsi dSi; uri · nsi = −1; y
∫∫Si
dSi = Si = 4πr2i
Finalmente encontramos una de las leyes de Maxwell si reescribimos la integral de superficie utilizando laLey de Gauss∫∫
S
E · dS =Q
ε0=
1
ε0
∫V
ρ (r) dV ⇒∫∫
S
E · dS =
∫V
(∇ ·E) dV =1
ε0
∫V
ρ (r) dV
con lo cual ∫V
(∇ ·E− ρ (r)
ε0
)dV ⇒ ∇ ·E =
ρ (r)
ε0
Discontinuidades y densidades superficiales de carga
Normalmente, siempre consideramos que los campos vectoriales a = a (x, y, z) son campos continuos(y, mas aun, con todas sus derivadas continuas). Sin embargo, encontramos en la naturaleza situaciones enla cuales el campo varıa mucho en una distancia muy corta (infinitesimal). En estas situaciones podemossimular esta rapida variacion como una discontinuidad en el campo. Existe formas de aplicar el Teorema deGauss para algunas situaciones en las cuales tratamos con campos discontinuos. La manera apropiada detratar (derivadas e integrales de) funciones discontinuas es considerandolas no funciones sino distribuciones.Este tipo de tratamiento esta fuera del alcance de este formulario y sera considerado en otros cursos.
Supongamos el caso que ilustra la Figura 5.16, cuadrante IVb. Una regionR delimitada por una superficieS, dentro de la cual, una superficie de discontinuidad, S, separa dos subregiones R
1y R2 a traves de la
cual un campo vectorial, a = a (x, y, z) , es discontinuo. Ahora bien, el campo vectorial es continuo en lassubregiones, por lo cual el flujo del campo atraviesa las superficies S1 y S que delimitan el volumen V1 de laregion R1. Entonces el Teorema de Gauss para cada region queda expresado como∫
V1
(∇ · a) dV =
∫∫S1
a · dS +
∫∫S
a+ · ns dS y
∫V2
(∇ · a) dV =
∫∫S2
a · dS−∫∫
S
a− · ns dS
Borra
dor Pre
limin
arFigura 5.17: Discontinuidad del Vector Desplazamiento
donde ns es el vector normal a la superficie S, de separacion de las dos regiones. Adicionalmente hemosdenotado, a+ y a− el campo a evaluado del lado de R1 y R2, respectivamente. Si ahora consideramos elteorema de Gauss en toda la region∫
V1+V2
(∇ · a) dV ≡∫V1
(∇ · a) dV +
∫V2
(∇ · a) dV
Claramente si el campo es continuo dentro de la region R entonces nos queda la formulacion estandardel Teorema de Gauss ∫
V1+V2
(∇ · a) dV =
∫∫S
a · dS
por el contrario si el campo es discontinuo, entonces debe tomarse en cuenta la discontinuidad del campo yla relacion que surge de sumar el flujo a traves de las dos regiones es∫
V1+V2
(∇ · a) dV =
∫∫S
a · dS−∫∫
S
(a2 − a1) · ns dS
con ns el vector unitario, normal a la superficie S y que apunta de R1 → R2. Es claro que la discontinuidadque cuenta es la de la componente del campo perpendicular a la superficie (ver Figura 5.17).
Este tipo de discontinuidad en campos irrotacionales es generado por la presencia de fuentes, las cuales,en este caso son densidades superficiales de carga.
Quiza el ejemplo tıpico para la aplicacion de las anteriores consideraciones es la aplicacion de las ecuacio-nes de Maxwell en el caso del vector desplazamiento electrico D, a traves de una superficie S, que separa dosmedios. Este caso se ilustra en la Figura 5.16, cuadrante IVc y en la Figura 5.17, solo que en este ultimo casoel vector normal esta definido a la inversa: la region 2 corresponde a la region 1 de la Figura 5.16, cuadranteIVc. La ecuacion de Maxwell correspondiente sera
∇ ·E =ρ (r)
ε0⇒ ∇ ·D = ρ (r) ⇒ (D2 −D1) · ns = σ , con D = ε0E
donde ns es el vector normal a la superficie (ver Figura 5.16, cuadrante IVc) y σ es la densidad superficial decarga en la superficie S. Para comprobar esta relacion construimos un volumen cilındrico infinitesimal que
Borra
dor Pre
limin
ar
encierra la superficie de discontinuidad, de tal forma que ∆S2 corresponde con la “tapa” del cilindro y ∆S1
con su “base” (Figura 5.16 cuadrante IVc). Adicionalmente, como ∆l ∼ 0, no solo podremos trabajar sin lasintegrales, el flujo a traves de las “paredes” del cilindro sera despreciable y ∆S2 ≈ ∆S1, sino que ademas, alencerrar la discontinuidad no tomamos en cuenta la contribucion de la superficie ∆S3 (o S, en el cuadranteIVb de la Figura 5.16). Ası
(∇ ·D) dV = D2 ·∆S2 −D1 ·∆S1 ⇒ ρ (r) (∆S2∆l) = (D2 −D1) · ns2∆S2
con lo cualρ (r) ∆l ≡ σ = (D2 −D1) · ns2 .
Teoremas de Green
Cuando consideramos campos vectoriales muy particulares el Teorema de Gauss nos lleva a un par deidentidades vectoriales conocidas como las Identidades o Teoremas de Green
Supongamos que tenemos dos campos escalares: ζ (x, y, z) y ξ (x, y, z) entonces y con ellos construimosun campo vectorial
a (x, y, z) = ζ (x, y, z)∇ξ (x, y, z) ⇒∫∫
s
a · dS =
∫∫∫V
(∇ · a) dV
es decir ∫∫s
(ζ (x, y, z)∇ξ (x, y, z)) · dS =
∫∫∫V
∇ · (ζ (x, y, z)∇ξ (x, y, z)) dV
con lo cual arribamos a la primera identidad de Green, Primer Teorema de Green o,Teorema escalar deGreen:∫∫
s
(ζ (x, y, z)∇ξ (x, y, z)) · dS =
∫∫∫V
[ζ (x, y, z) (∇ ·∇ξ (x, y, z)) + ∇ζ (x, y, z) ·∇ξ (x, y, z)] dV
Si ahora, consideramos los siguientes campos vectoriales
∇ · (ζ (x, y, z)∇ξ (x, y, z)) = ∇ζ (x, y, z) ·∇ξ (x, y, z) + ζ (x, y, z)∇ ·∇ξ (x, y, z)
∇ · (ξ (x, y, z)∇ζ (x, y, z)) = ∇ξ (x, y, z) ·∇ζ (x, y, z) + ξ (x, y, z)∇ ·∇ζ (x, y, z)
Restando ambas expresiones tendremos que
∇ · ζ (x, y, z)∇ξ (x, y, z)− ξ (x, y, z)∇ζ (x, y, z) =
ζ (x, y, z)∇ ·∇ξ (x, y, z)− ξ (x, y, z)∇ ·∇ζ (x, y, z)
y al integrar sobre un volumen V obtendremos la formulacion del Teorema de simetrico de Green, la segundaidentidad.∫∫∫
V
ζ (x, y, z)∇ ·∇ξ (x, y, z)− ξ (x, y, z)∇ ·∇ζ (x, y, z) dV =∫∫s
ζ (x, y, z)∇ξ (x, y, z)− ξ (x, y, z)∇ζ (x, y, z) · dS
La utilidad de estas relaciones las veremos en el desarrollo de la Teorıa del Potencial en la seccion 5.13.1en la pagina 272.
Borra
dor Pre
limin
ar
Figura 5.18: Teorema de Stokes
5.12.2. Teorema de Stokes
Presentacion y demostracion
El teorema de Stokes relaciona una integral de lınea escalar de un campo vectorial, a = a (x, y, z), alo largo de una curva cerrada C, con una integral del rotor del campo sobre la superficie encerrada por lamisma curva C. Es decir ∮
a · dr =
∫∫S
(∇× a) · dS ≡∫∫
S
(∇× a) · ns dS .
Tal y como hemos mencionado antes la superficie la define su vector normal, y este lo define el “sentido”de circulacion de la curva que bordea la superficie (ver Figura 5.18 cuadrantes I y III).
No haremos una demostracion formal del Teorema de Stokes como lo hicimos para el Gauss. Nos con-venceremos de que es correcta la relacion a partir de algunas situaciones sencillas. Cualquier superficie lapodremos dividir en pequenas cuadrıculas diferenciales, las cuales sumadas constituyen la superficie (verFigura 5.18 cuadrante II). Es facil convencerse que la circulacion6 por le borde de una cuadrıcula diferencial(por ejemplo en el plano xy) nos lleva a
Γ1234 =
∮1234
a · dr =
∫1
ax (x, y) dx+
∫2
ay (x, y) dy +
∫3
ax (x, y) (−dx) +
∫4
ay (x, y) (−dy)
donde hemos denotado la trayectoria a lo largo del perımetro de la cuadrıcula por 1234. De la Figura 5.19podemos intuir
Γ1234 =
∫ax (x0, y0) dx+
∫ay (x0 + dx, y0) dy +
∫ax (x0, y0 + dy) (−dx) +
∫ay (x0, y0) (−dy)
6Pueden consultar otro ejemplo de circulacion en la seccion 5.10.3.
Borra
dor Pre
limin
arFigura 5.19: Circulacion en una cuadrıcula del plano x, y
y de allı el desarrollo por Taylor que nos conduce a
Γ1234 =
∫ax (x0, y0) dx+
∫ [ay (x0, y0) +
∂ay∂x
∣∣∣∣x0
dx
]dy −
∫ [ax (x0, y0) +
∂ax∂y
∣∣∣∣y0
dy
]dx
+
∫ay (x0, y0) dy
=
∫ [∂ay∂x
∣∣∣∣x0
− ∂ax∂y
∣∣∣∣y0
]dxdy =
∫∫S
∇× a|z dSz ≡∫∫
S
(∇× a) · dS .
Esto vale para todos los puntos (x0, y0) y se puede aplicar para las otras superficies, con lo cual es facilconvercerse que esta tecnica se puede utilizar para cada cuadrıcula en las que hemos dividido la superficie(ver Figura 5.18 cuadrante II). Mas aun, las circulaciones a lo largo de los perımetros de las cuadrıculasinteriores se anulan (ver Figura 5.18 cuadrante III) y solo sobrevive la circulacion a lo largo del perımetroexterior de la superficie. Con ello∑
cuadricula
a · dr ≡∑
(∇× a) · dS ⇒∮
a · dr =
∫∫S
(∇× a) · dS .
Expresiones equivalentes para el Teorema de Stokes
Del mismo modo que hicimos en la seccion 5.12.1 con el Teorema de Gauss, podemos hacerlo para elTeorema de Stokes y tendremos∮
φ (x, y, z) dr =
∫∫S
dS×∇φ (x, y, z) y
∮dr×B (x, y, z) =
∫∫S
(dS×∇)×B (x, y, z)
donde φ (x, y, z) es un campo escalar y B (x, y, z) un campo vectorial.Otra vez, la metodologıa para proceder a la demostracion se fundamenta en considerar un par de campos
vectoriales de la forma: a (x, y, z) = φ (x, y, z) c y b (x, y, z) = c×B (x, y, z) y desarrollar un algebra vectorialmınima.
Borra
dor Pre
limin
ar
Teorema de Stokes y Fuerzas Conservativas
El teorema de Stokes nos permite identificas que campos vectoriales irrotacionales generan integrales delınea las cuales son independientes de la trayectoria. Esto es
∇× F (x, y, z) = 0 ⇒∫∫
S
(∇× a) · dS =
∮a · dr = 0
con lo cual, lo que se esta implicando es que toda trayectoria cerrada se puede fraccionar en dos trayectoriasabiertas que se unen en los extremos, entonces∮
a · dr = 0 =
∫C1
a · dr +
∫C2
a · dr ⇒∫ P2
P1
curva C1
a · dr ≡∫ P2
P1
curva C2
a · dr
y lo que nos dice es que vamos de un punto (de corte de la curva cerrada) P1 a otro punto P2 por dostrayectorias distintas y la integral de lınea es la misma. Mas adelante veremos que a los campos vectorialesirrotacionales les esta asociado un potencial tal que
∇× F (x, y, z) = 0 ⇒ F (x, y, z) ∝∇φ (x, y, z) .
Teorema de Stokes y discontinuidades del campo vectorial
Al igual que el Teorema de Gauss puede ser considerado para manejar funciones discontinuas, el Teoremade Stokes tambien tiene una expresion cuando se consideran campos discontinuos (continuo a trozos ocontinuos por segmentos)
Consideremos el caso mas simple el de un campo vectorial a (x, y, z) que es discontinuo sobre una superficieS, que divide R en dos subregiones R1 y R2 (ver otra vez 5.16, cuadrante IVb). En este caso la superficieS, sera abierta y estara delimitada por una curva C2. La interseccion de las superficies S y S sera una curvaC, la cual dividira a S en dos superficies S1 y S2 (ver Figura 5.18 cuadrante IV). Entonces, aplicando elTeorema de Stokes: ∮
C1+C
a · dr =
∫ P2
P1
curva C1
a · dr +
∫ P1
P2
curva C
a · dr =
∫∫S1
(∇× a) · dS
∮C2+C
a · dr =
∫ P1
P2
curva C2
a · dr +
∫ P2
P1
curva C
a · dr =
∫∫S2
(∇× a) · dS
Ahora bien si las sumamos obtendremos∫∫S1
(∇× a) · dS +
∫∫S2
(∇× a) · dS =
∮C
a · dr +
∫ P1
P2
curva C en S1
a · dr +
∫ P2
P1
curva C en S2
a · dr
la cual puede ser reescrito como∮C
a · dr =
∫∫S
(∇× a) · dS−∫ P2
P1
curva C
(a|S2− a|S1
)· dr
donde hemos denotado a|S2como el campo vectorial evaluado sobre la curva C “del lado” de las superficie
S2. Es importante senalar que el termino que incorpora la contribucion de la discontinuidad del campo soloencierra componentes tangenciales a la superficie. Esto es claro del producto escalar con el vector dr tangentea la curva C (y tambien a la superficie S).
Borra
dor Pre
limin
ar
5.13. Teorıa de Potencial
5.13.1. Potenciales escalares
Si un campo vectorial ~F (x, y, z) en una determinada region R puede asociarse con un gradiente de unpotencial tendremos que
F (x, y, z) = −∇φ (x, y, z) ⇔ ∇× F (x, y, z) = 0 ⇔∮
F (x, y, z) · dr = 0 .
La ventaja que un campo derive de un potencial es, por un la lado la simplicidad y la cantidad de infor-macion que sobre el campo teneos: describimos la interaccion por una funcion y no con tres (las componentesdel campo) y sabremos que el campo es irrotacional y conservativo. Pero ademas la funcion que describe elcampo es escalar, con lo cual es independiente del sistema de coordenadas.
Cualquiera de las afirmaciones implica las otras dos, con o cual podremos elegir cualquier de ellas parademostrar las otras dos. Veamos:
un campo que derive de un potencial es conservativo e irrotacional
F = −∇φ (x, y, z) ⇒
−∇× (∇φ (x, y, z)) = 0
−∮∇φ (x, y, z) · dr = −
∮dφ = φ (x0, y0, z0)− φ (x0, y0, z0) = 0
donde hemos utilizado la definicion de diferencial total
dφ =∂φ (x, y, z)
∂xdx+
∂φ (x, y, z)
∂ydy +
∂φ (x, y, z)
∂zdz = ∇φ (x, y, z) · dr
un campo conservativo es irrotacional y deriva de un potencial.
Un campo conservativo implica que el trabajo (∫ P2
P1F (x, y, z) · dr) es independiente de la trayectoria
entre P1 y P2. Por eso llamamos a la fuerza conservativa por cuanto se conserva la energıa y por lotanto, esta depende unicamente de la posicion∮
F (x, y, z) · dr = 0 ⇒∫ P2
P1
F (x, y, z) · dr = φ (x2, y2, z2)− φ (x1, y1, z1)
⇓F (x, y, z) · dr = dφ = −∇φ (x, y, z) · dr ⇒ F (x, y, z) = −∇φ (x, y, z) ,
con lo cual hemos demostrado que el campo vectorial deriva de un potencial. El signo menos (−)es una convencion tradicional del oficio del Fısico y proviene de nuestra intuicion de flujo de losacontecimientos: “El agua siempre fluye hacia abajo”.
Ahora bien, utilizando el Teorema de Stokes tendremos:
F (x, y, z) = −∇φ (x, y, z) ⇒∮
F · dr =
∫∫S2
(∇× F) · dS = 0 ⇒ ∇× F (x, y, z) = 0 .
Es facil demostrar que el campo tambien es irrotacional.
un campo de fuerzas irrotacional implica que el campo deriva de un potencial y que el campo esconservativo.
Borra
dor Pre
limin
ar
Otra vez, por el Teorema de Stokes si el campo es irrotacional es conservativo
∇× F (x, y, z) = 0 ⇒∫∫
S2
(∇× F) · d S =
∮F · dr = 0
y si es conservativo deriva de un potencial
F (x, y, z) · dr = dφ = −∇φ (x, y, z) · dr ⇒ F (x, y, z) = −∇φ (x, y, z)
En definitiva, si cualquiera de las condiciones se cumple: conservativo, irrotacional o potencial, las otrastambien se cumpliran.
5.13.2. Potenciales vectoriales y calibres
Al igual que derivamos un campo vectorial F a partir de un potencial escalar φ (x, y, z) y asociamossu existencia a su condicion de irrotacionalidad, ∇ × F (x, y, z) = 0, podemos pensar que un campo sindivergencia (solenoidal o transverso) conlleva a la existencia de un potencial vectorial. Esto es
∇ · F (x, y, z) = 0 ⇒ F (x, y, z) = ∇× a (x, y, z)
Claramente∇ · F (x, y, z) = ∂iF
i = ∂i(εijk∂jAk
)= 0 .
El campo vectorial a = a (x, y, z) se conoce con el nombre de potencial vectorial del campo F. Ahora bien,el campo solenoidal, F, no queda unıvocamente determinado a partir de su potencial vectorial. Existe unaarbitrariedad de un campo escalar, llamado de calibre χ = χ (x, y, z) (gauge en ingles) de forma tal que
a′ = a + ∇χ (x, y, z) ⇒ F = ∇× a′ = ∇× (a + ∇χ) = ∇× a + ∇× (∇χ) = ∇× a
de forma que varios potenciales vectoriales a′ y a generan el mismo campo vectorial F. Esta arbitrariedadnos permite particularizar el calibre segun nos convenga. Existen varios calibres en el mercado, los cualesson utilizados segun el problema fısico al cual tratemos. Entre ellos podemos mencionar un par de ellos:
El calibre de Lorentz :
Esta seleccion proviene de requerir que el campo de calibre satisfaga la ecuacion de onda
∇2χ (x, y, z, t)− a∂2χ (x, y, z, t)
∂t2= 0
donde a es una constante. Notese que hemos supuesto que el campo de calibre puede depender deltiempo. El calibre del Lorentz se escoje porque (entre otras cosas) permite que la solucion a la ecuacionde onda para el potencial vectorial
∇2a (x, y, z, t)− a∂2a (x, y, z, t)
∂t2= 0
quede unıvocamente determinada.
El calibre de Coulomb, de radiacion o transverso:
La seleccion de este calibre impone que el potencial vectorial a (x, y, z, t) satisfaga la ecuacion
∇ · a = 0 ⇒ ∇ · a′ (x, y, z, t) = ∇ · (a (x, y, z, t) + ∇χ (x, y, z, t)) = 0 ⇒ ∇2χ (x, y, z, t) = 0
El nombre de calibre de Coulomb, de radiacion o transverso proviene de las consecuencias de suutilizacion en las ecuaciones de Maxwell.
Notese que si el campo (y el calibre) es independiente del tiempo a = a (x, y, z) ambos calibres coinciden.
Borra
dor Pre
limin
ar
5.13.3. Teorema de Green y Potenciales
Si el rotor y la divergencia de un campo vectorial F, decente (continuo y continuamente diferenciable)estan especificados en una region del espacio delimitada por una superficie cerrada S, y las componentes delcampo normales a esa superficie ns ·F, tambien se conocen, entonces el Teorema de Green nos garantiza queese campo F que cumple con esas condiciones es unico.
Esa demostracion procede ası. Supongamos que existe otro campo vectorial que cumple con las mismascondiciones que el campo F. Esto es
∇ · F = ∇ ·G
∇× F = ∇×G
ns · F = ns ·G
⇒ H = F−G ⇒
∇ ·H = 0
∇×H = 0
ns ·H = 0
como H es irrotacional entonces
∇×H = 0 ⇒ H = ∇φ (x, y, z) ⇒ ∇ ·H = ∇ ·∇φ (x, y, z) = 0
y el Teorema de Green nos garantiza que∮φ∇φ · dS =
∫∫S
φ (∇φ · ns) dS =
∫∫∫V
[φ (∇ ·∇φ) + ∇φ ·∇φ] dV
con lo cual ∫∫S
φ (∇φ · ns) dS =
∫∫S
φ (H · ns) dS =
∫∫∫V
[H ·H] dV ⇒ H = 0
de donde se deduce que F = G es decir, que el campo F es unico.
5.13.4. Teorema de Helmholtz
El teorema de Helmholtz afirma que todo campo vectorial F, continuo, y continuamente diferenciable(al menos a trozos) y, regular en infinito se puede expresar como una suma de dos “componentes”, unalongitudinal o irrotacional Fl, y otra transversa o solenoidal Ft. Esto es
F = Fl + Ft , con
∇× Fl = 0
∇ · Ft = 0
En general dado que el campo F puede ser discontinuo, tendremos que suponer que
∇ · F = ρ (r)
∇× F = J (r)
y como F = Fl + Ft ⇒
∇ · F = ∇ · (Fl + Ft) = ∇ · Fl = ρ (r)
∇× F = ∇× (Fl + Ft) = ∇× Ft = J (r)
dado que ∇ · () y ∇× () son lineales. Esta separacion del campo vectorial F = Fl + Ft es completamentegeneral y siempre puede hacerse para cualquier campo vectorial.
Supondremos ademas, que la solucion a la ecuacion de Poisson ∇2φ (x, y, z) = −ρ (x, y, z) existe y esunica7.
7Esta suposicion es indispensable. Las condiciones sobre el potencial φ (x, y, z) que la implican seran consideradas en otroscursos de Metodos Matematicos. En este curso, supondremos que existe y es unica.
Borra
dor Pre
limin
ar
Tendremos que
∇× Fl = 0 ⇒ Fl = −∇φ (x, y, z) ⇒ ∇ · F = ∇ · Fl = −∇2φ (x, y, z) = ρ (r)
y la solucion existe y es unica. Es decir, podemos expresar de manera unıvoca al campo vectorial F (a travesde su “componente” longitudinal Fl) en terminos de un campo escalar (a funcion potencial) φ (x, y, z). Porotra parte
∇ · Ft = 0 ⇒ Ft = ∇× a ⇒ ∇× F = ∇× Ft = ∇× (∇× a) = ∇ (∇ · a)−∇2a = J (r)
La cual al seleccionar el calibre de Coulomb ∇ · a = 0 se convierte en
∇× (∇× a) = ∇2a = ∂i∂i a = −J (r) ⇒ ∂i∂i ak = −Jk (r) ⇔
∇2ax = −Jx (r)
∇2ay = −Jy (r)
∇2az = −Jz (r)
Una vez mas nos topamos con la solucion a la ecuacion de Poisson, esta vez para cada componente. Estose cumple siempre, porque hemos supuesto que la solucion para la ecuacion de Poisson existe y es unica.
Un corolario del Teorema de Helmholtz que un campo vectorial queda unıvocamente determinado siconocemos su rotor y su divergencia.
Borra
dor Pre
limin
ar
5.14. Algunos ejemplos resueltos
1. Hallar las componentes cartesianas del vector que, en coordenadas cilındricas, tiene las siguiente com-ponentes (1,−1, 3)
Solucion: Ese vector en coordenadas cilındricas se puede escribir como: V = ur − uϕ + 3uz.
En general, las componentes de los vectores transforman como
ai =∂xi (xm)
∂xkak ⇒
a1 =∂x1 (xm)
∂xkak
a2 =∂x2 (xm)
∂xkak
a3 =∂x3 (xm)
∂xkak
con
x1 = x
x2 = y
x3 = z
y
x1 = r
x2 = ϕ
x3 = z
y la ley de transformacion entre coordenadas cartesianas y coordenadas cilındricas es
x = x (r, ϕ) = r cos(ϕ); y = y (r, ϕ) = r sen(ϕ) y z = z
con lo cual es facil identificar
∂x(r,ϕ)∂r = cos(ϕ)
∂y(r,ϕ)∂r = sen(ϕ)
∂z∂r = 0
∂x(r,ϕ)∂ϕ = −r sen(ϕ)
∂y(r,ϕ)∂ϕ = r cos(ϕ)
∂z∂ϕ = 0
∂x(r,ϕ)∂z = 0
∂y(r,ϕ)∂z = 0
∂z∂z = 1
por lo tanto
a1 =∂x1 (xm)
∂xkak =
∂x1 (xm)
∂x1a1 +
∂x1 (xm)
∂x2a2 +
∂x1 (xm)
∂x3a3
a1 =∂x (r, ϕ)
∂r(1) +
∂x (r, ϕ)
∂ϕ(−1) = cos(ϕ) + r sen(ϕ) = cos (−1) + 1 sen (−1) = −0,30117
del mismo modo
a2 =∂y (r, ϕ)
∂r(1) +
∂y (r, ϕ)
∂ϕ(−1) = sen(ϕ)− r cos(ϕ) = sen (−1)− (1) cos (1) = −1,3818
a3 = 3
con lo cual ~V = ur − uϕ + 3uz = −0,30117 i− 1,3818 j + 3 k.
2. Dados T ij , ai y bi ∈ E3 con
T ij =
1 0 33 4 13 1 4
; a =
52−5
y b =
−254
Borra
dor Pre
limin
ar
a) Suponga que T ij , a y b estan expresados en coordenadas cartesianas, calcule: Aijaibj , Sija
iaj y
Aijbibj . Donde Sij y Akl son, respectivamente, las partes simetrica y antisimetrica del tensor T ij .
Solucion: La metrica en coordenadas cartesianas viene dada por
gij =
1 0 00 1 00 0 1
Tendremos que:
Sij =1
2(Tij + Tji) =
1
2
1 0 33 4 13 1 4
+
1 3 30 4 13 1 4
=
2 3 63 8 26 2 8
Notese que la expresion matricial para Tij ≡ gikT kj es la misma que para T ij debido a la forma dela metrica en este espacio. Del mismo modo
Aij =1
2(Tij − Tji) =
1
2
1 0 33 4 13 1 4
− 1 3 3
0 4 13 1 4
=
0 −3 03 0 00 0 0
por lo tanto
aiAijbj =
1
2
(5 2 −5
) 0 −3 03 0 00 0 0
−254
= −87
2
aiSijaj =
1
2
(5 2 −5
) 2 3 63 8 26 2 8
52−5
= 1
biAijbj = 0
b) Suponga ahora que esos mismos T ij , a y b estan expresados en coordenadas cilındricas.
1) Encuentre la expresion para b en coordenadas esfericas.
Solucion: Al expresar b en cilındricas tendremos que b = −2 uρ + 5 uϕ + 4 uz con lo cualpara expresar b en esfericas podemos proceder de dos formas.La primera forma es transformando las componentes al conocer como transforman las coor-
denadas. Es decir conociendo xi = xi (xm) y xj = xj (xm) expresar bi = ∂xi
∂xkbk. Dado que
x (ρ, ϕ) = ρ cos(ϕ) = x (r, ϕ, θ) = r cos(ϕ) sen(θ) ⇒
ρ = r sen(θ)
ϕ = ϕy z = r cos(θ)
equivalentemente,
r =√ρ2 + z2; θ = arctan
(ρz
); ϕ = ϕ
Borra
dor Pre
limin
ar
por lo tanto
bi =∂xi
∂xkbk =
∂x1
∂x1∂x1
∂x2∂x1
∂x2
∂x2
∂x1∂x2
∂x2∂x2
∂x3
∂x3
∂x1∂x3
∂x2∂x3
∂x3
−2
54
=
∂r∂ρ
∂r∂ϕ
∂r∂z
∂ϕ∂ρ
∂ϕ∂ϕ
∂ϕ∂z
∂θ∂ρ
∂θ∂ϕ
∂θ∂z
−2
54
bi =
∂√ρ2+z2
∂ρ
∂√ρ2+z2
∂ϕ
∂√ρ2+z2
∂z∂ϕ∂ρ
∂ϕ∂ϕ
∂ϕ∂z
∂ arctan( ρz )∂ρ
∂ arctan( ρz )∂ϕ
∂ arctan( ρz )∂z
−2
54
=
ρ√ρ2+z2
0 z√ρ2+z2
0 1 0z
ρ2+z2 0 −ρρ2+z2
−2
54
por lo tanto en esfericas
b =
−2 sen(θ) + 4 cos(θ)5
−2 cos(θ)r − 4 sen(θ)
r
= (−2 sen(θ) + 4 cos(θ)) ur+5 uϕ−(
2 cos(θ)
r+
4 sen(θ)
r
)uθ
La otra forma es expresar la base ortonormal cilındrica en terminos de la base ortonormalesferica. Otra vez, utilizamos la base cartesiana como intermediaria. Esto es:
uρ = cos(ϕ) i + sen(ϕ) j;uϕ = − sen(ϕ) i + cos(ϕ) juz = k
⇔
i = cos(ϕ) uρ − sen(ϕ) uϕj = sen(ϕ) uρ + cos(ϕ) uϕk = uz
y parecido en esfericas, donde
ur = cos(ϕ) sen(θ) i + sen(ϕ) sen(θ) j + cos(θ) k
uϕ = − sen(ϕ) i + cos(ϕ) j
uθ = cos(ϕ) cos(θ) i + sen(ϕ) cos(θ) j− sen(θ) k
y
i = cos(ϕ) sen(θ) ur + cos(ϕ) cos(θ) uθ − sen(ϕ) uϕ
j = sen(ϕ) sen(θ) ur + sen(ϕ) cos(θ) uθ + cos(ϕ) uϕ
k = cos(θ) ur− sen(θ) uθ
con lo cual
uρ = cos(ϕ) (cos(ϕ) sen(θ) ur + cos(ϕ) cos(θ)− sen(ϕ) uϕ)
+ sen(ϕ) (sen(ϕ) sen(θ) ur + sen(ϕ) cos(θ) uθ + cos(ϕ) uϕ)
uρ = sen(θ) ur + cos(θ) uθ
uϕ = uϕ
uz = cos(θ) ur− sen(θ) uθ
entonces
b = −2 uρ + 5 uϕ + 4 uz = −2 (sen(θ) ur + cos(θ) uθ) + 5 (uϕ) + 4 (cos(θ) ur− sen(θ) uθ)
Finalmente
b = (−2 sen(θ) + 4 cos(θ)) ur + 5uϕ − (2 cos(θ) + 4 sen(θ)) uθ .
Borra
dor Pre
limin
ar
2) Encuentre la expresion para Aijaibj en coordenadas esfericas.
Solucion: La expresion para aiAijbj = − 87
2 sera la misma que el caso anterior porque aiAijbj
es un escalar bajo transformaciones de coordenadas, lo que significa que es invariante y valdralo mismo en todos los sistemas de coordenadas.Recuerde que
Cilındricas :
x = x (ρ, ϕ) = ρ cos(ϕ)
y = y (ρ, ϕ) = ρ sen(ϕ)
z = z
Esfericas :
x = x (r, ϕ, θ) = r cos(ϕ) sen(θ)
y = y (r, ϕ, θ) = r sen(ϕ) sen(θ)
z (r, ϕ, θ) = r cos(θ)
El tensor metrico en coordenadas cilındricas es
g11 = gρρ = 1; g22 = gϕϕ = ρ2; g33 = gzz = 1.
mientras que en coordenadas esfericas es
g11 = grr = 1; g22 = gϕϕ = r2sen2(θ) ; g33 = gθθ = r2.
3. Dado el sistema de coordenadas parabolicas
x = ξη cos(ϕ); y = ξη sen(ϕ); z =1
2
(η2 − ξ2
)Exprese el diferencial de volumen dv = dxdydz en estas coordenadas.
Solucion: Hay varias maneras de resolver este problema. La mas intuitiva es que, dado que las coor-denadas parabolicas son un sistema de coordenadas ortogonales entonces multiplicar largo, por ancho,por alto con las longitudes de arco en cada una de las direcciones ortogonales. Esto es
ds2 = gnudqndqu = g11
(dq1)2
+ g22
(dq2)2
+ g33
(dq3)2 ⇒
ds2→1 = g11
(dq1)2
ds2→2 = g22
(dq2)2
ds2→3 = g33
(dq3)2
por consiguiente
dv = (ds→1) (ds→2) (ds→3) =√g11dq1√g22dq2√g33dq3 = h1h2h3dq1dq2dq3
con
h1 =
∥∥∥∥ ∂r
∂q1
∥∥∥∥ =√g11 =
√(∂x (q1, q2, q3)
∂q1
)2
+
(∂y (q1, q2, q3)
∂q1
)2
+
(∂z (q1, q2, q3)
∂q1
)2
h2 =
∥∥∥∥ ∂r
∂q2
∥∥∥∥ =√g22 =
√(∂x (q1, q2, q3)
∂q2
)2
+
(∂y (q1, q2, q3)
∂q2
)2
+
(∂z (q1, q2, q3)
∂q2
)2
h3 =
∥∥∥∥ ∂|r∂q3
∥∥∥∥ =√g11 =
√(∂x (q1, q2, q3)
∂q3
)2
+
(∂y (q1, q2, q3)
∂q3
)2
+
(∂z (q1, q2, q3)
∂q3
)2
Borra
dor Pre
limin
ar
por lo cual, dado que r = x (η, ξ, ϕ) i + y (η, ξ, ϕ) j + z (η, ξ) k, entonces
h1 =
∥∥∥∥ ∂r
∂q1
∥∥∥∥ =√g11 =
√(η cos(ϕ))
2+ (η sen(ϕ))
2+ (ξ)
2=√
(η2 + ξ2)
h2 =
∥∥∥∥ ∂r
∂q2
∥∥∥∥ =√g22 =
√(ξ cosϕ)
2+ (ξ sen(ϕ))
2+ (−η)
2=√
(η2 + ξ2)
h1 =
∥∥∥∥ ∂r
∂q1
∥∥∥∥ =√g11 =
√(−ξη sen(ϕ))
2+ (ξη cos(ϕ))
2+ (0)
2= ξη
y finalmentedv = h1h2h3dξdηdϕ = ξη
(η2 + ξ2
)dξdηdϕ .
La otra forma de resolverlo, tambien intuitiva es hacer el producto mixto de los tres vectores ortogonalesbase sin normalizar. Esto es
dv =
∥∥∥∥(dq1 ∂r
∂q1
)•(
dq2 ∂r
∂q2× dq3 ∂r
∂q3
)∥∥∥∥ = dq1dq2dq3
∥∥∥∥ ∂r
∂q1•(∂r
∂q2× ∂r
∂q3
)∥∥∥∥entonces, en general
dv = dq1dq2dq3
det
∣∣∣∣∣∣∣∣∣∂x(q1,q2,q3)
∂q1∂y(q1,q2,q3)
∂q1∂z(q1,q2,q3)
∂q1
∂x(q1,q2,q3)∂q2
∂y(q1,q2,q3)∂q2
∂z(q1,q2,q3)∂q2
∂x(q1,q2,q3)∂q3
∂y(q1,q2,q3)∂q3
∂z(q1,q2,q3)∂q3
∣∣∣∣∣∣∣∣∣
= dq1dq2dq3 det
∣∣J (x (q1, q2, q3), y(q1, q2, q3
), z(q1, q2, q3
))∣∣donde J
(x(q1, q2, q3
), y(q1, q2, q3
), z(q1, q2, q3
))es la matriz Jacobiana de la transformacion.
Entonces
dv = dξdηdϕ
det
∣∣∣∣∣∣η cos(ϕ) η sen(ϕ) ξξ cos(ϕ) ξ sen(ϕ) −η−ξη sen(ϕ) ξη cos(ϕ) 0
∣∣∣∣∣∣ = ξη
(η2 + ξ2
)dξdηdϕ
En general, el diferencial del volumen viene expresado como un producto mixto de la base ortonormal|q1〉 , |q2〉 , |q3〉
dv =∥∥(dq1 |q1〉
)•(dq2 |q2〉 × dq3 |q3〉
)∥∥ = dq1dq2dq3 ‖|q1〉 • (|q2〉 × |q3〉)‖
dv = dqn 〈qn|(ε123dq2dq3 |q1〉
)= gnudqug22dq2g33dq3〈qn |q1〉︸ ︷︷ ︸
δn1
= g11dq1g22dq2g33dq3
4. Dado un sistema generico de coordenadas oblicuas
|e1〉 = a |i〉+ b |j〉 ; |e2〉 = c |i〉+ d |j〉
Borra
dor Pre
limin
ar
a) Encuentre la expresion para la metrica gij en estas coordenadas.
Solucion: Para una base generica, |xj〉 la metrica viene definida por
gij ≡ gji = g [|xi〉 , |xj〉] ≡ 〈xi |xj〉 ≡ 〈xj |xi〉
〈gij〉 =
(〈x1 |x1〉 〈x1 |x2〉〈x2 |x1〉 〈x2 |x3〉
)=
(a2 + b2 ac+ bdac+ bd c2 + d2
)b) Encuentre la expresion para un vector generico |v〉 = vx |i〉+ vy |j〉 en estas coordenadas.
Solucion:|e1〉 = a |i〉+ b |j〉
|e2〉 = c |i〉+ d |j〉
⇔
|i〉 = 1∆ (d |e1〉 − b |e2〉)
|j〉 = 1∆ (c |e1〉 − a |e2〉)
con ∆ = bc− ad por lo cual
|v〉 = vx |i〉+ vy |j〉 =vx∆
(d |e1〉 − b |e2〉) +vy∆
(c |e1〉 − a |e2〉)
=(dvx∆
+ cvy∆
)|e1〉 −
(bvx∆
+ avy∆
)|e2〉
c) Suponga ahora una base y un tensor concreto
|e1〉 = |i〉 ; |e2〉 =
√2
2|i〉+
√2
2|j〉 ; T ij =
(4 21 4
)Encuentre la expresion matricial para el tensor Tij
8
Solucion: En general,
Tij = gikTkj = gik
∂xk
∂xmTmn
∂xn
∂xj
Identificando
vx = v1 =∂x1
∂xjvj =
∂x1
∂x1v1 +
∂x1
∂x2v2 =
d
∆︸︷︷︸∂x1
∂x1
vx +c
∆︸︷︷︸∂x1
∂x2
vy
vy = v2 =∂x2
∂xjvj =
∂x2
∂x1v1 +
∂x2
∂x2v2 =
−b∆︸︷︷︸∂x2
∂x1
vx +−a∆︸︷︷︸∂x2
∂x2
vy
como
a = 1b = 0
c =√
22
d =√
22
⇒
gik ⇒
(1
√2
2√2
2 1
), ∂xk
∂xm ⇒(−1 −10 1
)
∂xn
∂xj =(∂xn
∂xj
)−1 ⇒(−1 −10 1
)−1
=
(−1 −10 1
)8Ayuda: dada una mantriz generica Aij =
(A BC D
), su inversa sera
(D
AD−BC − BAD−BC
− CAD−BC
AAD−BC
).
Borra
dor Pre
limin
ar
Finalmente:
Tij =
(1
√2
2√2
2 1
)(−1 −10 1
)(4 21 4
)(−1 −10 1
)=
(5− 1
2
√2 −1 + 3
2
√2
52
√2− 1 − 1
2
√2 + 3
).
5. Definimos una transformacion ortogonal (una transformacion de un sistema de coordenadas ortogonalesa otro ortogonal tambien) si se cumple
xi =∂xi
∂xkxk + ai; xi =
∂xi
∂xkxk + ai; donde det
(∂xk
∂xl
)= det
(∂xk
∂xi
)= ±1
con∂xk
∂xi∂xi
∂xl=∂xk
∂xi∂xi
∂xl= δkl
a) Muestre que las transformaciones de Galileo en 2 dimensiones(x1
x2
)=
(cos(θ) − sen(θ)sen(θ) cos(θ)
)(x1
x2
)+
(V 1ootV 2oot
)son transformaciones ortogonales. Note que V 1
oo, y V 2oo son las velocidades en la direccion 1 y 2,
respectivamente, del observador O con coordenadas xi respecto al observador O con coordenadasxi, mientras t es el tiempo medido por ambos observadores.
Solucion: Una vez mas, identificando
xi =∂xi
∂xkxk + ai ⇒
(x1
x2
)=
(∂x1
∂x2∂x1
∂x2
∂x2
∂x1∂x2
∂x2
)(x1
x2
)+
(a1
a2
)con lo cual
∂x1
∂x2 = cos(θ) ∂x1
∂x2 = − sen(θ)∂x2
∂x1 = sen(θ) ∂x2
∂x2 = cos(θ)
a1 = V 1oot
a2 = V 2oot
det
∣∣∣∣ cos(θ) − sen(θ)sen(θ) cos(θ)
∣∣∣∣ = cos2 θ +2
sen θ2 = 1
6. Las transformaciones de Galileo nos permiten relacionar las posiciones de una partıcula respecto ados observadores los cuales se encuentran en movimiento, uno respecto al otro. Considere entonces elmovimiento de una partıcula visto desde el sistema de coordenadas xi tal que
x = V0xt; y = V0yt− gt2
2
Exprese el vector velocidad V de esta partıcula visto del sistema de coordenadas xk.
Solucion: Tendremos que
x1 = x = V0xt
x2 = y = V0yt− g t2
2
⇒V 1 = Vx = dx1
dt = V0x
V 2 = Vy = dx2
dt = V0x − gt
por lo cual (V 1
V 2
)=
(cos(θ) − sen(θ)sen(θ) cos(θ)
)(V 1
V 2
)+
(V 1ootV 2oot
)
Borra
dor Pre
limin
ar
Finalmente
V = V 1i + V 2j con
V 1 = V 1 cos(θ)− V 2 sen(θ) + V 1oot
V 2 = V 1 sen(θ) + V 1 cos(θ) + V 2oot
7. Consideremos el siguiente par de tensores provenientes de la teorıa de elasticidad
uik =1
2(∂k ui + ∂i uk) ≡ 1
2
(∂ui∂xk
+∂uk∂xi
);
(uik)0
= uik −1
3umm δik;
y construyamos el tensor de esfuerzos como
pij = 2λ(uij)0
+Kull δij
Calcule la energıa libre para el medio elastico, definida como F = 12pijuji .
Solucion: Tenemos que
pij = 2λ(uij)0
+Kull δij = 2λ
(uij −
1
3umm δij
)+Kull δ
ij = 2λuij + ullδ
ij
(K − 2λ
3
)donde: umm = 1
2 (∂m um + ∂m um) = ∂m um, con lo cual
F =1
2piju
ji =
1
2
(2λuij + ullδ
ij
(K − 2λ
3
))uji =
(λuiju
ji + ullδ
ijuji
(1
2K − λ
3
))= λ
(ui1u
1i + ui2u
2i + ui3u
3i
)+
(1
2K − λ
3
)(ull)2
= λ((u1
1u11 + u2
1u12 + u3
1u13
)+(u1
2u21 + u2
2u22 + u3
2u23
)+(u1
3u31 + u2
3u32 + u3
3u33
))+
(1
2K − λ
3
)(ull)2
= λ((u1
1
)2+(u2
2
)2+(u3
3
)2+ 2
(u1
2u21 + u2
3u32 + u3
1u13
))+
(1
2K − λ
3
)(ull)2
=
(1
2K +
2λ
3
)(ull)2
+ 2λ(u1
2u21 + u2
3u32 + u3
1u13
)=
(1
2K +
2λ
3
)(∂xux + ∂yuy + ∂zuz)
2+ 2λ (∂xuy∂yux + ∂yuz∂zuy + ∂zux∂xuz) .
8. Considere ahora la siguiente transformacion de coordenadas
xα = Lαβ xβ + aα; con γ =
1√1− vkvk
; α, β = 0, 1, 2, 3; i, j, k = 1, 2, 3
y
L00 = γ , Li0 = L0
i = γvi , Lij = Lji = δij + vivj(γ − 1)
vkvk
las Lαβ se denominan impulso (topboost) de Lorentz y donde las vk son las componentes tridimensionales
de la velocidad relativa entre los observadores O y O con coordenadas xα y xβ , respectivamente. Lacoordenada x0 representa el tiempo medido por el observador O mientras que las xj representan las
Borra
dor Pre
limin
ar
coordenadas espaciales x, y, z para el mismo observador O con i, j = 1, 2, 3 respectivamente. Notese que0 ≤ vkvk < 1. Suponga, por facilidad, que el movimiento es en una dimension: α, β = 0, 1 y i, j = 1.
Esto implica
Lαβ =
(1√
1−v2v√
1−v2v√
1−v21√
1−v2
)⇒
(x0
x1
)=
(1√
1−v2v√
1−v2v√
1−v21√
1−v2
)(x0
x1
)
Lαβ =
(1√
1−v2−v√1−v2
−v√1−v2
1√1−v2
)⇒(x0
x1
)=
(1√
1−v2−v√1−v2
−v√1−v2
1√1−v2
)(x0
x1
)a) Muestre que los tiempos se alargan cuando son medidos por observadores en movimiento.
Solucion: Tenemos que ∆t = t2 − t1 = x02 − x0
1 medido por el observador en reposo y equivalen-temente ∆t = t2 − t1 = x0
2 − x01 medido por el observador en movimiento.
∆t = t2 − t1 = x02 − x0
1 =(L0β x
β2 + a0
)−(L0β x
β1 + a0
)= L0
β xβ2 − L0
β xβ1 = L0
β
(xβ2 − x
β1
)= L0
0
(x0
2 − x01
)+ L0
1
(x1
2 − x11
)=
(x0
2 − x01
)√
1− v2=
∆t√1− v2
Claramentelımv→1
∆t =∞
Notese que hemos supuesto que el reloj que marca el ∆t y que esta en reposo respecto al sistemaxβ se encuentra en la misma posicion espacial x0
2 = x01.
b) Muestre como las distancias se acortan cuando son medidas por observadores en movimiento.
Solucion: Igualmente la distancia entre dos puntos espaciales sera
l = x12 − x1
1 =(L1β x
β2 + a1
)−(L1β x
β1 + a1
)= L1
β
(xβ2 − x
β1
)= L1
0
(x0
2 − x01
)+ L1
1
(x1
2 − x11
)Si suponemos ahora que la distancia en el sistema en movimiento xβ la medimos en el mismotiempo, entonces x0
2 = x01 con lo cual
l = L11
(x1
2 − x11
)=
(x1
2 − x11
)√
1− v2=
l√1− v2
⇒ l =√
1− v2l ⇒ lımv→1
√1− v2l = 0
9. La fuerza de Lorentz F = q (E + v ×B) para una partıcula con carga q que se mueve con una velocidadv en un campo electrıco E, y una inducion magnetica B. Muestre que
F = q (E + v ×B)
E = −∇φ− ∂A
∂t
∇×A = B
⇒ F = q
[−∇φ− dA
dt+ ∇ (A · v)
]
Borra
dor Pre
limin
ar
Solucion:
F = q (E + v ×B) = q
(−∇φ− ∂A
∂t+ v × (∇×A)
)Veamos
v × (∇×A) = εjklvkεlmn∂mAnej = εjklε
mnlvk∂mAnej =(δmj δ
nk − δmk δnj
)vk∂mAnej
=(vk∂jAk − vk∂kAj
)ej
con lo cual
F j = q
(−∂jφ− ∂A
∂t+ vk∂jAk − vk∂kAj
)= q
(−∂jφ− ∂A
∂t− vk∂kAj + ∂j
(vkAk
)−Ak
(∂jvk
))F j = q
(−∂jφ− ∂A
∂t− vk∂kAj + ∂j
(vkAk
))= q
[−∇φ− dA
dt+ ∇ (A · v)
]ya que
dAj
dt=∂Aj
∂xidxi
dt+∂Aj
∂t= vi∂iA
j +∂Aj
∂t; ∂jvk =
∂vk
∂xj= 0 y vk = vk (t) .
10. Las fuerzas de mareas corresponden a la atraccion de la luna sobre las partıculas (el agua) en lasuperficie de la tierra ¿Cual es el potencial que corresponde a las fuerzas de marea? Recuerde que lafuerza gravitacional que produce las mareas es
F = GMm
r3Mm
r
donde rMm es la distancia (fija) entre los centros Luna y Tierra, y r es el radio vector del centro de laLuna a la partıcula que se ve afectada.
Solucion: Colocando la Tierra en el centro de coordenadas y la Luna en el eje z tendremos:
F = GMm
r3Mm
r = GMm
r3Mm
(−xi− yj + 2zk) = −∇φ
donde:
−GMm
r3Mm
x = −∂φ∂x
, −GMm
r3Mm
y = −∂φ∂y
, GMm
r3Mm
2z = −∂φ∂z
integrando nos queda
φ = GMm
r3Mm
x2
2+ G (y, z) ⇒ −∂φ
∂y= −∂G (y, z)
∂y= −GMm
r3Mm
y ⇒ G (y, z) = GMm
r3Mm
y2
2+K (z)
φ = GMm
r3Mm
x2
2+G
Mm
r3Mm
y2
2+K (z) ⇒ −∂φ
∂z=∂K (z)
∂z= G
Mm
r3Mm
2z ⇒ K (z) = −GMm
r3Mm
z2
Por lo tanto:
φ = GMm
r3Mm
[x2
2+y2
2− z2
].
Borra
dor Pre
limin
ar
11. La Ley de Ampere se puede derivar de la ecuacion de Maxwell ∇ × H = J donde H es el campomagnetico y J la densidad de corriente. Si el campo electrico es nulo (E = 0) muestre que∮
H · dr = I
con I la corriente neta que atraviesa la circulacion del campo magnetico.
Solucion: ∮H · dr =
∫∫S
(∇×H) · dS =
∫∫S
J · dS = I
12. Considere el siguiente campo de fuerza:
F =(x2 + y2 + z2
)n(xi + yj + zk) .
a) Calcule en trabajo∫
F · dr a lo largo de un arco de circunferencia unitaria, colocado en el planoxy: primero girando en sentido antihorario de 0 → π y luego en sentido horario 0 → −π ¿Quepuede concluir delcampo de fuerzas?
Solucion: Se puede resolver de varıas maneras.
La forma elegante es expresando el campo de fuerza F en coordenadas esfericas. Esto es
F =(x2 + y2 + z2
)n(xi + yj + zk) ≡ r2nr ≡ r2n+1ur
luego recordamos que dr es siempre es tangente a la trayectoria, y en este caso la trayectoriaes una circunferencia unitaria ubicada en el plano xy, entonces
dr ∝ uφ ⇒ F · dr = 0 en todo punto
con lo cual esta fuerza es conservativa porque
F · dr = 0 ∀ (x, y) ⇒∮
F · dr = 0 .
La otra forma es con la fuerza bruta, cartesiana∫F · dr =
∫ (x2 + y2 + z2
)n(xi + yj + zk) · (dxi + dyj + dzk)
como la trayectoria es una circunferencia unitaria ubicada en el plano xy, entonces y =√1− x2, z = 0, con x variando entre 1 y −1, tanto en el caso de circular en sentido antihorario
de 0→ π o en sentido horario 0→ −π.∫F · dr =
∫ −1
1
(x2 + y2
)nx dx+
∫ 0
0
(x2 + y2
)ny dy
=
∫ −1
1
(x2 +
(1− x2
))nx dx =
∫ −1
1
x dx = 0
No es suficiente, pero podemos sospechar que la fuerza es conservativa, por cuanto dos circu-laciones distintas nos dieron el mismo valor de la integral.
Borra
dor Pre
limin
ar
b) ¿Ese campo vectorial tendra un potencial ϕ (x, y, z) asociado, tal que F = −∇ϕ (x, y, z)? Justifi-que su respuesta.
Si existe el potencial, encuentrelo y determine el valor del exponente n de tal forma que la funcionpotencial diverge simultaneamente en el origen y en infinito.
Solucion: Otra vez, planteamos la ecuacion F = −∇ϕ (x, y, z) en esfericas. Esto es
F = r2n+1ur = −(∂ϕ (r, θ, φ)
∂rur +
1
r
∂ϕ (r, θ, φ)
∂θuθ +
1
r sen(θ)
∂ϕ (r, θ, φ)
∂φuφ
)con lo cual tienen que cumplirse las siguientes ecuaciones
r2n+1 =∂ϕ (r, θ, φ)
∂r; 0 =
∂ϕ (r, θ, φ)
∂θ; 0 =
∂ϕ (r, θ, φ)
∂φ
Las dos ultimas ecuaciones, validas para r 6= 0, implican que ϕ no depende ni de θ, ni de φ. Laprimera puede ser integrada y nos queda como
r2n+1 =dϕ (r)
dr⇒
∫r2n+1d r = ϕ (r) ⇒ ϕ (r) =
−r2n+2
2n+ 2+ C
resultado que claramente diverge para n = −1, tanto cuando r → 0 como cuando r → ∞.Obviamente, valıda tambien al hacerlo en cartesianas
F =(x2 + y2 + z2
)n(xi + yj + zk) = −
(∂ϕ (x, y, z)
∂xi +
∂ϕ (x, y, z)
∂yj +
∂ϕ (x, y, z)
∂zk
)con lo cual (
x2 + y2 + z2)nx = −∂ϕ (x, y, z)
∂x,(x2 + y2 + z2
)ny = −∂ϕ (x, y, z)
∂y(x2 + y2 + z2
)nz = −∂ϕ (x, y, z)
∂z
Integrando la primera de esas ecuaciones
ϕ (x, y, z) = −∫ (
x2 + y2 + z2)nx dx = −1
2
(x2 + y2 + z2
)n+1
n+ 1+ C (y, z)
Donde C (y, z) es una funcion que tendremos que ir descubriendo poco a poco. Ahora bien, susti-tuyendo esa forma de ϕ (x, y, z) en la segunda ecuacion, tendremos que
(x2 + y2 + z2
)ny = − ∂
∂y
(−1
2
(x2 + y2 + z2
)n+1
n+ 1+ C (y, z)
)=(x2 + y2 + z2
)ny − ∂C (y, z)
∂y
con lo cual concluimos que C es independiente de y.
0 =∂ (C (y, z))
∂y⇒ C = C (z) ⇒ ϕ (x, y, z) = −1
2
(x2 + y2 + z2
)n+1
n+ 1+ C (z)
Borra
dor Pre
limin
ar
y ahora se sustituye esta nueva forma de la funcion ϕ (x, y, z) en la tercera ecuacion
(x2 + y2 + z2
)nz = − ∂
∂z
(−1
2
(x2 + y2 + z2
)n+1
n+ 1+ C (z)
)=(x2 + y2 + z2
)nz − ∂C (z)
∂z
entonces C tambien es independiente de z. Finalmente se determina que
ϕ (x, y, z) = −1
2
(x2 + y2 + z2
)n+1
n+ 1
Obviamente es el mismo resultado cuando recordamos que: r2 = x2 + y2 + z2 y tiene el mismocomportamiento para n = −1.
13. Dado el siguiente campo vectorial
F =2A cos(θ)
r3ur +
A sen(θ)
r3uθ
con A = constante y ur, uθ vectores unitarios base en coordenadas esfericas.
a) Calcule el rotor ∇× F
Solucion: El rotor en coordenadas esfericas viene dado por
∇× F =1
r2 sen(θ)
ur r uθ r sen(θ) uφ
∂∂r
∂∂θ
∂∂φ
2A cos(θ)r3 r A sen(θ)
r3 0
=uφr
∂[A sen(θ)r2
]∂r
−∂[
2A cos(θ)r3
]∂θ
= 0
b) Calcule en trabajo∮
F ·dr a lo largo de una circunferencia unitaria en el plano θ = π2 ¿Que puede
concluir del campo de fuerzas?
Solucion: Por el teorema de Stokes el trabajo en un circuito cerrado se anula∮F · dr =
∫∫∇× F · dS = 0
Se pueda ademas concluir que la fuerza es conservativa.
c) ¿Ese campo vectorial tendra un potencial asociado tal que F = −∇ϕ? Justifique su respuesta yde ser posible, encuentre la expresion para ese potencial.
Solucion: Una vez mas
2A cos(θ)
r3ur +
A sen(θ)
r3uθ = −
(∂ϕ (r, θ, φ)
∂rur +
1
r
∂ϕ (r, θ, φ)
∂θuθ +
1
r sen(θ)
∂ϕ (r, θ, φ)
∂ϕuφ
)con lo cual, tambien una vez mas
2A cos(θ)
r3= −∂ϕ (r, θ, φ)
∂r,
A sen(θ)
r3= −1
r
∂ϕ (r, θ, φ)
∂θ, 0 =
∂ϕ (r, θ, φ)
∂φ
Borra
dor Pre
limin
ar
La ultima ecuacion indica que ϕ no depende de φ. Ahora bien, integrando la primera de estasecuaciones, tendremos
2A cos(θ)
r3= −∂ϕ (r, θ, φ)
∂r⇒ ϕ (r, θ) = −
∫2A cos(θ)
r3dr + C (θ) = A
cos(θ)
r2+ C (θ)
al sustituir la forma del potencial en la segunda ecuacion tendremos
A sen(θ)
r2= − ∂
∂θ
(A
cos(θ)
r2+ C (θ)
)⇒ ∂C (θ)
∂θ= 0
De esta forma
ϕ (r, θ) = Acos(θ)
r2.
14. Si F = 1r2 ur. Encuentre algun posible campo vectorial A tal que ∇×A = F
Solucion: Tenemos
∇×A =1
r2 sen(θ)
∣∣∣∣∣∣∣∣∣∣ur r uθ r sen(θ) uφ
∂∂r
∂∂θ
∂∂φ
Ar (r, θ, φ) r Aθ (r, θ, φ) r sen(θ) Aφ (r, θ, φ)
∣∣∣∣∣∣∣∣∣∣= − 1
r2ur
con lo cual
1
r2=
1
r2 sen(θ)
(∂ (r sen(θ) Aφ (r, θ, φ))
∂θ− ∂ (r Aθ (r, θ, φ))
∂φ
)
0 =
(∂ (r sen(θ) Aφ (r, θ))
∂r− ∂Ar (r, θ, φ)
∂φ
), 0 =
(∂ (r Aθ (r, θ, φ))
∂r− ∂Ar (r, θ, φ)
∂θ
)Ahora hay que hacer algun tipo de suposicion para que podamos encontrar, facilmente algun potencialvectorial. Supongamos pues que
Ar (r, θ, φ) = cte
Aφ (r, θ, φ)
Aθ (r, θ, φ) = 0
⇒
sen(θ) =∂(r sen(θ) Aφ(r,θ,φ))
∂θ
0 = ∂Ar(r,θ,φ)∂φ
0 = Aθ (r, θ, φ) + r ∂Aθ(r,θ,φ)∂r − ∂Ar(r,θ,φ)
∂θ
Integrando la primera obtendremos
sen(θ) =∂ (r sen(θ) Aφ (r, θ, φ))
∂θ⇒ Aφ (r, θ, φ) = − cos(θ)
r sen(θ)+ C1 (r, θ)
de la segunda concluimos que Ar = Ar (r, θ), es decir, Ar es independiente de φ. Finalmente, de la ter-cera ecuacion concluimos que podemos hacer adicionalmente Ar = Ar (r) y C1 (r, θ) = 0. Resumiendo
F = − 1
r2ur ∧ ∇×A = F ⇒ A = Ar (r) ur −
cos(θ)
r sen(θ)uφ .
Borra
dor Pre
limin
ar
15. ParaF =
(x2 ı+ y2 + z2 k
)evalue las siguientes integrales:
a)∮
F · dr a lo largo de una circunferencia unitaria.
Solucion: Por el Teorema de Stokes∮c
F · d ~r =
∫∫S
(∇× F) · dS
con lo cual
∇× F =
∣∣∣∣∣∣i j k∂∂x
∂∂y
∂∂z
x2 y2 z2
∣∣∣∣∣∣ = 0 ⇒∮c
F · dr = 0
b)∮ ∮
F · dS a lo largo de una esfera unitaria.
Solucion: Por el Teorema de la divergencia∮ ∮F · dS =
∫∫∫v
(∇ · F) dV
por consiguiente∫∫∫V
(∇ · F) dV =
∫∫∫V
(i∂
∂x+ j
∂
∂y+ k
∂
∂z
)·(x2 i + y2 j + z2 k
)dx dy dz
=
∫∫∫V
(2x+ 2y + 2z) dx dy dz
Si ahora transformamos a coordenadas esfericas tendremos que
x = r sen(θ) cos(ϕ); y = r sen(θ) sen(ϕ); z = r cos(θ); con dV = r2 sen(θ)dr dθ dϕ
con lo cual∫∫∫V
(2x+ 2y + 2z) dxdydz =
∫∫∫V
(2r sen(θ) cos(ϕ) + 2r sen(θ) sen(ϕ) + 2r cos(θ)) r2 sen(θ)drdθdϕ
∫∫∫V
(∇ · F) dV = −1
4π .
16. En coordenadas cilındricas un vector tiene por componentes (0, sen(ϕ), z). Calcular:
a) La divergencia en coordenadas esfericas.
Solucion: Una vez mas(x1, x2, x3
) (r, θ, ϕ) y
(x1, x2, x3
) (ρ, ϕ, z)
a1 =∂x1 (xm)
∂xkak; a2 =
∂x2 (xm)
∂xkak; a3 =
∂x3 (xm)
∂xkak
Borra
dor Pre
limin
ar
con
r =√z2 + ρ2 ; θ = arctan
(ρz
); ϕ = ϕ ⇐⇒ ρ = r sen(θ) ; ϕ = ϕ ; z = r cos(θ)
con lo cual
a1 =∂x1 (xm)
∂xkak =
∂√z2 + ρ2
∂zz =
z2√(z2 + ρ2)
=(r cos(θ))
2√(r cos(θ))
2+ (r sen(θ))
2= r cos2 θ
a2 =∂ arctan
(ρz
)∂z
z =:−ρz
z2 + ρ2=
−r2 sen (θ) cos (θ)
(r cos(θ))2
+ (r sen(θ))2 = − sen(θ) cos(θ)
a2 = sen(ϕ)
de modo que el campo vectorial, en esfericas es
(0, sen(ϕ), z) (r cos2 θ,− sen(θ) cos(θ), sen(ϕ)
)y la divergencia
∇ ·A =1
r2 sen(θ)
(∂(r2 sen(θ) r cos2(θ)
)∂r
+∂ (r sen(θ) (− sen(θ) cos(θ)))
∂θ+∂ (r (sen(ϕ)))
∂ϕ
)
∇ ·A =3r sen(θ) cos2(θ)− 3 sen(θ) cos2(θ) + sen(θ) + cos(ϕ)
r sen(θ).
b) El rotor en coordenadas cartesianas.
Solucion: Ahora(x1, x2, x3
) (x, y, z) y
(x1, x2, x3
) (ρ, ϕ, z)
con
x = ρ cos(ϕ) ; y = ρ sen(ϕ) ; z = z ⇐⇒ ρ =√x2 + y2 ; ϕ = arctan
(yx
); z = z
de allı se siguen para las componentes cilındricas A (0, sen(ϕ), z)
ax =∂ (ρ cos(ϕ))
∂ϕsen(ϕ) = −ρ
(1 + cos2(ϕ)
)= −
√x2 + y2
[1 + cos2
(arctan
(yx
))]= − 2x2 + y2√
x2 + y2
ay =∂ρ sen(ϕ)
∂ϕsen(ϕ) = ρ cos(ϕ) sen(ϕ) =
√x2 + y2 cos
(arctan
(yx
))sen(
arctan(yx
))=
xy√x2 + y2
az = z .
Borra
dor Pre
limin
ar
Y el rotor
∇×A = i
(∂az∂y− ∂ay
∂z
)+ j
(∂ax∂z− ∂az
∂x
)+ k
(∂ay∂x− ∂ax
∂y
)
∇×A = k
∂(
xy√(x2+y2)
)∂x
−∂
(− 2x2+y2√
x2+y2
)∂y
=2y3k(√x2 + y2
)3
17. Muestre la relacion∆a ≡ (∇ ·∇) a = ∇ (∇ · a)−∇× (∇× a)
y a partir de ella encuentre las componentes del Laplaciano ∆a en coordenadas cilındricas.
Solucion: En coordenadas cartesianas tendremos que
(∇ ·∇) a = ∂i(∂jaj
)ei − εijk
[∂j(εklm∂
lam)]
ei =[∂i(∂jaj
)−(δilδ
jm − δ
jl δim
)∂j(∂lam
)]ei
=[∂i(∂jaj
)− ∂j
(∂iaj
)+ ∂j
(∂jai
)]ei =
[∂j∂
jai]ei .
Para encontrar la expresion del Laplaciano de un vector en coordenadas cilındricas tenemos que
∆a = ∆axi + ∆ayj + ∆azk = ∆ax (cos(ϕ)er − sen(ϕ)eϕ) + ∆ay (sen(ϕ)er + cos(ϕ)eϕ) + ∆azez
= (∆ax cos(ϕ) + ∆ay sen(ϕ)) er + (∆ay cos(ϕ)−∆ax sen(ϕ)) eϕ + ∆azez
ya que
i = cos(ϕ)er − sen(ϕ)eϕ , j = sen(ϕ)er + cos(ϕ)eϕ , k =ez ; x = r cos(ϕ) , y = r sen(ϕ) , z = z
Notese que
∆ax = ∂j∂jax =
∂2ax∂x2
+∂2ax∂y2
+∂2ax∂z2
, ∆ay = ∂j∂jay =
∂2ay∂x2
+∂2ay∂y2
+∂2ay∂z2
,
∆az = ∂j∂jaz =
∂2az∂x2
+∂2az∂y2
+∂2az∂z2
son las componentes cartesianas.
18. Muestre que∇ (a · b) = (a ·∇) b + (b ·∇) a + a× (∇× b) + b× (∇× a)
Solucion: El resultado es un gradiente porque (a · b) es una funcion escalar. El lado izquierdo de laexpresion sera
(∇ (a · b))i
= ∂i (a · b) = ∂i(ajb
j)
=(∂iaj
)bj +
(∂ibj
)aj
Borra
dor Pre
limin
ar
mientras que el lado derecho
(∇ (a · b))i
=(aj∂
j)bi +
(bj∂
j)ai + εijkaj (∇× b)k + εijkbj (∇× a)k
=(aj∂
j)bi +
(bj∂
j)ai + εijkajεkmn∂
mbn + εijkbjεkmn∂man
=(aj∂
j)bi +
(bj∂
j)ai + εijkεmnkaj∂
mbn + εijkεmnkbj∂man
=(aj∂
j)bi +
(bj∂
j)ai +
(δimδ
jn − δjmδin
)aj∂
mbn+
+(δimδ
jn − δjmδin
)bj∂
man
= aj∂jbi + bj∂
jai + δimδjnaj∂
mbn − δjmδinaj∂mbn+
+ δimδjnbj∂
man − δjmδinbj∂man
= aj∂jbi + bj∂
jai + an∂ibn − am∂mbi + bn∂
ian − bm∂mai
= aj∂jbi − am∂mbi︸ ︷︷ ︸
=0
+ bj∂jai − bm∂mai︸ ︷︷ ︸
=0
+ an∂ibn + bn∂
ian
= an∂ibn + bn∂
ian = ∂i(ajb
j)
= ∂i (a · b) .
19. Dado el siguiente campo vectorial a = 4xy i− y2 j + z k.
a) Encuentre el flujo del campo a traves de un cubo unitario: x = 0, x = 1, y = 0, y = 1, z = 0, z = 1.
Solucion: Tenemos que el flujo del campo vectorial es∫S
a · dS =
∫(∇ · a) dV =
∫(2y + 1) dV =
∫ 1
0
dx
∫ 1
0
dz
∫ 1
0
(2y + 1) dy = 2
b) Encuentre el flujo del rotor de ese campo a traves de una semi esfera: x2 +y2 +z2 = 16 con z ≥ 0.
Solucion: El flujo del rotor sera∫S
(∇× a) · dS =
∮a · dr =
∮ (4xy i− y2 j + z k
)· (dx i + dy j) =
∫4xy dx−
∫y2dy
como el circuito sera una circunsferencia de radio r = 4 en el plano z = 0 entonces al pasar apolares nos queda
x = 4 cos(θ) ⇒ dx = −4 sen(θ) dθ ; y = 4 sen(θ) ⇒ dy = 4 cos(θ) dθ .
con lo cual ∮a · dr = −5
∫ 2π
0
42 cos(θ) sen2(θ)dθ = 0
c) Considere ahora un cilindro x2 + y2 = 16 con −1 ≤ z ≤ 1
Encuentre el flujo del campo a traves de esa superficie.
Solucion: Como siempre, para encontrar el flujo del campo podemos hacerlo directamente∫S
a · dS, o a traves de su divergencia,∫
(∇ · a) dVEl flujo de este campo a traves de la superficie que encierra el cilindro serıa∫
S
a · dS =
∫S+
a · dS +
∫Sc
a · dS +
∫S−
a · dS
Borra
dor Pre
limin
ar
Con dS± las dos tapas del cilindro (z = 1 y x = −1), mientras que dSc representa lasuperficie del cilindro. Una forma de resolverlo serıa: se transforma el campo a cilındricas, yaque d~S = dSc ur + dS± uz.Esto es:
a = 4(4 cos(θ))(4 sen(θ))(cos(θ) ur − sen(θ) uθ) + (4 sen(θ))2(sen(θ) ur + cos(θ) uθ) + z k
y acomodandoa = 16sen(θ) (cos(2θ) ur − sen(2θ) uθ) + z k
Entonces, el flujo en las “tapas” es∫S+
a · dS =
∫S−
a · dS = 16π
mientras que en las superficie cilındrica sera:∫Sc
a · dS =
∫Sd
4dθ dz (16sen(θ) cos(2θ)) = 64
∫ 1
−1
dz
∫ 2π
0
dθ (sen(θ) cos(2θ)) = 0
Finalmente ∫S
a · dS = 32π
Hubiera sido inmediato si hubieramos utilizado el teorema de la divergencia y reutilizado losresultados del volumen anterior. Ası∫
(∇ · a) dV =
∫(2y + 1) dV =
∫(2 (ρ sen(θ)) + 1) ρdθ dρ dz
con y = ρ sen(θ) y el diferencial de volumen dV = ρdθ dρ dz.Entonces, finalmente,∫
(∇ · a) dV =
∫ 1
−1
dz
∫ 4
0
dρ 2ρ2
∫ 2π
0
dθ sen(θ) +
∫ 1
−1
dz
∫ 4
0
dρ 2ρ2
∫ 2π
0
dθ
para que, otra vez ∫S
a · dS = 32π
porque el primer termino de la suma se anula.
Encuentre el flujo del rotor de ese campo para el caso z ≥ 0.
Solucion: El flujo del rotor sera exactamente el mismo que en caso de las semiesfera. Esto es∫S
(∇× a) · dS =
∮a · dr = 0
d) Encuentre alguna de las componentes longitudinales y transversales del campo.
Solucion: Todo campo vectorial a se puede separar en una componente longitudinal al, y otratransversal at. Esto es:
a = al + at con
∇× al = 0
∇ · at = 0
⇒
∇× al = 0
∇ · al = ∇ · a = 2y + 1
Borra
dor Pre
limin
ar
con lo cual tenemos
∂yalz − ∂zaly = 0 , ∂za
lx − ∂xalz = 0 , ∂xa
ly − ∂yalx = 0
y∂xa
lx + ∂ya
ly + ∂za
lz = 2y + 1
Para empezar a acotar la solucion, supongamos que alz = alz(x, y, z) = 0
∂zaly = 0 y ∂za
lx = 0 ⇒ alx = alx(x, y) y aly = aly(x, y)
∂xaly − ∂yalx = 0 y ∂xa
lx + ∂ya
ly = 2y + 1
Otro par de suposiciones salvadoras son: alx = alx(x, y) = f(x) y aly = aly(x, y) = g(x). Estas nos
garantizan que se cumple la ecuacion ∂xaly − ∂yalx = 0. Es claro entonces que podemos encontrar
una solucion de la forma alx = f(x) = x y aly = g(y) = y2, que satisfaga ∂xalx + ∂ya
ly = 2y + 1.
Con lo cualal = x i + y2 j ⇒ at = a− al = x(4y − 1) i− 2y2 j + z k
Claramente, las suposiciones
alz = alz(x, y, z) = 0, alx = alx(x, y) = f(x) y aly = aly(x, y) = g(x)
son arbitrarias y otras suposiciones pueden ser hechas y, tendremos resultados distintos.
e) Encuentre los potenciales escalar y vectorial asociados con este campo vectorial a, a traves de lascomponentes longitudinal al y transversal at.
Solucion: El potencial escalar, φ = φ(x, y, z), esta asociado a la componente longitudinal, al, delcampo. Esto es
∇× al = 0 ⇒ al = −∇φ ⇒
x = −∂xφ(x, y, z) ⇒ φ(x, y, z) = −x2 + χ(y, z)
y2 = −∂yφ(x, y, z) ⇒ y2 = −∂yχ(y, z)
Con lo cual
φ(x, y, z) =x
2+y3
3+ ϕ(z)
El potencial vectorial para un campo vectorial, Ψ = Ψ(x, y, z), esta asociado a la componentetransversa at del campo. Esto es
∇ · at = 0 ⇒ at = ∇×Ψ ⇒
x(4y − 1) = ∂yΨz − ∂zΨy
−2y2 = ∂zΨx − ∂xΨz
z = ∂xΨy − ∂yΨx
Una vez mas, y de forma arbitraria, suponemos Ψz = 0. Entoces las ecuaciones anteriores seconvierten en
x(4y − 1) = −∂zΨy; −2y2 = ∂zΨx; y z = ∂xΨy − ∂yΨx
con lo cualx(4y − 1) = −∂zΨy ⇒ Ψy = −x(4y − 1)z + f(x, y)
−2y2 = ∂zΨx ⇒ Ψx = −2y2z + g(x, y)
Borra
dor Pre
limin
ar
y con estos resultados debemos satisfacer
z = ∂xΨy − ∂yΨx ⇒ z = −(4y − 1)z + ∂xf(x, y) + 4yz − ∂yg(x, y)
con lo cual es inmediato que una posible solucion surge de f(x, y) = g(x, y) = 0, para quefinalmente el potencial vectorial lo podamos expresar como
Ψ = −x(4y − 1)z i− 2y2z j .
20. Muestre que
Si un campo de velocidades es potencial, el campo de aceleraciones tambien lo sera.
Esto es: Siv(r(t), t) = ∇ϕ entonces a(r(t), t) = ∇Φ
con
a(r(t), t) =dv(r(t), t)
dt=∂v(r(t), t)
∂t+ (v(r(t), t) ·∇) v(r(t), t)
Solucion: Adaptando la relacion vectorial del primer problema obtenemos
∇ (v · v) = (v ·∇) v + (v ·∇) v + v × (∇× v) + v × (∇× v)⇒∇(v2)
= 2 (v ·∇) v
con lo cual
a =∂
∂t∇ϕ+
1
2∇(
(∇ϕ)2)
= ∇(∂ϕ
∂t+
1
2(∇ϕ)
2
)⇒ a = ∇Φ
Encuentre la forma del potencial del campo de aceleraciones en terminos del campo de velocidadesy su potencial.
Solucion: Arriba notamos claramente que
Φ =∂ϕ
∂t+
1
2v2 ≡ ∂ϕ
∂t+
1
2(∇ϕ)
2.
Borra
dor Pre
limin
ar
5.15. Ejercicios propuestos
1. Muestre que
a) Considerando: ∇ =i∂()∂x +j∂()
∂y +k∂()∂z
1) ∇ [∇ϕ (x, y, z)×∇φ (x, y, z)] = 0
2) ∇× [ϕ (x, y, z)∇φ (x, y, z)] = 0
b) Si x = r sen(θ) cos(φ) , y = r sen(θ) sen(φ) , x = r cos(θ). Encuentre, en este nuevo sistema decoordenadas (r, θ, φ), las expresiones para: ∇f ; ∆ = ∇ ·∇f y ∇× v
2. En coordenadas cilındricas un vector tiene por componentes (0, sen θ, z). Calcular:
a) La divergencia en coordenadas esfericas
b) El rotor en coordenadas cartesianas
3. Muestre que se cumple la siguiente la relacion
∆a ≡ (∇ ·∇) a = ∇ (∇ · a)−∇× (∇× a)
y a partir de ella encuentre las componentes del laplaciano ∆a en coordenadas cilındricas
4. Encuentre el vector normal a la superficie
z =√x2 + y2 + 3
√x2 + y2
en un punto cualquiera (x, y, z) 6= (0, 0, 0) , luego encuentre la expresion para el angulo que forma estevector con el eje. Encuentre el lımite al cual tiende este angulo cuando (x, y, z)→ (0, 0, 0).
5. La ecuacion de equilibrio hidrostatico en simetria esferica es
∇P (r) + ρ (r)∇ϕ (r) = 0
donde P (r) es la presion, ρ (r) la densidad y ϕ (r) el potencial gravitacional. Muestre que las normalesa las superficies isobaras y las normales a las superficies equipotenciales, son paralelas.
6. Dado r = x i + y j + z k con ‖r‖ = r = cte, f (r) un campo escalar bien comportado y a y c vectoresconstantes, muestre que
a) ∇r = ur ≡ rr ; ∇ (a · rf (r)) = af (r) + (a · r) f ′ (r) ur
b) ∇ · (rf (r)) = 3f (r) + rf ′ (r) ; ∇ · ((a · r) r) = 4 (a · r)∇ · ((a · r) c) = ∇ · ((c · r) a) = (a · c) ; ∇ · ((r× a)× c) = −2 (a · c)
c) Encuentre los enteros n tales que ∇ · (rnr) = 0
d) ∇× r = ∇× (f (r) r) = 0; ∇× (c× r) = 2c; ∇× (c (a · r)) = a× c∇× ((c× r) a) = a× c
e) (r×∇) · (r×∇) f (r) = r2∆f (r)− r2 ∂2f(r)∂r2 − 2r ∂f(r)
∂r con ∆f (r) ≡ (∇ ·∇) f (r)
7. Encuentre la expresion para la divergencia y el rotor de la velocidad v y la aceleracion a de un cuerporıgido alrededor de un punto (x, y, z)
v = ω × r a = ε× r + ω × (ω × r)
donde ω es la velocidad angular y ε es un vector constante.
Borra
dor Pre
limin
ar
8. Pruebe que el campo de velocidades v (r) de un disco que rota alrededor de su centro con una velocidadangular ω cumple con la relacion ∇× v = 2ω
9. Encuentre la circulacion alrededor de una circunferencia de radio unidad centrada en el origen para lossiguientes campos.
a) a = 12 (−y i + x j)
b) a = (xy + 1) i +(
12x
2 + x+ 2)j
10. Encuentre el rotor y el flujo para el campo vectorial
a =(x2 + y − 4
)i + 3xyj+
(2xz + z2
)k
a traves del hemisferio x2 + y2 + z2 = 16 con z > 0.
11. Muestre la relacion∆a ≡ (∇ ·∇) a = ∇ (∇ · a)−∇× (∇× a)
y a partir de ella encuentre las componentes del Laplaciano ∆a en coordenadas cilındricas
12. Muesre que el vector a (r) es solucion a la ecuacion
∇× (∇× a)− k2a = 0 ⇒(∇ + k2
)a = 0
con la condicion solenoidal ∇ · a = 0. La ecuacion(∇ + k2
)a = 0 se conoce como la ecuacion de
Helmholtz.
13. Dado el campo de fuerzas F = rn r. Verifique si existe una funcion escalar ϕ (x, y, z) tal que F =−∇ϕ (x, y, z). En el caso de que sea posible, encuentre esa funcion ϕ (x, y, z).
14. En mecanica clasica la cantidad de movimiento viene definida como L = r×p. Para pasar a mecanicacuantica se asocia r y p con los operadores posicion y cantidad de movimiento los cuales, al operarsobre la funcion de onda nos proveen
〈r|X |ψ〉 = x 〈r |ψ〉 = x ψ (r) 〈r|Px |ψ〉 =
(−i~ ∂
∂x
)〈r |ψ〉 = −i~ ∂
∂xψ (r)
〈r|Y |ψ〉 = y 〈r |ψ〉 = y ψ (r) 〈r|Py |ψ〉 =
(−i~ ∂
∂y
)〈r |ψ〉 = −i~ ∂
∂yψ (r)
〈r|Z |ψ〉 = z 〈r |ψ〉 = z ψ (r) 〈r|Pz |ψ〉 =
(−i~ ∂
∂z
)〈r |ψ〉 = −i~ ∂
∂zψ (r)
En definitiva, en coordenadas cartesianas en la representacion de coordenadas |r〉 tendremos que
〈r|R |ψ〉 = r ψ (r) y 〈r|Px |ψ〉 = −i~ ∇ ψ (r)
a) Muestre que en Mecanica cuantica las componentes cartesianas del operador cantidad de movi-miento angular son
〈r|Lx |ψ〉 = −i~(y∂
∂z− z ∂
∂y
)ψ (r) ; 〈r|Ly |ψ〉 = −i~
(z∂
∂x− x ∂
∂z
)ψ (r)
〈r|Lz |ψ〉 = −i~(x∂
∂y− y ∂
∂x
)ψ (r)
Borra
dor Pre
limin
ar
b) Utilizando las definiciones anteriores muestre que el conmutador de las componentes cartesianasde la cantidad de movimiento angular cumple con
[Lx, Ly] = i~Lz y en general εijkLiLj = i~Lk ⇒ L× L =iL
con L1 = L1 = Lx; L2 = L2 = Ly; L3 = L3 = Lz y L = Lxi + Lyj + Lzk
c) Dados dos Operadores Vectoriales A y B que conmtan entre ellos y con L tales que
[A,B] = [A,L] = [L,B] = 0
demuestre entonces que[A · L,B · L] = i (A× B) · L
15. El campo magnetico generado por una corriente I es
B =µ0I
2π
(−y
x2 + y2i +
x
x2 + y2j
)Encuentre un vector potencial magnetico, A, tal que ∇×A = B.
16. Si un campo vectorial tiene la forma B = ∇φ×∇ϕ, entonces B es solenoidal y su potencial vectoriales: A = 1
2 (φ∇ϕ− ϕ∇φ).
17. Dados el potencial vectorial A (r) del momento magnetico dipolar m y la fuerza F = ∇ × (B×m)que registra un momento magnetico dipolar m, sometido a un campo magnetico externo, B. Muestreque la fuerza ejercida por un dipolo magnetico sobre otro viene dada por:
Am (r) =( µ0
4πr3
)m× r
Fm (r) = ∇× (B×m)
⇒ Fm1→m2=µ0
4π∇(
2m1r m2r −m1ϕ m2ϕ −m1z m2z
r3
)
con m = mrur +mϕuϕ +mzuz.
18. Desarrolle el Teorema de Gauss para el caso bidimensional. Esto es, suponga una lınea de carga orien-tada en la direccion del eje z genera un potencial
ϕ (ρ) = −q ln(ρ)
2πε0; E = −∇ϕ con ρ =
√x2 + y2
19. Pruebe la generalizacion del Teorema de Green∫∫∫V
ζ (r)Lξ (r)− ξ (r)Lζ (r) dV = p (r)
∫∫s
ζ (r)∇ξ (r)− ξ (r)∇ζ (r) · d S
donde L es el operador autoadjunto definido por L⇒∇ · (p (r)∇) + q (r).
20. Considere una esfera de radio r = a y carga Q. Grafıque su potencial electrostatico para 0 < r <∞.
21. Considere una esfera de densidad uniforme ρ0, radio r = a y masa M .
a) Muestre que la fuerza gravitacional por unidad de masa es F = −(
4πGρ03r
)ur para 0 < r ≤ a.
b) Encuentre el potencial gravitacional asociado a esta fuerza
Borra
dor Pre
limin
ar
c) Imagine un tunel que atravieza la esfera pasado por su centro. Encuentre la ecuacion de movi-miento y la expresion del perıodo para una partıcula de masa m, que se deja caer por ese tunel.
22. Dado un vector potencial magnetico A tal que ∇×A = B. Muestre que∫∫s
B · dS =
∮A · dr es invariante de calibre: A (r)→ A (r) + ∇χ (r)
23. La fuerza de Lorentz para una partıcula con carga q que se mueve con una velocidad v en un campoelectrıco E y magnetico B es: F = q (E + v ×B). Muestre que
F = q (E + v ×B)
E = −∇φ− ∂A
∂t
∇×A = B
⇒ F =
[−∇φ− dA
dt+ ∇ (A · v)
]
top related