preliminar - uis

Report

Post on 03-Nov-2021

13 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Borra

dor Pre

limin

Borra

dor Pre

limin

arMatematicas Avanzadas:

de los espacios lineales al analisis vectorial

H. HernandezDepartamento de Fısica, Facultad de Ciencias,Universidad de Los Andes, Merida-Venezuela

L. A. NunezEscuela de Fısica, Facultad de Ciencias,

Universidad Industrial de Santander, Bucaramanga-Colombia

24 de septiembre de 2015

*Portada: Detalle de un manuscrito de Albert Einstein, Universidad Hebrea de Jerusalen

Borra

dor Pre

limin

arIndice general

1. Los vectores de siempre 91.1. Vectores, escalares y algebra vectorial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

1.1.1. Escalares y vectores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101.1.2. Algebra de vectores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

1.2. Independencia lineal y las bases para vectores . . . . . . . . . . . . . . . . . . . . . . . . . . . 131.3. Productos de vectores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

1.3.1. Producto escalar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141.3.2. Producto vectorial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161.3.3. Producto triple o mixto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161.3.4. Una division fallida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

1.4. Componentes, coordenadas y cosenos directores . . . . . . . . . . . . . . . . . . . . . . . . . . 181.4.1. Bases, componentes y coordenadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181.4.2. Cosenos directores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

1.5. Algebra vectorial y coordenadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191.5.1. Suma y resta de vectores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191.5.2. Dependencia e independencia lineal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 201.5.3. Producto escalar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 211.5.4. Producto vectorial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 221.5.5. Triple producto mixto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

1.6. Algebra vectorial con ındices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 231.6.1. Convencion de Einstein . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 231.6.2. Los vectores y los ındices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 241.6.3. Un par de calculos ilustrativos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 251.6.4. Escalares, pseudoescalares, vectores y pseudovectores . . . . . . . . . . . . . . . . . . . 26

1.7. Aplicaciones del algebra vectorial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 271.7.1. Rectas y vectores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 271.7.2. Planos y vectores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28

1.8. Un comienzo a la derivacion e integracion de vectores . . . . . . . . . . . . . . . . . . . . . . 301.8.1. Vectores variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 301.8.2. Derivacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 301.8.3. Velocidades y aceleraciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 321.8.4. Vectores y funciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 351.8.5. El vector gradiente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

Borra

dor Pre

limin

1.8.6. Integracion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 401.9. Vectores y numeros complejos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44

1.9.1. Los numeros complejos y su algebra . . . . . . . . . . . . . . . . . . . . . . . . . . . . 441.9.2. Vectores y el plano complejo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 451.9.3. Formulas de Euler y De Moivre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 461.9.4. Algunas aplicaciones inmediatas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48

1.10. Algunos ejemplos resueltos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 521.11. Ejercicios propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57

2. Espacios Vectoriales Lineales 632.1. Grupos, cuerpos y espacios vectoriales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64

2.1.1. Grupos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 642.1.2. Cuerpo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 662.1.3. Espacios vectoriales lineales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 662.1.4. Ejemplos espacios vectoriales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 672.1.5. La importancia de la conceptualizacion y la notacion . . . . . . . . . . . . . . . . . . . 682.1.6. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68

2.2. Espacios metricos, normados y con producto interno . . . . . . . . . . . . . . . . . . . . . . . 702.2.1. Metricas y espacios metricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 702.2.2. Normas y espacios normados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 712.2.3. Espacios con producto interno . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 722.2.4. Ejercicio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75

2.3. Variedades lineales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 782.3.1. Dependencia/independencia lineal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 782.3.2. Bases de un espacio vectorial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 792.3.3. El determinante de Gram . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 812.3.4. Ortogonalidad y bases ortogonales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 822.3.5. Ortogonalizacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 842.3.6. Complementos ortogonales y descomposicion ortogonal . . . . . . . . . . . . . . . . . . 872.3.7. Ejercicio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89

2.4. Aproximacion de funciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 902.4.1. Condiciones para la aproximacion de funciones . . . . . . . . . . . . . . . . . . . . . . 902.4.2. El Metodo de mınimos cuadrados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 912.4.3. Interpolacion polinomial de puntos experimentales . . . . . . . . . . . . . . . . . . . . 942.4.4. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96

2.5. Algunos ejemplos resueltos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97

3. Vectores Duales y Tensores 1023.1. Funcionales lineales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1033.2. Parentesis tensorial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104

3.2.1. Tensores, una definicion funcional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1043.2.2. Producto tensorial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1053.2.3. La tentacion del producto interno . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1073.2.4. Bases para un producto tensorial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1093.2.5. Tensores, sus componentes y sus contracciones . . . . . . . . . . . . . . . . . . . . . . 1093.2.6. Tensor metrico, ındices y componentes . . . . . . . . . . . . . . . . . . . . . . . . . . . 112

3.3. Un par de tensores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1133.3.1. El tensor de esfuerzos (stress) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114

Borra

dor Pre

limin

3.3.2. El Tensor de inercia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1173.4. Repensando los vectores nuevamente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119

3.4.1. Vectores, covectores y leyes de transformacion . . . . . . . . . . . . . . . . . . . . . . . 1193.4.2. Cartesianas y polares, otra vez . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1203.4.3. Repensando las componentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121

3.5. Transformaciones, vectores y tensores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1243.6. Un ejemplo detallado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1263.7. Teorema del cociente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1303.8. Vectores, tensores y espacios pseudo-euclideanos . . . . . . . . . . . . . . . . . . . . . . . . . 131

3.8.1. Espacios minkowskianos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1323.8.2. Un toque de Relatividad Especial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1333.8.3. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136

3.9. Bases continuas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1383.9.1. Bases de ondas planas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1393.9.2. Las Representaciones |r〉 y |p〉 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140

3.10. Ejercicios propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143

4. Matrices, Determinantes y Autovectores 1474.1. Operadores Lineales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148

4.1.1. Espacio Vectorial de Operadores Lineales . . . . . . . . . . . . . . . . . . . . . . . . . 1504.1.2. Composicion de Operadores Lineales . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1514.1.3. Funciones de Operadores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1534.1.4. Proyectores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1534.1.5. Espacio Nulo e Imagen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1544.1.6. Operadores Biyectivos e Inversos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1564.1.7. Operadores Hermıticos Conjugados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1584.1.8. Operadores Unitarios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1594.1.9. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 160

4.2. Representacion Matricial de Operadores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1614.2.1. Bases y Representacion Matricial de Operadores . . . . . . . . . . . . . . . . . . . . . 1634.2.2. Algebra de Matrices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1654.2.3. Representacion Diagonal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1654.2.4. Sistemas de ecuaciones lineales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1664.2.5. Operadores hermıticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1674.2.6. Inversa de una matriz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1674.2.7. Cambio de bases para vectores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1684.2.8. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169

4.3. Traza de Operadores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1694.3.1. Invariancia de la Traza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1704.3.2. Propiedades de la Traza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 170

4.4. Diferenciacion de Operadores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1704.4.1. Reglas de diferenciacion de operadores lineales . . . . . . . . . . . . . . . . . . . . . . 1714.4.2. La formula de Glauber . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1734.4.3. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 174

4.5. Un parentesis determinante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1744.5.1. Definicion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1744.5.2. Propiedades determinantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1754.5.3. Formula de Laplace . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177

Borra

dor Pre

limin

4.6. Un zoologico de matrices cuadradas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1774.7. Autovectores y Autovalores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 180

4.7.1. Definiciones y Teoremas Preliminares . . . . . . . . . . . . . . . . . . . . . . . . . . . 1804.7.2. Algunos comentarios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1804.7.3. Algunos Ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1814.7.4. Autovalores, autovectores e independencia lineal . . . . . . . . . . . . . . . . . . . . . 182

4.8. Autovalores y Autovectores de un operador . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1834.8.1. El polinomio caracterıstico. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1834.8.2. Primero los autovalores, luego los autovectores . . . . . . . . . . . . . . . . . . . . . . 1844.8.3. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 187

4.9. Autovalores y Autovectores de Matrices Importantes . . . . . . . . . . . . . . . . . . . . . . . 1884.9.1. Autovalores y Autovectores de Matrices Similares . . . . . . . . . . . . . . . . . . . . . 1884.9.2. Autovalores y Autovectores de matrices Hermıticas . . . . . . . . . . . . . . . . . . . . 1914.9.3. Autovalores y Autovectores de matrices Unitarias . . . . . . . . . . . . . . . . . . . . . 193

4.10. Conjunto completo de observables que conmutan . . . . . . . . . . . . . . . . . . . . . . . . . 1974.10.1. Observables que Conmutan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1974.10.2. Ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2004.10.3. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 202

4.11. Sistemas de ecuaciones lineales: segunda revision . . . . . . . . . . . . . . . . . . . . . . . . . 2034.12. Algunos ejemplos resueltos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 207

5. Coordenadas Curvilıneas, Campos y Operadores Diferenciales 2165.1. Disgrecion derivativa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2175.2. Curvas y parametros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2175.3. Ejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2185.4. Coordenadas curvilıneas generalizadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 220

5.4.1. Coordenadas generalizadas, vectores y formas . . . . . . . . . . . . . . . . . . . . . . . 2215.4.2. Velocidades y aceleraciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2225.4.3. Coordenadas cartesianas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2235.4.4. Coordenadas cilındricas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2235.4.5. Coordenadas esfericas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 225

5.5. Vectores, Tensores, metrica y transformaciones . . . . . . . . . . . . . . . . . . . . . . . . . . 2285.5.1. Transformando vectores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2285.5.2. Transformando tensores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 230

5.6. Campos tensoriales y el concepto de campo . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2315.7. Campos escalares y superficies . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2345.8. Campos vectoriales y lıneas de flujo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 234

5.8.1. Lıneas de flujo o curvas integrales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2355.8.2. Trayectorias ortogonales a las lıneas de flujo . . . . . . . . . . . . . . . . . . . . . . . . 236

5.9. Flujo de Campos Vectoriales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2375.10. La fauna de los operadores vectoriales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 238

5.10.1. Derivada direccional, diferencial total y gradiente . . . . . . . . . . . . . . . . . . . . . 2385.10.2. Divergencia y flujo en campos vectoriales . . . . . . . . . . . . . . . . . . . . . . . . . 2425.10.3. Rotores, Lıneas de torbellino y Circulacion . . . . . . . . . . . . . . . . . . . . . . . . 2465.10.4. Formulario del Operador nabla, ∇ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2525.10.5. Nabla dos veces y el Laplaciano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2535.10.6. Derivadas Direccionales de Campos Vectoriales . . . . . . . . . . . . . . . . . . . . . . 2545.10.7. La Derivada Covariante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 256

Borra

dor Pre

limin

5.11. Integrales y Campos Vectoriales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2615.11.1. Integrales de Campos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2615.11.2. Integrales de lınea . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2625.11.3. Integrales de Superficie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 263

5.12. Campos Vectoriales y Teoremas integrales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2635.12.1. Teorema de Gauss . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2635.12.2. Teorema de Stokes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 269

5.13. Teorıa de Potencial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2725.13.1. Potenciales escalares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2725.13.2. Potenciales vectoriales y calibres . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2735.13.3. Teorema de Green y Potenciales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2745.13.4. Teorema de Helmholtz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 274

5.14. Algunos ejemplos resueltos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2765.15. Ejercicios propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 297

Borra

dor Pre

limin

arIntroduccion

El contenido de este libro no es mas que la recopilacion de las notas de clases...

Borra

dor Pre

limin

arCapıtulo 1Los vectores de siempre

Borra

dor Pre

limin

1.1. Vectores, escalares y algebra vectorial

Desde los primeros cursos de Fısica en educacion media, venimos hablando de vectores como cantidadesque tienen que ser representadas con mas de un numero. Son varias las razones que obligan a introducir este(y otro) tipo de cantidades “multidimensionales”. Enumeraremos algunas que, a nuestro criterio personal,son las mas representativas.

1. Necesidad de modelos matematicos de la naturaleza. Desde los albores del renacimiento, conGalileo Galilei a la cabeza, nos es imperioso representar cantidades de manera precisa. Las matematicasnos apoyan en esta necesidad de precision y desde ese entonces son el lenguaje de la actividad cientıfica.

2. Los modelos tienen que tener contrastacion experimental. Las ciencias y sus modelos, en ultimainstancia, tienen que ver con la realidad, con la naturaleza y por ello debemos medir y contrastar lashipotesis con esa realidad que modelamos. Necesitamos representar cantidades medibles (observables)y que, por lo tanto, tienen que ser representadas de la forma mas compacta, pero a la vez mas precisaposible.

3. Las leyes de los modelos deben ser independiente de los observadores. Cuando menos auna familia significativa de observadores, el comportamiento de la naturaleza no puede depender de lapercepcion de un determinado observador, por lo tanto, los modelos que construimos para describirlatampoco pueden depender de los observadores.

Es comun que tropecemos con: escalares, vectores, tensores y espinores, dependiendo del numero decantidades que necesitemos para representar determinado objeto matematico. Podremos constatar que lasleyes de la Fısica vienen escritas en forma vectorial (o tensorial) y, por lo tanto, sera la misma ley para lafamilia de observadores equivalentes.

1.1.1. Escalares y vectores

Dejaremos para mas adelante caracterizar objetos como tensores y espinores, por ahora nos contentaremoscon refrescar nuestros recuerdos con cantidades como:

Escalares: Seran aquellas cantidades las cuales se representan con UN solo numero, una magnitud: temperatura,volumen, masa, entre otras. Es costumbre no denotarlas de manera especial, ası T = 5oC representarauna temperatura de 5 grados centıgrados.

Vectores: Seran cantidades las cuales, para ser representadas por un objeto matematicos requieren mas de unacantidad: requieren de UN numero, UNA direccion y UN sentido. Entre las cantidades que tıpicamentereconocemos como vectores estan: la velocidad, la aceleracion, la fuerza En terminos graficos podremosdecir que un vector sera un segmento orientado, en el cual la dimension del segmento representara sumodulo y su orientacion la direccion y el sentido. Para diferenciarlos de las cantidades escalares hayuna variedad de representaciones, entre ellas: en negrita a; con una flecha arriba de la cantidad ~a; con

una tilde arriba o abajo a; o explicitando el origen del segmento orientado−−→OP . El modulo del vector lo

representaremos dentro de la funcion valor absoluto, o sencillamente sin la flecha arriba a = |a| = |~a| .

Los vectores son independientes del sistema de coordenadas. Sus caracterısticas (modulo, direccion ysentido) se preservaran en todos los sistemas de coordenadas. Mas aun, habra vectores que podremos des-plazarlos (conservando su modulo direccion y sentido) paralelos a ellos mismos, en el espacio y seguiransiendo los mismos, por ello encontraremos el termino de vectores deslizantes. Un ejemplo son las fuerzas queactuan en un determinado cuerpo, como se muestra el cuadrante I en la Figura 1.1. Tambien habra vectores

Borra

dor Pre

limin

Figura 1.1: Vectores y sus operaciones

atados a un punto en el espacio, por cuanto representan una de sus propiedades: la velocidad del viento, elcampo electrico, o sus variaciones son algunos ejemplos de estos vectores atados (observe la Figura 1.2 comoejemplos ilustrativos).

1.1.2. Algebra de vectores

Enumeraremos rapidamente el algebra de vectores sin hacer referencia a un sistema de coordenadas.Desde cursos anteriores nos ensenaron a representar graficamente este algebra, ası tenemos que:

Vector nulo. Es aquel que tiene por modulo cero y no se le pude asignar direccion ni sentido. Podremoscomparar vectores si tienen la misma direccion y sentido. El frecuente representar al vector nulo por 0.

Vector unitario. Es aquel que tiene por modulo la unidad, es muy util por cuanto, para efectos algebraicos,“contiene” unicamente direccion y sentido. Lo denotaremos con un acento circunflejo, comunmente llamado“sombrero” ua = a

|a| , con lo cual todo vector se podra expresar por un modulo en la direccion y sentido de

un vector unitario: a = |a| ua.

Comparacion de vectores. Al comparar sus modulos diremos que pueden ser mayores, menores o iguales.Por lo tanto, tal y como mostramos en el cuadrante IIa de la Figura 1.1, dos vectores seran iguales, a = b,si tienen la misma direccion y sentido.

Borra

dor Pre

limin

Figura 1.2: Ejemplos de vectores atados

Multiplicacion por un escalar. Un vector multiplicado por un escalar, α, cambiara su modulo si α > 0y cambiara su sentido, y eventualmente su modulo, si α < 0. Tal y como puede apreciarse en el cuadrante IIade la Figura 1.1. Claramente dos vectores proporcionales seran colineales. Diremos ademas, que el inversodel vector a sera la multiplicacion de a por (−1) . Esto es c = (−1) a = −a.

Suma de vectores. Aprendimos que para sumar vectores utilizamos la regla del paralelogramo, es decir,desplazamos paralelamente uno de los vectores y lo colocamos a continuacion del otro, de tal forma quela diagonal del paralelogramo, que tiene por lados los vectores sumandos, constituye el vector suma (vercuadrantes IIa y IIb de la Figura 1.1). Este esquema se puede generalizar para varios vectores tal y como lomostramos en el cuadrante III de la Figura 1.1. Allı construimos un polıgono cuyos lados los constituyen losvectores sumandos a,b, c, d y n con n = a + b + c + d.

Notese que aun en el caso tridimensional, el vector suma siempre sera coplanar (estara en el mismo plano)a los sumandos que lo generaron.

Igualmente, podemos definir la resta de vectores al sumar el inverso. Esto es

a− b ≡ a + (−b) ⇒ 0 = a− a ≡ a + (−a) .

En terminos graficos la resta de dos vectores se representa colocando los vectores (minuendo y sustraendo)con el mismo origen y uniendo las cabezas de flecha. Dependiendo de cual vector es el minuendo y cualsustraendo el vector resta apuntara del sustraendo hacia el minuendo, esto es, (a + b + c)− a = b + c.

Borra

dor Pre

limin

Claramente, el modulo del vector resta representa la distancia entre los dos extremos de los vectoresminuendo y el sustraendo

Un resumen de propiedades. Podemos resumir las propiedades del algebra de vectores como sigue:

La suma de vectores:

• tiene un unico elemento neutro 0 + a = a + 0 = a, ∀a,

• existe un elemento simetrico −a (uno para cada vector) tal que 0 = a− a ≡ a + (−a),

• es conmutativa a + b = b + a,

• es asociativa (a + b) + c = a + (b + c),

• es distributiva respecto a la multiplicacion por escalares: α (a + b) = αa + αb;

La multiplicacion de escalares por vectores:

• es conmutativa aα = αa,

• es asociativa α (βa) = (αβ) a,

• es distributiva (α+ β) a = αa + βa.

1.2. Independencia lineal y las bases para vectores

Armados con el algebra y explicitando sus propiedades podemos construir la primera aproximacion a unode los conceptos fundamentales del algebra lineal. La nocion de independencia o dependencia lineal.

Diremos que tres vectores a,b, c son linealmente independientes si se cumple que

α a + β b + γ c = 0 ⇒ α = β = γ = 0

es decir, que la unica manera que al sumar cualquier multiplo de a,b y c de manera que la suma se anule esobligando a que los escalares sean necesariamente nulos. Si no se cumple lo anterior entonces diremos queuno de los vectores sera linealmente dependiente y por lo tanto se podra expresar como combinacion linealde los otros dos

α a + β b + γ c = 0 alguno de

α 6= 0β 6= 0γ 6= 0

⇒ c = α a + β b

Los vectores linealmente independientes formaran una base para el espacio donde estos vectores “viven” yel numero maximo de vectores linealmente independientes sera la dimension de ese espacio de “residencia”.Tratemos de concretar algunas de estas afirmaciones.

Dos vectores linealmente dependientes son colineales. Es claro que

α a + β b = 0 con alguno de

α 6= 0β 6= 0

⇒

a = −β

αb

b = −αβ

el contrario tambien sera cierto: si dos vectores son colineales ellos seran linealmente dependientes.

a = λb ⇒ αa + βb = 0 ⇒ αλb + βb = 0 ⇒ (αλ+ β) b = 0 ⇒ λ = −βα,

con lo cual podremos afirmar que si dos vectores son linealmente independientes ellos no son colineales.

Borra

dor Pre

limin

Tres vectores linealmente dependientes son coplanares. Es claro que por ser los tres vectores lineal-mente dependientes al menos uno de los escalares tiene que ser distinto de cero, digamos γ, esto es

α a + β b + γ c = 0 ⇒ c = −αγ

a− β

γb = ξ1a + ξ2b ,

pero como ξ1a ∝ a y ξ2 b ∝ b, esto significa que ξ1a y a son colineales, de la misma manera que ξ2b y b, ypor lo tanto, la suma estara en el mismo plano.

Dos vectores linealmente independientes expanden todos los vectores coplanares. Dado dosvectores a y b linealmente independientes, entonces cualquier vector c, coplanar con a y b, podra expresarsecomo una combinacion lineal de estos. Diremos que c se expresa en terminos de a y b como c = ξ1a + ξ2by esa expresion es unica.

La primera de las afirmaciones es directa por cuanto hemos visto que si a y b son linealmente indepen-dientes y c es coplanar con a y b, entonces, necesariamente a,b y c son linealmente dependientes. Estoes:

α a + β b + γ c = 0⇒ c = −αγ

a− β

γb = ξ1a + ξ2b

La demostracion de que la expansion es unica viene de suponer que existen dos maneras distintas de repre-sentar al vector c

c = ξ1a + ξ2b

c = ζ1a + ζ2b

⇒ 0 =(ξ1 − ζ1

)a +

(ξ2 − ζ1

)b ⇒

ξ1 − ζ1 = 0 ⇒ ξ1 = ζ1

ξ2 − ζ2 = 0 ⇒ ξ2 = ζ2

debido a que a y b son linealmente independiente.La demostracion para el caso tridimensional es equivalente. Es decir tres vectores linealmente indepen-

dientes a,b y c expanden, de manera unıvoca, todos los vectores del espacio. Esta demostracion queda parael lector.

Cuando un vector c se pueda expresar en terminos de dos vectores linealmente independientes, a y bdiremos que a y b forman una base para todos los vectores coplanares a estos. Igualmente para el casotridimensional: tres vectores linealmente independientes a,b y c conformaran una base para los vectores delespacio. Los numeros ξ1 y ξ2 para el caso bidimensional se denominan las componentes de c a lo largo de ay b, respectivamente. Equivalentemente, ξ1, ξ2, ξ3 seran las componentes de cualquier vector para el caso 3Da lo largo de a,b y c, respectivamente. Esta nomenclatura sera mas evidente luego de la proxima seccion.

1.3. Productos de vectores

1.3.1. Producto escalar

Denominaremos producto escalar de dos vectores a y b a un escalar cuyo valor sera igual al producto delos modulos multiplicado por el coseno del angulo que ellos forman

ζ = a · b = |a| |b| cos(θ)〈a,b〉

El significado geometrico del producto escalar es evidente, cuadrante I de la Figura 1.3. El producto escalarrepresenta la proyeccion de a sobre b y equivalentemente la proyeccion de b sobre a.

De esta definicion se derivan varias consecuencias las cuales por obvias no dejan de ser importantes:

Borra

dor Pre

limin

arFigura 1.3: Productos de Vectores

El producto escalar de un vector consigo mismo, siempre es positivo:ζ = a · a = |a|2 ≥ 0, y solo sera nulo si a es el vector nulo. Esto es, ζ = 0 ⇒ a = 0. Con esto podemosconcluir que |a| =

√a · a =

√ζ.

El producto escalar es conmutativo:ζ = a · b = b · a, ya que el angulo entre los vectores es el mismo y la multiplicacion entre escalares esconmutativa.

El producto escalar es distributivo:Esto es, a · (b + c) = a · b + a · c. La demostracion (grafica) puede apreciarse en el cuadrante II de laFigura 1.3.

La multiplicacion por un escalar :ζ = αζ = |α| (a · b) = (αa) · b = a · (αb) = |αa| |b| cos(θ)〈a,b〉 = |a| |αb| cos(θ)〈a,b〉.

Desigualdad de Cauchy-Schwarz.A partir de la definicion de producto interno es inmediata la comprobacion de la siguiente desigualdad:

(a · b)2

=(|a| |b| cos(θ)〈a,b〉

)2 ⇒ (a · b)2 ≤ |a|2 |b|2 ⇔ a · b ≤ |a| |b|

ya que 0 ≤ cos2(θ)〈a,b〉 ≤ 1.

Del producto escalar surge el Teorema del Coseno.Es inmediato calcular el producto escalar de un vector consigo mismo, para ello vamos a suponer quec = a + b, con lo cual

c = a + b ⇒ c · c = (a + b) · (a + b) ⇒ |c|2 = |a|2 + |b|2 + 2 |a| |b| cos(θ)〈a,b〉

que no es otra cosa que el teorema del coseno y esta ilustrado en el cuadrante III de la Figura 1.3.

Borra

dor Pre

limin

Diremos que dos vectores no nulos son ortogonales (perpendiculares) si su producto escalar es nulo.Esta afirmacion es inmediata

a ⊥ b ⇒ θ〈a,b〉 =π

2⇒ a · b = |a| |b| cos(θ)〈a,b〉 = 0 .

1.3.2. Producto vectorial

Tambien hemos aprendido que existe otro producto entre vectores: el producto vectorial. A diferencia delproducto escalar que genera un escalar, el producto vectorial tiene como resultado otro vector: c = a × b(realmente un pseudovector o vector axial en contraposicion a los vectores polares, pero eso lo veremos masadelante en la seccion 1.6.4), con las siguientes caracterısticas:

El modulo de c, sera |c| = |a| |b| sen(θ)〈a,b〉. Es claro que el modulo de c representa el area delparalelogramo cuyos lados estan formados por a y b (ver el cuadrante V de la Figura 1.3).

Tal y como muestran los cuadrantes IV y V de la Figura 1.3, c tendra como direccion la perpendicularal plano que forman a y b, y como sentido la regla del pulgar derecho, regla de la mano derecha, o demanera mas elegante, sera positiva cuando la multiplicacion de a× b corresponda al sentido horario.

Podemos deducir algunas consecuencias de esta definicion.

El producto vectorial es anticonmutativo.a× b = −b× a, y se sigue de la definicion que expresa el cuadrante IV de la Figura 1.3.

El producto vectorial es distributivo respecto a la suma.a× (b + c) = a× b + a× c. La demostracion de esto lo dejaremos para mas adelante.

La multiplicacion por un escalar.

|c| = |α| |a× b| = |(αa)× b| = |a× (αb)| = |αa| |b| sen(θ)〈a,b〉 = |a| |αb| sen(θ)〈a,b〉

Dos vectores seran colineales si su producto vectorial se anula.Como en el caso cuando se anulaba el producto escalar identificabamos a dos vectores ortogonales,cuando se anula el producto vectorial tendremos dos vectores paralelos. Es claro que esto se cumple deinmediato

a ‖ b ⇒ θ〈a,b〉 = 0 ⇒ |c| = |a× b| = |a| |b| sen(θ)〈a,b〉 = 0

Si el modulo del vector es cero, obvio que es el vector nulo. Ahora bien, tambien de aquı deducimosque

c = a× b ⇒ c · a = (a× b) · a = c · b = (a× b) · b = 0 .

1.3.3. Producto triple o mixto

Analicemos ahora el numero (pseudoescalar) que proviene de la multiplicacion

V = c · (a× b) = |c| |(a× b)| cos(θ)〈c,a×b〉

Este producto tambien cumple con algunas propiedades que enunciaremos ahora y demostraremos mas tarde

El producto mixto representa el volumen del paralelepıpedo cuyos lados son los vectores a,b y c.|a× b| representa el area de la base y la altura esta representada por la proyeccion del vector c sobrela perpendicular al plano de la base que es, precisamente |c| cos(θ)〈c,a×b〉.

Borra

dor Pre

limin

arFigura 1.4: Vectores, bases y componentes

El producto mixto es cıclico respecto a sus factores.

(a× b) · c = (c× a) · b = (b× c) · a

Esta afirmacion se vera demostrada mas adelante.

El producto mixto se anula cuando se repite alguno de sus factores.

(a× b) · a = (a× b) · b = (a× a) · c = (b× b) · c = 0 .

Claramente, si (a× b)⊥a⇒ (a× b) · a = 0.

Si los tres vectores a,b y c son coplanares (linealmente dependientes) entonces:

(a× b) · c = 0 ,

dicho de manera mas elegante, util e impactante: tres vectores que cumplen con:

(a× b) · c 6= 0 ,

forman una base para el espacio tridimensional. Esa base se denominara levogira (contraria al giro delas manecillas del reloj) si el producto (a× b) · c < 0 y dextrogira (la convencional base de la manoderecha) si (a× b) · c > 0.

1.3.4. Una division fallida

Uno esperarıa que para cada una de las definiciones de productos vectoriales, existiera el vector cociente,es decir, que pudieramos “despejar” uno de los multiplicados en terminos del otro. La situacion es que estaoperacion no esta definida unıvocamente y lo podemos intuir a partir de una de las definiciones de producto.

Borra

dor Pre

limin

Supongamos que tenemos un producto escalar: ζ = a · b con lo cual, si pudieramos “despejar”, digamos

b =ζ

a¿Tendrıamos entonces definido b de una manera unıvoca? La respuesta es NO, ya que ζ = a·

(ζ

a+ d

)donde a ⊥ d, por lo cual existen infinitos b =

a+ d que cumplen ζ = a · b.

1.4. Componentes, coordenadas y cosenos directores

La formulacion de las leyes fısicas debe hacerse en termino de cantidades vectoriales (tensoriales). Estoindependiza su formulacion de un sistema particular de coordenadas, pero llegado el momento de calcularvalores y utilizar estas leyes, es mucho mas conveniente referirla a un sistema de coordenadas particularmenteadaptado a la geometrıa del problema. En ese caso la ecuacion vectorial se convertira en tantas ecuacionescomo componentes (referidas al sistema de coordenadas utilizado) tengan los vectores en ese sistema decoordenadas.

1.4.1. Bases, componentes y coordenadas

Tal y como mencionamos anteriormente, tres vectores no coplanares cualesquiera son linealmente in-dependientes y constituyen una base para el espacio tridimensional. Denominaremos, de ahora en adelante aestos vectores base wi, y por ser linealmente independientes podremos expresar cualquier vector a comouna combinacion lineal unica, tal y como lo mostramos en el cuadrante I de la Figura 1.4.

Con los vectores base w1,w2,w3 podemos construir un sistema (oblicuo en general) de coordenadasal colocarlos con un mismo origen, esto es

a = ξ1w1 + ξ2w2 + ξ3w3

donde las cantidadesξ1, ξ2, ξ3

son numeros (no son escalares) que representan las componentes del vector

a a lo largo de cada uno de los vectores base w1,w2,w3 . Notese que por costumbre (la cual sera evidentemas adelante) etiquetamos estos numeros con superındices y la letra que identifica el vector.

Mas aun, cada punto P del espacio viene definido por un radiovector r (P ) ≡−−→OP que une el origen

de coordenadas con el punto P y se le asocian tres numerosx1, x2, x3

, los cuales son las proyecciones

a lo largo de cada uno de los ejes coordenados

0x1, 0x2, 0x3

. Los numerosx1, x2, x3

se denominaran

componentes de r (P ) en el sistema de referencia w1,w2,w3.Existe una familia de sistemas de coordenadas en la cual sus vectores base son ortogonales (o mejor

ortonormales), es decir los vectores base e1, e2, e3 son perpendiculares entre si. Tal y como mostraremosmas adelante, siempre se puede construir un sistema ortogonal e1, e2, e3 u ortonormal i1, i2, i3 a partirde una base generica de vectores linealmente independientes w1,w2,w3. Cuando el sistema sea ortogonalsus componentes se denominaran rectangulares. Dependiendo del signo del triple producto mixto el sistemade coordenadas sera dextrogiro ((e1 × e2) · e3 > 0) o levogiro ((e1 × e2) · e3 < 0), tal y como se muestra enel cuadrante III de la Figura 1.4.

Es costumbre ancestral, por relaciones de dominacion de los derechos sobre los izquierdos (en latın eitaliano los zurdos son siniestros) utilizar la convencion dextrogira donde el producto: (e1 × e2) · e3 > 0, yen ese caso utilizamos el bien conocido conjunto de vectores unitarios i, j,k con los que ya hemos estadofamiliarizados

a = axi + ayj + azk y r (P ) = x i + y j + z k .

Tambien es costumbre representar este sistema de coordenadas ortonormal como: i ≡ i1, j ≡ i2 y k ≡ i3para recordar que estamos en un sistema de coordenadas cartesianas y utilizaremos los superındices 1, 2, 3

Borra

dor Pre

limin

para indicar las componentes del vector.

a = a1i1 + a2i2 + a3i3 y r (P ) = x1 i1 + x2 i2 + x3 i3 .

Obviamente el modulo del vector se podra expresar con la utilizacion del Teorema de Pitagoras

|a| =√

(a1)2 + (a2)2 + (a3)2 y |r (P )| =√

(x1)2 + (x2)2 + (x3)2

y la multiplicacion por un escalar sera

αa = α(a1i1 + a2i2 + a3i3

)=(αa1

)i1 +

(αa2

)i2 +

(αa3

)i3 ⇒ |αa| = α

√(a1)2 + (a2)2 + (a3)2

Igualmente para un vector unitario

ua =a

|a|=

a1i1 + a2i2 + a3i3√(a1)2 + (a2)2 + (a3)2

con lo cual todo vectora = |a| ua =

√(a1)2 + (a2)2 + (a3)2 ua .

1.4.2. Cosenos directores

Como se puede apreciar en el cuadrante IV de la Figura 1.4, podemos construir tres triangulos rectanguloscon el radiovector A (P ) como hipotenusa de cada uno de ellos. Los angulos que forma el radiovector A (P )con cada uno de los ejes coordenados x, y, z son α, β, γ respectivamente, con lo cual

Ax = |A| cos(α) Ay = |A| cos(β) y Az = |A| cos(γ) ⇒ cos2(α) + cos2(β) + cos2(γ) = 1

pero ademas

uA =A

|A|= cos(α) i + cos(β) j + cos(γ) k .

1.5. Algebra vectorial y coordenadas

Es posible reescribir el algebra vectorial mediante operaciones referidas a las coordenadas, como se mues-tra a continuacion.

1.5.1. Suma y resta de vectores

La suma sera representada por

a + b =(a1i1 + a2i2 + a3i3

)+(b1i1 + b2i2 + b3i3

)=(a1 + b1

)i1 +

(a2 + b2

)i2 +

(a3 + b3

)i3

y obviamente, la resta

a− b =(a1i1 + a2i2 + a3i3

)−(b1i1 + b2i2 + b3i3

)=(a1 − b1

)i1 +

(a2 − b2

)i2 +

(a3 − b3

)i3

con lo cual la distancia entre dos puntos P y M sera

d (P,M) = |(r (P ) = a)− (r (M) = b)| =√

(x1 − y1)2

+ (x2 − y2)2

+ (x3 − y3)2.

Borra

dor Pre

limin

1.5.2. Dependencia e independencia lineal

Ahora es facil estudiar la dependencia o independencia lineal en coordenadas. Otra vez, tres vectores:a = a1i1 + a2i2 + a3i3 ,b = b1i1 + b2i2 + b3i3 y c = c1i1 + c2i2 + c3i3, seran linealmente independientes si secumple que

α a + β b + γ c = 0 ⇒ α = β = γ = 0

Antes de proseguir en forma general, veamos algunos casos particulares

La base canonica: i1 = i ≡ (1, 0, 0) , i2 = j ≡ (0, 1, 0) , i3 = k ≡ (0, 0, 1). Estos vectores son claramentelinealmente independientes y por lo tanto constituyen una base.

Los vectores: e1 = i ≡ (1, 0, 0) , e2 = i + j ≡ (1, 1, 0) , e3 = i + j + k ≡ (1, 1, 1), no son linealmenteindependientes de manera obvia. Por lo tanto, veamos lo siguiente:

α = 0α+ β = 0

α+ β + γ = 0

⇒ α = 0

β = 0γ = 0

con lo cual demostramos que son linealmente independientes y por lo tanto constituyen una base paralos vectores tridimensionales.

En general tendremos que

0 = α(a1i1 + a2i2 + a3i3

)+ β

(b1i1 + b2i2 + b3i3

)+ γ

(c1i1 + c2i2 + c3i3

)

=(αa1 + βb1 + γc1

)i1 +

(αa2 + βb2 + γc2

)i2 +

(αa3 + βb3 + γc3

)i3 ⇒

αa1 + βb1 + γc1 = 0αa2 + βb2 + γc2 = 0αa3 + βb3 + γc3 = 0

Esto no es otra cosa que un sistema de 3 ecuaciones lineales con 3 incognitas α, β, γ y la solucion queestamos buscando α = β = γ = 0 se cumplira si∣∣∣∣∣∣

a1 b1 c1

a2 b2 c2

a3 b3 c3

∣∣∣∣∣∣ = a1(b2c3 − b3c2

)+ a2

(b3c1 − b1c3

)+ a3

(b1c2 − b2c1

)6= 0 .

Ejercicios

1. Dados los vectores

A = i1 + 2i2 + 3i3 , B = 4i1 + 5i2 + 6i3 , C = 3i1 + 2i2 + i3 , D = 6i1 + 5i2 + 4i3

a) Encuentre

A + B + C + D A + B−C−D A−B + C−D −A + B−C + D

b) El angulo entre los vectores A,B,C,D y los vectores base i1, i2, i3.

c) La magnitud de los vectores A,B,C,D.

d) El angulo entre A y B y entre C y D.

e) La proyeccion de A sobre B.

f ) ¿Son los vectores A,B,C,D coplanares?

Borra

dor Pre

limin

1.5.3. Producto escalar

Ahora refrasearemos, en termino de una base de vectores ortogonales, lo expresado en la seccion 1.3.1.Representaremos el producto escalar de dos vectores en una base cartesiana i1, i2, i3, que es una baseortonormal, de la siguiente manera:

a · b =(a1i1 + a2i2 + a3i3

)·(b1i1 + b2i2 + b3i3

)= a1b1 + a2b2 + a3b3

ya que por ser ortogonales se tiene que:

i1 · i1 = i2 · i2 = i3 · i3 = 1 , y

i1 · i2 = i2 · i1 = 0i1 · i3 = i3 · i1 = 0i2 · i3 = i3 · i2 = 0

Las propiedades del producto escalar en coordenadas cartesianas se comprueban facilmente

El producto interno de un vector consigo mismo, siempre es positivo.

ζ = a · a = |a|2 = (a1)2 + (a2)2 + (a3)2 ≥ 0

y(a1)2 + (a2)2 + (a3)2 = 0 ⇒ a1 = a2 = a3 = 0 ⇔ a = 0

Adicionalmente |a| =√ζ =√

a · a =√

(a1)2 + (a2)2 + (a3)2

El producto escalar es conmutativo

ζ = a · b = b · a = a1b1 + a2b2 + a3b3 = b1a1 + b2a2 + b3a3 .

El producto escalar es distributivo:

a · (b + c) =[a1i1 + a2i2 + a3i3

]·[(b1 + c1

)i1 +

(b2 + c2

)i2 +

(b3 + c3

)i2],

por lo tanto:

a1(b1 + c1

)+ a2

(b2 + c2

)+ a3

(b3 + c3

)=(

a1b1 + a1c1)

+(a2b2 + a2c2

)+(a3b3 + a3c3

)=(

a1b1 + a2b2 + a3b3)

+(a1c1 + a2c2 + a3c3

)= a · b + a · c

La multiplicacion por un escalar.

|α| (a · b) = (αa) · b = a · (αb) =(αa1

)b1 +

(αa2

)b2 +

(αa3

)b3 = a1

(αb1)

+ a2(αb2)

+ a3(αb3)

Desigualdad de Cauchy Schwarz.

a · b = a1b1 + a2b2 + a3b3 ≤√

(a1)2 + (a2)2 + (a3)2√

(b1)2 + (b2)2 + (b3)2 = |a| |b|

Diremos que dos vectores, no nulos son ortogonales (perpendiculares) si su producto escalar es nulo.Esta afirmacion es inmediata

a ⊥ b ⇒ θ〈a,b〉 =π

2⇒ a · b = |a| |b| cos(θ)〈a,b〉 = 0 ,

Borra

dor Pre

limin

por lo cual

a1b1 + a2b2 + a3b3 = |a| |b| cos(θ)〈a,b〉 ⇒ cos(θ)〈a,b〉 =a1b1 + a2b2 + a3b3√

(a1)2 + (a2)2 + (a3)2√

(b1)2 + (b2)2 + (b3)2

de donde se deduce que para dos vectores perpendiculares

a⊥b ⇒ 0 = a1b1 + a2b2 + a3b3 .

Del producto escalar surge el Teorema del Coseno. Es inmediato generalizar el producto escalar de unvector consigo mismo, para ello suponemos que c = a + b, con lo cual

c = a + b ⇒ c · c = (a + b) · (a + b) ⇒ |c|2 = |a|2 + |b|2 + 2 |a| |b| cos(θ)〈a,b〉 ,

que no es otra cosa que el teorema del coseno y esta ilustrado en el cuadrante III de la Figura 1.3.

1.5.4. Producto vectorial

De igual manera, lo que aprendimos en la seccion 1.3.2 ahora lo expresamos en terminos de las compo-nentes de los vectores en una base ortonormal de la forma

c = a× b =(a2b3 − a3b2

)i1 +

(a3b1 − a1b3

)i2 +

(a1b2 − a2b1

)i3

lo anterior se puede organizar como el determinante de la matriz

c = a× b =

∣∣∣∣∣∣i1 i2 i3a1 a2 a3

b1 b2 b3

∣∣∣∣∣∣con lo cual

|c| =

√(a2b3 − a3b2)

2+ (a3b1 − a1b3)

2+ (a1b2 − a2b1)

=√

(a1)2 + (a2)2 + (a3)2√

(b1)2 + (b2)2 + (b3)2 sen(θ)〈a,b〉

1.5.5. Triple producto mixto

Finalmente, analicemos el numero (pseudoescalar) que proviene de la multiplicacion

V = c · (a× b) = |c| |a× b| cos(θ)〈c,a×b〉 =

∣∣∣∣∣∣c1 c2 c3

a1 a2 a3

b1 b2 b3

∣∣∣∣∣∣ .Obviamente, este numero representa del volumen del paralelepıpedo cuyos lados quedan definidos por a,by c.

Ejercicios

1. Dados los vectores

A = i1 + 2i2 + 3i3 , B = 4i1 + 5i2 + 6i3 , C = 3i1 + 2i2 + i3 , D = 6i1 + 5i2 + 4i3

Borra

dor Pre

limin

a) Encuentre (A + B) · (C + D)

b) Los productos A×B, B×C, C×D y los angulos que estos forman con D.

c) C · (A×B).

2. Si i1, i2, i3 es una base ortonormal. Diga si los siguientes vectores forman una base

a)e1 = 2i1 + i2 − 3i3 , e2 = i1 − 4i3 , e3 = 4i1 + 3i2 − i3

b)e1 = i1 − 3i2 + 2i3 , e2 = 2i1 − 4i2 − i3 , e3 = 3i1 + 2i2 − i3

1.6. Algebra vectorial con ındices

Antes de comenzar con la presentacion de este esquema de calculo cabe aclarar algunas costumbres yconvenciones con la notacion de ındices.

1.6.1. Convencion de Einstein

1. Los ındices repetidos (arriba y abajo) indicaran suma por los valores que tomen los ındices. Las com-ponentes de los vectores tendran ındices arriba y los vectores base abajo:

a = a1e1 + a2e2 + a3e3 =

3∑m=1

amem ⇔ a = amem = aiei .

2. Los ındices repetidos son mudos (no importa la letra que lo etiquete) y representan suma. Ası

KjAj = KmAm = K1A1 +K2A2 +K3A3 = B .

En este punto del discurso, la posicion de los ındices (arriba y abajo) solo tiene sentido estetico y soloası indican suma. Mas adelante veremos que representan cantidades distintas.

3. Llamaremos contraccion cuando sumamos respecto a un par de ındices, vale decir:∑i

Aii = A11 +A2

2 +A33 =⇒ Aii = A1

1 +A22 +A3

Las cantidades con dos o mas ındices las llamaremos componentes de tensores, son arreglos bidimensio-nales (tridimensionales, tetradimensionales, segun el numero de ındices) y seran considerados en detalleposteriormente. Por ahora, contentemonos con saber que son cantidades con dos ındices. Es claro quela contraccion de ındices convierte un conjunto de numeros (i× j)→ 1, en un solo numero.

4. Los ındices libres (aquellos que no estan sumados) indican el numero de objetos disponibles y debenmantenerse. Por ejemplo:

Kki Ak = Bi ⇔

1A1 +K21A2 +K3

1A3 = B1

K12A1 +K2

2A2 +K32A3 = B2

K11A1 +K2

1A2 +K31A3 = B1

con lo cual Kki Ak = Bi representan 3 ecuaciones. La operacion Kk

i Akj = Bij representan 9.

Borra

dor Pre

limin

5. La delta de Kronecker1 δki lleva un ındice arriba y uno abajo. Representa δki = 1 si i = k y es nula enlos otros casos. Con esto:

Kkij δ

ik = K1

1j δ11︸︷︷︸

+K12j

=0︷︸︸︷δ21 +K1

=0︷︸︸︷δ31 +K2

=0︷︸︸︷δ12 +K2

2j δ22︸︷︷︸

+K23j

=0︷︸︸︷δ32 +K3

=0︷︸︸︷δ13 +K3

=0︷︸︸︷δ23 +K3

3j δ33︸︷︷︸

es decirKkij δ

ik = Kk

kj = Kiij = K1

1j +K22j +K3

3j .

6. Ademas de la delta de Kronecker introduciremos el sımbolo de permutacion de Levi-Civita2 εijk parael caso de tres dimensiones, vale decir i, j, k = 1, 2, 3

εijk = εijk =

+1 cuando (1, 2, 3) ; (3, 1, 2) ; (2, 3, 1) permutacion cıclica−1 cuando (1, 3, 2) ; (3, 2, 1) ; (2, 1, 3) permutacion impar o anticıclica

0 cuando i = j; i = k ∧ j = k

y quiere decir que es distinto de cero cuando todos los ındices son diferentes: 1 si la permutacion deındices es cıclicas (o par) y −1 si la permutacion es anticıclica (o impar). Con ello, si queremos calcularpor ejemplo: ci = εijkajbk, entonces resulta:

c1 = ε111a1b1 + ε112a1b2 + ε113a1b3 + ε121a2b1 + ε122a2b2 + ε123a2b3 + ε131a3b1 + ε132a3b2 + ε133a3b3

c2 = ε211a1b1 + ε212a1b2 + ε213a1b3 + ε221a2b1 + ε222a2b2 + ε223a2b3 + ε231a3b1 + ε232a3b2 + ε233a3b3

c3 = ε311a1b1 + ε312a1b2 + ε313a1b3 + ε321a2b1 + ε322a2b2 + ε323a2b3 + ε331a3b1 + ε332a3b2 + ε333a3b3

con lo cual

ci = εijkajbk ⇒

c1 = ε123a2b3 + ε132a3b2 = a2b3 − a3b2

c2 = ε231a3b1 + ε213a1b3 = a3b1 − a1b3

c3 = ε312a1b2 + ε321a2b1 = a1b2 − a2b1

7. A continuacion enumeramos algunas propiedades de la delta de Kronecker y del sımbolo de permutacionde Levi-Civita, dejamos al lector su demostracion. Ellas son:

δjj = 3 ,

εjkmεilm = δijδ

lk − δikδlj = δijδ

lk − δljδik ,

εjmnεimn = 2δij ,

εijkεijk = 6 .

1.6.2. Los vectores y los ındices

Sumas de vectores

La suma de vectores sera expresada de la siguiente manera

a + b = aiei + biei =(ai + bi

)ei = ciei ⇒ ci = ai + bi con i = 1, 2, 3

1LEOPOLD KRONECKER (7 diciembre 1823 Legnica, Polonia, 29 diciembre 1891, Berlin, Alemania) Matematico polaco conimportantes contribuciones en teorıa de numeros, funciones elıpticas y algebra, ası como la interrelacion entre estas disciplinas.

2TULLIO LEVI-CIVITA (1873 Padova, Veneto, 1941 Roma, Italia) Geometra italiano y uno de los desarrolladores delCalculo Tensorial que mas tarde serıa utilizado por Einstein y Weyl como el lenguaje de la Relatividad General.

Borra

dor Pre

limin

Producto escalar

A partir da ahora y de forma equivalente, expresaremos el producto escalar en termino de los ındices. Deforma y manera que

a · b = |a| |b| cos(θ)ab = aibi con i = 1, 2, 3

Producto vectorial

En terminos de ındices, la componente i del producto vectorial se puede expresar como

(a× b)i

= εijkajbk con i, j, k = 1, 2, 3

todas las particularidades de producto vectorial ahora descansan en las propiedades del sımbolo de LevyCivita.

Triple producto mixto

Analicemos ahora el numero (pseudoescalar) que proviene de la multiplicacion

c · (a× b) = |c| |a× b| cos(θ)〈c,a×b〉 = ciεijk ajbk = εijk c

iajbk =

∣∣∣∣∣∣c1 c2 c3

a1 a2 a3

b1 b2 b3

∣∣∣∣∣∣1.6.3. Un par de calculos ilustrativos

Mostremos dos casos de identidades vectoriales que pueden ser demostradas mediante la utilizacion deındices.

1. a× (b× c) = (c · a) b− (a · b) c

El resultado sera un vector, por lo tanto

(a× (b× c))i

= εijkaj (b× c)k

= εijkajεkmnbmcn = εijkεkmnajb

mcn = εijkεmnkajbmcn

=(δimδ

jn − δjmδin

)ajb

mcn = δimδjnajb

mcn − δjmδinajbmcn

= δimbmδjnajc

n − δincnδjmajbm = biancn︸︷︷︸

(c·a)

− ciajbj︸︷︷︸(a·b)

(a× (b× c))i

= bi (c · a)− ci (a · b) .

2. (a× b) · (c× d) = (a · c) (b · d)− (a · d) (b · c)

Borra

dor Pre

limin

El lado derecho es un escalar, por lo tanto

(a× b) · (c× d) = (a× b)l(c× d)l

= εljkajbk εlmncmdn = εljkεlmn ajbkc

mdn

= εjklεmnl ajbkcmdn =

(δjmδ

kn − δkmδjn

)ajbkc

mdn

= δjmδknajbkc

mdn − δkmδjnajbkcmdn

= δjmajcm︸︷︷︸

(a·c)

δknbkdn︸︷︷︸

(b·d)

− δkmbkcm︸︷︷︸(b·c)

δjnajdn︸︷︷︸

(a·d)

= (a · c) (b · d)− (b · c) (a · d) .

1.6.4. Escalares, pseudoescalares, vectores y pseudovectores

La diferencia entre vectores polares y axiales proviene del siguiente comportamiento bajo transformacionesde coordenadas y bases. Un vector polar (normal, comun y corriente) queda invariante bajo la siguientetransformacion (reflexion)

ei → −eiai → −ai

=⇒ a = aiei →

(−ai

)(−ei) = aiei = a .

Mientras que un pseudovector o vector axial cambia de signo cuando las componentes de los vectores y susvectores base que lo generan tambien lo hacen:

ei → −eiai → −aibi → −bi

=⇒ c = a× b→[εijk (−aj) (−bk)

](−ei) = −ciei = −c

es decir

a× b =(a2b3 − a3b2

)e1 +

(a3b1 − a1b3

)e2 +

(a1b2 − ayb1

)e3 ,

luego de la reflexion:

a× b =[(−a2

) (−b3

)−(−a3

) (−b2

)](−e1) +

[(−a3

) (−b1

)−(−a1

) (−b3

)](−e2)

+[(−a1

) (−b2

)−(−a2

) (−b1

)](−e3)

= −[(a2b3 − a3b2

)e1 +

(a3b1 − a1b3

)e2 +

(a1b2 − a2b1

)e3

]= − (a× b)

Existen varias e importantes cantidades fısicas que vienen representadas por pseudovectores, entre ellasmencionamos:

Velocidad Angular: v = ω × rCantidad de Movimiento Angular: L = r× p

Torque: τ = r× F

Campo de Induccion Magnetica:∂B

∂t= −∇×E

Adicionalmente el volumen, V = c · (a× b), como era de esperarse, no es invariante bajo el cambio delespacio

ci → −ciai → −aibi → −bi

=⇒ V = c · (a× b) = ciεijk ajbk → (−ci)

[εijk (−aj) (−bk)

]= −V ,

Borra

dor Pre

limin

arFigura 1.5: Geometrıa analıtica y vectores cartesianos

el volumen es un pseudoescalar.Mientras que los escalares si son invariantes bajo esta transformacion

ai → −aibi → −bi

=⇒ ζ = a · b = aibi →

(−ai

)(−bi) = ζ .

En general tambien tendremos multiplicacion entre algunos de estos objetos, con lo cual construiremosotros objetos. Dejamos al lector demostrar la siguiente tabla de relaciones

vector · vector = escalarvector · pseudovector = pseudoescalar

pseudovector · pseudovector = escalarvector × vector = pseudovectorvector × pseudovector = vector

pseudovector × pseudovector = pseudovector

1.7. Aplicaciones del algebra vectorial

Uno de los terrenos mas exitosos de las aplicaciones del algebra vectorial es la geometrıa analıtica. Estose realiza en base a la definicion que hicieramos de radio vector, en la cual a cada punto, P, del espacio leasociabamos un radiovector posicion tal y como lo mostramos en el cuadrante I de la Figura 1.4 .

P ←→ (x, y, z) ≡(x1, x2, x3

)⇒ r (P ) = x i + y j + z k = x1i1 + x2i2 + x3i3 = xiii

A partir de esta definicion todas las propiedades geometricas del espacio las podemos construir con vectores.

1.7.1. Rectas y vectores

La ecuacion de la recta en termino de vectores la definiremos fijando uno de sus puntos, digamos:

r (P1) ≡ X (P1) = X1 = x1 i + y1 j + z1 k = x1(1)i1 + x2

(1)i2 + x3(1)i3 ←→ (x1, y1, z1) ,

Borra

dor Pre

limin

y un vector que indique su direccion, digamos A = A1 i +A2 j +A3 k (ver cuadrante I de la Figura 1.5) conlo cual la ecuacion de una recta en lenguaje vectorial sera:

X = X1 + λA ⇒ x1 i + y1 j + z1 k+ λ (A1 i +A2 j +A3 k) ⇒

x = x1 + λA1

y = y1 + λA2

z = z1 + λA3

donde X = x i + y j + z k es el conjunto de puntos genericos que cumple con la ecuacion de la recta en 3D.Si utilizamos la notacion de ındices, las ecuaciones anteriores son mas evidentes:

X = X1 + λA ⇒ xiii = xi(1)ii + λAiii ⇒ xi = xi(1) + λAi para i = 1, 2, 3 .

Notese que efectivamente se cumplen tres ecuaciones escalares y cada una de ellas tiene la forma de unarecta. Ademas, tal y como se muestra la Figura 1.5 el punto generico (x, y, z) lo describe (sobre la recta) lavariacion del modulo de A mediante la constante de proporcionalidad λ. Si se requiere describir una rectaque pase por dos puntos: (x1, y1, z1) y (x2, y2, z2) entonces una vez seleccionado uno de los puntos (digamos(x1, y1, z1)) seleccionamos el vector A = r (P2) − r (P1) como la resta de los dos radiovectores a los puntosP2 y P1. Esto es

X = X1 + λ (X2 −X1) ⇒ X =X1 + δX2

1− δ, con δ =

X1 −X

X2 −X.

Aquı la division entre vectores δ tiene sentido porque no es una division entre vectores genericos es una divi-sion entre vectores que tienen la misma direccion Notese ademas que, lo mismo ocurre cuando “despejamos”λ de la ecuacion de la recta

λ =X−X1

A⇒ xi = xi(1) + λAi ⇒ λ =

xi − xi(1)

Ai=x− x1

Ax=y − y1

Ay=z − z1

y equivalentemente ocurre cuando “despejamos” λ de la ecuacion de la recta que pasa por dos puntos.

λ =X−X1

X2 −X1⇒ xi = xi(1) + λ

(xi(2) − x

i(1)

)⇒ λ =

xi − xi(1)

xi(2) − xi(1)

=x− x1

x2 − x1=

y − y1

y2 − y1=

z − z1

z2 − z1

1.7.2. Planos y vectores

Ocurre exactamente lo mismo cuando construimos la ecuacion vectorial para un plano. En general unasuperficie la define su vector normal (perpendicular). En el caso de una superficie plana (un plano) tendrauna unica normal que lo define, por lo tanto, un plano vendra definido por su vector perpendicular en un

punto, digamos P1 : (x1, y1, z1). La ecuacion vectorial del plano vendra definida por todos los vectores−−→PQ

tales que sean perpendiculares a un determinado vector A (ver cuadrante II de la Figura 1.5). Donde el puntoP es un punto generico (x, y, z) que define un radiovector. La ecuacion vectorial del plano sera simplemente

A ·

r (P )− r (P1)︸︷︷︸B

= 0 ⇔ A · (r− r1) = 0 ⇔ A · r = A · r1︸︷︷︸b

Borra

dor Pre

limin

Esto es, se tiene que cumplir la condicion

(A1 i +A2 j +A3 k) · [(x i + y j + z k)− (x1 i + y1 j + z1 k)] = 0

(A1 i +A2 j +A3 k) · [(x− x1) i + (y − y1) j + (z − z1) k] = 0

A1 (x− x1) +A2 (y − y1) +A3 (z − z1) = 0

con lo cual la ecuacion del plano queda como siempre la hemos conocido

A1x+A2y +A3z −A1x1 −A2y1 −A3z1 = 0 ⇒ A1x+A2y +A3z = b = A1x1 +A2y1 +A3z1

es decir, de manera mas compacta

Aixi −Ajxj1 = 0 ⇒ Akxk = b = Alx

Es claro que A · r1 = b es la proyeccion del radiovector r (P1) sobre la perpendicular que define al plano. Porlo tanto sera la distancia entre el plano y el origen de coordenadas. Si b = 0 el plano pasa por el origen decoordenadas.

Consideremos ahora el cuadrante III de la Figura 1.5. Allı estan especificados tres puntos en el espaciocaracterizados por sus correspondientes radiovectores posicion: r (P1) = r1, r (P2) = r2 y r (P3) = r3. Estostres puntos seran coplanares si

(r1 − r2) · [(r2 − r3)× (r3 − r1)] = 0 ⇔ εmnl (xm1 − xm2 ) (xn2 − xn3 )

(xl3 − xl1

)= 0

y la ecuacion del plano vendra dada por

(r− r1) · [(r2 − r1)× (r3 − r1)] = 0 .

Ejercicios

1. Verifique las siguientes identidades

a)A× (B×C) + B× (C×A) + C× (A×B) = 0

(A×B) · (C×D) =

∣∣∣∣∣∣A ·C A ·D

B ·C B ·D

∣∣∣∣∣∣c)

(A×B)× (C×D) = B[A · (C×D)]−A[B · (C×D)]

d)(A×B) · (C×D) + (B×C) · (A×D) + (C×A) · (B×D) = 0

2. Dada la siguiente basee1 = −4i1 + 2i2 , e2 = 3i1 + 3i2 , e3 = 2i3

Encuentre las componentes covariantes y contravariantes de un vector que va del origen al puntoP = (1, 1, 1).

Borra

dor Pre

limin

Figura 1.6: Vectores variables

1.8. Un comienzo a la derivacion e integracion de vectores

1.8.1. Vectores variables

Los vectores podran ser constantes o variables. Ahora bien, esta caracterıstica se verificara tanto en lascomponentes como en la base. Esto quiere decir que cuando un vector es variable podran variar su modulo,su direccion, su sentido, o todo junto o por separado. Obviamente esta variabilidad del vector dependera dela base en la cual se exprese, por lo cual un vector podra tener una componente constante en una base y noconstante en otra, vale decir

A (t) = Ak (t) ek (t) = Ak′ek′ (t) .

Notese que hemos utilizado una base ek (t) de vectores variables a diferencia de la tradicional base devectores cartesianos, los cuales son constantes en modulo, direccion y sentido (ver los cuadrantes I y II dela Figura 1.6). Mas aun, tal y como se muestra en cuadrante II de la Figura 1.6, todo vector variable podraser expresado como la suma de uno variable, a (t) , mas otro constante c

A (t) = a (t) + c .

1.8.2. Derivacion

De esta manera, cuando uno piensa en un vector variable A (t) uno rapidamente intenta establecer uncociente incremental:

lım∆t→0

A (t+ ∆t)−A (t)

∆t= lım

∆t→0

∆A (t)

∆t=

dA (t)

Borra

dor Pre

limin

el cuadrante IV de la Figura 1.6 ilustra graficamente este cociente incremental.Como siempre, las propiedades de esta operacion derivacion seran

dt[A (t) + B (t)] =

dtA (t) +

dtB (t) , (1.1)

dt[α (t) A (t)] =

dtα (t)

]A + α (t)

dtA (t)

], (1.2)

dt[A (t) ·B (t)] =

dtA (t)

]B + A (t)

dtB (t)

], (1.3)

dt[A (t)×B (t)] =

dtA (t)

]×B + A (t)×

dtB (t)

]. (1.4)

Ahora bien, esto implica que

A (t) = Ak (t) ek (t) ⇒ dA (t)

dt=

d[Ak (t) ek (t)

]dt

=dAk (t)

dtek (t) +Ak (t)

dek (t)

con lo cual hay que tener cuidado al derivar vectores y cerciorarse de la dependencia funcional de la basey componentes. Habra sistemas de coordenadas (bases de vectores) que seran constantes y otros en loscuales sus vectores bases cambiaran en su direccion. El primer termino de la ultima ecuacion representa lavariacion del modulo, y el segundo muestra la contribucion de los cambios en direccion del vector. Mas aun,mostraremos apoyandonos en la ilustracion de el cuadrante III de la Figura 1.6 que, independientementedel sistema de coordenada, el cambio en el modulo apunta en la direccion del vector, mientras que lascontribuciones en direccion apuntan en la direccion perpendicular al vector. Esto es:

dA (t)

dt=

d |A (t)|dt

u‖ + |A (t)| u⊥ , con u‖ · u⊥ = 0 .

Es facil convencernos de la forma del primer termino. Siempre podemos representar un vector como sumodulo y un vector unitario en la direccion apropiada. Esto es

A (t) = |A (t)| u(t) =⇒ dA (t)

dt=

d [|A (t)| u (t)]

dt=

d |A (t)|dt

u (t) + |A (t)| du (t)

dt,

adicionalmente: |A (t)|2 = A (t) ·A (t), por lo tanto

d[|A (t)|2

]dt

≡ d [A (t) ·A (t)]

dt= 2 |A (t)| d |A (t)|

dt≡ 2A (t) · dA (t)

dt,

con lo cual, al despejar de esta ultima ecuacion

d |A (t)|dt

≡ A (t)

|A (t)|︸︷︷︸u(t)

· dA (t)

dt= u (t) · dA (t)

dt,

para que finalmente

u (t) · dA (t)

dt= u (t) ·

[d |A (t)|

dtu (t) + |A (t)| du (t)

]⇒

u (t) · dA (t)

dt=

d |A (t)|dt

u (t) · du (t)

dt= 0

Borra

dor Pre

limin

Es decir que el cambio en el modulo de un vector se manifiesta en la direccion del mismo vector, tal ycomo era intuitivo suponer. Adicionalmente, vemos que el vector siempre sera perpendicular a su derivada.Graficamente podemos apreciarlo en el cuadrante IV de la Figura 1.6 , pero tambien surge analıticamente siderivamos el vector unitario en la direccion de A (t)

d [u (t) · u (t)]

dt≡

d(|u (t)|2

)dt

=d (1)

dt≡ 0 = u (t) · du (t)

dt⇒ u (t) ⊥ du (t)

dt,

es decir

dA (t)

dt=

d [|A (t)| u (t)]

dt=

d |A (t)|dt

u (t) + |A (t)| du (t)

dt=

d |A (t)|dt

u‖ + |A (t)| u⊥ .

Supongamos que ahora definimos un vector

∆θ = ∆θ v con

v ⊥ u‖

v ⊥ u⊥

⇒

v × u‖ = u⊥

u⊥ × v = u‖

u‖ × u⊥ = v

donde ∆θ es el angulo de rotacion del vector A (t) (ver cuadrante V de la Figura 1.6). Claramente

∆A⊥ = [A (t+ ∆t) sen (∆θ)] u⊥ ≈ [A (t+ ∆t) ∆θ] u⊥ ⇒ ∆A⊥ = ∆θ ×A (t) ,

entonces

∆A⊥∆t

≡[

∆A

∆t·A⊥

]A⊥ =

∆θ

∆t×A (t) ⇒

[dA (t)

dt· u⊥

]u⊥ =

dθ (t)

dtv ×A (t) = ω ×A (t) ,

donde hemos identificado ω = dθ(t)dt v. Podemos ir mas alla observando el cuadrante V de la Figura 1.6,

vemos que si suponemos que el modulo del vector es constante, entonces

d |A (t)|dt

= 0 ⇒ dA (t)

dt= |A (t)| u⊥ ⇒

[dA (t)

dt· u⊥

]u⊥ = ω ×A (t) .

1.8.3. Velocidades y aceleraciones

El radio vector posicion de una partıcula genera los vectores velocidad y aceleracion

r = r (t) ⇒ v (t) =dr (t)

dt⇒ a (t) =

dv (t)

dt=

d2r (t)

dt2,

ahora bienr = rur = xi + yj + zk , con ur = cos(θ) i + sen(θ) j .

Si suponemos que la partıcula describe una trayectoria entonces

r = r (t)

θ = θ (t)

⇐⇒

x = x (t)y = y (t)z = z (t)

; ur = ur (t) ;i = constj = constk = const

Borra

dor Pre

limin

Es muy comun denotar a la derivada temporal sobre funciones de una variable con un punto, es decir,podemos utilizar la siguiente notacion

g(t) ≡ dg (t)

dt,

con lo cual

durdt

=d [cos(θ (t))i + sen(θ (t))j]

dt= − sen(θ (t)) θ(t)i + cos(θ (t))θ(t)j

durdt

= θ(t)[− sen(θ (t))i + cos(θ (t))j]︸︷︷︸uθ

= θ(t)uθ ,

ya que

|ur| =√

ur · ur =√

[cos(θ (t)) i + sen(θ (t)) j] · [cos(θ (t)) i + sen(θ (t)) j] = 1

|uθ| =√

uθ · uθ =√

[− sen(θ (t)) i + cos(θ (t)) j] · [− (sen(θ (t)))i + cos(θ (t))j] = 1 ,

yuθ · ur = ur · uθ = [− sen(θ (t)) i + cos(θ (t)) j] · [cos(θ (t)) i + sen(θ (t)) j] = 0 .

Mas aun

duθdt

=d [−sen(θ (t)) i + cos(θ (t)) j]

dt= − cos(θ (t)) i− sen(θ (t)) j = −θ(t)ur .

Para una partıcula que sigue un movimiento generico, su trayectoria vendra descrita en coordenadascartesianas por:

r = x (t) i + y (t) j + z (t) k ,

su velocidad sera

v (t) =dr (t)

dt=

d [x (t) i + y (t) j + z (t) k]

dt= x(t)i + y(t)j + z(t)k = vx (t) i + vy (t) j + vz (t) k ,

y la aceleraciona (t) = vx(t)i + vy(t)j + vz(t)k = ax (t) i + ay (t) j + az (t) k .

Mientras que en coordenadas polares sera

r (t) = r (t) ur (t) ⇒ v (t) =d [r (t) ur (t)]

dt= r(t)ur (t) + r (t)

dur (t)

dt,

con lo cual la velocidad vendra dada por

v (t) = vr (t) ur (t) + r (t) θ(t)uθ (t) ,

Borra

dor Pre

limin

y la aceleracion

a (t) =dv (t)

dt=

d[vr (t) ur (t) + r (t) θ(t)uθ (t)

]dt

=d [vr (t) ur (t)]

dt+

d[r (t) θ(t)uθ (t)

]dt

= r(t)ur (t) + r(t)dur (t)

dt+ r(t)θ(t)uθ (t) + r (t) θ(t)uθ (t) + r (t) θ(t)

duθ (t)

r(t)− r (t)

(θ(t)

ur (t) +

2 r(t)θ(t) + r (t) θ(t)

uθ (t) .

Claramente para el caso de un movimiento circular

r = R = const ⇒ dR

dt= 0 ⇒

r (t) = R ur (t)

v (t) = R θ(t)uθ

a (t) = −R θ(t)2ur (t) +R θ(t)uθ (t)

De aquı podemos ver claramente que el vector velocidad v (t) y el vector posicion r (t) son ortogonales. Lavelocidad, v (t) , siempre es tangente a la trayectoria r (t) y en este caso la trayectoria es una circunferencia.

En general el vector

rmed =∑i

∆ r (ti) =∑i

(r (ti + ∆ti)− r (ti)) ⇒ lım∆t→0

∑i

∆ r (ti) =

∫dr (t) = r (t) ,

es decir dr (t) = lım∆t→0

∑i ∆ r (ti) es tangente a la trayectoria. Es claro que

dr (t) = d [x (t) i + y (t) j + z (t) k] ≡ dx (t)

dti +

dy (t)

dtj +

dz (t)

dtk .

Tal y como mencionamos arriba, para el sistema de coordenadas cartesiano podemos definir un vector(en este caso) velocidad angular ω tal que:

|ω|× ur = uv

uv ×ω

|ω|= ur

ur × uv =ω

|ω|

⇒ v (t) = ω × r (t)

Supongamos por simplicidad que elegimos el sistema de coordenadas cartesiano, donde r esta en elplano x, y. En este caso es inmediato comprobar que vi = εijkωjxk, y dado que r y v tienen unicamentecomponentes 1 y 2 entonces, necesariamente ω tiene unicamente componente 3, Es decir

r = riei

v = viei

⇒

v1 = ε1j2ωjx2

v2 = ε2j1ωjx1

⇒ ω = |ω| e3 = ωk ,

Borra

dor Pre

limin

comor = x (t) i + y (t) j ,

entonces

v (t) =dr (t)

dt= vx (t) i + vy (t) j = ω × r (t) = θ(t)k× [x (t) i + y (t) j] ,

se vera mas claro en coordenadas polares, esto es

v (t) =dr (t)

dt=r (t) θ(t)uθ (t) = [|ω| un (t)]× [r (t) ur (t)] , |r (t)| = const

=r (t) θ(t)︸︷︷︸v⊥

uθ (t) = |ω| r (t) uθ (t) ⇒ θ(t) ≡ |ω| .

1.8.4. Vectores y funciones

Antes de continuar con la integracion repensemos algunas funciones de tipo φ (x, y, z) y V (x, y, z). Estasfunciones son sin duda funciones de varias variables:

φ = φ (x, y, z) ,

V = V (x, y, z) = iVx (x, y, z) + jVy (x, y, z) + kVz (x, y, z) .

Un par de reflexiones se pueden hacer en este punto, primeramente, dado que hemos relacionado un puntodel espacio con un radio vector posicion, entonces

P(x,y,z) ↔ (x, y, z)↔ r = x i + y j + z k ⇒

φ = φ (x, y, z) ≡ φ (r)

V = V (x, y, z) ≡ V (r)

La primera funcion, φ (r) sera una funcion escalar de argumento vectorial o, simplemente un campo escalary la segunda se conoce como una funcion vectorial de argumento vectorial o campo vectorial. Como hemosdicho, este tipo de funciones y las operaciones que pueden ser realizadas con ellas, y su significado, serananalizadas en detalle mas adelante durante el desarrollo de este curso.

En segundo lugar, siempre podremos parametrizar las coordenadas y tendremos

φ = φ (t) = φ (x (t) , y (t) , z (t)) ,

V = V (t) = V (x (t) , y (t) , z (t)) = Vx (x (t) , y (t) , z (t)) i + Vy (x (t) , y (t) , z (t)) j + Vz (x (t) , y (t) , z (t)) k .

Este caso lo hemos encontrado en montones de situaciones, por ejemplo, el movimiento parabolico vienedescrito por vectores velocidad y posicion dados por:

v(t) = −gt k + v0 = −gt k + (v0xi + v0yj + v0zk) ⇒

vx = v0x

vy = v0y

vz = v0z − gt

r(t) = −g2t2 k + v0t = −g

2t2 k + (v0xi + v0yj + v0zk) t ⇒

x = v0xty = v0ytz = v0zt− g

2 t2

Borra

dor Pre

limin

Derivada de funciones φ (r (t))

Al derivar una funcion de argumento vectorial tambien se aplica la “regla de la cadena”. Esto es, si

φ (r (t)) = g (x (t) , y (t) , z (t))

entonces:

dφ (r (t))

dt=∂φ (x (t) , y (t) , z (t))

∂x

dx (t)

dt+∂φ (x (t) , y (t) , z (t))

∂y

dy (t)

dt+∂φ (x (t) , y (t) , z (t))

∂z

dz (t)

[∂ (x, y, z)

∂xi +

∂φ (x, y, z)

∂yj+∂φ (x, y, z)

∂zk

]·[

dx (t)

dti +

dy (t)

dtj +

dz (t)

dtk

]

= ∇φ (x (t) , y (t) , z (t)) · dr (t)

dt,

donde hemos representado

∇φ (r (t)) =∂φ (x, y, z)

∂xi +

∂φ (x, y, z)

∂yj +

∂φ (x, y, z)

∂zk = ∂iφ (x, y, z) ei = φ,i (x, y, z) ii ,

y lo llamaremos el gradiente de la funcion φ (r (t)).El gradiente de un campo escalar es uno de los objetos mas utiles que encontraremos en el estudio de

problemas de fısica-matematica, el cual lo utilizaremos por ahora de manera operacional. Es bueno recordarque emerge como consecuencia de una derivacion contra un parametro. El gradiente mide el cambio de lafuncion φ (x, y, z).

La idea de gradiente nos lleva a considerar a ∇ como un operador vectorial que actua sobre la funcionescalar de variable vectorial φ (r (t)). Es decir, y con un poquito de imaginacion

∇φ (r (t)) ≡(∂

∂xi +

∂

∂yj+

∂

∂zk

)φ (x, y, z) =

(ii∂

i)φ (x, y, z)

⇓

∇ () =

(∂ ()∂x

i +∂ ()∂y

j+∂ ()∂z

)= ii∂

i () .

Derivada de funciones V (r (t))

De modo que inspirados en la regla de la cadena de una funcion escalar de variable vectorial podemoscomprobar que

dt=

dVx (x, y, z)

dti +

dVy (x, y, z)

dtj +

dVz (x, y, z)

dtk =

dV i (x, y, z)

dtii

por consiguiente, si V, tiene por componentes cartesianas (Vx, Vy, Vz) las componentes del vector derivado

seran(

dVxdt ,

dVydt ,

dVzdt

). Con lo cual cada componente

d(V i (x (t) , y (t) , z (t))

)dt

=d(V i(xj (t)

))dt

=∂(V i(xj))

∂xkdxk (t)

dt=

(dr (t)

dt·∇)V i (x, y, z) ,

Borra

dor Pre

limin

en terminos vectoriales

dt=

(dr (t)

dt·∇)

V ≡ (v ·∇) V ⇒ d ()dt

= (v ·∇) () ≡ vi∂i () ,

con v la derivada del radiovector posicion r (t), es decir, la velocidad. Entonces, estamos viendo que el cambiodel vector V respecto al tiempo es el cambio de sus componentes en la direccion de la velocidad.

Si se nos ocurre calcular la derivada del vector velocidad para encontrar la aceleracion tendremos quenos quedara expresada como

a =dv

dt= (v ·∇) v ⇒ ai = (v ·∇) vi ,

donde las componentes cartesianas de los vectores velocidad y aceleracion son: vi = vi (x (t) , y (t) , z (t)) yai = ai (x (t) , y (t) , z (t)), respectivamente.

1.8.5. El vector gradiente

El operador vectorial ∇ () merece un poco de atencion en este nivel. Tal y como hemos visto

∇φ (x, y, z) =∂φ (x, y, z)

∂xi +

∂φ (x, y, z)

∂yj +

∂φ (x, y, z)

∂zk ,

= ∂1φ (x, y, z) i1 + ∂2φ (x, y, z) i2 + ∂3φ (x, y, z) i3 .

Con el operador nabla ∇ () realizaremos operaciones igual como con un vector comun y corriente. Asıen el caso de ∇×E, que se denomina rotor de E, este viene definido por

∇×E =

(∂

∂xi +

∂

∂yj +

∂

∂zk

)× (Exi + Eyj + Ezk)

(∂Ez∂y− ∂Ey

∂z

)i +

(∂Ex∂z− ∂Ez

∂x

)j +

(∂Ey∂x− ∂Ez

∂y

)k = εijk∂jEk ii .

Tambien podemos hablar del “producto escalar” de nabla por un vector a. A esta operacion la llamaremosdivergencia de a:

∇ · a =∂ai

(xj)

∂xi≡ ∂iai

(xj)≡ ∂ax (x, y, z)

∂x+∂ay (x, y, z)

∂y+∂az (x, y, z)

∂z,

pero por ahora consideremos nabla ∇ como un vector.De este modo habra una gran cantidad de relaciones vectoriales que involucran a ∇, las cuales se podran

demostrar. Veamos algunos ejemplos.

1. ∇ (a · b) = (a ·∇) b + (b ·∇) a + a× (∇× b) + b× (∇× a)El resultado es un gradiente, es decir un vector. El lado izquierdo sera

(∇ (a · b))i

= ∂i (a · b) = ∂i(ajb

=(∂iaj

)bj +

(∂ibj

)aj

Borra

dor Pre

limin

mientras que el lado derecho

(∇ (a · b))i

=(aj∂

j)bi +

(bj∂

j)ai + εijkaj

(~∇× b

+ εijkbj (∇× a)k

=(aj∂

j)bi +

(bj∂

j)ai + εijkajεkmn∂

mbn + εijkbjεkmn∂man

=(aj∂

j)bi +

(bj∂

j)ai + εijkεmnkaj∂

mbn + εijkεmnkbj∂man

=(aj∂

j)bi +

(bj∂

j)ai +

(δimδ

jn − δjmδin

)aj∂

mbn +(δimδ

jn − δjmδin

)bj∂

man

= aj∂jbi + bj∂

jai + δimδjnaj∂

mbn − δjmδinaj∂mbn + δimδjnbj∂

man − δjmδinbj∂man

= aj∂jbi + bj∂

jai + an∂ibn − am∂mbi + bn∂

ian − bm∂mai

= aj∂jbi − am∂mbi︸︷︷︸

+ bj∂jai − bm∂mai︸︷︷︸

+ an∂ibn + bn∂

ian

= an∂ibn + bn∂

ian = ∂i(ajb

= ∂i (a · b) .

2. ∇× (a ·∇) a = (∇ · a) (∇× a)− [∇ · (∇× a)] a + (a ·∇) (∇× a)− [(∇× a) ·∇] a

Iniciamos la traduccion a ındices por el lado izquierdo de la ecuacion, ası

∇× (a ·∇) a = εijk∂j (am∂m) ak = εijk (∂jam) ∂mak + εijkam∂j∂

mak

= εijk (∂jam) ∂mak + am∂m(εijk∂jak

el lado derecho lo traduciremos termino por termino

(∇ · a) (∇× a) = (∂mam)(εijk∂jak

)− [∇ · (∇× a)] a = −

[∂mε

mjk∂jak]ai = −

[εmjk∂m∂jak

]ai = 0

(a ·∇) (∇× a) = am∂m(εijk∂jak

)− [(∇× a) ·∇] a = −

[(εmjk∂jak

)∂m]ai .

El segundo termino se anula por cuanto εmjk es antisimetrico respecto a los ındices m, j mientras que∂m∂j es simetrico. El tercer termino del desarrollo del lado derecho corresponde con el segundo deldesarrollo del lado izquierdo. Por lo tanto, llegamos a la siguiente igualdad

εijk (∂jam) ∂mak = (∂mam)(εijk∂jak

)−[(εmjk∂jak

)∂m]ai

Para verificar la igualdad tendremos que evaluar componente a componente. Esto es, para el ladoizquierdo:

ε1jk (∂jam) ∂mak = ε123 (∂2am) ∂ma3 + ε132 (∂3am) ∂ma2

= (∂2am) ∂ma3 − (∂3am) ∂ma2

= (∂2a1) ∂1a3 + (∂2a2) ∂2a3 + (∂2a3) ∂3a3 − (∂3a1) ∂1a2 − (∂3a2) ∂2a2 − (∂3a3) ∂3a2 ,

mientras que para el primer termino del lado derecho

(∂mam)(ε1jk∂jak

)= (∂mam)

(ε123∂2a3

)+ (∂mam)

(ε132∂3a2

)= ∂2a3∂

1a1︸︷︷︸α

+ ∂2a3∂2a2 + ∂2a3∂

3a3 − ∂3a2∂1a1︸︷︷︸

− ∂3a2∂2a2 − ∂3a2∂

3a3 ,

Borra

dor Pre

limin

y el segundo termino se escribe como

−[(εmjk∂jak

)∂m]ai = −

(ε1jk∂jak

)∂1a

1 −(ε2jk∂jak

)∂2a

1 −(ε3jk∂jak

)∂3a

= − (∂2a3 − ∂3a2) ∂1a1 − (∂3a1 − ∂1a3) ∂2a

1 − (∂1a2 − ∂2a1) ∂3a1

= ∂3a2∂1a1︸︷︷︸

− ∂2a3∂1a1︸︷︷︸

+ ∂1a3∂2a1 − ∂3a1∂2a

1︸︷︷︸γ

+ ∂2a1∂3a1︸︷︷︸

− ∂1a2∂3a1 .

Al sumar ambos terminos se eliminan los sumandos indicados con letras griegas, y queda como

(∂mam)(ε1jk∂jak

)−[(εmjk∂jak

)∂m]ai = ∂2a3∂2a2

Ξ+ ∂2a3∂3a3

−∂3a2∂2a2Ω

−∂2a2∂3a3Ψ

+ ∂1a3∂2a1Λ

−∂1a2∂3a1Σ

y al compararlo con el desarrollo del lado derecho e identificar termino a termino queda demostrada laigualdad

ε1jk (∂jam) ∂mak = (∂2a1) ∂1a3Λ

+ (∂2a2) ∂2a3Ξ

+ (∂2a3) ∂3a3Υ

− (∂3a1) ∂1a2Σ

− (∂3a2) ∂2a2Ω

− (∂3a3) ∂3a2Ψ

De igual manera se procede con i = 2 e i = 3.

Ejercicios

1. Demuestred

dt[A · (B×C)] =

dt· (B×C) + A ·

(dB

dt×C

)+ A ·

(B× dC

)2. Demuestre

[A ·

(dA

dt× d2A

dt2

)]= A ·

(dA

dt× d3A

dt3

)3. Demuestre que

∇× (∇×A) = ∇∇ ·A−∇ ·∇A

4. Demuestre que∇× (φ∇φ) = 0

5. Muestre que∇× [A× (∇×A)] = 0

si A = (y, z)i.

Borra

dor Pre

limin

1.8.6. Integracion

Despues de haber diferenciado campos escalares y vectoriales, el siguiente paso es integrarlos. Encontra-remos algunos objetos vectoriales a integrar y seran:∫

V (u) du → integracion de un vector por un escalar

∫c

φ (x, y, z) dr → integracion de un escalar a lo largo de un vector

∫c

V (x, y, z) · dr → integracion de un vector a lo largo de otro vector

∫c

V (x, y, z)× dr → integracion de un vector por otro vector .

El primero de los casos es el tipo de integral que siempre hemos utilizado para encontrar la posicion apartir de la velocidad. Los siguientes tres casos se conocen con el nombre de integrales de lınea por cuantoes importante la “ruta” o trayectoria que sigamos al integrar. Esto aparece indicado por la letra C en laintegral y sera evidente mas adelante. En general la integral de lınea dependera de la trayectoria.

Un vector por un escalar

El primer caso de este tipo integrales es el trivial que siempre hemos utilizado:∫V (u) du = i

∫Vx (u) du+ j

∫Vy (u) du+ k

∫Vz (u) du =

(∫V i (u) du

)ii .

La integral de un vector (en un sistema de coordenadas cartesianas) por un escalar se convierte en la sumade tres integrales, cada una a lo largo de las componentes cartesianas del vector.

Ası integramos la aceleracion de un movimiento parabolico

dt= a = −g k ⇒ v =

∫a dt = k

∫−g dt = −k gt + v0 = −k gt + iv0x + jv0y + k .v0z

Ahora bien, existen sutilezas en este caso que debemos tener en cuenta. Por ejemplo, considere la integral∫dt

(a× d2a

dt2

∫dt

(a× da

)− da

dt× da

∫dt

(a× da

)= a× da

dt+ c .

Pero en general los casos quedan resueltos integrando componente a componente con la ayuda de la notacionde ındices ∫

dt (a× b) =

[∫dt(εijkajbk

)]ii .

Tal vez, uno de los problemas que ilustra mejor esta situacion es el movimiento bajo fuerzas centrales.La Ley de Gravitacion de Newton nos dice que∑

F = m a ⇒ mGM

r2mM

ur = mdv

dt⇒ dv

dt=GM

r2mM

ur .

Borra

dor Pre

limin

Es costumbre definir la velocidad aerolar, va, como el area barrida por el radio vector posicion, r (t) quedescribe la trayectoria de la partıcula

2va = r× dr

dt= r ur ×

d (r ur)

dt= rur ×

(dr

dtur + r

durdt

)= r ur × r

durdt

= r2ur ×durdt

Notese que si c es un vector constante

(ur ×

durdt

)= 0 ⇒ ur ×

durdt

= c ⇒ 2va = r2ur ×durdt

= const ,

con lo cual

dt(v × va) =

dt× va =

r2mM

ur × va =MG

ur ×

(ur ×

durdt

)

dt(v × va) =

(ur ·

durdt

)ur − (ur · ur)

durdt

=MG

durdt

integrando

v × va =MG

2ur + p

donde p es un vector arbitrario de constante de integracion. Finalmente nos damos cuenta que

r · (v × va) = r ur ·(MG

2ur + p

)=MG

2r + rp cos(θ)

= εijkrivjvak ≡ va · (r× v) = va · va = v2a

y entonces

v2a =

2r + rp cos θ ⇒ r =

v2a

MG2 + p cos(θ)

≡2v2aMG

1 + 2pMG cos(θ)

que constituye la ecuacion de una conica.

Un escalar a lo largo de un vector∫Cφ (r) dr

El segundo objeto que “tropezaremos” es la integracion de funciones de varias variables a lo largo de unacurva determinada. Esto es∫C

φ (x, y, z) dr =

∫C

φ (x, y, z) (dx i + dy j + dz k) = i

∫C

φ (x, y, z) dx+j

∫C

φ (x, y, z) dy+k

∫C

φ (x, y, z) dz .

La integral se nos ha convertido en tres integrales, las cuales son ahora componentes de un vector. Estoes posible dado que la base (i, j,k) es una base constante. Ahora bien, cada una de estas integrales soninterdependientes, dado que hay que seguir la misma curva C. Consideremos el caso bidimensional que esmas simple y contiene toda la riqueza conceptual del tridimensional.

Por ejemplo:

φ (x, y) = 3x2 + 2y ⇒∫ (1,2)

(0,0)

(3x2 + 2y

)dr = i

∫ (1,2)

(0,0)

(3x2 + 2y

)dx+ j

∫ (1,2)

(0,0)

(3x2 + 2y

)dy

Borra

dor Pre

limin

Se requiere especificar la curva C a lo largo de la cual integraremos desde el punto P1 → (0, 0) al puntoP2 → (1, 2). Si recorremos la ruta C1: (0, 0)→ (1, 0)→ (1, 2) tendremos que

(0, 0)→ (1, 0) ⇒ y = cte = 0 ⇒∫ (1,0)

(0,0)

(3x2 + 2y

)dr = i

∫ (1,0)

(0,0)

(3x2 + 2y

)dx = i

∫ 1

(3x2)

dx = i

(1, 0)→ (1, 2) ⇒ x = cte = 1 ⇒∫ (1,0)

(0,0)

(3x2 + 2y

)dr = j

∫ (1,2)

(0,0)

(3x2 + 2y

)dy = j

∫ 2

(3 + 2y) dy = 10j

con lo cual

C1 ←→ (0, 0)→−−−−−→

CA1

(1, 0)→ (1, 2)−−−−−→

CB1

⇒∫ (1,2)

(0,0)

(3x2 + 2y

)dr = i + 10j

Si hubieramos seleccionado la recta que une a estos dos puntos como la curva C2 entonces

C2 : y = 2x ⇒ dy = 2dx ,

entonces ∫ (1,2)

(0,0)

(3x2 + 2y

)dr = i

∫ (1,2)

(0,0)

(3x2 + 2y

)dx+ j

∫ (1,2)

(0,0)

(3x2 + 2y

)dy

= i

∫ 1

(3x2 + 2 (2x)

)dx+ j

∫ 1

(3x2 + 2 (2x)

)2dx = 3i + 6j

En general la curva C se parametrizara y las integrales en varias variables se convertiran en integrales alo largo del parametro que caracteriza la curva

C ←→ x = x (τ) , y = y (τ) , z = z (τ)

Por lo tanto:∫C

φ (x, y, z) dr =

∫C

φ (x (τ) , y (τ) , z (τ))

(∂x (τ)

∂τdτ i +

∂y (τ)

∂τdτ j +

∂z (τ)

∂τdτ k

)= i

∫C

φ (x (τ) , y (τ) , z (τ))∂x (τ)

∂τdτ + j

∫C

φ (x (τ) , y (τ) , z (τ))∂y (τ)

∂τdτ

+ k

∫C

φ (x (τ) , y (τ) , z (τ))∂z (τ)

∂τdτ .

Las parametrizaciones para las curvas anteriores son muy simples

CA1 =

x = τ

y = 0; CB1 =

x = 2

y = τ; C2 =

x = τ

y = 2τ

Un vector a lo largo de otro vector∫C

F (r) · dr

Quiza la integral de lınea mas conocida sea una del tipo∫C

F (r) ·dr por cuanto nos la hemos “tropezado”en el calculo del trabajo que realiza una fuerza. Todo lo que hemos considerado al parametrizar la curva enel caso anterior, sigue siendo valido.∫

F (r) · dr =

∫C

Fx (x, y, z) dx+

∫C

Fy (x, y, z) dy +

∫C

Fz (x, y, z) dz =

∫C

F i(xj)

dxi

Borra

dor Pre

limin

Por lo cual, si consideramosF (r) =

(3x2 + 2xy3

)i + 6xy j ,

entonces ∫ (1, 34√

(0,0)

F (r) · dr =

∫ (1, 34√

(0,0)

((3x2 + 2xy3

)i + 6xy j

)(dx i + dy j)

∫ (1, 34√

(0,0)

(3x2 + 2xy3

)dx+

∫ (1, 34√

(0,0)

6xy dy ,

y si la curva que une esos puntos viene parametrizada por

x = 2τ2

y = τ3 + τ

⇒

∂x(τ)∂τ = 4τ

∂y(τ)∂τ = 3τ2 + 1

entonces la primera de las integrales resulta∫ (1, 34

√2)

(0,0)

(3x2 + 2xy3

)dx =

∫ (3(2τ2)2

+ 2(2τ2) (τ3 + τ

)3)(4τ) dτ

∫ √2

(12τ5 + 4τ12 + 12τ10 + 12τ8 + 4τ6

)dτ =

9305

96 096

√2 .

Y la segunda ∫ (1, 34√

(0,0)

6xy dy =

∫ √2

6(2τ2) (τ3 + τ

) (3τ2 + 1

)dτ =

32,

con lo cual∫ (1, 34√

(0,0)

F (r) · dr =

∫ (1, 34√

(0,0)

(3x2 + 2xy3

)dx+

∫ (1, 34√

(0,0)

6xy dy =73

32+

9305

96 096

√2 .

Ejercicios

1. Un campo de fuerza actua sobre un oscilador descrito por

F = −kxi− kyj

Compare el trabajo hecho al moverse en contra de este campo al ir desde el punto (1, 1) al punto (4, 4)siguiendo los siguientes caminos:

a) (1, 1)→ (4, 1)→ (4, 4)

b) (1, 1)→ (1, 4)→ (4, 4)

c) (1, 1)→ (4, 4) siguiendo el camino x = y

2. Dado el campo de fuerza

F = − y

x2 + y2i +

x2 + y2j

Calcule el trabajo hecho en contra de este campo de fuerza al moverse al rededor de un circulo de radiouno y en el plano x− y

Borra

dor Pre

limin

a) desde 0 a π en sentido contrario a la agujas del reloj.

b) desde 0 a −π en sentido de las agujas del reloj.

3. Evaluar la siguiente integral ∮r · dr .

1.9. Vectores y numeros complejos

Desde los primeros cursos de matematica nos hemos tropezado con las llamadas raıces imaginarias ocomplejas de polinomios. De este modo la solucion a un polinomio cubico

x3 − 3x2 + 4x− 12 = 0 ⇒

x = 2ix = −2ix = 3

⇒ (x+ 2i) (x− 2i) (x− 3) = 0

o cuadratico

x2 + 4 = 0 ⇒

x = 2ix = −2i

⇒ (x+ 2i) (x− 2i)

nos lleva a definir un numero i2 = −1 ⇒ i =√−1. Como vimos arriba al multiplicar el numero imaginario

i por cualquier numero real obtendremos el numero imaginario puro ib, con b ∈ <. La nomenclatura denumeros imaginarios surgio de la idea de que estas cantidades no representaban mediciones fısicas. Esa ideaha sido abandonada pero el nombre quedo.

1.9.1. Los numeros complejos y su algebra

Un numero complejo, z, es la generalizacion de los numeros imaginarios (puros), ib. Esto es

z = a+ ib con a, b ∈ < ⇒

a→ parte real

b→ parte imaginaria

Obviamente los numeros reales seran a + i0 numeros complejos con su parte imaginaria nula. Los numerosimaginarios puros seran numeros complejos con su parte real nula, esto es, 0+ ib. Por ello, en general diremosque

z = a+ ib ⇒ a = Re (z) ∧ b = Im (z) ,

es decir, a corresponde a la parte real de z y b a su parte imaginaria.Cada numero complejo, z, tendra un numero complejo conjugado, z∗ tal que

z = a+ ib z∗ = a− ib⇓

(z∗)∗

= z ∧ z · z∗ = a2 + b2 ,

claramentez · z∗ ≥ 0 ⇒ |z|2 = |z∗|2 = z · z∗ .

Es importante senalar que, en general, no existe relacion de orden entre los numeros complejos. Valedecir, que no sabremos si un numero complejo es mayor que otro. No esta definida esta operacion.

z1 ≯ z2 ∨ z1 ≮ z2 .

Borra

dor Pre

limin

Las relaciones de orden solo se podran establecer entre modulos de numeros complejos y no numeros complejosen general.

Rapidamente recordamos el algebra de los numeros complejos:

Dos numeros complejos seran iguales si sus partes reales e imaginarios lo son

z1 = z2 ⇒ (a1 + ib1) = (a2 + ib2) ⇒ a1 = a2 ∧ b1 = b2 .

Se suman dos numeros complejos sumando sus partes reales y sus partes imaginarias.

z3 = z1 + z2 ⇒ (a1 + ib1) + (a2 + ib2) = (a1 + a2)︸︷︷︸a3

+ i(b1 + b2)︸︷︷︸b3

= a3 + ib3 ,

claramente z + z∗ = 2 Re z, tambien z − z∗ = 2 Im z. Igualmente es inmediato comprobar que

(z1 + z2)∗

= z∗1 + z∗2 .

Se multiplican numeros complejos por escalares multiplicando el escalar por sus partes reales e imagi-narias

z3 = αz1 ⇒ α (a1 + ib1) = (αa1) + i (αb1) .

Se multiplican numeros complejos entre si, multiplicando los dos binomios y teniendo cuidado quei2 = −1.

z3 = z1z2 ⇒ (a1 + ib1) · (a2 + ib2) = (a1a2 − b1b2) + i (a1b2 + b1a2) ,

tambien es inmediato comprobar que (z1z2)∗

= z∗1z∗2 .

Se dividen numeros complejos siguiendo la estrategia de racionalizacion de fracciones irracionales. Estoes

z3 =z1

z2⇒ (a1 + ib1)

(a2 + ib2)=

(a1 + ib1)

(a2 + ib2)

(a2 − ib2)

(a2 − ib2)=a1a2 + b1b2(a2

2 + b22)+ i

b1a2 − a1b2(a2

2 + b22),

es claro que el divisor sera cualquier numero complejo excepto el cero complejo: 0 + i0.

1.9.2. Vectores y el plano complejo

Mirando con cuidado el algebra de numeros complejos nos damos cuenta que un numero complejo puedeser representado por una dupla de numeros complejos es decir,

z = (a+ ib) z = (a, b)

las propiedades entre numeros complejos de igualdad, suma y multiplicacion por un escalar arriba expuestas secumplen de forma inmediata con esta nueva representacion. Hay que definir las operaciones de multiplicaciony division entre numeros complejos de forma que

(a1, b1) (a2, b2) = (a1a2 − b1b2, a1b2 + b1a2) ∧ (a1, b1)

(a2, b2)=

(a1a2 + b1b2(a2

2 + b22),b1a2 − a1b2(a2

2 + b22)

)Esta asociacion de un numero complejo con una pareja de numeros inmediatamente nos lleva a imaginarun punto en un plano (complejo) en el cual la primera componente (horizontal) representa la parte realy la segunda componente (vertical) representa la parte imaginaria. De esta forma asociamos a un numerocomplejo a un vector que une a ese punto (a, b) con el origen del plano complejo. Esta representacion de

Borra

dor Pre

limin

numeros complejos como vectores un el plano (complejo) de conoce con el nombre de Diagrama de Argand3 apesar que no fue Jean Argand, sino Caspar Wessel4 el primero en proponerlo. Por cierto, esta interpretacionfue tres veces redescubierta, primero por Caspar Wessel en 1799, luego por Jean Argand en 1806 y finalmentepor Gauss5 en 1831.

De esta manera, como un recordatorio al plano real

z = x+ iy z = r (cos(θ) + i sen(θ)) con

r =√zz∗ = |z| =

√x2 + y2

tan(θ) =y

xdonde − π ≤ θ ≤ π

La interpretacion vectorial de numeros complejos permite que la suma de numeros complejos sea representadapor la “regla del paralelogramo”. Mientras que los productos escalar y vectorial nos llevan a

z1 · z2 = Re (z1z∗2) = Re (z∗1z2) ∧ z1 × z2 = Im (z∗1z2) = −Im (z1z

∗2)

Con esta interpretacion tendremos

x = Re z componente real del vector z o parte real de zy = Im z componente imaginaria del vector z o parte imaginaria de z

r =√zz∗ = |z| modulo, magnitud o valor absoluto de z

θ angulo polar o de fase del numero complejo z

1.9.3. Formulas de Euler y De Moivre

Nos hemos tropezado con la expansion en Taylor6, esta serie permite expresar cualquier funcion infini-tamente diferenciable alrededor de un punto x0 como una serie infinita de potencias del argumento de lafuncion. Esto es:

f (x) = 1 +df (x)

∣∣∣∣x=x0

(x− x0) +1

d2f (x)

dx2

∣∣∣∣x=x0

(x− x0)2

d3f (x)

dx3

∣∣∣∣x=x0

(x− x0)3

+ · · · · · ·

f (x) = Cn (x− x0)n, con Cn =

dn f (x)

d xn

∣∣∣∣x=x0

y donde n = 0, 1, 2, 3, . . .

3En honor a JEAN ROBERT ARGAND (Ginebra, Suiza, 18 Julio 1768; Parıs, Francia 13 agosto 1822). Contador peromatematico aficionado, propuso esta interpretacion de numeros complejos como vectors en un plano complejo en un libroautoeditado con sus reflexiones que se perdio y fue rescatado 7 anos despues, fecha a partir de la cual Argand comenzo apublicar en Matematicas.

4CASPAR WESSEL (Vestby, Noruega 8 junio 1745; 25 marzo 1818, Copenhagen, Dinamarca) Matematico noruego quese dedico principalemente al levantamiento topografico de Noruega. Su trabajo sobre la interpretacion de numeros complejospermanecio desconocido por casi 100 anos.

5 JOHANN CARL FRIEDRICH GAUSS (30 abril 1777, Brunswick, Alemania; 23 febrero 1855, Gottingen, Alemania). Unode los matematicos mas geniales y precoces de la Historia. Desde los 7 anos comenzo a mostrar sus condiciones de genialidad.Sus contribuciones en Astronomıa y Matematicas son multiples y diversas.

6BROOK TAYLOR (18 agosto 1685, Edmonton, Inglaterra; 29 diciembre 1731, Londres, Inglaterra) Fısico y Matematicoingles contemporaneo de Newton y Leibniz y junto con ellos participo profundamente en el desarrollo del Calculo diferencial eintegral. Ademas de sus aportes al estudio del magnetismo, capilaridad y termometrıa, desarrollo el area de diferencias finitasque hasta hoy utilizamos para calculos en computacion. Invento la integracion por partes y descubrio la serie que lleva sunombre.

Borra

dor Pre

limin

con lo cual, si consideramos x0 = 0, entonces podemos ver algunos desarrollos en series de funciones elemen-tales

ex = 1 + x+1

2x2 +

6x3 +

24x4 +

120x5 +

720x6 +

5040x7 + · · · · · ·

cos(x) = 1− 1

2x2 +

24x4 − 1

720x6 + · · · · · ·

sen(x) = x− 1

6x3 +

120x5 − 1

5040x7 + · · · · · ·

Es facil convencerse que la serie

eiθ = 1 + iθ − 1

2θ2 +

(−1

)θ3 +

24θ4 +

120iθ5 − 1

720θ6 +

(− 1

5040i

)θ7 + · · · · · ·

puede rearreglarse como

eiθ =

(1− 1

2θ2 +

24θ4 − 1

720θ6 + · · · · · ·

)︸︷︷︸

cos(θ)

+ i

(θ − 1

6θ3 +

120θ5 − 1

5040θ7 + · · · · · ·

)︸︷︷︸

sen(θ)

eiθ = cos(θ) + i sen(θ) ,

esta relacion se conoce como la relacion de Euler7. Con lo cual ahora tenemos tres formas de representar unnumero complejo

z = x+ iy z = r (cos(θ) + i sen(θ)) z = reiθ .

La expresion z = x + iy se conoce como forma cartesiana de representacion de un numero complejo,la forma z = r (cos(θ) + i sen(θ)) sera la forma trigonometrica o polar y la expresion z = eiθ sera la for-ma de Euler. Es importante notar una sutileza implıcita en esta notacion. La forma cartesiana representaunıvocamente a un numero complejo, mientras que la forma polar (y la de Euler), es ambigua

z = r (cos(θ) + i sen(θ)) = r (cos(θ + 2nπ) + i sen(θ + 2nπ)) , (1.5)

es decir, existen varios valores del argumento que definen el mismo numero complejo. Esto se consideraramas adelante cuando tratemos las funciones de numero complejos.

Las sumas de numeros complejos son mas facilmente planteables en su forma cartesiana. Mientras lasmultiplicacion y division seran directas en la forma de Euler

z1 = r1eiθ1

z2 = r2eiθ2

⇒ z1z2 = eiθ1eiθ2 = ei(θ1+θ2) = r1r2 (cos (θ1 + θ2) + i sen (θ1 + θ2)) .

Mas aun, siz = x+ iy ⇒ ez = e(x+iy) = exeiy = ex (cos(y) + i sen(y)) ,

7LEONHARD EULER (15 abril 1707, Basilea, Suiza; 18 septiembre 1783, San Petersburgo, Rusia). Uno de los matematicosmas prolıficos de todos los tiempos. Desarrollo inmensamente campos como la geometrıa analıtica y trigonometrıa, siendo elprimero que considero el coseno y el seno como funciones. Hizo aportes significativos en el desarrollo del calculo diferencial eintegral ası como tambien, astronomıa, elasticidad y mecanica de medios contınuos.

Borra

dor Pre

limin

a partir de la relacion o formula de Euler se puede demostrar la De Moivre8(eiθ)n

= einθ (cos(θ) + i sen(θ))n

= cos (nθ) + i sen (nθ) , con n entero.

1.9.4. Algunas aplicaciones inmediatas

Presentaremos algunas aplicaciones inmeditas la formula de De Moivre en diferentes ambitos.

Identidades trigonometricas

La primera de las aplicaciones de la formula de De Moivre es para construir identidades trigonometricasen las cuales se expresa el coseno, o el seno, de factores de un angulo. Veamos las siguientes (nada triviales)identidades trigonometricas

cos(3θ) = 4 cos3(θ)− 3 cos(θ) o sen(3θ) = 3 sen(θ)− 4sen3(θ) ,

para demostrar estas (y otras) identidades utilizamos la formula de De Moivre, es decir

cos(3θ) + i sen( 3θ) = (cos(θ) + i sen(θ))3

= cos3(θ)− 3 cos(θ) sen2(θ) + i(3 cos2(θ) sen(θ)− sen3(θ)

igualando ahora parte real e imaginaria tendremos

cos(3θ) = cos3(θ)− 3 cos(θ) sen2(θ)

= cos3(θ)− 3 cos(θ)(1− cos2(θ)

)= 4 cos3(θ)− 3 cos(θ)

sen(3θ) = 3 cos2(θ) sen(θ)− sen3(θ)

= 3(1− sen2(θ)

)sen(θ)− sen3(θ) = 3 sen(θ)− 4sen3(θ) .

El metodo puede extenderse a expresiones de senos y cosenos de nθ.Igualmente podemos desarrollar un metodo para encontrar expresiones de potencias de funciones trigo-

nometricas en termino de funciones de factores de angulo del tipo (cos(θ))n

= F (cos(nθ), sen(nθ)). Paraempezar, supongamos que tenemos un numero complejo de modulo 1, de tal forma que

z = eiθ = cos(θ) + i sen(θ) ⇒

zn +

zn= 2 cos(nθ)

zn − 1

zn= 2i sen(nθ)

Estas identidades surgen de manera inmediata de

zn +1

zn= (cos(θ) + i sen(θ))

n+ (cos(θ) + i sen(θ))

−n= (cos(nθ) + i sen(nθ)) + (cos (−nθ) + i sen (−nθ))

= cos(nθ) + i sen(nθ) + cos(nθ)− i sen(nθ) = 2 cos(nθ) ,

igualmente puede demostrarse la segunda de las afirmaciones anteriores.

8ABRAHAM DE MOIVRE (26 mayo 1667 in Vitry-le-Francois, Francia; 27 noviembre 1754, Londres Inglaterra) Matematicofrances que tuvo que emigrar a Inglaterra por razones religiosas. Contemporaneo de Newton, Liebniz y Halley, fue pionero consus contribuciones en geometrıa analıtica y teorıa de probabilides.

Borra

dor Pre

limin

Ahora bien, supongamos ademas que n = 1, con lo cual se cumple que

z +1

z= eiθ + e−iθ = 2 cos(θ) y z − 1

z= eiθ − e−iθ = 2i sen(θ) ,

que tambien lo sabıamos desde la mas temprana edad de nuestros cursos de bachillerato. Ahora bien, lo quequiza no sabıamos en ese entonces (y quiza ahora tampoco) es que a partir de aquı podemos construir, porejemplo:

cos5(θ) =1

(z +

[(z5 +

(5z3 +

(10z +

)],

es decir

cos5(θ) =1

25[2 cos(5θ) + 10 cos(3θ) + 20 cos(θ)] ,

de la misma manera se puede proceder con otras potencias y con potencias de la funcion seno.

Raıces de polinomios

La formula de De Moivre nos puede ayudar para encontrar raıces de polinomios. Supongamos, paraempezar, que queremos encontrar las n raıces de la ecuacion zn = 1. Para ello procedemos con el siguienteartificio

zn = 1 = cos (2πk) + i sen (2πk) = ei(2πk) , donde k = 0, 1, 2, ....

con lo cual las n raıces de la ecuacion zn = 1 seran

zn = 1 ⇒ z = ei(2πkn )

⇓

︷︸︸︷0 = 1; z1 = e2πi( 1

n ); z2 = e2πi( 2n ); z3 = e2πi( 3

n ); · · · zn−2 = e2πi(n−2n ); zn−1 = e2πi(n−1

n )

es decir, n raıces corresponderan a los n valores de k = 0, 1, 2, · · ·n−2, n−1. Mayores valore de k no proveennuevas raıces.

Estas propiedades pueden extenderse a raıces de polinomios. Supongamos la siguiente ecuacion polinomicacon sus raıces:

z5 − z4 + 2z − 2 = 0 ⇒(z4 + 2

)(z − 1) = 0 ⇒

z4 + 2 = 0 ⇒ z4 = −2

z − 1 = 0 ⇒ z = 1

una vez mas

z4 = −2(1) = −2(ei(2πk)

)⇒ z =

[−2(ei(2πk)

)]1/4= (−2)1/4ei(

2πk4 ) =

2(1 + i) 23/4ei(

2πk4 )

donde hemos utilizado el hecho de que: (−1)1/4 = i1/2 =√

22 (1 + i) . Por lo tanto:

z0 =1

2(1 + i) 23/4 , z1 =

2(1 + i) 23/4ei(

π2 ) =

2(1 + i) 23/4 ,

z2 =1

2(1 + i) 23/4ei(π) = −1

2(1 + i) 23/4 , z3 =

2(1 + i) 23/4ei(

3π2 ) = − i

2(1 + i) 23/4 ,

Borra

dor Pre

limin

por lo tanto, la ecuacion z5 − z4 + 2z − 2 = 0, tendra las siguientes cinco raıces:

z0 =1

2(1 + i) 23/4 , z1 = −1

2(1− i) 23/4 , z2 = −1

2(1 + i) 23/4 , z3 =

2(1− i) 23/4 , z4 = 1 .

Una afirmacion que nos han dicho, y que quiza no sepamos de donde viene, es que si un polinomiocon coeficientes reales tiene raıces complejas, ellas seran complejas conjugadas unas de otras. Vale decir, siz5 − z4 + 2z − 2 = 0 tiene como raız z0 = 1

2 (1 + i) 23/4, tambien tendra como raız z3 = 12 (1− i) 23/4 y

z0 = z∗3 .Esta afirmacion se prueba de forma general si suponemos que tenemos la siguiente ecuacion

ai zi = 0 , con i = 0, 1, 2, · · ·n− 1, n ⇒ a0 + a1 z + a2 z

2 · · ·+ an−1 zn−1 + an z

n = 0 ,

donde los coeficientes a0, a1, a2, · · · , an−1, an los suponemos reales, esto es: ai = a∗i para todos los valoresdel ındice i.

Al tomar el complejo conjugado nos queda:

a0 + a1 z + a2 z2 · · ·+ an−1 z

n−1 + an zn = 0 ⇐⇒ a∗0 + a∗1 z

∗ + a∗2 (z∗)2 · · ·+ a∗n−1 (z∗)

n−1+ a∗n (z∗)

n= 0 ,

como los coeficientes son reales tenemos que

a0 + a1 z + a2 z2 · · ·+ an−1 z

n−1 + an zn = 0 ⇐⇒ a0 + a1 z

∗ + a2 (z∗)2 · · ·+ an−1 (z∗)

n−1+ an (z∗)

n= 0 ,

esto nos dice que si z es solucion tambien lo sera z∗ ya que la ecuacion es la misma por tener los mismoscoeficientes (reales).

Ahora consideremos el siguiente polinomio complejo

P (z) = z6 − z5 + 4z4 − 6z3 + 2z2 − 8z + 8 = 0 .

Si por algun metodo comprobamos que (z3 − 2) es uno de sus factores, entonces podremos encontrar lasraıces del polinomio P (z). Veamos, claramente si (z3 − 2) es un factor podemos expresar

P (z) = z6 − z5 + 4z4 − 6z3 + 2z2 − 8z + 8 = (z3 − 2)(z3 − z2 + 4z − 4) = (z3 − 2)(z − 1)(z2 + 4) ,

con lo cual, como z es complejo, hay que tener cuidado con las raıces encubiertas

z6 − z5 + 4z4 − 6z3 + 2z2 − 8z + 8 = 0 ⇒ (z3 − 2)(z − 1)(z2 + 4) = 0 ⇒

z3 = 2

z = 1

z2 = −4

Por un lado: z2 = −4 ⇒ z = ±2i .Y por el otro:

z3 = 2 = 2(ei(2πk)

)⇒ z =

[2(ei(2πk)

)]1/3= 21/3ei(

2πk3 ) .

Por lo tanto:

z0 = 21/3 , z1 = 21/3ei(2π3 ) = −21/3

[1−√

3i], z2 = 21/3ei(

4π3 ) = −21/3

[1 +√

3i].

La ecuacion z6 − z5 + 4z4 − 6z3 + 2z2 − 8z + 8 = 0, tendra las siguientes seis raıces:

z =3√

2 , z = − 13√

[1±√

3 i], z = 1 , z = ±2i .

Borra

dor Pre

limin

Logaritmos y potencias de numeros complejos

Definamos la siguiente funcionz = eiθ ⇐⇒ Ln(z) = iθ ,

donde Ln representa el logaritmo natural del numero complejo z. Notese que hemos utilizado Ln en lugarde tradicional ln y la razon es la ambiguedad implıcita en la notacion de Euler, vale decir

z = reiθ ⇐⇒ Ln(z) = ln(r) + i (θ + 2nπ) = ln(r) + iθ ,

en otras palabras, Ln(z) no es funcion por el hecho de ser multivaluada. Se supera esta dificultad cuando serestringe el argumento −π < θ ≤ π y esta se conoce como el valor principal de la funcion

Por ejemplo, al evaluar

Ln (−3i) = Ln[3ei(−

π2 +2nπ)

]= ln(3) + i

(−π

2+ 2nπ

)con n = 0, 1, 2, · · ·

decimos que el valor principal del Ln (−3i) sera ln(3)− iπ2 .Con la misma intuicion se procede con las potencias de numeros complejos. Si queremos evaluar z = i−5i

tendremos que proceder como sigue

z = i−5i ⇒ Ln (z) = Ln(i−5i

)= −5iLn (i) = −5iLn

[ei(

π2 +2nπ)

]= 5

(π2

+ 2nπ),

con lo cual z = i−5i ¡es un numero real!

Para finalizar consideremos otro par de casos de potencias y logaritmos: ii y Ln[√

3 + i3].

Entonces

ii =[ei(

π2 +2nπ)

]i= ei

2(π2 +2nπ) = e−(π2 +2nπ) ,

y para

[√3 + i

= 3 Ln

[2ei(

arctan(

1√3

))]= 3

[ln(2) + i

(arctan

(1√3

)+ 2nπ

)]= ln(8) + i

(π2

+ 6nπ).

Ejercicios

1. Demuestre que

a)cos(3α) = cos3(α)− 3 cos(α)sen2(α)

b)sen(3α) = 3 cos2(α)sen(α)− sen3(α)

2. Encuentre las raıces de

a) 2i

b) 1−√

c) (−1)1/3

d) 81/6

e) (−8− 8√

3i)1/4

Borra

dor Pre

limin

1.10. Algunos ejemplos resueltos

1. Hemos definido como la posicion, R, del centro de masa para un sistema de N partıculas como

R =ΣNi=1miriΣNj=1mj

donde ri corresponde con la posicion de la i−esima partıcula.

Determine la posicion del centro de masa para un sistema de tres masas, mi = 1,2,3, colocadas en losvertices de un triangulo equilatero de lado l = 2.

Solucion: Al colocar el origen de coordenadas en uno de los vertices y uno de los ejes de coordenadassobre uno de los lados, entonces

R =Σ3i=1miri

Σ3j=1mj

=m1r1 +m1r1

MT=

1 · 2i + 3 ·(i +√

3j)

6i +

√3

2. Dada una base ortonormal i, j,k y los siguientes vectores

a = 3i + 2j + k , b = 3i− 2j + k , c = i− k

a) Comprobar si a,b, c forman una base.

Solucion: Para que los vectores formen una base tienen que ser linealmente independientes. Estoes αa + βb + γc = 0 ⇒ α = β = γ = 0, con lo cual

α (3i + 2j + k) + β (3i− 2j + k) + γ (i− k) = 0 ⇒

3α+ 3β + γ = 02α− 2β = 0α+ β − γ = 0

y al resolver el sistema se obtiene: α = β = γ = 0 con lo cual se demuestra que son linealmenteindependientes.

Otra manera de resolverlo es mostrar que: c · (a× b) 6= 0 y efectivamente

c · (a× b) =

∣∣∣∣∣∣1 0 −13 2 13 −2 1

∣∣∣∣∣∣ = 4 6= 0 .

b) Si a,b, c forman una base, exprese d = i + 2j , e = 3i− 2j y f = a× b en termino de esa basea,b, c. De lo contrario, construya una base como a,b,a × b y exprese los vectores d, e, fen termino de esa nueva base.

Solucion: Como forman base expresamos los vectores en esos terminos. Esto es

i + 2j = α (3i + 2j + k) + β (3i− 2j + k) + γ (i− k) ⇒

3α+ 3β + γ = 12α− 2β = 2α+ β − γ = 0

resolviendo tendremos que d = 58a− 3

8b + 14c. Seguidamente

3i− 2j = α (3i + 2j + k) + β (3i− 2j + k) + γ (i− k) ⇒

3α+ 3β + γ = 32α− 2β = −2α+ β − γ = 0

Borra

dor Pre

limin

resolviendo tendremos que e = − 18a + 7

8b + 34c

Ahora bien

f = a× b ≡ (3i + 2j + k)× (3i− 2j + k) ≡

∣∣∣∣∣∣i j k3 2 13 −2 1

∣∣∣∣∣∣ = 4i− 12k

con lo cual

4i− 12k = α (3i + 2j + k) + β (3i− 2j + k) + γ (i− k) ⇒

3α+ 3β + γ = 42α− 2β = 0α+ β − γ = −12

y finalmente f = a× b = −a− b + 10c .

3. Utilizando la notacion de ındices demostrar que para cualquier trıo de vectores a,b, c se cumple quea× (b× c) + b× (c× a) + c× (a× b) = 0.

Solucion: En notacion de ındices

a× (b× c) + b× (c× a) + c× (a× b) = εlmiamεijkbjck + εlmibmεijkc

jak + εlmicmεijkajbk

con lo cual, arreglando

εlmiεijkambjck + εlmiεijkbmc

jak + εlmiεijkcmajbk =(

δljδmk − δmj δlk

)amb

jck +(δljδ

mk − δmj δlk

)bmc

jak +(δljδ

mk − δmj δlk

)cma

jbk

y ahora desarrollando los productos de las δ’s, e indentificando termino a termino, notamos que seanula akblck︸︷︷︸

−akbkcl︸︷︷︸II

bkclak︸︷︷︸II

−bkckal︸︷︷︸III

ckalbk︸︷︷︸III

−ckakbl︸︷︷︸I

= 0 .

4. Una partıcula se mueve a lo largo de una curva descrita por

x(t) = 3t2 y(t) = 4t3 − t z(t) = t

a) Encuentre las expresiones para los vectores: posicion, velocidad y aceleracion de esa partıcula.

Solucion:

r(t) = 3t2i + (4t3 − t)j + tk , v = 6ti + (12t2 − 1)j + k , a = 6i + 24tj .

b) Encuentre las expresiones, mas generales, de los vectores tangentes y perpendiculares a todo puntode la trayectoria de la partıcula.

Solucion: Vector tangente a todo punto de la trayectoria es el vector velocidad

v = 6ti + (12t2 − 1)j + k ,

El perpendicular a todo punto, sera un vector b = bxi + byj + bzk, tal que

(6ti + (12t2 − 1)j + k) · (bxi + byj + bzk) = 6tbx + (12t2 − 1)by + bz = 0 ,

con lo cualb = bxi + byj− (6tbx + (12t2 − 1)by)k .

Borra

dor Pre

limin

5. El campo de fuerzas del oscilador anarmonico anisotropo bidimensional se escribe como

F = −k1x2i + k2yj . (1.6)

Encuentre el trabajo realizado,∫ (x2,y2)

(x1,y1)dr · F a lo largo de las siguientes trayectorias

a) (1, 1)→ (4, 1)→ (4, 4)

Solucion:∫ (4,1)

(1,1)

(idx) · (−k1x2i + k2j) +

∫ (4,4)

(4,1)

(jdy) · (−k116i + k2yj) = −21k1 +15k2

b) (1, 1)→ (1, 4)→ (4, 4)

Solucion:∫ (1,4)

(1,1)

(jdy) · (−k1i + k2yj) +

∫ (4,4)

(1,4)

(idx) · (−k1x2i + k24j) = −21k1 +

15k2

c) (1, 1)→ (4, 4) para x = y

Solucion:∫ (4,4)

(1,1)

(idx+ jdx) · (−k1x2i + k2xj) =

∫ (4,4)

(1,1)

(−k1x2 + k2x)dx = −21k1 +

15k2

6. Dados los siguientes puntos en el espacio (1, 0, 3); (2,−1, 0); (0,−1, 1); (−1, 0, 1).

a) Considere los tres primeros puntos. ¿Estos tres puntos son coplanares? ¿por que? Explique.

Solucion: Tres puntos en el espacio definen un plano, por lo tanto siempre seran coplanares.

b) Encuentre el area del triangulo que tiene por vertices esos tres puntos.

Solucion: Para ello seleccionamos uno de los puntos como un vertice privilegiado (digamos(2,−1, 0)) respecto al cual construiremos dos vectores que representan dos de los lados del triangu-lo. Esto es

a = (1, 0, 3)− (2,−1, 0)↔ a = −i + j + 3k ,

yb = (0,−1, 1)− (2,−1, 0)↔ b = −2i + k ,

con lo cual, el area del vertice sera la mitad del area del paralelogramo que tiene por lados estosdos vectores. Es decir

A =1

2|a× b| ⇒ a× b =

∣∣∣∣∣∣i j k−1 1 3−2 0 1

∣∣∣∣∣∣ = i− 5j + 2k⇒ A =1

2|i− 5j + 2k| =

√30

c) Encuentre la ecuacion del plano que los contiene

Solucion: La ecuacion del plano vendra dada por

(r− r1) · ((r2 − r1)× (r3 − r1)) = 0 ,

donder = xi + yj + zk, r1 = i + 3k, r2 = 2i− j, r3 = −j + k,

Borra

dor Pre

limin

con lo cual la ecuacion del plano queda como∣∣∣∣∣∣(x− 1) y (z − 3)

1 −1 −3−1 −1 −2

∣∣∣∣∣∣ = 0 ⇒ −(x− 1) + 5y − 2(z − 3) = 0 ⇒ x− 5y + 2z = 7 .

d) Considere los cuatro puntos ¿Estos cuatro puntos son coplanares? ¿por que? De NO ser coplanares,encuentre la distancia del cuarto punto al posible plano que contiene a los otros tres.

Solucion: Para verificar si el cuarto punto esta en el plano, verificamos si cumple la ecuacion quelo define

(−1)− 5(0) + 2(1) 6= 7 ,

los cuatro puntos no son coplanares. Para calcular la distancia del cuarto punto al plano seconstruye el vector unitario normal al plano

nP =a× b

|a× b|=

1√30

(i− 5j + 2k) , d = nP · c =1√30

(i− 5j + 2k) · (−3i + j + k) ,

con lo cual la distancia al cuarto punto sera

d = nP · c =1√30

(i− 5j + 2k) · (−3i + j + k) = − 6√30.

7. Considere los siguientes tres vectores

w1 = i + 3k , w2 = 2i− 3j , w3 = −j + k .

a) ¿Forman una base para R3? Explique detalladamente

Solucion: Son linealmente independientes, estos es

αw1 + βw2 + γw3 = 0 ⇒ α = β = γ = 0 ,

que se comprueba directamente al resolver

α +2β = 0−3β −γ = 0

3α +γ = 0

b) Si es que forman base, exprese el vector a = i− 3j + 3k en la posible base w1,w2,w3Solucion: Como son linealmente independientes, forman base, con lo cual cualquier vector puedeser expresado como combinacion lineal de estos tres. Eso es:

a = αw1 + βw2 + γw3 ⇒

α +2β = 1−3β −γ = −3

3α +γ = 3

⇒

α = 1

β = 13

γ = 2

8. Utilizando la notacion de ındices muestre si se cumple la siguiente identidad

∇× (a× b) = a (∇ · b)− b (∇ · a) + (b ·∇) a− (a ·∇) b.

Borra

dor Pre

limin

Solucion:

∇× (a× b) = εijk∂j(εklmalbm) = (δilδ

jm − δimδ

jl )∂j(a

lbm) = ∂m(aibm)− ∂l(albi) ,

expandiendo la derivada

∇× (a× b) = bm∂m(ai) + ai∂m(bm)− bi∂l(al)− al∂l(bi) ≡ (b ·∇)a + (∇ · b)a− (∇ · a)b− (a ·∇)b .

9. La trayectoria de un punto en el plano vista por un observador 1 es

r1(t) = 5 cos(3t2) i + 5 sen(3t2) j .

a) Exprese las aceleraciones radiales y tangenciales de esta partıcula.

Solucion: Es claro que la partıcula describe un movimiento circular donde θ(t) = 3t2

r(t) = 5ur ⇒ v(t) =dr(t)

dt= 5

dθ(t)

dtuθ = 30t uθ ⇒ a(t) =

da(t)

dt= 30 uθ − 30t ur .

b) Considere ahora un segundo observador, el cual describe una trayectoria respecto al primerorepresentada por

r21(t) = (t3 − 4t)i + (t2 + 4t) j .

Encuentre las expresiones para los vectores posicion, velocidad y aceleracion de la partıcula me-didos respecto al segundo observador.

Solucion: La trayectoria de la partıcula respecto al segundo observador sera

r2(t) = r1(t)− r21(t) = 5 cos(3t2) i + 5 sen(3t2) j− ((t3 − 4t)i + (t2 + 4t) j) ,

con lo cualr2(t) = (5 cos(3t2)− (t3 − 4t))i + (5 sen(3t2)− (t2 + 4t))j ,

entonces

v2(t) =dr2(t)

dt= (30t cos(3t2)− (3t2 − 4))i + (30t sen(3t2)− (2t+ 4))j ,

a2(t) =dv2(t)

dt= (30 cos(3t2)− 180tt sen(3t2)− 6t)i + (30 sen(3t2)− 180t2 cos(3t2)− 2)j .

Borra

dor Pre

limin

1.11. Ejercicios propuestos

1. Auguste Bravais9 se dio cuenta que replicando un arreglo geometrico muy simple, se puede describiruna estructura cristalina. Dicho de otro modo, que conociendo una celda simple, podemos conocer laestructura cristalina. Esto es que las posiciones de los atomos en una red cristalina puede ser descrita porun vector R = a+b+c = n1a1 +n2a2 +n3a3 = niai donde los ai son vectores no coplanares (vectoresprimitivos o, simplemente en nuestro lenguaje, vectores base). Los ni son numeros enteros (negativos,cero o positivos). La posicion de cada atomo de un cristal puede ser descrita como reescalamientos(discretos) de este vector generico o, de manera mas precisa, la traslacion del origen de coordenadaspor un vector. Ese concepto se conoce como redes de Bravais10. En cada red puede haber varios vectoresprimitivos11. Se puede definir la celda primitiva como la estructura mınima que replicada reproducetodo el cristal. Vale decir la estructura cristalina es invariante bajo traslaciones espaciales del tipoR′ = R + T con T = miai.

Figura 1.7: Las 5 redes de Bravais bidimensionales fundamentales: 1 Oblicuas, 2 rectangular, 3 rectangu-lar centrada (rombica), 4 hexagonal, y 5 cuadrada. Figura tomada de http://en.wikipedia.org/wiki/

Bravais_lattice

a) Redes de Bravais bidimensionales. Tal y como muestra la Figura 1.7 existen 5 tipos distintosde redes de Bravais bidimensionales.

1) Dada la red bidimensional de la Figura 1.8 encuentre todos los posibles vectores primitivos yceldas primitivas asociadas.

9http://en.wikipedia.org/wiki/Auguste_Bravais10http://en.wikipedia.org/wiki/Bravais_lattice11http://www.engr.sjsu.edu/rkwok/Phys175A/Chapter%201.pdf

http://en.wikipedia.org/wiki/Bravais_lattice

http://en.wikipedia.org/wiki/Auguste_Bravais

http://en.wikipedia.org/wiki/Bravais_lattice

http://www.engr.sjsu.edu/rkwok/Phys175A/Chapter%201.pdf

Borra

dor Pre

limin

arFigura 1.8: Red cristalina bidimensional. Encuentre todos los posibles vectores y celdas primitivas asociadas

2) La humanidad ha estado seducida por la geometrıa desde que empezo a representar figuras.A partir de las cuatro imagenes que se ilustran en la Figura 1.9, encuentre todos los posiblesvectores y celdas primitivas asociadas.

3) Maurits Cornelis Escher12 fue un fenomenal dibujante holandes, quien se intereso por lassimetrıas de los grupos de imagenes de papel tapiz. Berend, hermano de Maurits, era cris-talografo y le mostro la belleza de las simetrıas de la naturaleza. En las cuatro obras delgenero de Teselado13 de M.C. Escher, presentadas en la Fig 1.10 encuentre todos los posiblesvectores y celdas primitivas asociadas.

b) Redes de Bravais Tridimensionales. Este tipo de redes complica un poco mas el escenario.Se puede demostrar que existen 14 de estas redes, tal y como se muestran en la Figura 1.11

Muestre que los volumenes de ocupacion atomica, para los sistemas Monoclınico, Triclınico,Ortorombico, Tetragonal, Romboedrico, exagonal y cubico, corresponden a las expresionesque se muestran en la Figura 1.11.

El sistema cubico, el mas simple, corresponde a un sistema con un unico parametro de reda = |a|, ya que a = b = c. Ademas, una posible descripcion, para el caso mas simple, esa = i; b = j; c = k, los tres vectores cartesianos ortogonales. Existen otros sistemas quetambien estan asociados al cubico. Estos son el sistema cubico cara centrada (fcc por sussiglas en ingles) y cubico cuerpo centrado (bcc). En el primero existen atomos en el centro decada una de las caras del cubo definido por la trıada, a = b = c. En el sistema fcc se anadeun atomo la centro del cubo simple.

1) Muestre que un sistema bcc tambien puede ser descrito por los vectores primitivos: a = ai,b = aj y c = a(i + j + k)/2. Dibuje la celda primitiva y calcule su volumen.

2) Muestre que un sistema bcc tambien puede ser descrito por los vectores primitivos: a =a(j + k− i)/2, b = a(k + i− j)/2 y c = a(i + j− k)/2. Dibuje la celda primitiva y calculesu volumen.

3) Muestre que un sistema fcc tambien puede ser descrito por los vectores primitivos: a =a(j + k)/2, b = a(i + k)/2 y c = a(i + j)/2. Otra vez, dibuje la celda primitiva y calculesu volumen.

12http://en.wikipedia.org/wiki/M._C._Escher13http://en.wikipedia.org/wiki/Tessellation

http://en.wikipedia.org/wiki/M._C._Escher

http://en.wikipedia.org/wiki/Tessellation

Borra

dor Pre

limin

arFigura 1.9: Cuatro detalles geometricos. Cuadrante I: Mural egipcio. Cuadrante II: Mural Mural Asirio.Cuadrante III: Tejido Tahitı. Cuadrante IV: Ilustracion en pieza de porcelana china. Tomado de http:

//en.wikipedia.org/wiki/Wallpaper_group

Se puede definir la red recıproca como

a′ =b× c

a · (b× c); b′ =

c× a

a · (b× c); y c′ =

a× b

a · (b× c);

De esta manera es claro que, por construccion, a′ · b = a′ · c = 0 y ademas a′ · a = 1. Conlo cual podemos generalizarlo como ei

′ · ej = δi′

j . Exprese los vectores y las celdas recıprocaspara los sistemas cubico simple, y los distintos bcc y fcc. Calcule ademas el volumen de cadacelda recıproca.

2. Considerando que

r = x i + y j + z k = xmem,

A = A(r) = A(x, y, z) = Ai(x, y, z)ei y B = B(r) = B(x, y, z) = Bi(x, y, z)ei

φ = φ(r) = φ(x, y, z) y ψ = ψ(r) = ψ(x, y, z)

usando la notacion de ındices e inspirandose en las secciones 1.6.3, 1.8.5 y 1.10, muestre las siguientesidentidades vectoriales

a) ∇(φψ) = φ∇ψ + ψ∇φ

b) ∇ · (φA) = φ∇ ·A + (∇φ) ·Ac) ∇×∇φ = 0, tambien ∇ · (∇×A) y ¿que puede decir de ∇× (∇ ·A)?

d) ∇ · (A×B) = (∇×A) ·B + A× (∇×B)

e) ∇× (∇×A) = ∇(∇ ·A)−∇2A

http://en.wikipedia.org/wiki/Wallpaper_group

Borra

dor Pre

limin

Figura 1.10: Teselados de M.C. Escher, tomados de http://www.wikipaintings.org/en/

paintings-by-genre/tessellation?firstArtist=m-c-escher#artist-m-c-escher

3. Una partıcula se mueve bajo la ley r(t) = x(t)i + y(t)j + z(t)k con

x(t) = 2t2; y(t) = t2 − 4t; z(t) = 3t− 5.

El parametro t representa el tiempo. Encuentre las expresiones para la aceleracion y la velocidad de lapartıcula, para t = 1 y en la direccion del vector i− 3j + 2k.

4. Suponga ahora el caso general de una partıcula que se mueve en una curva descrita por r(t) = x(t)i +y(t)j + z(t)k. Muestre que el vector velocidad es tangente a la trayectoria descrita

5. Encuentre la ecuacion vectorial para una trayectoria recta que pasa por los puntos P → (1, 2, 3) yQ→ (1, 1, 1)

6. Encuentre el angulo entre los siguientes planos x+ y + z = 9 y x+ y − z = 3.

7. Un fluido se considera irrotacional si su campo de velocidades v = v(r) = v(x, y, t) cumple con laecuacion ∇× v = 0. Suponga, ahora que v = (x+ 2y + az)i + (bx− 3y − z)j + (4x+ cy + 2z)k.

a) Encuentre el valor de a, b y c para que este campo de velocidades sea irrotacional

b) Es intuitivo convencerse que si ∇ × v = 0 ⇒ v = ∇ψ. Encuentre expresion para la funcionpotencial ψ = ψ(r) = ψ(x, y, z)

c) Considere la siguiente integral I =∫C dr · v. Donde C es el circuito a recorrer.

1) Calcule el valor de la integral I a lo largo del trayecto: (0, 0, 0)→ (1, 1, 0) mediante una seg-mento de recta. Luego, de (1, 1, 0)→ (2, 0, 0) a lo largo de otro segmento de recta. Finalmenteregresando (2, 0, 0)→ (0, 0, 0) tambien siguiendo una recta.

http://www.wikipaintings.org/en/paintings-by-genre/tessellation?firstArtist=m-c-escher#artist-m-c-escher

Borra

dor Pre

limin

Figura 1.11: Las 14 Redes de Bravais Tridimensionales y las estructuras cristalinas asociadas. Tomado dehttp://en.wikipedia.org/wiki/Bravais_lattice

2) Calcule el valor de la integral I de (0, 0, 0)→ (2, 0, 0) a lo largo de un arco de circunferenciaque cumple con la ecuacion (x−1)2 +y2 = 1. Ahora regresando de (2, 0, 0)→ (0, 0, 0) tambiena traves de una recta.

3) ¿Que puede concluir del campo v?

8. Dos funciones complejas Z1(t) y Z2(t) cumplen con las siguientes ecuaciones

dZ∗1dt

==−i

Z1 − Z2y

dZ∗2dt

==−i

Z2 − Z1

Muestre que las siguientes cantidades son constantes.

Z1 + Z2

|Z1 − Z2|

http://en.wikipedia.org/wiki/Bravais_lattice

Borra

dor Pre

limin

|Z1|2 + |Z2|2

9. Considere la siguiente ecuacion

z7 − 4z6 + 6z5 − 6z4 + 6z3 − 12z2 + 8z + 4 = 0

Encuentre sus raıces sabiendo que z3 = 2.

10. Muestre que la expansion binomial puede ser escrita como

(1 + x)n =

n∑m=0

Am(n) xm con Am(n) =n!

m!(n−m)!

Si esta convencido de la expansion anterior, considere ahora una parecida:(1 + eiθ

)ny muestre que

n∑m=0

Am(n) cos(nθ) = 2n cosn(θ

)cos

(nθ

n∑m=0

Am(n) sen(nθ) = 2n cosn(θ

)sen

(nθ

)11. Las funciones hiperbolicas se definen como

cosh(x) =ex + ex

2y senh(x) =

ex + ex

y de manera analoga a las funciones trigonometricas tendremos el resto de funciones

tanh(x) =senh(x)

cosh(x); sech(x) =

cosh(x); csech(x) =

senh(x); ctanh(x) =

tanh(x);

a) Muestre las siguientes equivalencias

cosh(x) = cos(ix), i senh(x) = sen(ix), cos(x) = cosh(ix) y i sen(x) = senh(x)

b) Muestre las siguientes identidades

cosh2(x)− senh2(x) = 1; sech2(x) = 1− tanh2(x); cosh(2x) = cosh2(x) + senh2(x)

c) Resuelva las siguientes ecuaciones hiperbolicas

cosh(x)− 5senh(x)− 5 = 0, 2 cosh(4x)− 8 cosh(2x) + 5 = 0 y cosh(x) = senh(x) + 2sech(x)

d) La posicion de una partıcula vista desde dos observadores relativistas O y O puede expresarse entermino de funciones hiperbolicas como

xµ = Lµν xν con µ, ν = 0, 1 y Lµν =

(cosh(φ) −senh(φ)senh(φ) cosh(φ)

)Encuentre la matriz Lµν tal que xν = Lνµ x

Muestre que ds2 = (x0)2 − (x1)2 = (x0)2 − (x1)2 .

Borra

dor Pre

limin

arCapıtulo 2Espacios Vectoriales Lineales

Borra

dor Pre

limin

2.1. Grupos, cuerpos y espacios vectoriales

2.1.1. Grupos

Considere el siguiente conjunto G = g1, g2, g3, · · · , gn, · · · y la operacion . Entonces estos elementosforman un grupo abeliano1 respecto a la operacion si ∀ gi ∈ G se tiene que:

1. Cerrada respecto a la operacion : gi ∈ G, gj ∈ G ⇒ ∃ gk = gi gj ∈ G

2. Asociativa respecto a la operacion : gk (gi gj) = (gk gi) gj

3. Existencia de un elemento neutro: ∃ 1 ∈ G ⇒ gi 1 = gi = 1 gi

4. Existencia de un elemento inverso: gi ∈ G ⇒ ∃ g−1i ∈ G ⇒ gi g−1

i = g−1i gi = 1

5. Conmutativa respecto a la operacion : gi gj ≡ gj gi .

Ejemplos de grupos:

Los enteros Z = · · · − 3− 2,−1, 0, 1, 2, 3, · · · respecto a la suma pero no respecto a la multiplicacion(excluyendo el cero) por cuanto no existe inverso

Los racionales respecto a la suma y a la multiplicacion

Los numeros complejos z = eiθ respecto a la multiplicacion

Las rotaciones en 2 dimensiones (2D), sin embargo las rotaciones en 3D forman un grupo no-abeliano

Dado un grupo de tres elementos, G = 1, a, b y la operacion . Por construccion si queremos que laoperacion de dos de los elementos provea un tercero distinto, entonces la UNICA “tabla de multiplica-cion” posible sera:

1 a b1 1 a ba a b 1b b 1 a

Si solo se cumplen las cuatro primeras, entonces se dice que simplemente forman grupo respecto a laoperacion . Se pueden definir subgrupos si un subconjuntos de los elementos de un grupo gi ∈ G tambienforman un grupo.

El numero de los elementos de un grupo puede ser finito o infinito. En el primer caso de denominangrupos finitos y el numero de elementos que contenga se conoce como el orden del grupo. Un grupo finitoque se construye a partir de una operacion con un unico miembro se denomina grupo cıclico, y el casomas elemental es G =

I,X,X2, X3, · · · , Xg−1

. Obviamente hemos definido aquı: X2 = XX y X3 =

X2X = XXX y ası consecutivamente hasta ejecutarse g − 1 veces, entonces se retoma el elementoidentidad, esto es: Xg−1 X = Xg = I.

1NIELS HENRIK ABEL, (1802-1829 Noruega) Pionero en el desarrollo de diferentes ramas de la matematica moderna, Abelmostro desde su infancia un notable talento para el estudio de las ciencias exactas. Tal predisposicion se verıa muy prontoconfirmada por sus precoces investigaciones sobre cuestiones de algebra y calculo integral, en particular sobre la teorıa de lasintegrales de funciones algebraicas (a las que se denominarıa abelianas en honor de su formulador) que no habrıa de publicarsehasta 1841, doce anos despues de su fallecimiento. En 2002 el gobierno noruego lanzo el premio Abel que llenara el vacıo queexiste en la premiacion Nobel del gobierno sueco, en el cual no existe premiacion para la comunidad matematica.

Borra

dor Pre

limin

Considere los siguientes conjuntos y operaciones

Gmod8 = 1, 3, 5, 7 y la operacion multiplicacion modulo 8. Esto es: multiplicar dos de los elementosy dividirlo entre (para este caso) 8. De esta forma 3 · 3 = 9 y el residuo de dividir 9/8 es 1, vale decir(3 · 3)mod8 = 1 De esta manera construimos entonces la tabla de multiplicacion

×mod8 1 3 5 71 1 3 5 73 3 1 7 55 5 7 1 37 7 5 3 1

Gmod5 = 1, 2, 3, 4 y la operacion multiplicacion modulo 5. Tabla de multiplicacion:

×mod5 1 2 3 41 1 2 3 42 2 4 1 33 3 1 4 24 4 3 2 1

⇔

×mod5 1 2 4 31 1 2 4 32 2 4 3 14 4 3 1 23 3 1 2 4

Gmod24 = 1, 5, 7, 11 y la operacion multiplicacion modulo 24. Tabla de multiplicacion:

×mod24 1 5 7 111 1 5 7 115 5 1 11 77 7 11 1 511 11 7 5 1

G× = 1, i,−1,−i y la operacion multiplicacion:

× 1 i -1 -i1 1 i -1 -ii i -1 -i 1

-1 -1 -i 1 i-i -i 1 i -1

Diremos que los grupos Gmod8 y Gmod24 son isomorfos porque tienen tablas equivalentes de multiplicacion.Esto es, dado un grupo generico G = 1, A,B,C su tabla de multiplicacion sera:

× 1 A B C1 1 A B CA A 1 C BB B C 1 AC C B A 1

Borra

dor Pre

limin

Note que A−1 =A y que siempre la operacion de dos elementos da uno distinto a los operados.De igual forma los grupos G× y Gmod5 son isomorfos con una tabla de multiplicacion

× 1 A B C1 1 A B CA A B C 1B B C 1 AC C 1 A B

2.1.2. Cuerpo

Definiremos como un cuerpo (o campo) el conjunto A = α1, α2, α3, · · · , αn, · · · sobre el cual estandefinidas dos operaciones: suma (+) y multiplicacion (·) y que satisfacen las siguientes propiedades:

1. Forman un grupo abeliano respecto a la suma (+), con el elemento neutro representado por el cero (0).

2. Forman un grupo abeliano respecto a la multiplicacion (·). Se excluye el cero (0) y se denota el elementoneutro de la multiplicacion como (1).

3. Es distributiva respecto a la suma (+) : Dados αi, αj y αk se tiene queαi · (αj + αk) = αi · αj + αi · αk.

Ejemplos tıpicos de campos lo constituyen los racionales Q, los numeros reales R y los numeros complejosC. Normalmente se refiere estos campos como Campos Escalares.

2.1.3. Espacios vectoriales lineales

Sea el conjunto de objetos V = |v1〉 , |v2〉 , |v3〉 · · · |vi〉 · · · . Se denominara V un espacio vectorial linealy sus elementos |vi〉 vectores, si existe una operacion suma, , respecto a la cual los elementos |vi〉 ∈ Vforman un grupo abeliano y una operacion multiplicacion por un elemento de un campo, K = α, β, γ · · · ,tal que:

1. La operacion suma es cerrada en V : ∀ |vi〉 , |vj〉 ∈ V ⇒ |vk〉 = |vi〉 |vj〉 ∈ V

2. La operacion suma es conmutativa y asociativa:

a) ∀ |vi〉 , |vj〉 ∈ V ⇒ |vi〉 |vj〉 = |vj〉 |vi〉b) ∀ |vi〉 , |vj〉 , |vk〉 ∈ V ⇒ (|vi〉 |vj〉) |vk〉 = |vi〉 (|vj〉 |vk〉)

3. Existe un unico elemento neutro |0〉 : |0〉 |vj〉 = |vj〉 |0〉 = |vj〉 ∀ |vj〉 ∈ V

4. Existe un elemento simetrico para cada elemento de V: ∀ |vj〉 ∈ V ∃ |−vj〉 / |vj〉 |−vj〉 = |0〉

5. α (β |vi〉) = (αβ) |vi〉

6. (α+ β) |vi〉 = α |vi〉+ β |vi〉

7. α (|vi〉 |vj〉) = α |vi〉 α |vj〉

8. 1 |vi〉 = |vi〉

Es inmediato notar que podemos definir subespacios vectoriales dentro de los espacios vectoriales. Ellosseran aquellos conjuntos de vectores que cumplan con los requisitos anteriores pero ademas cerrados dentrode los mismos conjuntos de vectores.

Borra

dor Pre

limin

2.1.4. Ejemplos espacios vectoriales

Seran ejemplos de espacios vectoriales los siguientes:

1. Los numeros reales y complejos con el campo de reales o complejos y definidas las operaciones ordinariasde suma y multiplicacion.

V ≡ R , ≡ + , |v〉 ≡ x , K ≡ R.V ≡ C , ≡ + , |v〉 ≡ x+ iy , K ≡ R.

Cuando el campo K es el conjunto de los numeros reales se dira que es un espacio vectorial real denumeros reales si V ≡ R, y si V ≡ C se dira un espacio vectorial real de numeros complejos. Por suparte, si K ≡ C diremos que es un espacio vectorial complejo de numeros reales (V ≡ R) o complejos(V ≡ C). Siempre se asociara el campo de escalares al espacio vectorial. Se dira que es un espaciovectorial sobre el campo de los escales. Si el campo es real (complejo) se dira que el espacio vectoriales real (complejo).

2. El espacio V ≡ Rn = R ×R × · · · ×R, vale decir el producto cartesiano de R, cuyos elementos sonn−uplas de numeros, con la operacion suma ordinaria de vectores en n-dimensionales y la multiplicacionpor escalares.

|x〉 = (x1, x2, x3, · · ·xn) ∧ |y〉 = (y1, y2, y3, · · · , yn)

|x〉 |y〉 ≡ (x1 + y1, x2 + y2, x3 + y3, · · ·xn + yn)

α |x〉 = (αx1, αx2, αx3, · · ·αxn) .

Este espacio vectorial es de dimension finita. Igualmente, sera un espacio vectorial Cn = C×C×· · ·×Cpara el cual los elementos xi ∈ C. Si para este caso el campo sobre el cual se define el espacio vectorialCn es real, tendremos un espacio vectorial real de numeros complejos.

Es obvio que el caso V ≡ R para el cual |x〉1 = (x1, 0, 0, · · · , 0) y |y〉1 = (y1, 0, 0, · · · , 0) o cual-quier espacio de vectores formados por las componentes, i.e. |x〉i = (0, 0, 0, · · · , xi, · · · 0) y |y〉i =(0, 0, 0, · · · , yi, · · · 0) formaran subespacios vectoriales dentro de Rn.

3. El espacio E∞ constituido por vectores |x〉 = (x1, x2, x3, · · ·xn, · · · ) contables pero con infinitas com-ponentes.

|x〉 = (x1, x2, x3, · · · , xn, · · · ) ∧ |y〉 = (y1, y2, y3, · · · , yn, · · · )|x〉 |y〉 ≡ (x1 + y1, x2 + y2, x3 + y3, · · · , xn + yn, · · · )

α |x〉 = (αx1, αx2, αx3, · · · , αxn, · · · ) ,

con la restriccion que

lımn→∞

n∑i=1

xi = L , con L finito .

4. El conjunto de la matrices n× n reales o complejas con el campo K real o complejo.

|x〉 = Mab ∧ |y〉 = Nab

|x〉 |y〉 ≡Mab +Nab = (M +N)abα |x〉 = αMab = (αM)ab

Es tambien obvio que se podran formar subespacios vectoriales cuyos elementos sean matrices dedimension menor a n× n.

Borra

dor Pre

limin

5. El conjunto de todos los polinomios con coeficientes reales: P =a0, a1x, a2x

2, · · · , anxn, · · ·

, con la suma ordinaria entre polinomios y la multiplicacion ordinaria de polinomios con escalares.

6. Espacios Funcionales (de los cuales los polinomios son un caso particular). En estos espacios los vectoresseran funciones, la suma sera la suma ordinaria entre funciones y la multiplicacion por un escalartambien sera la multiplicacion ordinaria de una funcion por un elemento de un campo

|f〉 = f (x) ∧ |g〉 = g (x)

|f〉 |g〉 ≡ f (x) + g (x) ≡ (f + g) (x)

α |f〉 = (αf) (x) ≡ αf (x) .

7. El conjunto de todas las funciones continuas e infinitamente diferenciables, definidas en el intervalo[a, b] : C∞[a,b] .

8. El conjunto de todas las funciones complejas de variable real, ψ (x) , definidas en [a, b] , de cuadrado

integrable (es decir para las cuales∫ ba

dx |ψ (x)|2 sea finita). Este espacio se denomina comunmenteL2 y puede ser definido en un rango [a, b], finito o infinito, y para mas de una variable.

2.1.5. La importancia de la conceptualizacion y la notacion

En los ejemplos antes mencionados hemos utilizado para representar un vector abstracto la notacionde |v1〉 y con ellos construimos un espacio vectorial abstracto V = |v1〉 , |v2〉 , |v3〉 , · · · , |vn〉. Un espaciovectorial abstracto sera un conjunto de elementos genericos que satisfacen ciertos axiomas. Dependiendo delconjunto de axiomas tendremos distintos tipos de espacios abstractos. En matematica el concepto de espaciosabstracto es reciente (1928) y, aparentemente, se le debe a Maurice Frechet2. La teorıa resulta de desarrollarlas consecuencias logicas que resultan de esos axiomas. Los elementos de esos espacios se dejan sin especificara proposito. Ese vector abstracto puede representar, vectores en Rn, matrices n × n o funciones continuas.La notacion |v1〉, que se denomina un ket y al cual le corresponde un bra 〈v2| proviene del vocablo inglesbraket que significa corchete y sera evidente mas adelante cuando construyamos escalares braket 〈v2| |v1〉 .Esta util notacion la ideo Paul Dirac3, uno de los fısicos mas influyentes en el desarrollo de la fısica del sigloXX.

2.1.6. Ejercicios

1. Sea S el conjunto de todos los numeros reales excluyendo −1 y defina la operacion

a b = a+ b+ ab

donde + es la suma estandar entre numeros reales.

a) Muestre que [S,] forman grupo

b) Encuentre la solucion en S para la ecuacion 2 x 3 = 7

2MAURICE FReCHET (1878 Maligny, Yonne, Bourgogne-1973 Parıs, Francia). Versatil matematico frances, con importantescontribuciones en Espacios Metricos, Topologıa y creador del concepto de Espacios Abstractos.

3PAUL ADRIEN MAURICE DIRAC (1902 Bristol, Inglaterra 1984-Tallahassee, EE.UU). Ademas de contribuir de maneradeterminante en la comprension de la Mecanica Cuantica, es uno de los creadores de la Mecanica Cuantica Relativista la cualayudo a comprender el papel que juega el espın en las partıculas subatomicas. Por sus importantes trabajos compartio conErwin Schrodinger el Premio Nobel de Fısica en 1933.

Borra

dor Pre

limin

2. Considere un triangulo equilatero. Uno puede identificar operaciones de rotacion alrededor de un ejeperpendicular a la figura y reflexiones respecto a planos que dejan invariante la figura del triangulo.

a) Muestre que el conjunto de estas operaciones forma un grupo G4 =I,R, R,X1, X2, X3

. con

I la operacion identidad; R y R las rotaciones y X1, X2 y X3 las reflexiones. Muestre ademas,que las rotaciones forman un subgrupo cıclico de orden 3, mientras que las reflexiones forman unsubgrupo cıclico de orden 2

b) Construya la tabla de multiplicacion para G4

c) Considere las siguientes matrices

I =

(1 00 1

); A =

− 12

√3

−√

32 − 1

B =

− 12 −

√3

2 − 12

C =

(−1 00 1

); D =

12 −

√3

−√

32 − 1

E =

√3

212

Muestre que forman grupo bajo la multiplicacion de matrices y que ese grupo es isomorfo a G4

d) Considere las siguientes funciones

f1(x) = x; f2(x) =1

x; f3(x) =

1− x; f4(x) =

x− 1

x; f5(x) = 1− x; f6(x) =

x− 1;

Muestre que forman grupo bajo la operacion fi(x)fj(x) = fi(fj(x)) y que ese grupo es isomorfoa G4

3. Definamos una operacion binaria como

x y = x+ y + αxy

con x, y, α ∈ R y ademas α 6= 0.

a) Demuestre que es asociativa

b) Muestre que genera un grupo enR−

(−1α

). Es decir, ∀x, y ∈ R ∧ x 6= −1

α , y 6=−1α entonces

x y forma un grupo

4. Muestre que el siguiente conjunto de transformaciones en el plano xy forman un grupo y construya sutabla de multiplicacion

a) 1 =

x→ x

y → y

b) I =

x→ −x

y → −y

Borra

dor Pre

limin

c) Ix =

x→ −x

y → y

d) Iy =

x→ x

y → −y

5. Muestre que tambien seran espacios vectoriales

a) El conjunto de todas las funciones f = f (x) definidas en x = 1 con f (1) = 0. Si f (1) = c¿Tendremos igual un espacio vectorial? ¿Por que?

b) Los vectores (x, y, z) ∈ V3 tal que sus componentes satisfacen el siguiente sistema de ecuacionesalgebraico

a11x+ a12y + a13z = 0

a21x+ a22y + a23z = 0

a31x+ a32y + a33z = 0

2.2. Espacios metricos, normados y con producto interno

2.2.1. Metricas y espacios metricos

El siguiente paso en la dotacion de propiedades de los espacios lineales lo constituye la idea de metrica odistancia entre sus elementos. El concepto de metrica surge de la generalizacion de la idea de distancia entredos puntos de la recta real.

Un espacio vectorial sera metrico si podemos definir una funcion d tal que:

d : V ×V→ R / ∀ |x〉 , |y〉 , |z〉 ∈ V

y se cumple que:

1. d (|x〉 , |y〉) ≥ 0 , si d (|x〉 , |y〉) = 0 ⇒ |x〉 ≡ |y〉

2. d (|x〉 , |y〉) ≡ d (|y〉 , |x〉)

3. d (|x〉 , |y〉) ≤ d (|x〉 , |z〉) + d (|y〉 , |z〉) (La desigualdad triangular).

Ası, diremos que (V,K,, d) es un espacio vectorial, lineal, metrico.

Ejemplos

1. Espacios euclidianos reales Rn .

a) Para R, es decir la recta real, la definicion de metrica es d (|x〉 , |y〉) ≡ |x− y| .

b) Para R2, es decir el plano, una definicion de metrica es: d (|x〉 , |y〉) ≡√

(x1 − y1)2

+ (x2 − y2)2.

Tambien podemos construir otra definicion de metrica como: d (|x〉 , |y〉) ≡ |x1 − y1|+|x2 − y2|. Laprimera de estas metricas se conoce como metrica euclıdea y la segunda como metrica Manhattano metrica de taxistas. Es claro como el mismo espacio vectorial genera varios espacios metricos,dependiendo de la definicion de metrica, y para el caso particular de estas dos metricas correspon-den corresponden a medidas del desplazamiento en aviones (metrıca euclıdea) o vehıculos terresteen ciudades.

Borra

dor Pre

limin

c) En general para espacios euclidianos reales Rn una posible definicion de metrica sera:

d (|x〉 , |y〉) ≡√

(x1 − y1)2

+ (x2 − y2)2

+ (x3 − y3)2

+ · · ·+ (xn − yn)2.

2. Espacios unitarios n−dimensionales, o espacios euclidianos complejos, Cn. La definicion de distanciapuede construirse como:

d (|x〉 , |y〉) ≡√|x1 − y1|2 + |x2 − y2|2 + |x3 − y3|2 + · · ·+ |xn − yn|2

y es claro que se recobra la idea de distancia en el plano complejo: d (|x〉 , |y〉) ≡ |x− y|.

3. Para los espacios de funciones C∞[a,b] una posible definicion de distancia serıa:

d (|f〉 , |g〉) ≡ maxt∈[a,b]

|f (t)− g (t)| .

Es importante destacar que las definiciones de distancia arriba propuesta son invariante bajo traslacionesde vectores. Esto es: |x〉 = |x〉+ |a〉 ∧ |y〉 = |y〉+ |a〉, entonces, d (|x〉 , |y〉) ≡ d (|x〉 , |y〉) .

2.2.2. Normas y espacios normados

La idea de distancia, de metrica, es el equipamiento mas elemental que uno le puede exigir a un espaciovectorial. Mucho mas interesante aun son aquellos espacios vectoriales que estan equipados con la idea denorma y, a partir de allı, se define la idea de distancia. La norma tiene que ver con el “tamano” del vector yla metrica tiene que ver con la distancia entre vectores. Cuando definimos la metrica a partir de la norma,vinculamos las propiedades algebraicas del espacio con sus propiedades geometricas.

La Norma, ‖|vi〉‖ ≡ N (|vi〉) de un espacio vectorial V = |v1〉 , |v2〉 , |v3〉 · · · |vn〉 sera una funcionN : V→ R / ∀ |vi〉 ∈ V que cumple con:

1. N (|vi〉) ≡ ‖|vi〉‖ ≥ 0 , si ‖|vi〉‖ = 0 ⇒ |vi〉 ≡ |0〉

2. N (α |vi〉) ≡ ‖α |vi〉‖ = |α| ‖|vi〉‖

3. ‖|vi〉+ |vj〉‖ ≤ ‖|vi〉‖+ ‖|vj〉‖ (Desigualdad Triangular).

La definicion de Norma induce una metrica de la forma d (|vi〉 , |vj〉) ≡ ‖|vi〉 − |vj〉‖. Se denota en estecaso un espacio vectorial normado como (V,K,; ‖·‖) y tambien se le conoce como un Espacio de Banach.El concepto de espacio vectorial normado fue formulado en 1922 de manera independiente por S. Banach4,H. Hahn y N. Wiener.

Ejemplos

1. Espacios euclidianos reales, Rn y espacios euclidianos complejos Cn. Para estos espacios de Banach, laNorma se define como:

‖|x〉‖ =

√|x1|2 + |x2|2 + |x3|2 + · · ·+ |xn|2 =

(n∑i=1

|xi|2) 1

4STEFAN BANACH (1892 Kracovia, Polonia-1945 Lvov,Ucrania) Matematico polaco, uno de los fundadores del AnalisisFuncional Moderno, con sus mayores contribuciones a la teorıa de espacios topologicos. Hizo tambien importantes aportes a lateorıa de la Medida, Integracion y Teorıa de Conjuntos y Series Ortogonales.

Borra

dor Pre

limin

es claro que para un espacio euclidiano R3 se cumple que ‖|x〉‖ =√x2

1 + x22 + x2

3, por lo tanto, laidea de Norma generaliza la nocion de “tamano” del vector |x〉. Tambien es claro que la definicion dedistancia se construye a partir de la norma de la forma:

d (|x〉 , |y〉) ≡ ‖|x〉 − |y〉‖ =

√|x1 − y1|2 + |x2 − y2|2 + |x3 − y3|2 + · · ·+ |xn − yn|2 .

2. Para el espacio lineal de matrices n × n reales o complejas con el campo K real o complejo, unadefinicion de norma es

‖M‖ =

m∑a=1

n∑b=1

|Mab| ,

y la correspondiente definicion de distancia

d (|x〉 , |y〉) ≡ ‖M −N‖ =

m∑a=1

n∑b=1

|Mab −Nab| .

3. Para los espacios funcionales C∞[a,b] una posible definicion de norma serıa:

‖|f〉‖ = maxt∈[a,b]

|f (t)| ,

otra posible definicion serıa

‖|f〉‖ =

(∫t∈[a,b]

dx |f (x)|2) 1

2.2.3. Espacios con producto interno

El siguiente paso en la construccion de espacios vectoriales mas ricos es equiparlo con la definicion deproducto interno y a partir de esta definicion construir el concepto de norma y con este el de distancia.La idea de producto interno generaliza el concepto de producto escalar de vectores en R3 e incorpora a losespacios vectoriales abstractos el concepto de ortogonalidad y descomposicion ortogonal. Historicamente, lateorıa de espacios vectoriales con producto interno es anterior a la teorıa de espacios metricos y espacios deBanach y se le debe a D. Hilbert5. Adicionalmente, la semejanza entre la geometrıa euclidiana y la geometricade Rn ha hecho que espacios en los cuales de puedan definir, distancia, angulos, a partir de una definicionde producto interno, se denominen tambien espacios euclidianos.

Producto interno

En un espacio vectorial abstracto V = |v1〉 , |v2〉 , |v3〉 · · · |vn〉, la definicion del producto interno dedos vectores se denota como 〈vi| vj〉 y es una funcion: V ×V→ K ∀ |vi〉 , |vj〉 , |vk〉 ∈ V, es decir, asocia aese par de vectores con un elemento del campo, o cuerpo, K.

Las propiedades que definen el producto interno son:

1. 〈vi| vi〉 ∈ K ∧ 〈vi| vi〉 ≥ 0 ∀ |vi〉 ∈ V , si 〈vi| vi〉 = 0 ⇒ |vi〉 ≡ |0〉5DAVID HILBERT (1862 Kaliningrad, Rusia-1943 Gottingen, Alemania) Matematico aleman defensor de la axiomatica

como enfoque primordial de los problemas cientıficos. Hizo importantes contribuciones en distintas areas de la matematica,como: Invariantes, Campos de Numeros Algebraicos, Analisis Funcional, Ecuaciones Integrales, Fısica-Matematica y Calculo enVariaciones.

Borra

dor Pre

limin

2. 〈vi| vj〉 = 〈vj | vi〉∗ ∀ |vi〉 , |vj〉 ∈ V

3. 〈vi| vj + vk〉 = 〈vi| vj〉+ 〈vi| vk〉 ∧ 〈vi + vj | vk〉 = 〈vi| vk〉+ 〈vj | vk〉 ∀ |vi〉 , |vj〉 , |vk〉 ∈ V

4. 〈vi| αvj〉 = α 〈vi| vj〉 ∧ 〈αvi| vj〉 = α∗ 〈vi| vj〉 ∀ |vi〉 , |vj〉 ∈ V ∧ α ∈ K

5. 〈vi| 0〉 = 〈0| vi〉 = 0

A partir de la definicion de producto interno se construyen los conceptos de norma y distancia

‖|vi〉‖ =√〈vi| vi〉 y d (|vi〉 , |vj〉) ≡ ‖|vi〉 − |vj〉‖ =

√〈vi − vj | vi − vj〉

La desigualdad de Cauchy-Schwarz

Todo producto interno 〈vi| vj〉 definido en un espacio vectorial abstracto V = |v1〉 , |v2〉 , |v3〉 · · · |vn〉cumple con la desigualdad de Cauchy-Schwarz

|〈vi| vj〉|2 ≤ 〈vi| vi〉〈vj | vj〉 ⇐⇒ |〈vi| vj〉| ≤ ‖|vi〉‖ ‖|vj〉‖ .

Es claro que si |vi〉 = |0〉 ∧ |vj〉 = |0〉 se cumple la igualdad y es trivial la afirmacion.Para |vi〉 ∧ |vj〉 cualesquiera, procedemos construyendo |vk〉 = α |vi〉+ β |vj〉 con |vi〉 ∧ |vj〉 arbitrarios,

pero α y β tendran valores particulares, por lo tanto

〈vk| vk〉 ≡ 〈αvi + βvj | αvi + βvj〉 ≥ 0

= |α|2 〈vi| vi〉+ α∗β 〈vi| vj〉+ β∗α 〈vj | vi〉+ |β|2 〈vj | vj〉 ≥ 0 .

Si α = 〈vj | vj〉, se tiene que

〈vj | vj〉〈vi| vi〉+ β 〈vi| vj〉+ β∗ 〈vj | vi〉+ |β|2 ≥ 0 ,

seguidamente seleccionamos β = −〈vi| vj〉 y por lo tanto β∗ = −〈vj | vi〉 y consecuentemente

〈vj | vj〉〈vi| vi〉 ≥ 〈vi| vj〉〈vj | vi〉 = |〈vi| vj〉|2 .

De la desigualdad de Cauchy-Schwarz y la definicion de norma se desprende que

|〈vi| vj〉|2

‖|vi〉‖2 ‖|vj〉‖2≤ 1 ⇒ −1 ≤ |〈vi| vj〉|

‖|vi〉‖ ‖|vj〉‖≤ 1 ,

por lo tanto podemos definir el “angulo” entre los vectores abstractos |vi〉 ∧ |vj〉 como

cos(Θ) =|〈vi| vj〉|‖|vi〉‖ ‖|vj〉‖

Mas aun, a partir de la definicion de norma se obtiene

con lo cual hemos generalizado para un espacio vectorial abstracto el teorema del coseno

‖|vi〉+ |vj〉‖2 = ‖|vi〉‖2 + ‖|vj〉‖2 + 2 ‖|vi〉‖ ‖|vj〉‖ cos(Θ)

y para el caso que los vectores |vi〉 ∧ |vj〉 sean ortogonales, esto es 〈vi| vj〉 = 0, tendremos el teorema dePitagoras generalizado

‖|vi〉+ |vj〉‖2 = ‖|vi〉‖2 + ‖|vj〉‖2 .

Borra

dor Pre

limin

Ejemplos

1. Espacios euclidianos reales, Rn y espacios euclidianos complejos Cn.

Los vectores de estos espacios pueden ser representados por |x〉 = (x1, x2, · · ·xn) ∧ |y〉 = (y1, y2, · · · , yn)y el producto interno queda definido por

〈x| y〉 = x1y1 + x2y2 + x3y3, · · ·xnyn =

n∑i=1

xiyi ,

es claro que esta definicion de producto interno coincide, para R2 (y R3) con la idea de productoescalar convencional que consideramos en las secciones 1.3.1 y 1.5.3, vale decir

a = axi + ayj

b = bxi + byj

⇒ a · b = axbx + ayby .

Ahora bien, el lector puede comprobar que para vectores en R2 tambien se puede proveer una definicionde producto interno

a~ b = 2axbx + axby + aybx + ayby ,

igualmente valida, con lo cual es claro que en un mismo espacio vectorial pueden coexistir diferentesproductos internos. Por su parte, la norma es

‖|x〉‖ =√〈x| x〉 =

√x2

1 + x22 + x2

3, · · ·+ x2n =

√√√√ n∑i=1

x2i .

La distancia tambien recupera la idea intuitiva de distancia euclidiana

d (|x〉 , |y〉) ≡ ‖|x〉 − |y〉‖ =√〈x− y| x− y〉

d (|x〉 , |y〉) =

√(x1 − y1)

2+ (x2 − y2)

2+ (x3 − y3)

2+ · · ·+ (xn − yn)

El teorema del coseno queda como

n∑i=1

(xi + yi)2

n∑i=1

x2i +

n∑i=1

y2i + 2

√√√√ n∑i=1

x2i

√√√√ n∑i=1

y2i cos(Θ) ,

mientras que el teorema de Pitagoras es

n∑i=1

(xi + yi)2

n∑i=1

x2i +

n∑i=1

y2i ,

obvio que para R2 tanto el teorema del coseno como el teorema de Pitagoras retoman su forma tradi-cional. Finalmente la desigualdad de Cauchy-Schwarz se expresa

|〈x| y〉| ≤ ‖|x〉‖ ‖|y〉‖ ⇒

∣∣∣∣∣n∑i=1

xiyi

∣∣∣∣∣2

≤n∑i=1

x2i

n∑i=1

y2i .

Borra

dor Pre

limin

2. Para los espacios de funciones continuas C∞[a,b] una posible definicion de producto interno serıa

〈f | g〉 =

∫dx f∗ (x) g (x) ,

de la cual se deriva la expresion para la norma

‖|f〉‖2 = 〈f | f〉 =

∫dx |f (x)|2 ,

la distancia entre funciones quedara definida como

d (|f〉 , |g〉) ≡ ‖|f〉 − |g〉‖ ≡√〈f − g| f − g〉 =

√〈f | f〉 − 〈f | g〉 − 〈f | g〉∗ + 〈g| g〉

d (|f〉 , |g〉) =

√∫dx |f (x)− g (x)|2

√∫dx |f (x)|2 − 2 Re

(∫dx f∗ (x) g (x)

∫dx |g (x)|2 .

Los teoremas del coseno puede ser escrito como∫dx |f (x) + g (x)|2 =

∫dx |f (x)|2 +

∫dx |g (x)|2

+ 2

(∫dx |f (x)|2

) 12(∫

dx |g (x)|2) 1

cos(Θ) ,

donde

cos(Θ) =

∫dx f∗ (x) g (x)(∫

dx |f (x)|2) 1

2(∫

dx |g (x)|2) 1

y como era de esperarse el teorema de Pitagoras queda∫dx |f (x) + g (x)|2 =

∫dx |f (x)|2 +

∫dx |g (x)|2 ,

para funciones f (x) y g (x) ortogonales, mientras que para este caso, la desigualdad de Cauchy-Schwarzse expresa ∣∣∣∣∫ dx f∗ (x) g (x)

∣∣∣∣2 ≤ ∫ dx |f (x)|2∫

dx |g (x)|2 .

2.2.4. Ejercicio

Los vectores en R3 en coordenada cartesianas los definimos como a = axi + ayj + azk y definimos una“tabla de multiplicacion” entre ellos de la forma

⟨ei |ej〉 = δij con i, j = 1, 2, 3, esto es:⟨

ei |ej〉 i j k

i 1 0 0j 0 1 0k 0 0 1

con i, j = 1, 2, 3

Borra

dor Pre

limin

Un cuaternion cartesiano puede escribirse de manera analoga a los vectores cartesianos, vale decir:

|a〉 = aα |qα〉 = a0 + ai |qi〉 = a0 + axi + ayj + azk ,

con α = 0, 1, 2, 3 y donde las ai (con i = 1, 2, 3) son numeros reales que representan las componentesvectoriales en coordenadas cartesianas de los cuaterniones, mientras que la a0, tambien un numero real se lellama componente escalar6. Los cuaterniones fueron inventados por el matematico irlandes William RowanHamilton a mediados del siglo XIX, y por decirlo de alguna manera, son hıbridos o generalizaciones a unplano hipercomplejo. Un vector cartesiano es un cuaternion con la componente escalar nula.

Basandonos en este esquema podemos definir la “tabla de multiplicacion” para los cuaterniones cartesia-nos como

|q′i〉 |qj〉 1 |q1〉 |q2〉 |q3〉1 1 |q1〉 |q2〉 |q3〉|q′1〉 |q1〉 −1 |q3〉 − |q2〉|q′2〉 |q2〉 − |q3〉 −1 |q1〉|q′3〉 |q3〉 |q2〉 − |q1〉 −1

Notese que por el hecho que |qj〉 |qj〉 = −1 ⇒ |q1〉 |q1〉 = |q2〉 |q2〉 = |q3〉 |q3〉 = −1, se puedepensar que un cuaternion es la generalizacion de los numeros complejos a mas de una dimension (un numerohipercomplejo) donde la parte imaginaria tendrıa tres dimensiones y no una como es costumbre. Esto es

|a〉 = aα |qα〉 = a0 |q0〉︸︷︷︸1

+ aj |qj〉 = a0 + a1 |q1〉+ a2 |q2〉+ a3 |q3〉︸︷︷︸“parte compleja”

Siendo consistente con esa vision de generalizacion de un numero complejo, definiremos el conjugado deun cuaternion como |b〉z = b0 |q0〉 − bj |qj〉 con j = 1, 2, 3. Es decir, en analogıa con los numeros complejosel conjugado de un cuaternion cambia el signo de su “parte compleja vectorial”. Igualmente, definiremos lasuma entre cuaterniones como

|a〉 = aα |qα〉

|b〉 = bα |qα〉

⇒ |c〉 = cα |qα〉 = |a〉+ |b〉 = (aα + bα) |qα〉 ⇒ cα = (aα + bα)

Esto quiere decir que los vectores se suman componente a componente. Mientras que la multiplicacion porun escalar queda definida por α |c〉 = αcα |qα〉, es decir se multiplica el escalar por cada componente.

1. Compruebe si los Cuaterniones, |a〉, forman un espacio vectorial respecto a una operacion esa sumay esa multiplicacion por escalares, analoga a la de los vectores en R3 en coordenada cartesianas ¿Loscuaterniones |a〉 son vectores, pseudovectores o ninguna de las anteriores? Explique por que.

2. Dados dos cuaterniones |b〉 ≡(b0,b

)y |r〉 ≡

(r0, r

), entonces, el producto entre cuaterniones |d〉 =

|b〉 |r〉 podra representarse como

|d〉 = |b〉 |r〉 ←→(d0,d

)=(b0r0 − b · r, r0b + b0r + b× r

)donde · y × corresponden con los productos escalares y vectoriales tridimensionales de siempre.

6Recuerde que estamos utilizando la convencion de Einstein en la cual cα |qα〉 ≡ c0 +∑3j=1 c

j |qj〉. Es decir hemos supuesto

que |q0〉 ≡ 1, la unidad en los numeros reales. Adicionalmente, notese que los ındices griegos α, β, · · · toman los valores 0, 1, 2, 3,mientras que los latinos que acompanan a los vectores cartesianos toman los siguiente valores j, k, l = 1, 2, 3.

Borra

dor Pre

limin

Ahora con ındices: dados |b〉 = bα |qα〉 y |r〉 = rα |qα〉, compruebe si el producto |d〉 = |b〉 |r〉 puedeser siempre escrito de la forma

|d〉 = |b〉 |r〉 = a |q0〉+ S(ij)δ0i |qj〉+A[jk]ibjrk |qi〉

donde a representa un escalar; S(ij)δ0i tres cantidades (recuerde que los ındices latinos toman los valores

j, k, l = 1, 2, 3, mientras i = 0, 1, 2, 3); donde S(ij) indica Sji = Sij , que la cantidad Sij es simetrica, ypor lo tanto

(Sijδ0

i + Sjiδ0i

)|qj〉. Mientras A[jk]i representa un conjunto de objetos antisimetricos en

j y k: A[jk]i → Ajki = −Akji →(Ajkibjrk −Akjibjrk

)|qi〉7.

Identifique las cantidades: a, S(ij) y A[jk]i en terminos de las componentes de los cuaterniones ¿Elproducto de cuaterniones |d〉 = |a〉 |r〉 sera un vector, pseudovector o ninguna de las anteriores?Explique por que.

3. Muestre que los cuaterniones pueden ser representados por matrices complejas 2× 2 del tipo

|b〉 ←→(

z w−w z

)donde z, w son numeros complejos y w y z sus complejos conjugados

4. Muestre que una representacion posible para la base de cuaterniones es, la matriz unitaria 4x4 y

|q1〉 =

0 1 0 0−1 0 0 00 0 0 10 0 −1 0

; |q2〉 =

0 0 0 −10 0 −1 00 1 0 01 0 0 0

; |q3〉 =

0 0 −1 00 0 0 11 0 0 00 −1 0 0

5. Compruebe si la siguiente es una buena definicion de producto interno:

〈a |b〉 = |a〉z |b〉

6. Modifique un poco la definicion anterior de tal forma que se tenga la

(a |b) =1

2[〈a |b〉 − |q1〉〈a |b〉 |q1〉]

y compruebe si esta definicion compleja del producto interno cumple con todas las propiedades. Noteseque un cuaternion de la forma |f〉 = f0 + f1 |q1〉 es un numero complejo convencional.

7. Compruebe si la siguiente es una buena definicion de norma para los cuaterniones

n(|b〉) = ‖|a〉‖ =√〈a |a〉 =

√|a〉z |a〉

8. Comprebe si un cuaternion definido por

|a〉 =|a〉z

‖|a〉‖2

puede ser considerado como el inverso o elemento simetrico de |a〉 respecto a la multiplicacion

9. Compruebe si los Cuaterniones |a〉 forman un grupo respecto a una operacion multiplicacion .

7Para familiarizarse con las expresiones vectoriales con la notacion de ındices puede consultar la seccion 1.6

Borra

dor Pre

limin

10. Los vectores en R3 en coordenadas cartesianas, |v〉, pueden ser representados como cuaterniones dondela parte escalar es nula v0 = 0→ |v〉 = vj |qj〉. Compruebe si el siguiente producto conserva la norma

|v′〉 = |a〉 |v〉 |a〉

Estos es: ‖|v′〉‖2 =(v1′)2

+(v2′)2

+(v3′)2

≡(v1)2

+(v2)2

+(v3)2

= ‖|v〉‖2

2.3. Variedades lineales

2.3.1. Dependencia/independencia lineal

Siguiendo la misma lınea de razonamiento que en las secciones 1.2 y 1.5.2, generalizamos el concepto dedependencia e independencia lineal de R2 y R3. Ası

|0〉 = C1 |v1〉+ C2 |v2〉+ C3 |v3〉 · · ·+ Cn |vn〉 =

n∑i=1

Ci |vi〉 ,

Podemos afirmar que:

Si esta ecuacion se cumple para algun conjunto de Ci no nulos, se dira que el conjunto de vectorescorrespondiente |vi〉 son linealmente dependientes.

Por el contrario, si esta ecuacion solo puede ser satisfecha para todos los Ci = 0, entonces se dira queel conjunto de vectores correspondiente |vi〉 son linealmente independientes.

Ejemplos dependencia/independencia lineal

1. Dados tres vectores en R4

|v1〉 =

13−1

; |v2〉 =

2013

; |v3〉 =

−1

100

El criterio de independencia lineal se cumple si |0〉 = C1 |v1〉+C2 |v2〉+C3 |v3〉 y todos los Ci sonnulos, esto es

C1 +2C2 −C3 = 03C1 +C3 = 0−C1 +C2 = 02C1 +3C2 = 0

de donde es claro ver que la unica solucion posible implica C1 = C2 = C3 = 0, es decir, el conjunto devectores: |v1〉 , |v2〉 , |v3〉 son linealmente independientes.

2. Si consideramos el espacio vectorial V = |v1〉 , |v2〉 , |v3〉 , · · · , |vn〉 seran ejemplos de independen-cia lineal:

|vk〉 ≡ f (t) = tk para k = 1, 2, 3, · · · Es claro que un polinomio de grado n + 1, no podra serexpresado en terminos un polinomio de grado n, en otras palabras, tn+1 6=

∑ni=0 Ci t

i .

|vk〉 ≡ f (t) = eakt con a1, a2, a3, · · · coeficientes constantes. Tambien salta a la vista que nopodremos expresar una de esas funciones exponenciales como una combinacion lineal.

Borra

dor Pre

limin

|v1〉 = cos(t), |v2〉 = sen(t) y |v3〉 = 1,

entonces |v1〉 , |v2〉 , y |v3〉 seran vectores linealmente independientes.

4. Consideremos ahora otro ejemplo en P3:

|x1〉 = 1; |x2〉 = x− 1; |x3〉 = x2; |x4〉 = x2 + 2x+ 1 .

Podemos ver que este conjunto es linealmente dependiente ya que siempre podremos expresar

|x4〉 = 3|x1〉+ 2|x2〉+ |x3〉 .

Ejercicios

1. Considere un conjunto S conformado unicamente por numeros reales positivos. Consideremos las si-guientes reglas sobre S: Por “suma”de dos numeros entenderemos su producto en el sentido usual, yel “producto”de un elemento r ∈ S y un numero real λ entenderemos r elevado a la potencia de λ, enel sentido usual. ¿S es un espacio vectorial?

2. Considere el conjunto de vectores en el plano conformado por vectores localizados en el origen y cuyospuntos finales permanecen siempre en el primer cuadrante. ¿Este conjunto es un espacio vectorial?

3. Diga si los siguientes conjuntos de vectores en P3 son o no linealmente independientes.

a) |x1〉 = 2x; |x2〉 = x2 + 1; |x3〉 = x+ 1; |x4〉 = x2 − 1

b) |x1〉 = x(x− 1); |x2〉 = x; |x3〉 = x3; |x4〉 = 2x3 − x2

2.3.2. Bases de un espacio vectorial

Ahora bien, dado un espacio vectorial V = |v1〉 , |v2〉 , |v3〉 · · · , |vn〉, si encontramos que el conjuntode |vn〉 es linealmente dependiente, entonces siempre es posible despejar uno de los vectores en terminosde los demas, vale decir

|vn〉 = C1 |v1〉+ C2 |v2〉+ C3 |v3〉 · · ·+ Cn−1 |vn−1〉 =

n−1∑i=1

Ci |vi〉 .

Seguidamente podemos proceder a comprobar si |v1〉 , |v2〉 , |v3〉 · · · , |vn−1〉 es un conjunto de vectoreslinealmente independientes, es decir, si C1 = C2 = C3 = · · · = Cn−1 = 0. En caso de no serlo se procedeotra vez a despejar uno de los vectores en terminos de los anteriores y a aplicar el criterio de independencialineal:

|vn−1〉 = C1 |v1〉+ C2 |v2〉+ C3 |v3〉 · · ·+ Cn−2 |vn−2〉 =

n−2∑i=1

Ci |vi〉 ,

se comprueba si se cumpleC1 = C2 = C3 = · · · = Cn−1 = 0 .

Borra

dor Pre

limin

En caso contrario, se repite este procedimiento hasta encontrar un conjunto |v1〉 , |v2〉 , |v3〉 · · · , |vn−j〉 devectores linealmente independientes. Esto es:

C1 = C2 = C3 = · · · = Cn−j = 0 ,

y por lo tanto

|vn−j+1〉 = C1 |v1〉+ C2 |v2〉+ C3 |v3〉 · · ·+ Cn−j |vn−j〉 =

n−j∑i=1

Ci |vi〉 .

Nos preguntamos nuevamente si se cumple que:

C1 = C2 = C3 = · · · = Cn−j = 0 .

En el caso de ser cierto, esto significarıa que

|0〉 = C1 |v1〉+ C2 |v2〉+ C3 |v3〉 · · ·+ Cn−j |vn−j〉 =

n−j∑i=1

Ci |vi〉 ,

Diremos entonces que |v1〉 , |v2〉 , |v3〉 , · · · , |vn−j〉 forman una base para V.La dimension de V sera el conjunto de vectores linealmente independientes, que para este caso sera n−j.

Ası se puede comprobar que, dado |x〉 ∈ V, entonces

|x〉 =

n−j∑i=1

Ci |vi〉 ∀ |x〉 ∈ V ,

y el conjunto C1, C2, C3, · · ·Cn−j sera unico.Diremos que el numero mınimo de vectores:

|v1〉 , |v2〉 , |v3〉 , · · · , |vn−j〉

que expanden V conforman una base de ese espacio vectorial, y que el numero finito de cantidades

C1, C2, C3, · · ·Cn−j ,

constituyen las componentes de |x〉 relativas a la base |v1〉 , |v2〉 , · · · , |vn−j〉.De lo anteriormente expuesto se puede concretar la siguiente definicion:A un conjunto finito de vectores de un espacio vectorial

B = |v1〉 , |v2〉 , |v3〉 , · · · , |vn〉 ∈ V,

se les denominara una base de ese espacio V si los |v1〉 , |v2〉 , |v3〉 , · · · , |vn〉 son linealmente independientesy expanden V. El espacio vectorial se denominara de dimension finita sı el conjunto de vectores base es finitoy de dimension infinita sı, por el contrario, el conjunto de vectores base es infinito.

Es facil darse cuenta que si V lo expanden n vectores linealmente independientes, cualquier otro vector|x〉 ∈ V sera linealmente dependiente. Igualmente, y facilmente demostrable, es que todas las bases de unespacio vectorial V, de dimension finita, tendran el mismo numero de elementos y ese numero de elementosera la dimension del espacio.

Adicionalmente, puede ser que dentro de un espacio vectorial V se puedan encontrar subespacios y dentrode esos subespacios un conjunto de vectores base.

Borra

dor Pre

limin

Vale decir, si ∀ |x〉 ∈ V:

|x〉 = C1 |v1〉 · · ·+ Cn−j |vn−j〉︸︷︷︸S1

+ Cn−j+1 |vn−j+1〉 · · ·Cn−k |vn−k〉︸︷︷︸S2

+ Cn−k+1 |vn−k+1〉 · · ·Cn |vn〉︸︷︷︸S3

con|x〉 = |x1〉+ |x2〉+ |x3〉 y |x1〉 ∈ S1; |x2〉 ∈ S2; |x3〉 ∈ S3 ,

entonces diremos que V es la suma directa de S1,S2 y S3 y lo denotaremos como: V = S1 ⊕ S2 ⊕ S3.

2.3.3. El determinante de Gram

Existe una forma directa de comprobar la independencia lineal de una conjunto de vectores

|v1〉 , |v2〉 , |v3〉 · · · , |vn〉 ∈ V .

Dado un |x〉 ∈ V, entonces, y al multiplicar por 〈vi|, resulta:

|x〉 =

n∑i=1

Ci |vi〉 ⇒

C1 〈v1 |v1〉+ C2 〈v1 |v2〉+ C3 〈v1 |v3〉+ · · ·+ Cn 〈v1 |vn〉 = 〈v1 |x〉C1 〈v2 |v1〉+ C2 〈v2 |v2〉+ C3 〈v2 |v3〉+ · · ·+ Cn 〈v2 |vn〉 = 〈v2 |x〉...

donde las C1, C2, C3, · · ·Cn son las incognitas, por lo cual, para que este sistema tenga solucion se imponeque ∣∣∣∣∣∣∣∣∣

〈v1 |v1〉〈v1 |v2〉〈v1 |v3〉 · · · 〈v1 |vn〉〈v2 |v1〉〈v2 |v2〉〈v2 |v3〉 · · · 〈v2 |vn〉

.... . .

...〈vn |v1〉〈vn |v2〉〈vn |v3〉 · · · 〈vn |vn〉

∣∣∣∣∣∣∣∣∣ 6= 0

Esto es, que el determinante de Gram8 distinto de cero implica que el conjunto de vectores: |v1〉 , |v2〉 , |v3〉 · · · , |vn〉es linealmente independiente. La inversa tambien es cierta.

Ejemplos bases espacios lineales

1. El espacio vectorial Vn tendra dimension n y una de las posibles bases |v1〉 , |v2〉 , |v3〉 · · · , |vn〉 sera|v1〉 = (1, 0, 0, · · · , 0)|v2〉 = (0, 1, 0, · · · , 0)|v3〉 = (0, 0, 1, · · · , 0)...

...|vn−j〉 = (0, 0, 0, · · · , 1)

Esta base se conoce con el nombre de base canonica.

2. El espacio de polinomios, Pn, de grado g ≤ n tendra como una de las posibles bases al conjunto1, t, t2, t3, · · · , tn

, porque cualquier polinomio de grado ≤ n podra ser expresado como combinacion

lineal de estos n+1 vectores. Mas aun, el espacio de todos los polinomios, P∞, tendra como una posiblebase al conjunto de funciones

1, t, t2, t3, · · · , tn · · ·

. En este caso P∞ sera infinito dimensional.

8JORGEN PEDERSEN GRAM (1850-1916 Dinamarca) Matematico danes, que alternaba su actividad de gerente de unaimportante companıa de seguros con las matematicas (Probabilidad, Analisis Numerico y Teorıa de Numeros). Es conocidomayormente por el metodo de ortogonalizacion, pero se presume que no fue el quien primero lo utilizo. Aparentemente fueideado por Laplace y utilizado tambien por Cauchy en 1836. Gram murio arrollado por una bicicleta a la edad de 61 anos.

Borra

dor Pre

limin

2.3.4. Ortogonalidad y bases ortogonales

En una espacio vectorial con producto interno, dos vectores |e1〉 ∧ |e2〉 seran ortogonales si su productointerno se anula

|e1〉 ⊥ |e2〉 ⇔ 〈e2 |e1〉 = 0 .

Se denomina un conjunto ortogonal de vectores |e1〉 , |e2〉 , |e3〉 · · · , |en〉 si

〈ei |ej〉 = δij ‖|ej〉‖2 , i, j = 1, 2, 3, · · · , n y con

δij = 0 si i 6= jδij = 1 si i = j

y se denominara conjunto ortonormal si ‖|ej〉‖2 = 1.Un conjunto ortogonal de vectores |e1〉 , |e2〉 , |e3〉 , · · · , |en〉 ∈ V es linealmente independiente, mas

aun, para el caso particular de un espacio euclidiano, |e1〉 , |e2〉 , |e3〉 , · · · , |en〉 conforman una base orto-gonal para V. La demostracion es sencilla. Para un determinado espacio vectorial una combinacion lineal delos |e1〉 , |e2〉 , |e3〉 , · · · , |en〉 se anula.

n∑i=1

Ci |ei〉 = |0〉 ⇒

〈e1| [∑ni=1 Ci |ei〉] = 0 ⇒

∑ni=1 Ci δ1i = 0 ⇒ C1 = 0

〈e2| [∑ni=1 Ci |ei〉] = 0 ⇒

∑ni=1 Ci δ2i = 0 ⇒ C2 = 0

〈e3| [∑ni=1 Ci |ei〉] = 0 ⇒

∑ni=1 Ci δ3i = 0 ⇒ C3 = 0

.... . .

......

〈en| [∑ni=1 Ci |ei〉] = 0 ⇒

∑ni=1 Ci δni = 0 ⇒ Cn = 0

con lo cual, queda claro que: |e1〉 , |e2〉 , |e3〉 , · · · , |en〉 son un conjunto de vectores linealmente indepen-dientes.

Si la dimension de V es n (dim V = n) y tenemos n vectores linealmente independientes, entonces esosn vectores |e1〉 , |e2〉 , |e3〉 , · · · , |en〉 forman una base ortogonal para V, y por lo tanto, las componentesde un vector en esa base se pueden expresar de manera simple.

∀ |x〉 ∈ V ⇒ |x〉 =

n∑i=1

Ci |ei〉 ⇒ 〈ej |x〉 = 〈ej |

[n∑i=1

Ci |ei〉

]⇒ Cj =

〈ej |x〉〈ej |ej〉

En el caso de un conjunto ortonormal de vectores |e1〉 , |e2〉 , |e3〉 · · · , |en〉 ∈ Vn, con ‖|ej〉‖2 = 1, lascomponentes de cualquier vector quedan determinadas de una forma todavıa mas simple y con consecuenciasmucho mas impactantes

‖|ej〉‖2 = 1 ⇒ Cj = 〈ej |x〉 ⇒ |x〉 =

n∑i=1

Ci |ei〉 =

n∑i=1

〈ei |x〉 |ei〉 ≡n∑i=1

|ei〉〈ei|︸︷︷︸1

|x〉 .

Es bueno recalcar la relacion de cierren∑i=1

|ei〉〈ei| = 1 ,

con lo cual es trivial demostrar la formula de Parseval

∀ |x〉 , |y〉 ∈ V ⇒ 〈y |x〉 ≡ 〈y|

(n∑i=1

|ei〉〈ei|

)|x〉 =

n∑i=1

〈y| ei〉〈ei| x〉 =

n∑i=1

〈y |ei〉〈x |ei〉∗

para el caso de |x〉 ≡ |y〉 se llega la generalizacion del Teorema de Pitagoras

〈x |x〉 ≡ ‖|x〉‖2 =

n∑i=1

|〈x |ei〉|2 .

Borra

dor Pre

limin

Ejemplos de bases ortogonales

1. Funciones Trigonometricas:

Uno de los ejemplos mas emblematicos es el caso de las funciones continuas, reales de variable real y

definidas en [0, 2π], C∞[0,2π], con lo cual el producto interno viene definido por 〈f | g〉 =∫ 2π

0dx f (x) g (x),

esto es, el conjunto de funciones |e1〉 , |e2〉 , |e3〉 , · · · , |en〉 · · · representadas por

|e0〉 = 1, |e2n−1〉 = cos(nx) y |e2n〉 = sen(nx), con n = 1, 2, 3, · · ·

Es claro que |e1〉 , |e2〉 , |e3〉 , · · · , |en〉 , · · · es un conjunto de funciones ortogonales por cuanto

〈en |em〉 = δnm ‖|en〉‖2 ⇒

0 si n 6= m

∫ 2π

0dx sen(nx) sen(mx) = 0∫ 2π

0dx cos(nx) sen(mx) = 0∫ 2π

0dx cos(nx) cos(mx) = 0

‖|en〉‖2 si n = m

∫ 2π

0dx = 2π si n = m = 0∫ 2π

0dx cos2(nx) = π si n = m = 2k − 1∫ 2π

0dx sen2(nx) = π si n = m = 2k

con k = 1, 2, 3, · · · , tambien.

Podremos construir una base ortonormal de funciones: |e1〉 , |e2〉 , |e3〉 , · · · , |en〉 , · · · de la forma

|e0〉 =1√2π, |e2n−1〉 =

1√π

cos(nx) y |e2n〉 =1√π

sen(nx).

Cualquier funcion definida en el intervalo [0, 2π] puede expresarse en terminos de esta base como

|f〉 =

∞∑i=1

Ci |ei〉 ⇒ Ci = 〈ei |f〉 =

1√2π

∫ 2π

0dx f (x) = a0 si i = 0

1√2π

∫ 2π

0dx f (x) cos(nx) = a2n−1 si i = 2n− 1

1√2π

∫ 2π

0dx f (x) sen(nx) = a2n si i = 2n

donde los Ci son los coeficientes de Fourier

2. Polinomios de Legendre: Otro de los ejemplos tıpicos lo constituyen los llamados polinomios de Legen-dre. Polinomios Pn(x) definidos en el intervalo [−1, 1] y generados a partir de la Formula de Rodrigues9

Pn(x) =1

n!2ndn

dxn(x2 − 1)n, n = 0, 1, 2, .....

con P0(x) = 1. Algunos de estos polinomios son:

P1(x) = x , P2(x) =1

2(3x2 − 1) , P3(x) =

2(5x2 − 3) , P4(x) =

8(35x4 − 30x2 + 3) , . . .

9BENJAMIN OLINDE RODRIGUES (1794 Burdeos, Francia - 1851, Parıs Francia) Banquero, matematico y activistapolıtico socialista frances durante la Revolucion Francesa. De origen judıo, y cuyas contribuciones fundamentales como laformula para la generacion de Polinomios de Legendre, permanecieron olvidadas por mucho tiempo.

Borra

dor Pre

limin

Como veremos mas adelante, los polinomios de Legendre son solucion de la ecuacion diferencial

(1− x2) y′′ − 2x y′ + λ(λ+ 1)y = 0 .

Es facil comprobar que los polinomios de Legendre |Pα〉 = Pα(x) son mutuamente ortogonales con unproducto interno definido como

〈Pn|Pm〉 =

∫ 1

−1

Pn(x)Pm(x)dx =2

2n+ 1δnm ,

con norma definida por

‖Pn‖2 = 〈Pn|Pn〉 =

∫ 1

−1

P 2n(x)dx =

2n+ 1.

Por lo tanto, cualquier funcion en el intervalo [−1, 1] puede ser expresada en esa base.

f(x) = |F 〉 =

∞∑k=0

ak |Pk〉 =

∞∑k=0

〈Pk|F 〉〈Pk|Pk〉

|Pk〉 .

Si f(x) es un polinomio

f(x) =

m∑n=0

bnxn =

∞∑k=0

ak |Pk〉 =

∞∑n=0

anPn(x)

no se requiere hacer ninguna integral por cuanto los coeficientes an se determinan a traves de unsistema de ecuaciones algebraicas. Por ejemplo, para el caso de f(x) = x2 tendremos

f(x) = x2 = a0P0(x) + a1P1(x) + a2P2(x)

= a0 + a1x+1

2a2(3x2 − 1)

3P0(x) +

3P2(x) .

2.3.5. Ortogonalizacion

Hemos visto que un conjunto de vectores ortogonales forman una base para un espacio vectorial. Ahorabien, siempre es posible construir un conjunto de vectores ortogonales a partir de un conjunto de vectoreslinealmente independientes. Es metodo de “ortogonalizacion” se conoce como el metodo de Gram-Schmidt10,en honor de estos dos matematicos alemanes que NO inventaron el metodo pero lo hicieron famoso. Al parecer,este procedimiento de ortogonalizacion se le debe al matematico frances P.S. Laplace.

Dado un conjunto de vectores linealmente independientes, |v1〉 , |v2〉 , |v3〉 , · · · , |vn〉 que expanden unespacio Euclidiano de dimension finita, En. Entonces siempre se puede construir un conjunto ortogonal devectores, |e1〉 , |e2〉 , |e3〉 , · · · , |en〉 que tambien expandan En de la siguiente forma:

10ERHARD SCHMIDT (1876, Estonia - 1959 Alemania). Matematico aleman fundador del primer instituto de matematicasaplicadas de Berlın. Alumno de Hilbert, Schmidt hizo sus mayores contribuciones en el campo de Ecuaciones Integrales y Teorıade Funciones en el Espacio de Hilbert.

Borra

dor Pre

limin

|e1〉 ≡ |v1〉

|e2〉 ≡ |v2〉 − 〈v2 |e1〉〈e1 |e1〉 |e1〉 \ 〈e2 |e1〉 = 0

|e3〉 ≡ |v3〉 − 〈v3 |e2〉〈e2 |e2〉 |e2〉 − 〈v3 |e1〉〈e1 |e1〉 |e1〉 \〈e3 |e1〉 = 0〈e3 |e2〉 = 0

|e4〉 ≡ |v4〉 − 〈v4 |e3〉〈e3 |e3〉 |e3〉 − 〈v4 |e2〉〈e2 |e2〉 |e2〉 − 〈v4 |e1〉〈e1 |e1〉 |e1〉 \

〈e4 |e1〉 = 0〈e4 |e2〉 = 0〈e4 |e3〉 = 0

......

|en〉 ≡ |vn〉 −∑n−1i=1

〈vn |ei〉〈ei |ei〉 |ei〉 \

〈e4 |e1〉 = 0〈e4 |e2〉 = 0〈e4 |e3〉 = 0

...〈e4 |en−1〉 = 0

Ası siempre es posible construir una base ortonormal a partir de un conjunto de vectores linealmenteindependientes. Esta base ortogonal sera unica en En, si existe otra sus vectores seran proporcionales. Masaun, cada espacio vectorial Vn de dimension finita tendra una base ortogonal asociada.

Ejemplos de ortogonalizacion

1. Un subespacio de V4, expandido por los siguientes vectores

|v1〉 =

13−1

; |v2〉 =

2013

; |v3〉 =

−1

100

Borra

dor Pre

limin

tendra una base ortogonal asociada dada por

|e1〉 ≡ |v3〉 =

−1

100

;

|e2〉 ≡ |v2〉 −〈v2 |e1〉〈e1 |e1〉

|e1〉 =

2013

− (−1)

−1

100

1113

|e3〉 ≡ |v1〉 −〈v1 |e2〉〈e2 |e2〉

|e2〉 −〈v1 |e1〉〈e1 |e1〉

|e1〉 =

|e3〉 ≡

13−1

− ( 9

)1113

− (1)

−1

100

− 74

− 14

;

y la base ortonormal asociada sera

|e1〉 =|e〉√〈e1 |e1〉

(√2

)−1

100

; |e2〉 =|e2〉√〈e2 |e2〉

(√12

)1113

;

|e3〉 =|e3〉〈e3 |e3〉

(2√

)

− 74

− 14

2. Para el caso de R2 es muy claro. Si tenemos dos vectores |v1〉 y |v2〉 linealmente independientes,

|v1〉 =

(11

); |v2〉 =

(01

);

elegimos |e1〉 ≡ |v2〉 entonces, |e2〉 vendra dado por

|e2〉 ≡ |v1〉 −〈v1 |e1〉〈e1 |e1〉

|e1〉 ⇒ |e2〉 ≡(

)−(

(10

)tal y como se esperaba, el otro vector ortogonal es el canonico.

Borra

dor Pre

limin

3. Consideramos el espacio de polinomios, Pn, de grado g ≤ n definidos en el intervalo [−1, 1]. Esteespacio vectorial tendra como una de las posibles bases al conjunto

1, t, t2, t3, · · · , tn

con el producto

interno definido por 〈f | g〉 =∫ 1

−1dx f (x) g (x).

Por lo tanto, se procede a construir una base ortogonal de la forma:

|e0〉 ≡ |v0〉 = 1

|e1〉 ≡ |v1〉 −〈v1 |e0〉〈e0 |e0〉

|e0〉 = t

ya que 〈v1 |e0〉 =∫ 1

−1dx t = 0; 〈e0 |e0〉 =

∫ 1

−1dx = 2 ,

|e2〉 ≡ |v2〉 −〈v2 |e1〉〈e1 |e1〉

|e1〉 −〈v2 |e0〉〈e0 |e0〉

|e0〉 = t2 − 13

〈v2 |e0〉 =∫ 1

−1dx t2 = 2

3 ; 〈v2 |e1〉 =∫ 1

−1dx t3 = 0;

〈e1 |e1〉 =∫ 1

−1dx t2 = 2

3 ,

|e3〉 ≡ |v3〉 −〈v3 |e2〉〈e2 |e2〉

|e2〉 −〈v3 |e1〉〈e1 |e1〉

|e1〉 −〈v3 |e0〉〈e0 |e0〉

|e0〉 = t3 − 35 t

〈v3 |e0〉 =∫ 1

−1dx t3 = 0; 〈v3 |e1〉 =

∫ 1

−1dx t4 = 2

〈v3 |e2〉 =∫ 1

−1dx t3

(t2 − 1

)= 0; 〈e2 |e2〉 =

∫ 1

−1dx

(t2 − 1

)2= 8

45 ,...

Podemos resumir los calculos anteriores como se muestra a continuacion:

|vn〉 |en〉 |en〉1 1

√12

t t√

32 t

t2(t2 − 1

)12

√52

(3t2 − 1

)t3

(t3 − 3

5 t)

√72

(5t3 − 3t

)t4

(t4 − 6

7 t2 + 3

)18

√92

(35t4 − 30t2 + 3

)...

......

2.3.6. Complementos ortogonales y descomposicion ortogonal

Sea un subespacio S ⊂ V, un elemento |vi〉 ∈ V se dice ortogonal a S si 〈sk |vi〉 = 0 ∀ |sk〉 ∈ S,es decir, es ortogonal a todos los elementos de S . El conjunto |v1〉 , |v2〉 , |v3〉 , · · · , |vm〉 de todos los

Borra

dor Pre

limin

elementos ortogonales a S, se denomina S−perpendicular y se denota como S⊥. Es facil demostrar que S⊥

es un subespacio, aun si S no lo es.Dado un espacio euclidiano de dimension infinita V : |v1〉 , |v2〉 , |v3〉 , · · · , |vn〉 , · · · y un subespacio

de V con dimension finita, S ⊂ V y dim S = m. Entonces ∀ |vk〉 ∈ V puede expresarse como la suma de

dos vectores |sk〉 ∈ S ∧ |sk〉⊥ ∈ S⊥. Esto es

|vk〉 = |sk〉+ |sk〉⊥ , |sk〉 ∈ S ∧ |sk〉⊥ ∈ S⊥ .

Mas aun, la norma de |vk〉 se calcula a traves del teorema de Pitagoras generalizado

‖|vk〉‖2 = ‖|sk〉‖2 +∥∥∥|sk〉⊥∥∥∥2

La demostracion es sencilla. Primero se prueba que la descomposicion ortogonal |vk〉 = |sk〉+|sk〉⊥ es siempreposible. Para ello recordamos que S ⊂ V es de dimension finita, por lo tanto existe una base ortonormal|e1〉 , |e2〉 , |e3〉 · · · |em〉 para S. Es decir, dado un |vk〉 definimos los elementos |sk〉 y |sk〉⊥ como siguen

|sk〉 =

m∑i=1

〈vk |ei〉 |ei〉 ∧ |sk〉⊥ = |vk〉 − |sk〉

m∑j=1

〈vk |ej〉〈ej |

|ei〉 = 0 ⇒ |sk〉⊥ ⊥ |ej〉

lo cual indica que |sk〉⊥ ∈ S⊥.

Podemos ir un poco mas alla. La descomposicion |vk〉 = |sk〉+ |sk〉⊥ es unica en V. Para ello suponemosque existen dos posibles descomposiciones, vale decir

|vk〉 = |sk〉+ |sk〉⊥ ∧ |vk〉 = |tk〉+ |tk〉⊥ , con |sk〉 ∧ |tk〉 ∈ S ∧ |sk〉⊥ ∧ |tk〉⊥ ∈ S⊥ .

Por lo tanto

|vk〉 − |vk〉 =(|sk〉+ |sk〉⊥

)−(|tk〉+ |tk〉⊥

)= 0 ⇒ |sk〉 − |tk〉 = |tk〉⊥ − |sk〉⊥ .

Pero |sk〉− |tk〉 ∈ S, es decir, ortogonal a todos los elementos de S⊥ y |sk〉− |tk〉 = |tk〉⊥− |sk〉⊥, con lo cual|sk〉 − |tk〉 ≡ |0〉 que es el unico elemento que es ortogonal a el mismo y en consecuencia la descomposicion

|vk〉 = |sk〉+ |sk〉⊥ es unica.Finalmente, con la definicion de norma

‖|vk〉‖2 =∥∥∥|sk〉+ |sk〉⊥

∥∥∥2

=(〈sk|+ 〈sk|⊥

)(|sk〉+ |sk〉⊥

)= 〈sk |sk〉+⊥ 〈sk |sk〉⊥ = ‖|sk〉‖2 +

∥∥∥|sk〉⊥∥∥∥2

Ası, dado Sm un subespacio de V de dimension finita y dado un |vk〉 ∈ V el elemento

|sk〉 ∈ S ⇒ |sk〉 =

m∑i=1

〈vk |ei〉 |ei〉 ,

sera la proyeccion de |vk〉 en S.En general, dado un vector |x〉 ∈ V y un subespacio de V con dimension finita, Sm ⊂ V y dim S = m,

Borra

dor Pre

limin

2.3.7. Ejercicio

Sea Pn el conjunto de todos los polinomios de grado n, en x, con coeficientes reales:

|pn〉 p(x) = a0 + a1x+ a2x2 + ...+ an−1x

n−1 =

n−1∑i=0

aixi

1. Demostrar que Pn es un espacio vectorial respecto a la suma de polinomios y a la multiplicacion depolinomios por un escalar (numero real).

2. Si los coeficientes ai son enteros ¿Pn sera un espacio vectorial? ¿ Por que?

3. ¿Cual de los siguientes subconjuntos de Pn es un subespacio vectorial?

a) El polinomio cero y todos los polinomios de grado n− 1.

b) El polinomio cero y todos los polinomios de grado par.

c) Todos los polinomios que tienen a x como un factor (grado n > 1).

d) Todos los polinomios que tienen a x− 1 como un factor.

4. ¿Cual de los siguientes polinomios pertenece al subespacio de P? Subespacio P generado por: |x1〉 =x3 + 2x+ 1; |x2〉 = x2 − 2; |x3〉 = x3 + x;

a) x2 − 2x+ 1

b) x4 + 1

c) − 12x

3 + 52x

2 − x− 1

d) x− 5

5. Probar que los polinomios

|x1〉 = 1; |x2〉 = x; |x3〉 =3

2x2 − 1

2; |x4〉 =

2x3 − 3

2x;

forman una base en P4. Expresar |p〉 = x2; |q〉 = x3 en funcion de esa base.

6. Sean |pn〉 = p(x)=∑n−1i=0 aix

i, |qn〉 = q(x) =∑n−1i=0 bix

i ∈ Pn. Considerese la siguiente definicion:

〈qn|pn〉 a0b0 + a1b1 + a2b2 + ...+ an−1bn−1 =

n−1∑i=0

aibi

a) Muestre que esta es una buena definicion de producto interno.

b) Con esta definicion de producto interior ¿Se puede considerar Pn un subespacio de C[a,b]? ¿Porque?

7. Considerando estas definiciones de producto interior en Pn

a) 〈qn|pn〉 =∫ 1

−1p(x)q(x)dx

b) 〈qn|pn〉 =∫ 1

0p(x)q(x)dx

Encontrar la distancia y el angulo entre los siguientes pares de vectores en P3

Borra

dor Pre

limin

a) |x1〉 = 1; |x2〉 = x

b) |x1〉 = 2x; |x2〉 = x2

8. Encontrar la proyeccion perpendicular de los siguientes vectores en C[−1,1] (espacio de funciones conti-nuas en el intervalo [-1,1]) al subespacio generado por los polinomios: 1, x, x2− 1. Calcular la distanciade cada una de estas funciones al subespacio mencionado.

a) f(x) = xn; n entero

b) f(x) = sen(x)

c) f(x) = 3x2

2.4. Aproximacion de funciones

2.4.1. Condiciones para la aproximacion de funciones

Sea |v1〉 , |v2〉 , |v3〉 , · · · , |vn〉 , · · · un espacio euclidiano de dimension infinita, V, y un subespacioSm ⊂ V, con dimension finita dim S = m, y sea un elemento |vi〉 ∈ V. La proyeccion de |vi〉 en Sm, |si〉 ,sera el elemento de Sm mas proximo a |vk〉. En otras palabras

‖|vi〉 − |si〉‖ ≤ ‖|vi〉 − |ti〉‖ ∀ |ti〉 ∈ S .

La demostracion se sigue ası

|vi〉 − |ti〉 = (|vi〉 − |si〉) + (|si〉 − |ti〉) ⇒ ‖|vi〉 − |ti〉‖2 = ‖|vi〉 − |si〉‖2 + ‖|si〉 − |ti〉‖2 ,

ya que |vi〉 − |si〉 = |sk〉⊥ ∈ S⊥ ∧ |si〉 − |t i〉 ∈ S, y vale el teorema de Pitagoras generalizado.Ahora bien, como

‖|si〉 − |ti〉‖2 ≥ 0 ⇒ ‖|vi〉 − |ti〉‖2 ≥ ‖|vi〉 − |si〉‖2 ⇒ ‖|vi〉 − |ti〉‖ ≥ ‖|vi〉 − |si〉‖ .

Desarrollemos la aproximacion de funciones continuas, reales de variable real, definidas en [0, 2π], C∞[0,2π],

mediante funciones trigonometricas y con el producto interno definido por: 〈f | g〉 =∫ 2π

0dx f (x) g (x).

Hemos visto que para este espacio vectorial tenemos una base ortonormal definida por

|e0〉 = ϕ0 (x) =1√2π

, |e2n−1〉 = ϕ2n−1 (x) =1√π

cos(nx) y |e2n〉 = ϕ2n (x) =1√π

sen(nx).

Por lo tanto, cualquier funcion definida en el intervalo [0, 2π] puede expresarse en terminos de esta base comomostramos a continuacion

|f〉 =

∞∑i=1

Ci |ei〉 ,

con Ci = 〈ei |f〉 =

∫ 2π

dx f (x)ϕi(x) =

1√2π

∫ 2π

0dx f (x) = a0 si i = 0

1√π

∫ 2π

0dx f (x) cos(nx) = a2n−1 si i = 2n− 1

1√π

∫ 2π

0dx sen(nx) f (x) = a2n si i = 2n

Borra

dor Pre

limin

Los Ci son los coeficientes de Fourier. Es decir, cualquier funcion puede ser expresada como una serie deFourier de la forma

f (x) =1

2a0 +

∞∑k=1

[ak cos(kx) + bk sen(kx)] ,

donde

ak =1

∫ 2π

dx f (x) cos(kx) ∧ bk =

∫ 2π

dx f (x) sen(kx) f (x) .

Es claro que para la aproximacion de funciones por funciones trigonometricas cuyos coeficientes son loscoeficientes de Fourier constituyen la mejor aproximacion. Por lo tanto, de todas las funciones F (x) ∈ C∞[0,2π]

las funciones trigonometricas, T (x) minimizan la desviacion cuadratica media∫ 2π

dx (f (x)− P (x))2 ≥

∫ 2π

dx (f (x)− T (x))2.

2.4.2. El Metodo de mınimos cuadrados

Una de las aplicaciones mas importantes en la aproximacion de funciones es el metodo de mınimoscuadrados. La idea es determinar el valor mas aproximado de una cantidad fısica, c, a partir de un conjuntode medidas experimentales: x1, x2, x3, · · ·xn. La intencion es encontrar el mejor valor de c a partir de eseconjunto de datos experimentales.

Para ello asociamos el conjunto de medidas x1, x2, x3, · · ·xn con las componentes de un vector |x〉 enRn. Ası tendremos que

|x〉 = (x1, x2, x3, · · ·xn) ∧ c |y〉 = (c,c,c, · · · c) ,

y, por lo tanto la mejor aproximacion de c|y〉, que llamaremos c′ |y〉, sera la proyeccion perpendicular de |x〉(las medidas) sobre el subespacio generado por |y〉. Esto es

c′ =〈x |y〉〈y |y〉

=x1 + x2 + x3, · · ·+ xn

que no es otra cosa que el promedio aritmetico de las medidas. Es claro que la proyeccion perpendicular de|x〉 sobre |y〉 hace mınimo la distancia entre el subespacio perpendicular generado por |y〉 y el vector |x〉. Esdecir, hace mınimo el cuadrado de esa distancia

[d (|x〉 , c′ |y〉)]2 = 〈x−c′y |x−c′y〉 =

n∑i=1

(xi − c′)2.

Este problema se puede generalizar si se desea medir dos (o n) cantidades. Para el caso de dos cantidadesextendemos la dimension del espacio y los resultados experimentales se expresaran como un vector de 2ndimensiones

|x〉 = (x11, x12, x13, · · ·x1n, x21, x22, x23, · · ·x2n) ,

mientras que los vectores que representan las cantidades mas aproximadas seran

c′1 |y1〉 =

c′1,c′1,c′1, · · · c′1︸︷︷︸,n

0, 0, 0, · · · 0︸︷︷︸n

∧ c′2 |y2〉 = (0, 0, 0, · · · 0, c′2,c′2,c′2, · · · c′2) .

Borra

dor Pre

limin

c′1 =〈x |y1〉〈y1 |y1〉

=x11 + x12 + x13, · · ·+ x1n

n∧ c′2 =

〈x |y2〉〈y2 |y2〉

=x21 + x22 + x23, · · ·+ x2n

La consecuencia mas conocida de esta aproximacion de funciones es el “ajuste” de un conjunto de datosexperimentales (x1, y1) , (x2, y2) , (x3, y3) , · · · , (xn, yn) a la ecuacion de una recta y =cx. En este caso, elplanteamiento del problema se reduce a encontrar el vector c′ |x〉, en el subespacio S (|x〉), que este lo mascercano posible al vector |y〉 = c |x〉.

Por lo tanto ‖|c′x− y〉‖2 sera lo menor posible y |c′x− y〉 sera perpendicular a S (|x〉), por lo que

〈x |c′x− y〉 = 0 ⇒ c′ =〈x |y〉〈x |x〉

=x1y1 + x2y2 + x3y3 · · ·+ xnyn

x21 + x2

2 + x23, · · ·+ x2

Para tratar de aclarar lo antes expuesto, consideremos tres ejemplos que muestran la versatilidad delmetodo y la ventaja de disponer de una clara notacion. Primeramente, mostraremos el caso mas utilizadode construir el mejor ajuste lineal a un conjunto de datos experimentales. Buscaremos la mejor recta quedescribe ese conjunto de puntos. Luego mostraremos la aplicacion del metodo para buscar la mejor funcionbilineal, vale decir que ajustaremos la mejor funcion de dos variables con una contribucion lineal de susargumentos: f = f(x1, x2) = ax1 + bx2. Finalmente, mostraremos como se puede utilizar el metodo demınimos cuadrados para ajustar un conjunto de datos experimentales a un polinomio de cualquier grado.Veamos los tres casos:

1. Si el conjunto de datos experimentales es: (1, 2) , (3, 2) , (4, 5) , (6, 6) ¿Cual es la recta que ajusta masacertadamente a estos puntos? La ecuacion queda como

|y〉 = c |x〉 ⇒

2256

= c

1346

⇒ c′ =〈x |y〉〈x |x〉

=2 + 6 + 20 + 36

1 + 9 + 16 + 36=

31= 1,03226 .

Se puede generalizar este procedimiento cuando se tiene que una cantidad y que es una combinacionlineal desconocida de un conjunto de cantidades

y = c1x1 + c2x2 + c3x3 + · · ·+ cmxm .

En este caso se ejecutaran n experimentos con n > m y el conjunto de medidas experimentales sera

(y1, x11, x12, · · ·x1m; y2, x21, x22, · · ·x2m; y3, x31, x32, · · ·x3m; · · · yn, xn1, xn2, xn3, · · ·xnm)

y a partir de estas generamos el siguiente sistema de ecuaciones

y1 = c′1x11 + c′2x12 + c′3x13, · · ·+ c′mx1m

y2 = c′1x21 + c′2x22 + c′3x23, · · ·+ c′mx2m

y3 = c′1x31 + c′2x32 + c′3x43, · · ·+ c′mx4m

...

yn = c′1xn1 + c′2xn2 + c′3xn3, · · ·+ c′mxnm

Borra

dor Pre

limin

en el cual las incognitas c′1,c′2,c′3, · · · c′m hacen que el lado derecho de las ecuaciones antes mencionadassean los mas proximas a las y1, y2, y3, · · · yn, por lo tanto, si consideramos los vectores

|x1〉 = (x11, · · ·x1n) ; |x2〉 = (x21, · · ·x2n) ; · · · |xm〉 = (xm1, · · ·xmn) ; |y〉 = (ym1, · · · yn)

los vectores |x1〉 , |x2〉 , · · · |xm〉 expanden el subespacio S (|x1〉 , |x2〉 , · · · |xm〉) donde esta la aproxi-macion de |y〉 . La distancia de este subespacio al vector |y〉, sera mınima. Esto es

[d (S (c′i |xi〉) , |y〉)]2

= 〈S (c′i |xi〉)−y |S (c′i |xi〉)−y〉

y |S (c′i |x〉)−y〉 sera ortogonal a los |xi〉:

〈xj |S (c′i |x〉)−y〉 ≡ 〈xi

∣∣∣∣∣m∑i=1

c′i |x〉−y

⟩= 0 ∀ i, j = 1, 2, 3, · · ·m

Podemos construir el sistema de ecuaciones normales para la aproximacion que hemos considerado:

c′1 〈x1 |x1〉+ c′2 〈x1 |x2〉+ c′3 〈x1 |x3〉+ · · ·+ c′m 〈x1 |xm〉 = 〈x1 |y〉c′1 〈x2 |x1〉+ c′2 〈x2 |x2〉+ c′3 〈x2 |x3〉+ · · ·+ c′m 〈x2 |xm〉 = 〈x2 |y〉...

(2.1)

donde, tal y como se ha senalado, las incognitas son las c′1,c′2,c′3, · · · c′m .

2. Se sospecha que una determinada propiedad de un material cumple con la ecuacion y = ax1 + bx2. Sial realizar un conjunto de medidas experimentales obtenemos y1

x11

x12

1512

;

x21

x22

1221

;

x31

x32

1011

;

x41

x42

01−1

Es claro que tenemos un subespacio de m = 2 dimensiones y hemos hecho n = 4 veces el experimento.Los vectores considerados arriba seran

|x1〉 = (1, 2, 1, 1) ; |x2〉 = (2, 1, 1,−1) ; |y〉 = (15, 12, 10, 0)

por lo tanto, vectorialmente |y〉 = a |x1〉+ b |x2〉, es decir las ecuaciones normales (2.1) se escriben

7a +4b = 494a +7b = 52

⇒

a = 4511

b = 5611

⇒ 11y = 45x1 + 56x2

3. Se puede extender el razonamiento anterior y generar un ajuste “lineal no lineal”. Esto es: el ajustelineal es en los coeficientes, pero la funcionalidad de la ley a la cual queremos ajustar los datos puedeser un polinomio de cualquier orden. Ese es el caso de una parabola que ajusta al siguiente conjuntode puntos

(0, 1) , (1, 3) , (2, 7) , (3, 15) ⇔ y = ax2 + bx+ c

Las ecuaciones toman la forma de1 = 0 +0 +c3 = a +b +c7 = 4a +2b +c

15 = 9a +3b +c

Borra

dor Pre

limin

y los vectores construidos a partir de los datos experimentales seran

|x1〉 = (0, 1, 4, 9) ; |x2〉 = (0, 1, 2, 3) ; |x3〉 = (1, 1, 1, 1) ; |y〉 = (1, 3, 7, 15) .

Una vez mas, la ecuacion vectorial serıa |y〉 = a |x1〉 + b |x2〉 + c |x3〉 y las ecuaciones normales (2.1)para este sistema se construyen como

136 = 98a +36b +14c62 = 36a +14b +6c26 = 14a +6b +4c

⇒

a = −6

b = 1135

c = − 325

⇒ y = −6x2 +113

5x− 32

2.4.3. Interpolacion polinomial de puntos experimentales

Muchas veces nos encontramos con la situacion en la cual tenemos un conjunto de (digamos n) medidaso puntos experimentales (x1, y1 = f(x1)), (x2, y2 = f(x2)), · · · , (xn, yn = f(xn)) y para modelar eseexperimento quisieramos una funcion que ajuste estos puntos. El tener una funcion nos provee la granventaja de poder intuir o aproximar los puntos que no hemos medido. La funcion candidata mas inmediataes un polinomio y debemos definir el grado del polinomio y la estrategia que aproxime esos puntos. Puede serque no sea lineal el polinomio y queramos ajustar esos puntos a un polinomio tal que este pase por los puntosexperimentales. Queda entonces por decidir la estrategia. Esto es: si construimos la funcion como “trozos”de polinomios que ajusten a subconjuntos (x1, y1 = f(x1)), (x2, y2 = f(x2)), · · · , (xm, ym = f(xm)) conm < n. de los puntos experimentales En este caso tendremos una funcion de interpolacion para cada conjuntode puntos. Tambien podemos a ajustar la funcion a todo el conjunto de puntos experimentales y, en ese casoel maximo grado del polinomio que los interpole sera de grado n − 1. Para encontrar este polinomio loexpresamos como una combinacion lineal de Polinomios de Legendre. Esto es

P(x) = f(x) =

n−1∑k=0

Ck |Pk〉 =

n−1∑k=0

CkPk(x) ⇒

y1 = f(x1) = C0P0(x1) + C1P1(x1) + · · ·+ Cn−1Pn−1(x1)y2 = f(x2) = C0P0(x2) + C1P1(x2) + · · ·+ Cn−1Pn−1(x2)...yn = f(xn) = C0P0(xn) + C1P1(xn) + · · ·+ Cn−1Pn−1(xn)

que no es otra cosa que un sistema de n ecuaciones con n incognitas: los coeficientes C0, C1, · · ·Cn−1 Alresolver el sistema de ecuaciones y obtener los coeficientes, podremos obtener la funcion polinomica queinterpola esos puntos. Una expansion equivalente se pudo haber logrado con cualquier otro conjunto depolinomios ortogonales, que ellos son base del espacio de funciones. Es importante hacer notar que debidoa que los polinomios de Legendre esta definido en el intervalo [−1, 1] los puntos experimentales deberanre-escalarse al ese intervalo para poder encontrar el polinomio de interpolacion como combinacion lineal delos Polinomios de Legendre.

Consideremos los puntos experimentales representado en la figura 2.1. Al construir el sistema de ecua-ciones obtendremos lo siguiente:

Borra

dor Pre

limin

arFigura 2.1: En el lado izquierdo se muestran los puntos experimentales:(2, 8), (4, 10), (6, 11), (8, 18), (10, 20), (12, 34) y a la derecha la funcion polinomica que los interpola.

−8 + C0 − C1 + C2 − C3 + C4 − C5 = 0

−10 + C0 − 35 C1 + 1

25 C2 + 925 C3 − 51

125 C4 + 4773125 C5 = 0

−11 + C0 − 15 C1 − 11

25 C2 + 725 C3 + 29

125 C4 − 9613125 C5 = 0

−18 + C0 + 15 C1 − 11

25 C2 − 725 C3 + 29

125 C4 + 9613125 C5 = 0

−20 + C0 + 35 C1 + 1

25 C2 − 925 C3 − 51

125 C4 − 4773125 C5 = 0

−34 + C0 + C1 + C2 + C3 + C4 + C5 = 0

y al resolver el sistema obtendremos que

C0 =2249

144, C1 =

3043

336, C2 =

1775

504, C3 = −175

216, C4 =

625

336, C5 =

14375

3024

con lo cual

P(x) = f(x) =2249

144+

3043

336x+

1775

504P (2, x)− 175

216P (3, x) +

625

336P (4, x) +

14375

3024P (5, x)

la interpolacion queda representada en al figura 2.1.Es importante senalar que mientras mas puntos experimentales se incluyan para la interpolacion, el

polinomio resultante sera de mayor grado y, por lo tanto incluira oscilaciones que distorcionaran una apro-ximacion mas razonable. Por ello, la estrategia de hacer la interpolacion a trozos, digamos de tres puntos entres puntos, generara un mejor ajuste, pero sera una funcion (un polinomio) contınuo a trozos.

Borra

dor Pre

limin

2.4.4. Ejercicios

Para estos ejercicios supondremos la utilizacion de cualquier ambiente de manipulacion simbolica, tipoMAPLE11, Mathematica12, MAXIMA13 o similares.

1. Al medir la temperatura a lo largo de una barra material obtenemos los siguientes valores

xi (cm) 1, 0 2, 0 3, 0 4, 0 5, 0 6, 0 7, 0 8, 0 9, 0Ti (C) 14, 6 18, 5 36, 6 30, 8 59, 2 60, 1 62, 2 79, 4 99, 9

Encuentre, mediante el metodo de los mınimos cuadrados los coeficientes que mejor ajustan a la rectaT = ax+ b.

2. Considere el espacio vectorial, C∞[−1,1], de funciones reales, continuas y continuamente diferenciables

definidas en el intervalo [−1, 1]. Es claro que una posible base de este espacio de funciones la constituye elconjunto de monomios

1, x, x2, x3, x4, · · ·

por cuanto estas funciones son linealmente independientes.

a) Si suponemos que este espacio vectorial esta equipado con un producto interno definido por

〈f |g〉 =∫ 1

−1dx f(x)g(x), muestre que esa base de funciones no es ortogonal.

b) Utilizando la definicion de producto interno 〈f |g〉 =∫ 1

−1dx f(x)g(x) ortogonalice la base

1, x, x2, x3, x4, · · ·

y encuentre los 10 primeros vectores ortogonales, base para C∞[−1,1]. Estanueva base de polinomios ortogonales se conoce como los polinomios de Legendre

c) Modifique un poco la definicion de producto interno 〈f |g〉 =∫ 1

−1dx f(x)g(x)

√(1− x2) y ortogo-

nalice la base

1, x, x2, x3, x4, · · ·

y encuentre otros 10 primeros vectores ortogonales base parael mismo C∞[−1,1]. Esta nueva base de polinomios ortogonales se conoce como los polinomios deTchebychev.

d) Suponga la funcion h(x) = sen(3x)(1− x2):

1) Expanda la funcion h(x) en terminos de la base de monomios y de polinomios de Legendre,grafique, compare y encuentre el grado de los polinomios en los cuales difieren las expansiones.

2) Expanda la funcion h(x) en terminos de la base de monomios y de polinomios de Tchebychev,grafique, compare y encuentre el grado de los polinomios en los cuales difieren las expansiones.

3) Expanda la funcion h(x) en terminos de la base de polinomios de Legendre y de Tchebychev,grafique, compare y encuentre el grado de los polinomios en los cuales difieren las expansiones.

4) Estime en cada caso el error que se comete como funcion del grado del polinomio (o monomio)de la expansion.

¿Que puede concluir respecto a la expansion en una u otra base?

11http://www.maplesoft.com12http://www.wolfram.com/mathematica/13http://maxima.sourceforge.net

http://www.maplesoft.com

http://www.wolfram.com/mathematica/

http://maxima.sourceforge.net

Borra

dor Pre

limin

2.5. Algunos ejemplos resueltos

1. Consideramos el espacio vectorial de polinomios de grado g ≤ n definidos en el intervalo [0, 1] o en elintervalo [−1, 1] segun el caso

a) ¿Cual o cuales de los siguientes conjuntos de vectores en P3 son linealmente independientes?Explique por que.

1)|x1〉 = 2x; |x2〉 = x2 + 1; |x3〉 = x+ 1; |x4〉 = x2 − 1 .

Solucion: Resultan ser linealmente dependiente ya que podremos expresar

|x4〉 = |x1〉+ |x2〉 − 2|x3〉 .

2)|x1〉 = x(x− 1); |x2〉 = x; |x3〉 = x3; |x4〉 = 2x3 − x2 .

Solucion: Linealmente dependiente ya que siempre podremos expresar

|x4〉 = −|x1〉+ |x2〉+ 2|x3〉 .

b) Considerando las siguientes definiciones de producto interior en Pn

〈qn|pn〉 =

∫ 1

−1

p(x)q(x)dx y 〈qn|pn〉 =

∫ 1

p(x)q(x)dx .

En P3 encuentre la distancia y el angulo entre los vectores

|x1〉 = x(x− 1); |x2〉 = x .

Solucion: En general la definicion de distancia es

d (|x1〉, |x2〉) =√〈x2 − x1 |x2 − x1〉

por lo tanto para 〈qn|pn〉 =∫ 1

−1p(x)q(x)dx la distancia sera

√〈x2 − x1 |x2 − x1〉 =

√∫ 1

−1

[x(x− 1)− x]2

dx =1

√690

y para 〈qn|pn〉 =∫ 1

0p(x)q(x)dx sera

√〈x2 − x1 |x2 − x1〉 =

√∫ 1

(x(x− 1)− x)2

dx =2

√30 .

Con respecto a los angulos:

θ = arc cos

(〈x1 |x2〉√

〈x1 |x1〉√〈x2 |x2〉

Para 〈qn|pn〉 =∫ 1

−1p(x)q(x)dx tenemos

Borra

dor Pre

limin

θ = arc cos

(〈x1 |x2〉√

〈x1 |x1〉√〈x2 |x2〉

)= arc cos

∫ 1

−1(x(x− 1))x dx√∫ 1

−1(x(x− 1))

2dx√∫ 1

−1x2dx

= arc cos

(− 1

√15√

)= 2,4825 rad .

Para 〈qn|pn〉 =∫ 1

0p(x)q(x)dx

θ = arc cos

(〈x1 |x2〉√

〈x1 |x1〉√〈x2 |x2〉

)= arc cos

∫ 1

0(x(x− 1)) (x) dx√∫ 1

0(x(x− 1))

2dx√∫ 1

0x2dx

= arc cos

(− 1

√15√

)= 2,4825 rad .

¡El mismo angulo!

c) Una de las posibles bases de Pn sera el conjunto

1, x, x2, x3, · · · , xn

con el producto interno

definido por 〈f | g〉 =∫ 1

0dx f (x) g (x).

1) Encuentre la base ortonormal que expande el subespacio S3 de los polinomios, Pn, de gradog ≤ 3.Solucion: El subespacio S3 tendra como vectores linealmente independientes

1, x, x2, x3

para encontrar la base ortonormal utilizamos el metodo de Gram Smith, con lo cual tendremosque

|en〉 ≡ |vn〉 −n−1∑i=1

〈vn |ei〉〈ei |ei〉

|ei〉 ,

esto es

|e1〉 = |v1〉 = 1

|e2〉 = |v2〉 −〈v2 |e1〉〈e1 |e1〉

|e1〉 = x−∫ 1

0xdx∫ 1

0dx

= x− 1

|e3〉 = |v3〉 −〈v3 |e1〉〈e1 |e1〉

|e1〉 −〈v3 |e2〉〈e2 |e2〉

|e2〉 = x2 −∫ 1

0x2dx∫ 1

0dx−∫ 1

0x2(x− 1

)dx∫ 1

(x− 1

)2dx

(x− 1

)= x2 − x+

|e4〉 = |v4〉 −〈v4 |e1〉〈e1 |e1〉

|e1〉 −〈v4 |e2〉〈e2 |e2〉

|e2〉 −〈v4 |e3〉〈e3 |e3〉

|e3〉

= x3 −∫ 1

0x3dx∫ 1

0dx−

(∫ 1

0x3(x− 1

)dx) (x− 1

)∫ 1

(x− 1

)2dx

−

(∫ 1

0x3(x2 + 1

6 − x)

dx) (x2 + 1

6 − x)

∫ 1

(x2 + 1

6 − x)2

= x3 − 1

20+

5x− 3

2x2

Borra

dor Pre

limin

Normalizando

|ξ1〉 =|e1〉√〈e1 |e1〉

=1√∫ 1

0dx

= 1

|ξ2〉 =|e2〉√〈e2 |e2〉

=x− 1

2√∫ 1

(x− 1

)2dx

= 2√

(x− 1

)

|ξ3〉 =|e3〉√〈e3 |e3〉

=x2 + 1

6 − x√∫ 1

(x2 + 1

6 − x)2

dx= 6√

(x2 +

6− x)

|ξ4〉 =|e4〉√〈e4 |e4〉

=x3 − 1

20 + 35x−

32x

2√∫ 1

(x3 − 1

20 + 35x−

32x

2)2

dx= 20

√7

(x3 − 1

20+

5x− 3

2x2

)

2) Encuentre las componentes del polinomio g (x) = 5 + 3x2−x3 +x5 proyectado sobre esa baseortonormal que expande a S3

Solucion: Las componentes de la proyeccion de g (x) en S3 serıan

c1 = 〈g |ξ1〉 =

∫ 1

(1)(5 + 3x2 − x3 + x5

)dx =

c2 = 〈g |ξ2〉 =

∫ 1

(2√

(x− 1

))(5 + 3x2 − x3 + x5

)dx =

197

420

√3

c3 = 〈g |ξ3〉 =

∫ 1

(6√

(x2 +

6− x))(

5 + 3x2 − x3 + x5)

dx =23

210

√5

c4 = 〈g |ξ4〉 =

∫ 1

(20√

(x3 − 1

20+

5x− 3

2x2

)) (5 + 3x2 − x3 + x5

)dx =

315

√7 ,

con lo cual

|g〉S3 =71

12|ξ1〉+

197

420

√3 |ξ2〉+

210

√5 |ξ3〉+

315

√7 |ξ4〉 .

Finalmente la proyeccion del polinomio en S3 sera

gS3 (x) =71

12+

197√

420

[2√

(x− 1

)]+

23√

210

[6√

(x2 +

6− x)]

+4√

315

[20√

(x3 − 1

20+

5x− 3

2x2

)]

gS3 (x) =71

12+

197

(x− 1

(x2 +

6− x)

+16

(x3 − 1

20+

5x− 3

2x2

)es decir

gS3 (x) =313

63+

42x+

21x2 +

9x3

La norma sera

‖|g〉S3‖2 =

(71

(197

420

√3

(23

210

√5

315

√7

=1,418,047

39,690∼= 35,728 .

Borra

dor Pre

limin

2. Encuentre la mınima distancia desde el subespacio S3 al polinomio g (x)

Solucion: La distancia mınima sera la norma del vector ortogonal a S3 tal que

|g〉 = |g〉S3 + |g〉⊥S3 donde |g〉S3 ∈ S3

y |g〉⊥S3 es un vector de su complemento ortogonal. Por lo tanto el Teorema de Pitagoras nos dice que

‖|g〉‖2 = ‖|g〉S3‖2 + ‖|g〉⊥S3‖2

con lo cual tendremos que la mınima distancia sera

‖|g〉⊥S3‖ =

√‖|g〉‖2 − ‖|g〉S3‖2

‖|g〉‖2 =

∫ 1

(5 + 3x2 − x3 + x5

)2dx =

495193

13860

‖|g〉S3‖2 =1418047

39690

con lo cual

‖|g〉⊥S3‖ =

√495193

13860− 1418047

39690≈ 1,196 5× 10−2

3. Sea f (x) = e2x una funcion perteneciente al espacio lineal de funciones continuas y continuamente dife-

renciables, C∞[−1,1], en el cual el producto interno viene definido por 〈q|p〉 =∫ 1

−1p(x)q(x) dx. Encuentre

el polinomio lineal mas cercano a la funcion f (x).

Solucion: En el subespacio S1 de polinomios lineales, los vectores base son 1, x. Es una base orto-gonal pero no es normal, con lo cual la normalizamos

|e1〉 = |v1〉 = 1 ⇒ |ξ1〉 =1√〈e1 |e1〉

=1√∫ 1

−1dx

√2

|e2〉 = |v2〉 −〈v2 |e1〉〈e1 |e1〉

|e1〉 = x−∫ 1

−1xdx∫ 1

−1dx

= x ⇒ |ξ2〉 =x√∫ 1

−1x2dx

√6

y la proyeccion ortogonal de esta funcion sera

c0 =

∫ 1

−1

e2x

√2

)dx = −

√2

(−e2 + e−2

)y c1 =

∫ 1

−1

(√6

)e2xdx =

√6

(e2 + 3e−2

)con lo cual la funcion lineal sera

Pn =

(√6

(e2 + 3e−2

))x−√

(−e2 + e−2

Borra

dor Pre

limin

arBibliografıa

[1] Arfken, G. B.,Weber, H., Weber, H.J. (2000) Mathematical Methods for Physicists 5ta Edicion(Academic Press, Nueva York)

[2] Borisenko, A.I, y Tarapov I.E. (1968) Vector and Tensor Analisys (Dover Publications Inc, NuevaYork)

[3] Dennery, P. y Krzywicki, A. (1995) Mathematics for Physicists (Dover Publications Inc, Nueva York)

[4] Harper, C. (1971) Introduction to Mathematical Physics (Prentice Hall, Englewood Cliff, N.J:)

[5] Hassani, S. (1991) Foundations of Mathematical Physics (Prentice Hall, International Edition,London:

[6] Hauser, W (1971) Introduction to Principles of Electromagnetism (Addison-Wesley Pub CoReading)

[7] Riley, K.F., Hobson, M.P. y Bence, S.J. (2002) Mathematical Methods for Physics and Enginee-ring (Cambridge University Press)

[8] Santalo, L.A (1969) Vectores y Tensores (Editorial Universitaria, Buenos Aires)

[9] Schutz, B. (1980) Geometrical Methods in Mathematical Physics (Cambridge University Press,Londres)

[10] Spiegel, M. (1959) Vector Analysis (Schaums Outline Series, McGraw Hill New York)

101

Borra

dor Pre

limin

arCapıtulo 3Vectores Duales y Tensores

102

Borra

dor Pre

limin

3.1. Funcionales lineales

Definiremos funcionales lineales como aquella operacion que asocia un numero complejo (o real) a unvector |v〉 ∈ V y cumple con la linealidad, vale decir:

∀ |v〉 ∈ V → F [|v〉] ∈ C ,

F [α |v1〉+ β |v2〉] ≡ α F [|v1〉] + β F [|v2〉] ∀ |v〉 , |v1〉 , |v2〉 ∈ V .

El conjunto de funcionales lineales F1,F2,F3, · · · ,Fn, · · · constituyen a su vez un espacio vectorial, elcual se denomina espacio vectorial dual de V y se denotara como V∗. Es facil convencerse que los funcionaleslineales forman un espacio vectorial ya que dados F1,F2 ∈ V∗ se tiene

(F1 + F2) [|v〉] = F1 [|v〉] + F2 [|v〉]

(α F) [|v〉] = α∗ F [|v〉]

∀ |v〉 ∈ V .

A este espacio lineal tambien se le llama espacio de formas lineales y a los funcionales 1−formas.En aquellos espacios lineales con producto interno definido (Espacios de Hilbert), el mismo producto

interno constituye la expresion natural del funcional. Ası tendremos que

Fa [|v〉] ≡ 〈a |v〉 ∀ |v〉 ∈ V ∧ ∀ 〈a| ∈ V∗ .

Es claro comprobar que el producto interno garantiza que los Fa,Fb, · · · forman un espacio vectorial:

(Fa + Fb) [|v〉] = Fa [|v〉] + Fb [|v〉] = 〈a |v〉+ 〈b |v〉

(α Fa) [|v〉] = 〈αa |v〉 = α∗ 〈a |v〉 = α∗ Fa [|v〉]

∀ |v〉 ∈ V .

Esta ultima propiedad se conoce como antilinealidad.Se establece entonces una correspondencia 1 a 1 entre kets y bras, entre vectores y funcionales lineales (o

formas diferenciales):λ1 |v1〉+ λ2 |v2〉 λ∗1 〈v1|+ λ∗2 〈v2| ,

que ahora podemos precisar:

〈a |v〉 = 〈v |a〉∗ ,〈a |λ1v1 + λ2v2〉 = λ1 〈a |v1〉+ λ2 〈a |v2〉 ,〈λ1a1+λ2a2 |v〉 = λ∗1 〈a1 |v〉+ λ∗2 〈a2 |v〉 .

Mas aun, dada una base |e1〉 , |e2〉 , |e3, 〉 · · · |en〉 para V siempre es posible asociar una base para V∗ detal manera que

|v〉 = λi |ei〉〈v| = λ∗i⟨ei∣∣ , con λi =

⟨ei |v〉 ∧ λ∗i = 〈v |ei〉 para i = 1, 2, · · · , n

En un lenguaje arcaico (y muchos textos de Mecanica todavıa lo reproducen) denominan a la base delespacio dual

⟨ei∣∣ la base recıproca de |ei〉.

Notese que estamos utilizando la notacion de Einstein en la que ındices repetidos indican suma, y endonde las bases del espacio dual de formas diferenciales

⟨ek∣∣ llevan los ındices arriba. Los ındices arriba se

llamaran contravariantes y los ındices abajo covariantes. Las componentes de las formas diferenciales en unabase dada, llevan ındices abajo 〈a| = ai

⟨ei∣∣ mientras que las componentes de los vectores los llevan arriba

|a〉 = aj |ej〉.

Borra

dor Pre

limin

3.2. Parentesis tensorial

La extension natural al concepto de funcional lineal es el concepto de tensor.

3.2.1. Tensores, una definicion funcional

Definiremos como un tensor a un funcional lineal que asocia un numero complejo (o real) a un vector |v〉 ∈V, a una forma 〈u| ∈ V∗, o ambas y cumple con la linealidad. Esto es:

∀ |v〉 ∈ V ∧ 〈u| ∈ V∗ → T [〈u| ; |v〉] ∈ C

T [ 〈u| ;α |v1〉+ β |v2〉] ≡ αT [〈u| ; |v1〉] + β T [〈u| ; |v2〉] ∀ |v1〉 , |v2〉 ∈ V ∧ 〈u| ∈ V∗

T [ζ 〈u1|+ ξ 〈u2| ; |v〉] ≡ ζT [〈u1| ; |v〉] + ξ T [〈u2| ; |v〉] ∀ |v〉 ,∈ V ∧ 〈u1| , 〈u2| ∈ V∗

En pocas palabras: un tensor es un funcional generalizado cuyos argumentos son vectoresy/o formas, loque significa que T [•; •] es una cantidad con dos “puestos” y una vez “cubiertos” se convierte en un escalar(complejo o real). Un tensor, con un argumento correspondiente a un vector y un argumento correspondientea una forma, lo podremos representar de la siguiente manera:

|v〉↓ ;

〈u|↓•

∈ C

Un tensor con dos argumentos correspondientes a vectores y uno a una forma serıa

T [, ; •]⇒ T

|v1〉↓ , |v2〉↓ ;

〈u|↓•

∈ C⇒ tensor de tipo

(12

);

y el caso contrario

T [; •, •]⇒ T

|v〉↓ ;

〈u1|↓• ,〈u2|↓•

∈ C⇒ tensor de tipo

(21

)En general

|v1〉↓ , |v2〉↓ , · · · , |vn〉↓ ;

〈u1|↓• ,〈u2|↓• · · · ,

〈um|↓•

⇒ tensor de tipo

(mn

En esta notacion el punto y coma (;) separa las “entradas” formas de las “entradas” vectores. Es impor-tante recalcar que el orden si importa, no solo para las cantidades separadas por ;, sino el orden de los“puestos” vectores y “puestos” formas separados por coma y repercutira en las propiedades de los tensores.Por ejemplo: si el orden de las “entradas” vectores no importa, podremos permutarlas sin alteraral tensor, tendremos entonces tensores simetricos respecto a esos “puestos” o “entradas”; delmismo modo, seran tensores antisimetricos aquellos en los cuales si el orden importa y al permutar esos“puestos” o “entradas” hay un cambio de signo en el tensor. Todos estos casos seran tratados con detallemas adelante, pero vale la pena recalcar que en general, para un tensor generico el orden de la “entradas” o“puestos” si importa pero no necesariamente se comporta como los casos resenados anteriormente.

Borra

dor Pre

limin

Obviamente las formas pueden ser representadas por tensores ya que son funcionales lineales de vectores,es decir:

Un vector es un tensor del tipo

(10

)⇒ T

〈a|↓• ∈ C.

los vectores constituyen un caso especial de tensores.

Una forma es un tensor del tipo

(01

)⇒ T

|a〉↓ ∈ C.

porque son funcionales lineales para las formas diferenciales.

Un tensor

(mn

)es un funcional lineal que asocia m 1-formas y n vectores en C.

3.2.2. Producto tensorial

Como sera evidente mas adelante, los tensores (simples) pueden provenir del producto tensorial (exterioro directo) de espacios vectoriales. Esto es, dados E1 y E2 dos espacios vectoriales con dimensiones n1 y n2,respectivamente y vectores genericos, |ϕ(1)〉 y |χ(2)〉 pertenecientes a estos espacios vectoriales: |ϕ(1)〉 ∈ E1

y |χ(2)〉 ∈ E2. Definiremos el producto tensorial (exterior o directo) de espacios vectoriales, E = E1⊗E2, si

a cada par de vectores |ϕ(1)〉 y |χ(2)〉 le asociamos un tensor tipo

(20

)y si se cumple que

|ϕ(1)χ(2)〉 = |ϕ(1)〉 ⊗ |χ(2)〉 = T

〈ζ(1)|↓• ,

〈ξ(2)|↓•

= 〈ζ(1) |ϕ(1)〉〈ξ(2) |χ(2)〉 ∈ C

y si ademas se cumplen las siguientes propiedades:

1. La suma entre tensores de E viene definida como

|ϕ(1)χ(2)〉+ |ζ(1)ξ(2)〉 = |ϕ(1)〉 ⊗ |χ(2)〉+ |ζ(1)〉 ⊗ |ξ(2)〉= |ϕ(1) + ζ(1)〉 ⊗ |χ(2) + ξ(2)〉

2. El producto tensorial es lineal respecto a la multiplicacion con numeros reales λ y µ

[|λϕ(1)〉]⊗ |χ(2)〉 = [λ |ϕ(1)〉]⊗ |χ(2)〉 = λ [|ϕ(1)〉 ⊗ |χ(2)〉] = λ |ϕ(1)χ(2)〉|ϕ(1)〉 ⊗ [|µχ(2)〉] = |ϕ(1)〉 ⊗ [µ |χ(2)〉] = µ [|ϕ(1)〉 ⊗ |χ(2)〉] = µ |ϕ(1)χ(2)〉

3. El producto tensorial es distributivo respecto a la suma:

|ϕ(1)〉 ⊗ [|χ1(2)〉+ |χ2(2)〉] = |ϕ(1)〉 ⊗ |χ1(2)〉+ |ϕ(1)〉 ⊗ |χ2(2)〉[|ϕ1(1)〉+ |ϕ2(1)〉]⊗ |χ(2)〉 = |ϕ1(1)〉 ⊗ |χ(2)〉+ |ϕ2(1)〉 ⊗ |χ(2)〉

Notese que los ındices (1) y (2) denotan la pertenencia al espacio respectivo.

Es facil convencerse que los tensores |ϕ(1)χ(2)〉 ∈ E = E1 ⊗E2 forman un espacio vectorial y la demos-tracion se basa en comprobar los axiomas o propiedades de los espacios vectoriales tal y como lo describimosen la Seccion 2.1.3:

Borra

dor Pre

limin

1. La operacion suma es cerrada en V : ∀ |vi〉 , |vj〉 ∈ V⇒|vk〉 = |vi〉 |vj〉 ∈ VEsto se traduce en demostrar que sumados dos tensores |ϕ(1)χ(2)〉 , y |ζ(1)ξ(2)〉 ∈ E el tensor sumatambien pertenece a E, con a y b pertenecientes al campo del espacio vectorial

a |ϕ(1)χ(2)〉+ b |ζ(1)ξ(2)〉 = |aϕ(1) + ζ(1)〉 ⊗ |χ(2) + bξ(2)〉

y esto se cumple siempre ya que, el producto tensorial es lineal respecto a la multiplicacion con numerosreales y por ser E1 y E2 espacios vectoriales se cumple

|aϕ(1) + ζ(1)〉 = a |ϕ(1)〉+ |ζ(1)〉 ∈ E1

|ϕ(2) + bζ(2)〉 = |ϕ(2)〉+ b |ζ(2)〉 ∈ E2

=⇒ |ϕ(1) + ζ(1)〉 ⊗ |χ(2) + ξ(2)〉 ∈ E2

2. La operacion suma es conmutativa y asociativaConmutativa ∀ |vi〉 , |vj〉 ∈ V⇒|vi〉 |vj〉 = |vj〉 |vi〉Esta primera es clara de la definicion de suma

|ϕ(1)χ(2)〉+ |ζ(1)ξ(2)〉 = |ϕ(1) + ζ(1)〉 ⊗ |χ(2) + ξ(2)〉

|ζ(1)ξ(2)〉+ |ϕ(1)χ(2)〉 = |ζ(1) + ϕ(1)〉 ⊗ |ξ(2) + χ(2)〉

por ser E1 y E2 dos espacios vectoriales∀ |vi〉 , |vj〉 , |vk〉 ∈ V ⇒ (|vi〉 |vj〉) |vk〉 = |vj〉 (|vi〉 |vk〉)una vez mas, esto se traduce en:

(|ϕ(1)χ(2)〉+ |ζ(1)ξ(2)〉) + |κ(1)κ(2)〉 = |ϕ(1)χ(2)〉+ (|ζ(1)ξ(2)〉+ |κ(1)κ(2)〉)

con lo cual, por la definicion de suma la expresion anterior queda como

(|ϕ(1) + ζ(1)〉 ⊗ |ξ(2) + χ(2)〉) + |κ(1)κ(2)〉 = |ϕ(1)χ(2)〉+ (|ζ(1) + κ(1)〉 ⊗ |ξ(2) + κ(2)〉)

|(ϕ(1) + ζ(1)) + κ(1)〉 ⊗ |(ξ(2) + χ(2)) + κ(2)〉 = |ϕ(1) + (ζ(1) + κ(1))〉 ⊗ |ξ(2) + (χ(2) + κ(2))〉

3. Existe un unico elemento neutro: ∃ |0〉 / |0〉 |vj〉 = |vj〉 |0〉 = |vj〉 ∀ |vj〉 ∈ VEs decir,

|ϕ(1)χ(2)〉+ |0(1)0(2)〉 = |ϕ(1) + 0(1)〉 ⊗ |χ(2) + 0(2)〉 = |ϕ(1)〉 ⊗ |χ(2)〉 = |ϕ(1)χ(2)〉

4. Existe un elemento simetrico para cada elemento de V :∀ |vj〉 ∈ V ∃ |−vj〉 / |vj〉 |−vj〉 = |0〉 ⇒

|ϕ(1)χ(2)〉 − |ϕ(1)χ(2)〉 = |ϕ(1)− ϕ(1)〉 ⊗ |χ(2)− χ(2)〉 = |0(1)〉 ⊗ |0(2)〉 = |0(1)0(2)〉

5. α (β |vi〉) = (αβ) |vi〉 ⇒

α (β |ϕ(1)χ(2)〉) = α (|βχ(2)〉 ⊗ |ϕ(1)〉) = |αβχ(2)〉 ⊗ |ϕ(1)〉= (αβ) |χ(2)〉 ⊗ |ϕ(1)〉 = (αβ) |ϕ(1)χ(2)〉

Borra

dor Pre

limin

6. (α+ β) |vi〉 = α |vi〉+ β |vi〉 ⇒

(α+ β) |ϕ(1)χ(2)〉 = |ϕ(1)〉 ⊗ |(α+ β)χ(2)〉 = |ϕ(1)〉 ⊗ |αχ(2) + βχ(2)〉= |ϕ(1)〉 ⊗ [(α |χ(2)〉+ β |χ(2)〉)]= α |ϕ(1)〉 ⊗ |χ(2)〉+ β |ϕ(1)〉 ⊗ |χ(2)〉

7. α (|vi〉 |vj〉) = α |vi〉 α |vj〉 ⇒

α (|ϕ(1)χ(2)〉+ |ζ(1)ξ(2)〉) = α (|ϕ(1) + ζ(1)〉 ⊗ |ξ(2) + χ(2)〉)= |α (ϕ(1) + ζ(1))〉 ⊗ |ξ(2) + χ(2)〉= |αϕ(1) + αζ(1)〉 ⊗ |ξ(2) + χ(2)〉= (|αϕ(1)χ(2)〉+ |αζ(1)ξ(2)〉)= α |ϕ(1)χ(2)〉+ α |ζ(1)ξ(2)〉

Equivalentemente, podemos construir un producto tensorial entre espacios de formas diferenciales. SiE∗1 y E∗2 son dos espacios vectoriales duales a E1 y E2, con dimensiones n1 y n2, respectivamente. A estosespacios pertenecen las formas diferenciales genericas 〈ζ(1)| ∈ E∗1 y 〈ξ(2)| ∈ E∗2. Definiremos el productotensorial de espacios vectoriales duales, E∗= E∗1 ⊗ E∗2, si a cada par de formas diferenciales 〈ζ(1)| ∈ E∗1 y

〈ξ(2)| ∈ E∗2 le asociamos un tensor tipo

(02

). Esto es

〈ζ(1)ξ(2)| = 〈ζ(1)| ⊗ 〈ξ(2)|

3.2.3. La tentacion del producto interno

A partir de las definiciones de productos internos en E1 y E2, uno puede verse tentado a definir unproducto interno de la siguiente forma

〈ϕ(1)χ(2) |ϕ(1)χ(2)〉 = 〈ϕ(1) |ϕ(1)〉 · 〈χ(2) |χ(2)〉 .

Mostraremos, sin embargo, que NO es una buena definicion de producto interno, y para ello debemos de-mostrar que se satisfacen los axiomas o propiedades del producto interno que expusimos en la Seccion 2.2.3.

Para facilitar la lectura repetiremos aquı las propiedades que definen el producto interno (expuestas enla Seccion 2.2.3) y haremos las “adaptaciones” del caso son:

1. 〈x| x〉 ∈ R ∧ 〈x| x〉 ≥ 0 ∀ |x〉 ∈ V si 〈x| x〉 = 0⇒ |x〉 ≡ |0〉Esto es:

〈ϕ(1)χ(2) |ϕ(1)χ(2)〉 = 〈ϕ(1) |ϕ(1)〉 · 〈χ(2) |χ(2)〉

como 〈ϕ(1) |ϕ(1)〉 y 〈χ(2) |χ(2)〉 son buenas definiciones de producto interno tendremos que

〈ϕ(1) |ϕ(1)〉 ≥ 0

〈χ(2) |χ(2)〉 ≥ 0

⇒ 〈ϕ(1)χ(2) |ϕ(1)χ(2)〉 ≥ 0

Aquı vale la pena mencionar algunos puntos sutiles sobre la segunda parte de la propiedad a demostrar:

Borra

dor Pre

limin

si 〈x| x〉 = 0⇒ |x〉 ≡ |0〉 lo cual para este caso se traducen en

〈ϕ(1)χ(2) |ϕ(1)χ(2)〉 = 〈ϕ(1) |ϕ(1)〉 · 〈χ(2) |χ(2)〉 = 0

〈ϕ(1) |ϕ(1)〉 · 〈χ(2) |χ(2)〉 = 0⇒

〈ϕ(1) |ϕ(1)〉 = 0

〈χ(2) |χ(2)〉 6= 0

⇒ |ϕ(1)〉 = |0(1)〉

〈ϕ(1) |ϕ(1)〉 6= 0

〈χ(2) |χ(2)〉 = 0

⇒ |χ(1)〉 = |0(1)〉

〈ϕ(1) |ϕ(1)〉 = 0

〈χ(2) |χ(2)〉 = 0

⇒ |ϕ(1)〉 = |0(1)〉

|χ(1)〉 = |0(1)〉

definitivamente, habrıa que restringir los posibles vectores que intervienen en el producto tensorial, demodo que no fuera posible vectores del tipo

|ϕ(1)0(2)〉 ≡ |ϕ(1)〉 ⊗ |0(2)〉 o |0(1)χ(2)〉 ≡ |0(1)〉 ⊗ |χ(2)〉

solo ası se cumple la propiedad mencionada.

2. 〈x| y〉 = 〈y| x〉∗ ∀ |x〉 , |y〉 ∈ VEsto puede ser demostrado facilmente como sigue

〈ϕ(1)χ(2) |ϕ(1)χ(2)〉 = 〈ϕ(1) |ϕ(1)〉 · 〈χ(2) |χ(2)〉= 〈ϕ(1) |ϕ(1)〉∗ · 〈χ(2) |χ(2)〉∗

= (〈ϕ(1) |ϕ(1)〉 · 〈χ(2) |χ(2)〉)∗

= 〈ϕ(1)χ(2) |ϕ(1)χ(2)〉∗

3. 〈x| y + z〉 = 〈x| y〉+ 〈x| z〉 ∧ 〈x+ z| y〉 = 〈x| y〉+ 〈z| y〉 ∀ |x〉 , |y〉 , |z〉 ∈ VPartimos del lado derecho de la primera de las igualdades anteriores:

〈ϕ(1)χ(2)| [|ϕ(1)χ(2)〉+ |ζ(1)ξ(2)〉] = 〈ϕ(1)χ(2)| [|ϕ(1) + ζ(1)〉 ⊗ |ξ(2) + χ(2)〉]= 〈ϕ(1) |ϕ(1) + ζ(1)〉 · 〈χ(2) |ξ(2) + χ(2)〉

y otra vez, como 〈ϕ(1) |ϕ(1)〉 y 〈χ(2) |χ(2)〉 son buenas definiciones de producto interno tendremosque:

〈ϕ(1) |ϕ(1) + ζ(1)〉 = 〈ϕ(1) |ϕ(1)〉+ 〈ϕ(1) |ζ(1)〉〈χ(2) |ξ(2) + χ(2)〉 = 〈χ(2) |ξ(2)〉+ 〈χ(2) |χ(2)〉

y al multiplicar 〈χ(2) |ξ(2) + χ(2)〉 por 〈ϕ(1) |ϕ(1) + ζ(1)〉 surgiran cuatro sumandos

〈ϕ(1) |ϕ(1)〉〈χ(2) |ξ(2)〉+〈ϕ(1) |ϕ(1)〉〈χ(2) |χ(2)〉+〈ϕ(1) |ζ(1)〉〈χ(2) |ξ(2)〉+〈ϕ(1) |ζ(1)〉〈χ(2) |χ(2)〉

lo cual contrasta con el lado izquierdo al utilizar la definicion dos veces que tienen dos sumandos

〈ϕ(1)χ(2) |ϕ(1)χ(2)〉+ 〈ϕ(1)χ(2) |ζ(1)ξ(2)〉 = 〈ϕ(1) |ϕ(1)〉 · 〈χ(2) |χ(2)〉+ 〈ϕ(1) |ζ(1)〉 · 〈χ(2) |ξ(2)〉

por lo cual NO se cumple esta propiedad y no hay forma de enmendarla.

Borra

dor Pre

limin

3.2.4. Bases para un producto tensorial

Si |ui(1)〉 y |vi(2)〉 son, respectivamente, bases discretas para E1 y E2 entonces podremos construirel tensor

|ui(1)vj(2)〉 = |ui(1)〉 ⊗ |vj(2)〉 ∈ E

el cual funcionara como una base para E y, por lo tanto, podremos construir un tensor generico de E

|ϕ(1)χ(2)〉 = |ϕ(1)〉 ⊗ |χ(2)〉 = ϕiχj |ui(1)vj(2)〉

donde ϕi y χj son las componentes de |ϕ(1)〉 y |χ(2)〉 en sus respectivas bases. En otras palabras, lascomponentes de un tensor en E corresponden a la multiplicacion de las componentes de los vectores en E1

y E2. Recuerde que estamos utilizando la convencion de Einstein de suma tacita en ındices covariantes ycontravariantes, en la cual ck |vk〉 ≡

∑nk=1 c

k |vk〉 .Es importante senalar que si bien un tensor generico |Ψ〉 ∈ E siempre se puede expandir en la base

|ui(1)vj(2)〉 no es cierto que todo tensor de E provenga del producto tensorial de E1 y E2. Es decir, E tienemas tensores de los que provienen el producto tensorial. Esta afirmacion puede intuirse del hecho que si|Ψ〉 ∈ E entonces

|Ψ〉 = ci,j |ui(1)vj(2)〉

por ser |ui(1)vj(2)〉 base para E. Es claro que dados dos numeros α1 y α2 habra ci,j que no provienen dela multiplicacion de α1α2.

3.2.5. Tensores, sus componentes y sus contracciones

Componentes de un tensor

Denominaremos componentes de un tensor, aquellos numeros que surgen de incorporar bases de formasdiferenciales y vectores. Ası, si |ui(1)〉 , |vj(2)〉 , |tk(3)〉 y 〈xm(1)| , 〈yn(2)| son bases para los vectores y

las formas, respectivamente, las componentes de un tensor

(23

)seran

Smnijk = S

|ui(1)〉↓ ,

|vj(2)〉↓ ,

|tk(3)〉↓ ;

〈xm(1)|↓• ,

〈yn(2)|↓•

.Claramente, esta definicion de componentes contiene a las componentes ci,j de aquellos espacios tensorialesgenerados por el producto tensorial. Si consideramos un tensor como resultado de un producto tensorial yconsideramos las bases |ui(1)〉 , 〈xm(1)|, sus componentes se pueden expresar ϕm(1)χi(1), vale decir,(

)⇐⇒ |ϕ(1)〉 ⊗ 〈∆(1)| ⇒ 〈xm(1) |ϕ(1)〉 ⊗ 〈∆(1)| ui(1)〉 ⇒ ϕm(1)δi(1)

Combinaciones lineales de tensores

Es claro que podremos sumar (componentes) de tensores como lo hemos hecho con la suma de (compo-nentes) de vectores

a + b = (ax + bx) i + (ay + by) j + (az + bz) k =(a1 + b1

)i +(a2 + b2

)j +(a3 + b3

)k =

(ai + bi

)|ei〉

esto es:

Rijkl = αQijkl + βP ijkl .

Borra

dor Pre

limin

Producto tensorial de tensores

Podemos extender aun mas la idea del producto directo y extenderla para tensores. Ası, para dos tensores

tipo

(20

(21

)se tiene que

|ϕ(1)χ(2)〉 = |ϕ(1)〉 ⊗ |χ(2)〉 = T

〈ζ(1)|↓• ,

〈ξ(2)|↓•

|µ(1)κ(2)Θ(1)〉 = |µ(1)〉 ⊗ |κ(2)〉 ⊗ 〈Θ (1)| = P

|ui(1)〉↓ ;

〈ε(1)|↓• ,

〈φ(2)|↓•

=⇒

|ϕ(1)χ(2)〉 ⊗ |µ(1)κ(2)Θ(1)〉 = |ϕ(1)〉 ⊗ |χ(2)〉 ⊗ |µ(1)〉 ⊗ |κ(2)〉 ⊗ 〈Θ (1)|

= T

〈ζ(1)|↓• ,

〈ξ(2)|↓•

⊗ P|ui(1)〉

↓ ;

〈ε(1)|↓• ,

〈φ(2)|↓•

= R

|ui(1)〉↓ ;

〈ε(1)|↓• ,

〈φ(2)|↓• ,

〈ζ(3)|↓• ,

〈ξ(4)|↓•

Por ejemplo, en componentes:

Sijlmk = QijP lmk .

Contraccion de un tensor

Denominaremos una contraccion cuando sumamos las componentes covariantes y contravariantes, estoes, si tenemos ϕi(1)χi(1) entonces se genera un escalar independiente de la base. Esta situacion sera masevidente cuando definamos metricas y contraccion de tensores. Por analogıa y considerando un caso mas

general, dada una componente Smnijk correspondiente a un tensor

(23

)podremos construir un nuevo tensor(

)a partir de una contraccion. Las componentes de este nuevo tensor seran: Smnijk ⇒ Sinijk ≡ Snjk.

Del mismo modo, dadas las componentes de dos tensores, P lm y Qijzk generaran componentes de nuevos

tensores Rlijk = P lmQijmk. Ası(20

)⇒ P lm(

)⇒ Qijzk

⇒(

)⇒ Rlijk = P lmQijmk

Es claro que si dos tensores derivan de productos tensoriales y si |ui(1)〉 , 〈um(1)| y |vi(2)〉 son bases

Borra

dor Pre

limin

ortonormales para E1 E∗1 y E2, entonces sus productos podran ser expresados como

|γ(1)δ(2)〉 =(γi(1)δj(2)

)︸︷︷︸P ij

|ui(1)〉 ⊗ |vj(2)〉

|α(1)β(1)〉 =(αl(1)βm(2)

)︸︷︷︸Qlm

|ul(1)〉 ⊗ 〈um(1)|

⇒

[(αl(1)βm(2)

)|ul(1)〉 ⊗ 〈um(1)|

] [(γi(1)δj(2)

)|ui(1)〉 ⊗ |vj(2)〉

]⇒

αl(1)βm(2)(γi(1)δj(2)

)〈um(1) |ui(1)〉︸︷︷︸

δmi

|vj(2)〉 ⊗ |ul(1)〉 ⇒

αl(1)βk(2)(γk(1)δj(2)

)|vj(2)〉 ⊗ |ul(1)〉 = P ijQli |vj(2)ul(1)〉 = Rjl |vj(2)ul(1)〉 .

Pero mas aun, si |ui(1)vj(2)〉 = |ui(1)〉⊗ |vj(2)〉 ∈ E es base de E entonces se puede demostrar lo anteriorsin circunscribirnos a tensores cuyas componentes provengan de multiplicacion de las componentes en cadaespacio vectorial.

Simetrizacion de tensores

Un tensor (las componentes) sera simetrico respecto a dos de sus ındices si su permutacion no cambia suvalor:

Sij = Sji; Sij = Sji; Sij···kl···mn = Sij···lk···mn Sij···kl···mn = Sij···lk···mn

y sera antisimetrico si

Aij = −Aji; Aij = −Aji Aij···kl···mn = −Aij···lk···mn Aij···kl···mn = −Aij···lk···mn .

Un tensor de rango 2, viene representado por una matriz. La matriz que representa un tensor de rango2, tendra como maximo 6 componentes distintas

Sij = Sji =

S11 S1

2 S13

S21 S2

2 S23

S31 S3

2 S33

S11 S1

2 S13

S12 S2

2 S23

S13 S2

3 S33

mientras que un tensor antisimetrico de segundo orden tendra, cuando maximo, tres componentes con valorabsoluto distintos de cero

Aij = −Aji =

0 A12 A1

−A21 0 A2

−A31 −A3

2 0

Siempre es posible construir tensores simetricos y antisimetricos a partir de un tensor generico. Esto es:

Sij =1

2(Tij + Tji) ≡ T(ij) ⇐⇒ Sij···kl···mn =

2(Tij···kl···mn + Tij···lk···mn) = Tij···(kl)···mn

Aij =1

2(Tij − Tji) ≡ T[ij] ⇐⇒ Aij···kl···mn =

2(Tij···kl···mn − Tij···lk···mn) = Tij···[kl]···mn

Borra

dor Pre

limin

Mas aun, es evidente que las componentes de un tensor generico Tij , pueden expresarse como una combinacionde su parte simetrica y antisimetrica

Tij = Sij +Aij .

Obviamente que algo equivalente se puede realizar para componentes contravariantes de tensores.

3.2.6. Tensor metrico, ındices y componentes

Para una base generica, |uj〉, no necesariamente ortogonal, de un espacio vectorial con producto interno,

podemos definir la expresion de un tensor simetrico

(02

)que hemos denominado tensor metrico de la

siguiente manera

|ui〉↓ , |uj〉↓, = gij ≡ gji ⇒ gij ≡ gji = g [|ui〉 , |uj〉]

〈ui|↓• ,〈uj|↓•

= gij ≡ gij ⇒ gij ≡ gij = (gij)−1

Notese que las gij ≡ gji son las componentes del tensor g[, ]

una vez que la base |uj〉 ha actuado.

La denominacion de tensor metrico, no es gratuita, g[, ]

cumple con todas las propiedades de la

metrica definida para un Espacio Vectorial Euclidiano expuestas en la Seccion 2.2.1.Una vez mas, para facilitar la lectura, transcribiremos a continuacion esas propiedades :

1. g [|ui〉 , |uj〉] = gij ≡ gji ≥ 0 ∀ |uj〉 , y si g [|ui〉 , |uj〉] = 0⇒ i = j

2. g [|ui〉 , |uj〉] = g [|uj〉 , |ui〉] ⇒ gij ≡ gji

3. g [|ui〉 , |uj〉] ≤ g [|ui〉 , |uk〉] + g [|uk〉 , |uj〉]: La desigualdad Triangular

Si la base generica, |ui〉 = |ei〉, es ortonormal, entonces estas propiedades emergen de manera natural

g [, ] ≡ gij⟨ei∣∣⊗ ⟨ej∣∣ ≡ gji ⟨ej∣∣⊗ ⟨ei∣∣ y g [•, •] ≡ gij |ei〉 ⊗ |ξj〉 ≡ gji |ej〉 ⊗ |ei〉 ,

con lo cual sus componentes seran matrices simetricas gij = gji e igualmente gij = gji.En general impondremos que(

gij⟨ui∣∣⊗ ⟨uj∣∣) (gkm |uk〉 ⊗ |um〉) = gijg

km⟨ui |uk〉

⟨uj |um〉 = gijg

kmδikδjm = gijg

ji = δii = n ,

ya que i, j = 1, 2, 3, · · · , n. Con lo cual gij es la matriz inversa de gij . Es decir, hemos definido las componentes

contravariantes del tensor de modo que cumplan con gikgkj = δji

Adicionalmente, tambien es claro que(gij⟨ui∣∣⊗ ⟨uj∣∣) |a〉 = ak

(gij⟨ui∣∣⊗ ⟨uj∣∣) |uk〉 = akgij

⟨uj |uk〉

⟨ui∣∣ = akgijδ

⟨ui∣∣ = akgik

⟨ui∣∣ ≡ ai ⟨ui∣∣ ,

con lo cual ai = akgik. De la misma forma

〈a|(gij |ui〉 ⊗ |uj〉

)= 〈a|

(gij |ui〉 ⊗ |uj〉

)= gij 〈a |ui〉 ⊗ |uj〉 = akg

ij⟨uk |ui〉 |uj〉 = akg

kj |uj〉 ≡ aj |uj〉 ,

Borra

dor Pre

limin

otra vez aj = akgkj , ahora subimos el ındice correspondiente.

De esta manera, el tensor metrico nos permite asociar formas con vectores, componentes covariantes(formas) a componentes contravariantes (vectores) y dicho rapido y mal, pero de uso muy frecuente: eltensor metrico nos permite subir y bajar ındices.

Otra forma de verlo es combinando las propiedades del producto directo de tensores y contraccion deındices

gij |ui〉 ⊗ |uj〉 ⊗ P lmnk |ul〉 ⊗ |um〉 ⊗ |un〉 ⊗⟨uk∣∣ ⇒ gijP lmnk |uj〉 ⊗ P lmnk |ul〉 ⊗ |um〉 ⊗ |un〉 ⊗

⟨uk∣∣ ui〉

gijP lmnk |uj〉 ⊗ |ul〉 ⊗ |um〉 ⊗ |un〉 ·⟨uk∣∣ ui〉︸︷︷︸δki

= P jlmn |uj〉 ⊗ |ul〉 ⊗ |um〉 ⊗ |un〉

gijP lmni ≡ P jlmn

Adicionalmente, el tensor metrico permite la contraccion de ındices. Ası, dado un producto tensorial dedos vectores que se pueden expresar en una base ortonormal |ei〉

|a, b〉 = |a〉 ⊗ |b〉 = akbm |ek〉 ⊗ |ξm〉⇓(

gij⟨ei∣∣⊗ ⟨ej∣∣) (ak |ek〉 ⊗ bm |em〉) = akbmgijδ

ikδjm = akbmgkm = akbk = 〈b |a〉 = 〈a |b〉 .

Es decir, el producto interno de dos vectores involucra, de manera natural, la metrica del espacio,

〈b |a〉 = 〈a |b〉 = akbk = akbk = akbmgkm = akbmg

km .

Obviamente la norma de un vector, tambien incluira al tensor metrico:

‖|a〉‖2 = 〈a |a〉 = aiaj⟨ei |ej〉 = aia

i = aiaj gij = aiaj gij .

El caso mas emblematico lo constituye la norma de un desplazamiento infinitesimal. Para una basegenerica, |uj〉 no necesariamente ortogonal de un espacio vectorial con producto interno, el desplazamientoinfinitesimal puede expresarse como

(ds)2 ≡ 〈dr |dr〉 =

(dxk

⟨uk∣∣) (dxm |um〉) =

⟨uk |um〉dxk dxm = dxmdxm = gkmdxkdxm .

Si la base |ej〉 es ortogonal (cosa mas o menos comun pero no necesariamente cierta siempre) las matricesgij y gij son diagonales y cumplen que

gii =1

gii⇒ (ds)

2=(h1 dx1

)2+(h2 dx2

)2+(h3 dx3

)2donde hi =

√gii, con i, j = 1, 2, 3 (aquı no hay suma), se denominan los factores de escala.

3.3. Un par de tensores

En esta seccion vamos a ejemplificar la utilizacion de los tensores en varios ambitos de la Fısica, enparticular de la Mecanica. En la proxima seccion 3.3.1 consideraremos el tensor de esfuerzos para describirlas tensiones internas de cuerpos sometidos a fuerzas externas. Haremos el analisis tanto para el caso de doscomo de tres dimensiones. Luego en la Seccion 3.3.2 consideraremos el tensor de inercia y su impacto en ladinamica de cuerpos en movimiento.

Borra

dor Pre

limin

3.3.1. El tensor de esfuerzos (stress)

Figura 3.1: Tensor de Esfuerzos (stress) en 2 dimensiones

El caso 2D

Supongamos un cuerpo que se encuentra en equilibrio y esta sometido a un conjunto de fuerzas externas.Para facilitar las cosas consideremos el efecto de esas fuerzas sobre un plano que contiene a un determinadopunto P (ver figura 3.1 cuadrante Ia) Es decir, vamos a considerar los efectos de las componentes de todaslas fuerzas sobre ese plano y obviaremos el efecto del resto de las componentes.

Como observamos en la figura 3.1 Ib y Ic, si cortamos la superficie en dos lıneas (AB y A′B′), podemosver que el efecto del conjunto de fuerzas externas es distinto sobre P en la direccion perpendicular a cada unade esas lıneas. De hecho, al “cortar” la superficie las fuerzas que aparecen sobre las lıneas AB (y A′B′) eranfuerzas internas y ahora son externas al nuevo cuerpo “cortado”. Ası, estas fuerzas por unidad de longitud1

1En el caso tridimensional, las fuerzas que generan los esfuerzos seran definidas como fuerzas por unidad de area. Ese casolo veremos en la proxima seccion.

Borra

dor Pre

limin

sobre el punto P existen como un conjunto de fuerzas que generan esfuerzos (stress). Por lo tanto, es claroque los esfuerzos sobre un punto dependen del punto, de las fuerzas externas y de la direccion del efecto.

Para irnos aclarando consideremos un elemento de area infinitesimal ds sobre la cual actua un conjuntode fuerzas externas, las cuales las podemos descomponer como normales y tangenciales a la lınea sobre lacual estan aplicadas (ver figura 3.1 cuadrante II). Es costumbre denotar los esfuerzos normales y tangenciales

dA = dxdy ⇒

↑ Y2 = σ2dx −→ X2 = τ2dx

Y3 = τ3dy ↑X3 = σ3dy →

dxdy ds dy

↑ Y1 = τ1dy→ X1 = σ1dy

↑ Y4 = σ4dx → X4 = τ4dx

Consideramos la segunda ley de Newton aplicada a cada diferencial de masa dm y obtendremos

∑Fexti = dm a = 0 ⇒

τ1dy + σ2dx+ τ3dy + σ4dx = 0 = (σ2 + σ4) dx+ (τ1 + τ3) dy ;

σ1dy + τ2dx+ σ3dy + τ4dx = 0 = (τ2 + τ4) dx+ (σ1 + σ3) dy

con lo cualσ2 = −σ4; τ1 = −τ3

τ2 = −τ4 σ1 = −σ3

como se esta en equilibrio, tambien la sumatoria de torques se tendra que anular. Esto es

(τ1dy) dx2 − (τ2dx) dy

2 = 0

(τ3dy) dx2 − (τ4dx) dy

2 = 0

⇒ τ1 = τ2 = τ3 = τ4

entonces, nos damos cuenta que existen solo tres cantidades independientes: dos esfuerzos normales σ1 y σ2;y un esfuerzo tangencial τ1. Adicionalmente notamos que los esfuerzos tienen que ver con la direccion dela fuerza y la superficie sobre la cual va aplicada. Con ello podemos disenar la siguiente notacion para losesfuerzos: σij . El primer ındice indica la direccion de la fuerza y el segundo direccion de la normal de lasuperficie donde esta aplicada. Ası, tal y como muestra la figura (ver figura 3.1 cuadrante II)

σ1 ≡ σxx; −σ4 ≡ σyy; τ2 ≡ σxy ≡ σyxEl cambio de signo se debe a lo incomodo de la notacion: σ4 ≡ σy−y ya que la normal de lado 4 apunta

en la direccion −y. Es importante tambien senalar que los esfuerzos en cualquier punto contenido en eldiferencial de area dA = dxdy deben ser considerado constantes. O, lo que es lo mismo, que podemos hacertender a cero el area del diferencial y con ello asociar los esfuerzos σij a un punto P contenido en dA sobrela cual hemos calculado los esfuerzos.

En esta misma lınea de razonamiento, nos podemos preguntar cual es la expresion de los esfuerzos cuandose miden respecto a una superficie generica, definida por un vector normal n (ver figura 3.1 cuadrante III).Es decir, queremos conocer los esfuerzos medidos en el punto P y en la direccion n, es decir, σnn.

Tendremos que

x→ σxxdy + σxydx = σnnds cos(φ) + σsnds sen(φ) ; y → σyydx+ σyxdy = σnnds sen(φ)− σsnds cos(φ)

Ahora bien, dado que dy = ds cos(φ) y dx = ds sen(φ), entonces podemos expresar

σnn = σxx cos2(φ) + σxy sen(φ) cos(φ) + σyx sen(φ) cos(φ) + σyy sen2(φ)

σsn = σxx sen(φ) cos(φ) + σxy sen2(φ)− σyx cos2(φ)− σyy sen(φ) cos(φ)

Borra

dor Pre

limin

arFigura 3.2: Tensor de Esfuerzos en 3 dimensiones

y si ahora nos damos cuenta que si construimos una matriz

Aij =

(Axn AxsAyn Ays

(cos(φ) sen(φ)sen(φ) − cos(φ)

)entonces podemos expresar

σnn = AxnAxnσxx +AxnA

ynσxy +AynA

xnσyx +AynA

ynσyy ⇒ σnn = AinA

jnσij con i, j = n, s

σsn = AxsAxnσxx +AxsA

ynσxy +AysA

xnσyx +AysA

ynσyy ⇒ σsn = AisA

jnσij con i, j = n, s

es decir,σkl = AikA

jlσij , con i, j, k, l = n, s .

Como veremos mas adelante, cualquier objeto que transforme como σkl = AikAjlσij lo llamaremos tensor

de segundo orden.

El caso 3D

Podemos proceder como en el caso anterior estableciendo las condiciones de equilibrio∑Fexti = 0 y

∑τ exti = 0 ,

con ello construimos un volumen (cubico) diferencial y construimos los esfuerzos normales y tangenciales,los cuales seran

σxxdydz; σyydxdz; σzzdxdy; σxzdxdy; σyzdxdy; σxydxdz;

Siguiendo el mismo proceso que involucra imponer el equilibrio, es facil demostrar que al igual que el casoanterior, el tensor de esfuerzos σij cumple con:

σxz = σzx; σyz = σzy; σxy = σyx .

Borra

dor Pre

limin

Tendremos 6 componentes (tres normales y tres tangenciales) independientes. Es decir, si bien el tensorde esfuerzos σij viene representado por una matriz 3 × 3 y por lo tanto tiene 9 elementos, solo 6 sonindependientes. Vayamos ahora el caso general para un tensor de esfuerzos en un medio elastico. Para elloconstruimos un tetraedro regular tal y como muestra la figura 3.2, y sobre su cara generica asociada a unvector normal n una fuerza F

F = F iii = Fxi + Fyj + Fzk ⇒

Fx = σxndSn

Fy = σyndSn

Fz = σzndSn

⇒ F i = σijnjdS ⇒ F = σ · dS

de esta manera se especifica como la fuerza actua sobre un determinado elemento de superficie. Es claro quela condicion de equilibrio se traduce en∑

Fxi = 0 ⇒ σxndSn −1

2σxxdy dz − 1

2σxydx dz − 1

2σxzdx dy = 0

∑Fyi = 0 ⇒ σyndSn −

2σyxdy dz − 1

2σyydx dz − 1

2σyzdx dy = 0

∑Fzi = 0 ⇒ σzndSn −

2σzxdy dz − 1

2σzydx dz − 1

2σzzdx dy = 0

Si consideramos la proyeccion de dSn sobre cada uno de los planos del sistema cartesiano tendremos que

dSn cos (i; n) = 12dy dz = dSn Axn

dSn cos (j; n) = 12dx dz = dSn Ayn

dSn cos (k; n) = 12dx dy = dSn Azn

⇒ σxn = σxxAxn + σxyA

yn + σxzA

y equivalentemente

σyn = σyxAxn + σyyA

yn + σyzA

zn; y σzn = σzxA

xn + σzyA

yn + σzzA

zn ,

las cuales se conocen como las relaciones de Cauchy, y representan los esfuerzos sobre la superficie con normaln.

Ahora bien, dado que F = σ · dS es una relacion vectorial podemos proyectar en la direccion um

um · F = um · (σ · dS) ⇒ Fm = σmn dSn =(σmi A

)dSn =

(σmi A

)dSn

σmndSn =(σmiA

)dSn ⇒ σmndSn =

(σkiA

kmA

)dSn con i, j = x, y, z

Una vez mas vemos que transforma como un tensor.

3.3.2. El Tensor de inercia

Consideremos el caso de un sistema de n partıculas. La cantidad de movimiento angular para este sistemavendra dada por

L =∑i

m(i)

(r(i) × v(i)

)

Borra

dor Pre

limin

donde hemos indicado que la i−esima partıcula que esta en la posicion r(i) tiene una velocidad v(i). Silas distancias entre las partıculas y entre las partıculas y el origen de coordenadas es constante podremosexpresar la velocidad de cada una de ellas como

v(i) = ω × r(i)

(¿por que?). Donde ω es la velocidad angular instantanea del sistema. Entonces tendremos que

L =∑i

m(i)

[r(i) ×

(ω × r(i)

)]=∑i

m(i)

[ω(r(i) · r(i)

)− r(i)

(ω · r(i)

)],

y para cada partıcula se cumple que las componentes de la cantidad de movimiento angular seran

Lk =∑i

m(i)

[ωk(rm(i)r(i)m

)− rk(i)

(ωmr(i)m

)].

Si vemos que ωk(i) = δkl ωl(i) entonces

Lk =∑i

m(i)

[δkl ω

l(rm(i)r(i)m

)− rk(i)

(ωmr(i)m

)]= ωl(i)

[∑i

m(i)

(δkl

(rm(i)r(i)m

)− rk(i)

(r(i)l

))]︸︷︷︸

Ikl

es decirLk = ωl(i)I

kl , donde Ikl =

∑i

m(i)

(δkl

(rm(i)r(i)m

)− rk(i)

(r(i)l

)).

El objeto Ikl se conoce como el tensor de inercia y corresponde a 9 cantidades (a pesar que solo 6 sonindependientes porque es un tensor simetrico)

Ikl =

Ixx Ixy Ixz

Iyx Iyy Iyz

Izx Izy Izz

∑im(i)

(y2

(i) + z2(i)

)−∑im(i)

(x(i)y(i)

)−∑im(i)

(x(i)z(i)

)−∑im(i)

(x(i)y(i)

) ∑im(i)

(x2

(i) + z2(i)

)−∑im(i)

(y(i)z(i)

)−∑im(i)

(x(i)z(i)

)−∑im(i)

(y(i)z(i)

) ∑im(i)

(z2

(i) + y2(i)

)

Por ahora, nos contentaremos en suponer que esta construccion es un tensor y lo demostraremos mas

adelante.La ilustracion mas sencilla de que la masa en rotacion se comporta como un tensor y no como un escalar

lo vemos en la rotacion de dos masas iguales: m1 y m2 (con lo cual m1 = m2 = m) unidas por una varillasin masa de longitud l. Si el sistema (masas + varillas) se encuentra girando alrededor su centro de masa yambas masas se encuentran sobre el plano xy, vale decir que la barra sin masa forma un angulo de α = π

2con el eje z, entoces tendremos que

r =l

2cos(θ) i +

2sen(θ)j ⇒ v =

dt= − l

dθ

dtsen(θ) i +

dθ

dtcos(θ) j

con lo cual

L = m1 (r1 × v1) +m2 (r2 × v2) = m (r1 × v1) +m ((−r1)× (−v1)) = 2m (r1 × v1) =

)2dθ

dtk

ya quem1 = m2 = m; r2 = −r1 y v2 = −v1 .

Borra

dor Pre

limin

Ejercicios

1. En el caso 3D tenemos que si ei define un sistema de coordenadas (dextrogiro) no necesariamenteortogonal, entonces, demuestre que

ei =ej × ek

ej × ek · eii, j, k = 1, 2, 3 y sus permutaciones cıclicas

2. Demuestre quegij = ei · ej

3. Si la base ei es ortogonal, demuestre que

a) gij es diagonal.

b) gii = 1/gii (no hay suma).

c) |ei| = 1/|ei|.

3.4. Repensando los vectores nuevamente

3.4.1. Vectores, covectores y leyes de transformacion

Hemos visto que un determinado vector |a〉 ∈ V puede expresarse en una base ortogonal |ej〉 como:aj |ej〉 donde las aj son las componentes del vector contravariantes en la base que se ha indicado. En general,como es muy largo decir “componentes del vector contravariante” uno se refiere (y nos referiremos de ahoraen adelante) al conjunto

como un vector contravariante obviando la precision de componente, perorealmente las aj son las componentes del vector.

Adicionalmente, en esta etapa pensaremos a las bases como distintos observadores o sistemas de referen-cias. Con ello tendremos (algo que ya sabıamos) que un vector se puede expresar en distintas bases y tendradistintas componentes referidas a esa base

|a〉 = aj |ej〉 = aj |ej〉 .

Ası una misma cantidad fısica vectorial se vera distinta (tendra distintas componentes) desde diferentessistemas de coordenadas. Las distintas “visiones” estan conectadas mediante un transformacion de sistemade referencia como veremos mas adelante.

Igualmente hemos dicho que una forma diferencial 〈b| ∈ V ∗ es susceptible de expresarse en una base⟨ei∣∣ del espacio dual V ∗ como bi

⟨ei∣∣ y, como el espacio esta equipado con un producto interno entonces

〈a |b〉 = 〈b |a〉 =(bi⟨ei∣∣) · (aj |ej〉) = bia

jδij = aibi

Con lo cual avanzamos otra vez en la interpretacion de cantidades fısicas: una cantidad fısica escalar se veraigual (sera invariante) desde distintos sistemas de referencia.

Ademas sabemos que unas y otras componentes se relacionan como⟨ei |a〉 = aj

⟨ei |ej〉 = ajδij = aj

⟨ei |ej〉⟨

ei |a〉 = aj⟨ei |ej〉 = ajδij = aj

⟨ei |ej〉

⇒

ai = Aij a

ai = Aijaj

donde claramente⟨ei |ej〉 = Aij ;

⟨ei |ej〉 = Aij y AikA

kj = δij ⇐⇒ Aij =

(Aij)−1

Borra

dor Pre

limin

Diremos entonces que aquellos objetos cuyas componentes transforman como ai = Aij aj o equivalentemente

ai = Aijaj seran vectores, o en un lenguaje un poco mas antiguo, vectores contravariantes. Algunos autores

prefieren utilizar la siguiente notacion para las transformaciones: ai = Aij′aj′ y ai

′= Ai

′

j aj , por lo que

δij = Aik′Ak′

j .Tradicionalmente, e inspirados en la ley de transformacion, la representacion matricial de las componentes

contravariantes de un vector,⟨ei |a〉 = aj , para una base determinada |ej〉 se estructuran en una columna

|a〉 ⇒⟨ei |a〉 con i = 1, 2, 3, · · · , n ⇐⇒

...an

De la misma manera, en el espacio dual, V ∗, las formas diferenciales se podran expresar en termino de

una base de ese espacio vectorial como 〈b| = bi⟨ei∣∣ = bi

⟨ei∣∣. Las bi seran las componentes de las formas

diferenciales o las componentes covariantes de un vector |b〉, o dicho rapidamente un vector covariante ocovector. Al igual que en el caso de las componentes contravariantes las componentes covariantes transformande un sistema de referencia a otro mediante la siguiente ley de transformacion:

〈b |ej〉 = bi⟨ei |ej〉 = biδ

ij = bi

⟨ei |ej〉

〈b |ej〉 = bi⟨ei |ej〉 = biδ

ij = bi

⟨ei |ej〉

⇒

bj = biA

bj = biAij

Otra vez, objetos cuyas componentes transformen como bj = biAij los denominaremos formas diferenciales o

vectores covariantes o covectores y seran representados matricialmente como un arreglo tipo fila

〈b| ⇒ 〈b |ei〉 con i = 1, 2, 3, · · · , n ⇐⇒(b1 b2 · · · bn

)3.4.2. Cartesianas y polares, otra vez

El ejemplo mas simple, y por ello, clasico y emblematico de lo anterior lo constituye las expresiones deun mismo vector en dos sistemas de coordenadas en el plano: Cartesianas |i〉 , |j〉 y polares |ur〉 , |uθ〉.Esto es

|a〉 = ax |i〉+ ax |j〉 = a1 |e1〉+ a2 |e2〉 y |a〉 = ar |ur〉+ aθ |uθ〉 = a1 |e1〉+ a2 |e2〉 .

Al expresar una base en terminos de la otra obtenemos

con lo cual ⟨ei |ej〉 = Aij ⇐⇒ Aij =

(〈i |ur〉〈i |uθ〉〈j |ur〉〈j |uθ〉

)≡(

cos(θ) − sen(θ)sen(θ) cos(θ)

)y⟨

ei |ej〉 = Aij ⇐⇒ Aij =

(〈ur |i〉〈ur |j〉〈uθ |i〉〈uθ |j〉

)≡(

cos(θ) sen(θ)− sen(θ) cos(θ)

)cumpliendo ademas(

cos(θ) − sen(θ)sen(θ) cos(θ)

)(cos(θ) sen(θ)− sen(θ) cos(θ)

(1 00 1

)⇐⇒ AikA

kj = δij .

Borra

dor Pre

limin

De este modo si

|a〉 = ar |ur〉+ aθ |uθ〉 = a1 |e1〉+ a2 |e2〉 = ax |i〉+ ax |j〉 = a1 |e1〉+ a2 |e2〉

tendremos que

ai = Aijaj ⇐⇒

(araθ

(cos(θ) sen(θ)− sen(θ) cos(θ)

)(axay

(ax cos(θ) + ay sen(θ)−ax sen(θ) + ay cos(θ)

)con lo cual

ar = ax cos(θ) + ay sen(θ) y aθ = −ax sen(θ) + ay cos(θ) .

Del mismo modo

ai = Aij aj ⇐⇒

(axay

(cos(θ) − sen(θ)sen(θ) cos(θ)

)(araθ

(ar cos(θ)− aθ sen(θ)ar sen(θ) + aθ cos(θ)

ax = ar cos(θ)− aθ sen(θ) y ay = ar sen(θ) + aθ cos(θ) .

3.4.3. Repensando las componentes

En general, podemos pensar que las componentes de los vectores pueden ser funciones de las otras.Consideremos el ejemplo anterior con esta vision. Tendremos que un punto en el plano viene representadoen coordenadas cartesianas por dos numeros (x, y) y en coordenadas polares por otros dos numeros (r, θ).Siguiendo el ejemplo anterior un punto P , en el plano lo describimos como

|P 〉 = rP |ur〉 = xP |i〉+ yP |j〉 .

Veamos como estan relacionadas estas dos descripciones, para este caso las ecuaciones de transformacion son

xP = xP (r, θ) = x1 = x1(x1, x2

)yP = yP (r, θ) = x2 = x2

(x1, x2

) ⇐⇒ rP = rP (x, y) = x1 = x1

(x1, x2

)θ = θP (x, y) = x2 = x2

(x1, x2

)y explıcitamente

xP = rP cos(θ) ⇒ x1 = x1 cos(x2)yP = rP sen(θ) ⇒ x2 = x1 sen(x2)

rP =√x2P + y2

P ⇒ x1 =

√(x1)

2+ (x2)

θ = arctan(yPxP

)⇒ x2 = arctan

(x2

)Es claro que ambas coordenadas estan relacionadas y que se puede invertir la relacion

x1 = x1(x1, x2

)x2 = x2

(x1, x2

) ⇐⇒x1 = x1

(x1, x2

)x2 = x2

(x1, x2

)Si se piden cosas razonables:

que las funciones xi = xi (xm) y xj = xj (xm) sean al menos C2 (funcion y derivada continua)

Borra

dor Pre

limin

que el determinante de la matriz Jacobiana sean finito y distinto de cero, para garantizar que existe lafuncion inversa.

det

(∂xi

(xk)

∂xj

)6= 0.

Mas aun, si

xi = xi(xj(xk))⇒ ∂xi

∂xk=∂xi

∂xj∂xj

∂xk= δik ⇒ dxi =

∂xi

∂xjdxj ,

con lo cual intuimos dos cosas:

1. que las componentes de un vector, deben transformar bajo un cambio de coordenadas como

xi =∂xi

(xk)

∂xjxj .

2. Las matrices jacobianas ∂xi

∂xky ∂xi

∂xkson una la inversa de la otra.

Veamos si es cierto para el caso de vectores en el plano. Para ello calculamos la matriz jacobiana (matrizde derivadas) la cual sera(

∂xi(x1, x2

)∂xj

∂x1(x1,x2)∂x1

∂x1(x1,x2)∂x2

∂x2(x1,x2)∂x1

∂x2(x1,x2)∂x2

(cos(x2) −x1 sen(x2)sen(x2) x1 cos(x2)

)

y seguidamente, identificando

xi =∂xi

(x1, x2

)∂xj

xj ⇒(x1

(cos(x2) −x1 sen(x2)sen(x2) x1 cos(x2)

)(x1

)Igualmente, si calculamos la inversa de la matriz jacobiana(

∂xi(x1, x2

)∂xj

)−1

(cos(x2) sen(x2)− sen(x2)

cos(x2)x1

x1√(x1)2+(x2)2

x2√(x1)2+(x2)2

−x2

(x1)2+(x2)2x1

(x1)2+(x2)2

tendremos (

x1√(x1)2+(x2)2

x2√(x1)2+(x2)2

−x2

(x1)2+(x2)2x1

(x1)2+(x2)2

( x1

)⇒ xi =

∂xi(x1, x2

)∂xj

xj .

Es decir

x1 =

√(x1)

2+ (x2)

2 ⇒ r =√x2 + y2 y 0 = 0 .

Consideremos ahora el caso tridimensional en esos mismos dos sistemas de coordenadas: uno cartesiano(x1 = x, x2 = y, x3 = z

)y otro esferico

(x1 = r, x2 = θ, x3 = φ

Tal y como hemos supuesto anteriormente el punto P vendra descrito por

|P 〉 = rP |ur〉 = xP |i〉+ yP |j〉+ zP |k〉

Borra

dor Pre

limin

de nuevo

x = x (r, θ, φ) = x1 = x1(x1, x2, x3

)y = y (r, θ, φ) = x2 = x2

(x1, x2, x3

)z = z (r, θ, φ) = x3 = x3

(x1, x2, x3

) ⇐⇒

r = r (x, y, z) = x1 = x1(x1, x2, x3

)θ = θ (x, y, z) = x2 = x2

(x1, x2, x3

)φ = φ (x, y, z) = x3 = x3

(x1, x2, x3

)Las ecuaciones de transformacion seran

xP = rP sen(θ) cos(φ) ⇒ x1 = x1 sen(x2) cos(x3)yP = rP sen(θ) sen(φ) ⇒ x2 = x1 sen(x2) sen(x3)zP = rP cos(θ) ⇒ x3 = x1 cos(x2)

rP =√x2P + y2

P + z2P ⇒ x1 =

√(x1)

2+ (x2)

2+ (x3)

φ = arctan(yPxP

)⇒ x2 = arctan

(x2

)θ = arctan

(√x2P+y2PzP

)⇒ x3 = arctan

(√(x1)2+(x2)2

con lo cual la matriz de las derivadas sera para esta transformacion en particular sera

∂xi(x1, x2, x3

)∂xj

sen (θ) cos (φ) −r sen (θ) sen (φ) r cos (θ) cos (φ)sen (θ) sen (φ) r sen (θ) cos (φ) r cos (θ) sen (φ)

cos (θ) 0 −r sen (θ)

es decir

∂xi(x1, x2, x3

)∂xj

sen(x2)

cos(x3)−x1 sen

(x2)

sen(x3)

x1 cos(x2)

cos(x3)

sen(x2)

sen(x3)

x1 sen(x2)

cos(x3)

x1 cos(x2)

sen(x3)

cos(x2)

0 −x1 sen(x2)

y su inversa

∂xi(x1, x2, x3

)∂xj

sen (θ) cos (φ) sen (θ) sen (φ) cos (θ)

− sen(φ)r sen(θ)

cos(φ)r sen(θ) 0

cos(θ) cos(φ)r

cos(θ) sen(φ)r − sen(θ)

o lo que es lo mismo

∂xi(x1, x2, x3

)∂xj

x√x2+y2+z2

y√x2+y2+z2

z√x2+y2+z2

−yx2+y2

xx2+y2 0

(x2+y2+z2)√x2+y2

−√x2+y2

(x2+y2+z2)

Dejaremos al lector comprobar que, efectivamente,

xi =∂xi

(x1, x2, x3

)∂xj

xj ⇐⇒ xi =∂xi

(x1, x2, x3

)∂xj

xj .

Borra

dor Pre

limin

3.5. Transformaciones, vectores y tensores

En general las afirmaciones anteriores se pueden generalizar considerando que las coordenadas que definenun determinado punto, P, expresado en un sistema de coordenadas particular, son

(x1, x2, · · · , xn

)y las

coordenadas de ese mismo punto P, expresado en otro sistema de coordenadas es(x1, x2, · · · , xn

)ambas

coordenadas estaran relacionadas por

x1 = x1(x1, x2, · · · , xn

)x2 = x2

(x1, x2, · · · , xn

)...

xn = xn(x1, x2, · · · , xn

) ⇐⇒

x1 = x1

(x1, x2, · · · , xn

)x2 = x2

(x1, x2, · · · , xn

)...

xn = xn(x1, x2, · · · , xn

)es decir xi = xi

(xj)⇐⇒ xi = xi

(xj)

con i, j = 1, 2, 3, · · · , n. Otra vez, solo exigiremos (y es bastante)que:

1. las funciones xi = xi (xm) y xj = xj (xm) sean al menos C2 (funcion y derivada continua)

2. que el determinante de la matriz jacobiana sean finito y distinto de cero, esto es

det

(∂xi

(x1, x2

)∂xj

)6= 0 ⇒

∣∣∣∣∣∣∣∣∣∣∣

∂x1

∂x1∂x1

∂x2 · · · ∂x1

∂xn

∂x2

∂x1∂x2

∂x2 · · · ∂x2

∂xn

......

...∂xn

∂x1∂xn

∂x2 · · · ∂xn

∂xn

∣∣∣∣∣∣∣∣∣∣∣6= 0 ⇒ xi = xi (xm) ⇐⇒ xj = xj (xm)

Ahora bien, una vez mas, derivando y utilizando la regla de la cadena

xi = xi(xj (xm)

)⇒ ∂xi

∂xl=∂xi

∂xk∂xk

∂xl= δil ⇒ dxi =

∂xi

∂xkdxk ,

como hemos comprobado para los dos casos particulares estudiados con anterioridad. De ahora en adelantetendremos las siguientes ReDefiniciones:

Un conjunto de cantidadesa1, a2, · · · , an

se denominaran componentes contravariantes de un vector

|a〉 ∈ V en un punto P de coordenadas(x1, x2, · · · , xn

)si

1. dada dos bases ortonormales de vectores coordenados. |e1〉 , |e2〉 , · · · |en〉 y∣∣ˆe1

⟩,∣∣ˆe2

⟩, · · ·

∣∣ˆen⟩se cumple que

|a〉 = ai |ei〉 = ai∣∣ˆei⟩ ⇒ ⟨

ei∣∣ a〉 = ai⟨

ˆei∣∣ a〉 = ai

⇒ ai = aj

⟨ˆei |ej〉

2. o equivalentemente, bajo una transformacion de coordenadas xi = xi(xj)

con i, j = 1, 2, 3, · · · , n.,estas cantidades transforman como

ai =∂xi

∂xkak ⇐⇒ ai =

∂xi

∂xkak con

∂xi

∂xk∂xk

∂xl= δil

y donde las cantidades ∂xi

∂xky ∂xi

∂xkdeberan ser evaluadas en el punto P .

Borra

dor Pre

limin

Un conjunto de cantidades b1, b2, · · · , bn se denominaran componentes covariantes de un vector〈b| ∈ V∗ en un punto P de coordenadas

(x1, x2, · · · , xn

)si

1. dada dos bases de formas⟨

e1∣∣ , ⟨e2

∣∣ , · · · 〈en| y⟨

ˆe1∣∣ , ⟨ˆe2

∣∣ , · · · ⟨ˆen∣∣ se cumple que

〈b| = bi⟨ei∣∣ = bi

⟨ˆei∣∣ ⇒

〈b| ei⟩

= bi

〈b| ˆei⟩

= bi

⇒ bi = bj 〈ej

∣∣ˆei⟩ .2. o equivalentemente, bajo una transformacion de coordenadas xi = xi

(xj)

(con i, j = 1, 2, 3, · · · , n)estas cantidades transforman como

bk =∂xi

∂xkbi ⇐⇒ bk =

∂xi

∂xkbi con

∂xi

∂xk∂xk

∂xl= δil

y donde las cantidades: ∂xi

∂xky ∂xi

∂xkdeberan ser evaluadas en el punto P .

Generalizamos los conceptos anteriores de la siguiente manera. Dado un conjunto bases para de formasdiferenciales 〈xm(1)| , 〈yn(2)| hemos definido las componentes contravariantes de un tensor

T ij = T

〈xi(1)|↓• ,

〈yj(2)|↓•

∈ V ⇐⇒T ij≡T 11, T 12, · · · , T 1n, T 21, T 22, · · · , T 2n, · · · , Tnn

ahora, en esta vision, las componentes contravariantes en un punto P de coordenadas

(x1, x2, · · · , xn

seran aquella que bajo una transformacion de coordenadas xi = xi(xj)

(con i, j = 1, 2, 3, · · · , n)transforman como

T ij =∂xi

∂xk∂xj

∂xmT km ⇐⇒ T ij =

∂xi

∂xk∂xj

∂xmT km con

∂xi

∂xk∂xk

∂xl= δil ,

donde ∂xi

∂xky ∂xi

∂xkdeberan ser evaluadas en el punto P . Esta generalizacion nos permite construir el

caso mas general.

Si |ti(1)〉 , |uj(2)〉 , · · · , |vk(m)〉 y〈xe(1)| ,

⟨yf (2)

∣∣ , · · · , 〈zg(n)|

son bases para los vectores y lasformas, respectivamente. Las componentes de un tensor

Tmnijk = T

|ti(1)〉↓ ,

|uj(2)〉↓, , · · · ,

|vk(m)〉↓ ;

〈xe(1)|↓• ,

〈yf (2)|↓• , · · · ,

〈zg(n)|↓•

seran un conjunto de cantidades

T 1···1

1···1 , T2···11···1 , · · · , T ···11···1, T

n···11···1 , T

n···12···1 , · · · , T 1···1

m···1, · · · , T n···nm···m

que sedenominaran las componentes contravariantes y covariantes respectivamente, de un tensor mixto enun punto P de coordenadas

(x1, x2, · · · , xn

)si bajo una transformacion de coordenadas xi = xi

(xj)

(con i, j = 1, 2, 3, · · · , n) estas cantidades transforman como

T i···ke···g =∂xi

∂xp· · · ∂x

∂xq∂xa

∂xe· · · ∂x

∂xgT p···qa···d ⇐⇒ T i···ke···g =

∂xi

∂xp· · · ∂x

∂xq∂xa

∂xe· · · ∂x

∂xgT p···qa···d

nuevamente con: ∂xi

∂xk∂xk

∂xl= δil y donde las cantidades ∂xi

∂xky ∂xi

∂xkdeberan ser evaluadas en el punto P .

Borra

dor Pre

limin

3.6. Un ejemplo detallado

Ilustremos ahora las transformaciones de tensores bajo cambios de la base del espacio vectorial. Unavez mas consideremos dos bases de vectores coordenados |e1〉 , |e2〉 , |e3〉 y |e1〉 , |e2〉 , |e3〉 para elespacio vectorial R3 La expresion de un determinado tensor en la base sera

|e1〉 , |e2〉 , |e3〉 ≡ |i〉 , |j〉 , |k〉 ⇒ T ij =

2 1 32 3 41 2 2

Si consideramos una nueva base: |w1〉 , |w2〉 , |w3〉

|w1〉 = |i〉

|w2〉 = |i〉+ |j〉

|w3〉 = |i〉+ |j〉+ |k〉

⇐⇒

⟨w1 |w1〉 = 1

⟨w1 |w2〉 = 1

⟨w1 |w3〉 = 1⟨

w2 |w1〉 = 1⟨w2 |w2〉 = 2

⟨w2 |w3〉 = 2⟨

w3 |w1〉 = 1⟨w3 |w2〉 = 2

⟨w3 |w3〉 = 3

para ese mismo espacio R3 encontraremos una nueva expresion para T ij en esa base.

Encontraremos ahora las expresiones para los siguientes tensores: T ji , Tij y T ij . Notese que esta nuevabase no es ortogonal ,

⟨wk |wi〉 6= δki , con lo cual no se cumplen muchas cosas, entre ellas: |wk〉

⟨wk∣∣ 6=

Para encontrar T ij expresamos los vectores base: |e1〉 = |i〉 , |e2〉 = |j〉 , |e3〉 = |k〉 en terminos de labase |w1〉 , |w2〉 , |w3〉, esto es:

|e1〉 = |i〉 = |w1〉

|e2〉 = |j〉 = |w2〉 − |w1〉

|e3〉 = |k〉 = |w3〉 − |w2〉

Recordamos que un vector generico transforma de la siguiente manera

|a〉 = aj |ej〉 = aj |wj〉

por lo tanto

|a〉 = aj |ej〉 = a1 |w1〉+ a2 |w2〉+ a3 |w3〉 = a1 |e1〉+ a2 (|e1〉+ |e2〉) + a3 (|e1〉+ |e2〉+ |e3〉)

con lo cuala1 |e1〉+ a2 |e2〉+ a3 |e3〉 =

(a1 + a2 + a3

)|e1〉+

(a2 + a3

)|e2〉+ a3 |e3〉

y podemos ver que

a1 = a1 + a2 + a3

a2 = a2 + a3

a3 = a3

⇒ ai =∂xi

∂xkak ⇒

∂x1

∂x1 = 1; ∂x1

∂x2 = 1; ∂x1

∂x3 = 1

∂x2

∂x1 = 0; ∂x2

∂x2 = 1; ∂x2

∂x3 = 1

∂x3

∂x1 = 0; ∂x3

∂x2 = 0; ∂x3

∂x3 = 1

Borra

dor Pre

limin

Es de hacer notar que dado que la base ortonormal |e1〉 , |e2〉 , |e3〉 ≡ |i〉 , |j〉 , |k〉 se tiene que

|a〉 = aj |ej〉 = ai |wi〉 ⇒⟨ei∣∣ a〉 = aj

⟨ei |ej〉 = ajδij = ai = ak

⟨ei |wk〉 ⇒

∂xi

∂xk=⟨ei |wk〉

Este mismo procedimiento se puede aplicar para expresar el vector |a〉 como una combinacion linealde los vectores |wj〉:

|a〉 = aj |ej〉 = aj |ej〉 = a1 |we1〉+ a2 |e2〉+ a3 |e3〉 = a1 |w1〉+ a2 (|w2〉 − |w1〉) + a3 (|w3〉 − |w2〉)

esto es

a1 = a1 − a2

a2 = a2 − a3

a3 = a3

⇒ ak = ai∂xk

∂xi⇒

∂x1

∂x1 = 1; ∂x1

∂x2 = −1; ∂x1

∂x3 = 0

∂x2

∂x1 = 0; ∂x2

∂x2 = 1; ∂x2

∂x3 = −1

∂x3

∂x1 = 0; ∂x3

∂x2 = 0; ∂x3

∂x3 = 1

Notese que, como era de esperarse,

∂xi

∂xk∂xk

∂xj= δij ⇒

1 1 10 1 10 0 1

1 −1 00 1 −10 0 1

1 0 00 1 00 0 1

Con las expresiones matriciales para las transformaciones, estamos en capacidad de calcular, compo-nente a componente, las representacion del tensor en la nueva base

T km =∂xk

∂xi∂xj

∂xmT ij

con lo cual

T 11 =

∂x1

∂xi∂xj

∂x1T ij

=∂x1

∂x1

(∂x1

∂x1T 1

1 +∂x2

∂x1T 1

2 +∂x3

∂x1T 1

)+∂x1

∂x2

(∂x1

∂x1T 2

1 +∂x2

∂x1T 2

2 +∂x3

∂x1T 2

∂x1

∂x3

(∂x1

∂x1T 3

1 +∂x2

∂x1T 3

2 +∂x3

∂x1T 3

)Es decir

T 11 = 1 ·

(1 T 1

1 + 0 T 12 + 0 T 1

)− 1 ·

(1 T 2

1 + 0 T 22 + 0 T 2

)+ 0

(1 T 3

1 + 0 T 32 + 0 T 3

)= T 1

1 − T 21 = 2− 2 = 0

Del mismo modo

T 12 =

∂x1

∂xi∂xj

∂x2T ij

=∂x1

∂x1

(∂x1

∂x2T 1

1 +∂x2

∂x2T 1

2 +∂x3

∂x2T 1

)+∂x1

∂x2

(∂x1

∂x2T 2

1 +∂x2

∂x2T 2

2 +∂x3

∂x2T 2

∂x1

∂x3

(∂x1

∂x2T 3

1 +∂x2

∂x2T 3

2 +∂x3

∂x2T 3

)

Borra

dor Pre

limin

resultando

T 12 = 1 ·

(1 T 1

1 + 1 T 12 + 0 T 1

)− 1 ·

(1 T 2

1 + 1 T 22 + 0 T 2

)+ 0

(1 T 3

1 + 1 T 32 + 0 T 1

(T 1

1 + T 12

)−(T 2

1 + T 22

)= (2 + 1)− (2 + 3) = −2

Se puede continuar termino a termino o realizar la multiplicacion de las matrices ∂xk

∂xi , Tij y ∂xj

∂xm pro-venientes de la transformacion de componentes de tensores. Vale decir

T km =∂xk

∂xiT ij

∂xj

∂xm⇔

1 −1 00 1 −10 0 1

2 1 32 3 41 2 2

1 1 10 1 10 0 1

0 −2 −31 2 41 3 5

Hay que resaltar el especial cuidado que se tuvo en la ubicacion de las matrices para su multiplicacion.

Si bien en la expresion T km = ∂xk

∂xi∂xj

∂xm T ij las cantidades ∂xk

∂xi son numeros y no importa el orden con elcual se multipliquen, cuando se escriben como matrices debe respetarse la “concatenacion interna deındices”. Esto es, cuando querramos expresar T km como una matriz, donde el ındice contravariante kindica filas y el ındice covariante m las columnas, fijamos primero estos ındices y luego respetamos la“concatenacion de ındices” covariantes con los contravariantes. Esta es la convencion para expresar lamultiplicacion de matrices en la notacion de ındices2. Esto es

T km =∂xk

∂xi∂xj

∂xmT ij ⇒ T km =

∂xk

∂xiT ij

∂xj

∂xm

Ahora los objetos ∂xk

∂xi , Tij y ∂xj

∂xm pueden ser sustituidos (en sus puestos correspondientes) por surepresentacion matricial.

Con lo cual hemos encontrado la respresentacion matricial T km de las componentes del tensor T en labase |w1〉 , |w2〉 , |w3〉; T 1

1 T 12 T 1

T 21 T 2

2 T 23

T 31 T 3

2 T 33

0 −2 −31 2 41 3 5

Para encontrar la expresion para Tkm recordamos que Tkm = gknTnm, es decir, requerimos las compo-

nentes covariantes y contravariantes del tensor metrico gkn que genera esta base. Para ello recordamosque para para una base generica, |wj〉, no necesariamente ortogonal, de un espacio vectorial con

producto interno, podemos definir la expresion de un tensor

(02

)que denominaremos tensor metrico

como

gij =∂xm

∂xi∂xn

∂xjgmn ≡ 〈em |wi〉〈en |wj〉 gmn

Recordemos tambien que la metrica covariante gij de una base ortonormal |e1〉 , |e2〉 , |e3〉 ≡ |i〉 , |j〉 , |k〉es

g11 = 1; g12 = 0; g13 = 0;

g21 = 0; g22 = 1; g23 = 0;

g31 = 0; g32 = 0; g33 = 1.

2Quiza una forma de comprobar si los ındices estan bien concatenados se observa si se “bajan” los ındices contravariantespero se colocan antes que los covariantes. Esto es, T ij → Tij . Ası, la multiplicacion de matrices queda representada de la siguiente

forma: Cij = AikBkj → Cij = AikBkj y aquı es claro que ındices consecutivos estan “concatenados” e indican multiplicacion.

Borra

dor Pre

limin

Con lo cual, para el caso de la base generica no ortonormal |wj〉 tenemos dos formas de calcular lascomponentes covariantes y contravariantes del tensor metrico. La primera es la forma directa

g11 = 〈en |w1〉〈em |w1〉 gnm =⟨e1 |w1〉

⟨e1 |w1〉+

⟨e2 |w1〉

⟨e2 |w1〉+

⟨e3 |w1〉

⟨e3 |w1〉 =

⟨e1 |w1〉2 = 1

g12 = 〈en |w1〉〈em |w2〉 gnm =⟨e1 |w1〉

⟨e1 |w2〉+

⟨e2 |w1〉

⟨e2 |w2〉+

⟨e3 |w1〉

⟨e3 |w2〉 =

⟨e1 |w1〉

⟨e1 |w2〉 = 1

g13 = 〈en |w1〉〈em |w3〉 gnm =⟨e1 |w1〉

⟨e1 |w3〉+

⟨e2 |w1〉

⟨e2 |w3〉+

⟨e3 |w1〉

⟨e3 |w3〉 =

⟨e1 |w1〉

⟨e1 |w3〉 = 1

g21 = 〈en |w2〉〈em |w1〉 gnm =⟨e1 |w2〉

⟨e1 |w1〉+

⟨e2 |w2〉

⟨e2 |w1〉+

⟨e3 |w2〉

⟨e3 |w1〉 =

⟨e1 |w2〉

⟨e1 |w1〉 = 1

g22 = 〈en |w2〉〈em |w2〉 gnm =⟨e1 |w2〉

⟨e1 |w2〉+

⟨e2 |w2〉

⟨e2 |w2〉+

⟨e3 |w2〉

⟨e3 |w2〉 ⇒

g22 =⟨e1 |w2〉

⟨e1 |w2〉

⟨e2 |w2〉

⟨e2 |w2〉 = 2

g23 = 〈en |w2〉〈em |w3〉 gnm =⟨e1 |w2〉

⟨e1 |w3〉+

⟨e2 |w2〉

⟨e2 |w3〉+

⟨e3 |w2〉

⟨e3 |w3〉 ⇒

g23 =⟨e1 |w2〉

⟨e1 |w3〉+

⟨e2 |w2〉

⟨e2 |w3〉 = 2

g31 = 〈en |w3〉〈em |w1〉 gnm =⟨e1 |w3〉

⟨e1 |w1〉+

⟨e2 |w3〉

⟨e2 |w1〉+

⟨e3 |w3〉

⟨e3 |w1〉 =

⟨e1 |w3〉

⟨e1 |w1〉 = 1

g32 = 〈en |w3〉〈em |w2〉 gnm =⟨e1 |w3〉

⟨e1 |w2〉+

⟨e2 |w3〉

⟨e2 |w2〉+

⟨e3 |w3〉

⟨e3 |w2〉 ⇒

g32 =⟨e1 |w3〉

⟨e1 |w2〉+

⟨e2 |w3〉

⟨e2 |w2〉 = 2

g33 = 〈en |w3〉〈em |w3〉 gnm =⟨e1 |w3〉

⟨e1 |w3〉+

⟨e2 |w3〉

⟨e2 |w3〉+

⟨e3 |w3〉

⟨e3 |w3〉 ⇒

g33 =⟨e1 |w3〉

⟨e1 |w3〉+

⟨e2 |w3〉

⟨e2 |w3〉+

⟨e3 |w3〉

⟨e3 |w3〉 = 3

g11 = 1; g12 = 1; g13 = 1;

g21 = 1; g22 = 2; g23 = 2;

g31 = 1 g32 = 2; g33 = 3.

y, consecuentemente podemos “arreglarlo como una matriz”3 de la siguiente forma

gij ≡ gji ⇐⇒

1 1 11 2 21 2 3

⇒ gij ≡ gij = (gij)−1 ⇐⇒

2 −1 0−1 2 −1

0 −1 1

Con lo cual, en terminos “matriciales” tendremos

gij ⇐⇒

1 0 00 1 00 0 1

; gij ⇐⇒

1 0 00 1 00 0 1

; gij ⇐⇒

1 0 00 1 00 0 1

;

gkm =∂xi

∂xkgij

∂xj

∂xm⇒

1 0 01 1 01 1 1

1 0 00 1 00 0 1

1 1 10 1 10 0 1

1 1 11 2 21 2 3

Notese que para conservar la convencion de ındices y poder representar la multipicacion de matrices,los ındices deben estar consecutivos, por tanto hay que trasponer la represetacion matricial para podermultiplicarlas.

gkm =∂xi

∂xkgij

∂xj

∂xm−→ gkm = Πik gij Πjm −→ gkm = Πki gij Πjm .

3Recordemos que hemos insistido que las matrices representan tensores mixtos

Borra

dor Pre

limin

Finalmente, estamos en capacidad de obtener las representaciones matriciales para los tensores: T ji , Tij , Tij .

T ji = (T ij )T ⇐⇒

0 −2 −31 2 41 3 5

0 1 1−2 2 3−3 4 5

⇒ T ji

Tkm = gknTnm ⇐⇒

1 1 11 2 21 2 3

0 −2 −31 2 41 3 5

2 3 64 8 155 11 20

⇒ Tkm

T kn = Tnmgmk ⇐⇒

0 −2 −31 2 41 3 5

1 1 11 2 21 2 3

−5 −10 −137 13 179 17 22

⇒ T km

Antes de pasar a la proxima seccion, quisieramos ejemplificar una forma “rapida y furiosa” (pero sucia)de calcular la metrica generada por una determinada base generica de vectores base. La idea es queviolentando toda nuestra notacion e idea de tensores construimos la metrica a partir de los vectoresbase definiendola como gij = 〈wi |wi〉, de esta manera

g11 = 〈w1 |w1〉 = 〈i |i〉 = 1; g12 = 〈w1 |w2〉 = 〈ji| (|i〉+ |j〉) = 1;

g21 = 〈w2 |w1〉 = (〈i|+ 〈j|) |i〉 = 1; g22 = 〈w2 |w2〉 = (〈i|+ 〈j|) (|i〉+ |j〉) = 2

g31 = 〈w3 |w1〉 = (〈i|+ 〈j|+ 〈k|) |i〉 = 1; g32 = 〈w3 |w2〉 = (〈i|+ 〈j|+ 〈k|) (|i〉+ |j〉) = 2;

yg13 = 〈w1 |w3〉 = 〈i| (|i〉+ |j〉+ |k〉) = 1;

g23 = 〈w2 |w3〉 = (〈i|+ 〈j|) (|i〉+ |j〉+ |k〉) = 2

g33 = 〈w3 |w3〉 = (〈i|+ 〈j|+ 〈k|) (|i〉+ |j〉+ |k〉) = 3

Dejamos al lector, la reflexion si esta forma “rapida de calcular la metrica” a partir de unos vectoresbase es general o, si en su defecto, es una coincidencia unicamente valida para este caso.

3.7. Teorema del cociente

Al igual que existe el producto directo entre tensores, cabe preguntarse si es posible multiplicar una com-ponente de un tensor por otra de otro tensor y el producto: ¿sera un tensor? Existe importantes situacionesfısicas en las cuales es aplicable esta pregunta. Si Tij son las componentes de un tensor de rango 2 y V i las deun vector ¿el producto TijV

i = Bj seran componentes de un vector? La respuesta no es siempre afirmativa, ypuede ser utilizado como un criterio de cuando una componente es la componente de un tensor. Este criteriose denomina el Teorema del Cociente.

La respuesta a esta pregunta surge de la respuesta a una pregunta distinta pero equivalente. Supongamosque nos dan n2 numeros aij y un (una componente de un) vector generico V i, si la cantidad aijV

iV j es un

escalar entonces la parte simetrica a(ij) = 12 (aij + aji) sera un (una componente de) tensor del tipo:

(02

La demostracion involucra algunos de las ideas antes expuestas y la haremos para fijar conceptos.

Borra

dor Pre

limin

Dados dos sistemas de coordenadas xi = xi (xm) y xj = xj (xm) (con i, j = 1, 2, 3, · · · , n) se cumple que

aij xixj = ψ = ψ = aij x

ixj donde ψ = ψ constituye un escalar

y por lo tanto, derivando y utilizando la regla de la cadena

xi = xi(xj (xm)

)⇒ ∂xi

∂xl=∂xi

∂xk∂xk

∂xl= δil ,

por lo que

(aij x

ixj − aij xixj)≡(aij − akl

∂xk

∂xi∂xl

∂xj

)xixj = 0 ,

como hay una suma en ij no se puede afirmar que la cantidad del parentesis se anula. Como esta afirma-cion vale para cualquier sistema de coordenadas, seleccionaremos las componentes coordenadas en la basecanonica.

x1 = (1, 0, 0, · · · , 0) ; x2 = (0, 1, 0, · · · , 0) ; · · · · · ·xn = (0, 0, 0, · · · , 1)

con lo cual

a11 − akl∂xk

∂ x1

∂xl

∂x1= 0; a22 − akl

∂xk

∂x2

∂xl

∂x2= 0; · · · · · · ann − akl

∂xk

∂xn∂xl

∂xn= 0 ,

Como siempre podemos hacer a(kl) = 12 (akl + alk) y a[kl] = 1

2 (akl − alk) y separar el tensor

akl = a(kl) + a[kl] ⇒ a(mm) −(a(kl) + a[kl]

) ∂xk

∂xm∂xl

∂xm= 0 ⇒ a(mm) = a(kl)

∂xk

∂xm∂xl

∂xm,

con lo cual se garantiza que la parte simetrica de un tensor transforma como un verdadero tensor una vezque se contrae con un par de vectores.

3.8. Vectores, tensores y espacios pseudo-euclideanos

Hasta este punto ha sido casi estetica la descripcion de formas representadas por bra: 〈a| ≡ ak⟨ek∣∣, en las

cuales sus componentes tienen subındices, mientras que los vectores bases,⟨ek∣∣, deben tener superındices.

Quiza el ejemplo mas emblematico y simple, donde se observa la diferencia entre formas (bras) y vectores(kets) es el caso de los espacios minkowskianos. Estos espacios, tambien llamados pseudoeuclideanos, presen-tan una variante en la definicion de producto interno, de tal forma que: 〈x| x〉 no necesariamente es positivo,y si 〈x| x〉 = 0 no necesariamente implica que |x〉 ≡ |0〉.

La consecuencia inmediata es que la definicion de norma N (|vi〉) ≡ ‖|vi〉‖, que vimos anteriormente, nonecesariamente es positiva. Vale decir que tendremos vectores con norma positiva, ‖|vi〉‖ > 0, pero tambienvectores con norma negativa o cero: ‖|vi〉‖ ≤ 0. Con lo cual la definicion de distancia, entendida como lanorma de la resta de vectores, d (|x〉 , |y〉) ≡ ‖|x〉 − |y〉‖, tampoco sera necesariamente positiva. Esto es, quelas distancias seran negativas, positivas o nulas: d (|x〉 , |y〉) < 0, d (|x〉 , |y〉) = 0 y d (|x〉 , |y〉) > 0.

Si extendemos la nocion de distancia para que albergue las posibilidades de distancias nula y negativas,entonces la definicion del tensor metrico para espacios pseudo-euclideanos debe cambiar tambien.

g [|xi〉 , |xj〉] = gij ≡ gji

< 0= 0> 0

Borra

dor Pre

limin

En resumen

〈x| x〉 =

< 0= 0> 0

⇒ d (|x〉 , |y〉) =

< 0= 0> 0

⇒ g [|xi〉 , |xj〉] =

< 0= 0> 0

Este tipo de espacios luce como un excentricidad mas de los matematicos. Una curiosidad de estudio dever como organizar los conceptos que aprendimos de los espacios euclidianos y extenderlos a otros espacios.Quiza se hubiera quedado ası, como una curiosidad matematica si la Fısica no hubiera sacado partido deestas particularidades para describir el comportamiento de la naturaleza. En la proxima seccion analizaremosel caso de espacios minkowskianos de dimension 4: M4.

3.8.1. Espacios minkowskianos

Consideremos un espacio tetradimensional expandido por una base ortonormal |e0〉 , |e1〉 , |e2〉 , |e3〉. Losvectores |e1〉 , |e2〉 , |e3〉 corresponden con la base canonica de R3.

Este espacio vectorial M4 tendra asociado un espacio dual⟨

e0∣∣ , ⟨e1

∣∣ , ⟨e2∣∣ , ⟨e3

∣∣ a traves de una metrica

ηαβ 〈eα| ⊗⟨eβ∣∣ ≡ ηβα ⟨eβ∣∣⊗ 〈eα| y ηαβ |eα〉 ⊗ |eβ〉 ≡ ηβα |eβ〉 ⊗ |eα〉

con α, β = 0, 1, 2, 3 y donde: η00 = η00 = 1, η11 = η11 = −1, η22 = η22 = −1, η33 = η33 = −1 (con ηαβ = 0para α 6= β), con lo cual se dice que η tiene signo −2.4

Tal y como presentamos en (3.2.6), podemos asociar componentes covariantes y contravariantes a travesde la metrica de la forma(ηαβ 〈eα| ⊗

⟨eβ∣∣) |a〉 = aσ

(ηαβ 〈eα| ⊗

⟨eβ∣∣) |eσ〉 = aσηαβ

⟨eβ |eσ〉〈eα| = aσηαβδ

βσ 〈eα| = aσηασ 〈eα| ≡ aα 〈eα|

Lo intereante del caso es que

aσησα = aα ⇒ a0 = a0, a1 = −a1, a2 = −a2, a3 = −a3.

Es decir, en este caso, porque la metrica tiene signo −2, entonces bajar los ındices espaciales (µ = i = 1, 2, 3)le cambia de signo a las componentes5. Dicho con mas propiedad, las componentes espaciales contravariantes(µ = i = 1, 2, 3) tienen signos contrarios a las componentes covariantes.

De la misma manera que se expuso anteriormente en (3.2.6)

〈a|(ηαj |eα〉 ⊗ |eβ〉

)= 〈a|

(ηαβ |eα〉 ⊗ |eβ〉

)= ηαβ 〈a |eα〉 ⊗ |ej〉 = aση

αj 〈eσ |eα〉 |eβ〉 = aσησβ |eβ〉 ≡ aβ |eβ〉

y otra vez, aσ = ησαaα, y habrıa cambio de signo cuando se bajan los ındices 1, 2, 3 para la metrica consigno −2 que hemos considerado anteriormente. Del mismo modo se “suben” y se “bajan” ındices paracomponentes de tensores

ηαβP γσεα ≡ P βγσε

Por su parte, el producto interno de dos vectores en un espacio de Minkowski involucra, de maneranatural, la metrica del espacio. Esto es

〈x |y〉 = 〈y |x〉 = xαyα = yαxα = xαyβηαβ = xαyβηαβ = x0y0−x1y1−x2y2−x3y3 = x0y0−x1y1−x2y2−x3y3

4Realmente el signo −2 es una convencion, se puede tambien considerar ηµν de signo +2, con η00 = −1, η11 = +1, η22 = +1,η33 = +1.

5Otra vez, para la metrica con signo −2, el cambio de signo entre componentes covariantes y contravariantes se da para lacomponente, µ = 0

Borra

dor Pre

limin

Una vez mas, la norma de un vector, tambien incluira al tensor metrico:

‖|x〉‖2 = 〈x |x〉 = xαxβ 〈eα |eβ〉 = xαx

α = xαxβ ηαβ = xαxβ ηαβ = x0x0 − x1x1 − x2x2 − x3x3

El caso mas conocido lo constituye la norma de un desplazamiento infinitesimal, en un espacio tetradimen-sional. Para una base generica, |uβ〉 (no necesariamente ortogonal) de un espacio vectorial con productointerno, el desplazamiento infinitesimal puede expresarse como

(ds)2 ≡ 〈dr |dr〉 = (dxα 〈uα|)

(dxβ |uβ〉

)= dxβ dxβ = ηαβ dxαdxβ = dt2 − dx2 ,

con dx2 =(dx1)2

+(dx2)2

+(dx3)2

3.8.2. Un toque de Relatividad Especial

La genialidad de Einstein fue haber entendido que tenıa que incorporar el tiempo como otra coorde-nada mas, vale decir, que los eventos que ocurren en la naturaleza estan etiquetados por cuatro numeros:(t, x, y, z) ≡ (x0, x1, x2, x3). El rapido desarrollo de la comprension de las ideas relativistas, muestra queestaban en el ambiente de la epoca de comienzos de 1900. Una vez mas la simplicidad como prejuicio seimpuso. Solo dos suposiciones estan en el corazon de la Relatividad Especial:

1. El principio de la Relatividad: Esto es que las leyes de la Fısica son identicas en todos los sistemas dereferencias inerciales.

2. La universalidad de la velocidad de la luz en el vacıo: La velocidad de la luz en el vacıo es siempre lamisma, y es independiente de la velocidad de la fuente de luz respecto a un observador en particular.

En terminos matematicos estas dos audaces suposiciones se concretan en una simple suposicion matematica:el producto interno entre dos elementos de este espacio tetradimensional, debe conservarse para una familia devectores base. Luego vendra la asociacion de observadores fısicos -o sistemas de coordenadas- con los miembrosde la familia de vectores base, pero la idea es la misma que planteamos para los espacios euclideanos en 2.2.3:el producto interno -y consecuentemente, la norma de los elementos del espacio vectorial y la distancia entreestos - en el mismo independientemente de la base en la cual expanda el espacio vectorial.

La primera de las interpretaciones es el como representamos los eventos en el espacio-tiempo. Supongamosel caso unidimensional en el espacio, vale decir los eventos ocurren en un punto de la recta real x = x1 y enun tiempo determinado, por lo tanto podremos asociar al evento un vector Evento→ (x0, x1).

A continuacion nos preguntamos que representan las distancias (espacio-temporales) entre estos doseventos. Tal y como vimos, las distancias entre dos elementos de un espacio vectorial puede ser construida apartir de la norma de la resta y la norma a partir del producto interno:

|| |y − x〉 ||2 ≡ 〈y − x |y − x〉

< 0 conexion tipo espacio ⇒ eventos desconectados causalmente= 0 conexion tipo luz ⇒ posible conexion causal a traves de rayos de luz> 0 conexion tipo tiempo ⇒ posible conexion causal

Con esta primera interpretacion de los valores de la norma y la vision tetradimensional, el espacio-tiempo,dividido en pasado, presente y futuro, se puebla de eventos que pueden estar o no relacionados causalmentetal y como muestra la figura 3.3.

La preservacion del producto interno para todos los observadores6 era intuitiva en los espacios euclideanosy, al mantenerla para los pseudo-euclideanos nos traera consecuencias nada intuitivas en nuestra idea intuitiva

6Estamos suponiendo que observadores, sistemas de coordenadas y sistemas de referencia son conceptos equivalentes.

Borra

dor Pre

limin

arFigura 3.3: Cono de luz, espacio-tiempo y eventos

de “realidad”. Para el caso de la formulacion de la Relatividad Especial, anadimos un supuesto mas: lascomponentes del tensor metricos son invariantes bajo transformaciones de coordenadas, esto es

g [|eµ〉 , |eν〉] ≡ g [|eµ〉 , |eν〉] ⇔ ηαβ = ηαβ , con |eµ〉 y |eµ〉

dos bases que se conectan a traves de una transformacion de coordenadas xµ = xµ (xα)⇔ xµ = xµ (xα)Construyamos el tipo de transformacion de coordenadas que mantiene estos dos supuestos:

el producto interno de dos vectores es independiente de la base que expanda el espacio vectorial y

las componentes del tensor metricos son invariantes bajo transformaciones de coordenadas.

Si el producto interno de dos vectores es independiente de la base que expanda el espacio vectorial, tendremos

〈x |y〉 = 〈x |y〉 ⇔ xαyα = xαyα ⇔ xαyβηαβ = xαyβ ηαβ ,

y como lo vimos en 3.5 las componentes de vectores, bajo cambio de coordenadas, transforman como

ai =∂xi

∂xkak ⇒ xαyα = xαyα ⇔ xαyβηαβ =

∂xν

∂xαxα∂xµ

∂xβyβ ηνµ = xαyβ

∂xν

∂xα∂xµ

∂xβηνµ ,

con lo cual concluimos que

ηαβ =∂xν

∂xα∂xµ

∂xβηνµ ≡

∂xν

∂xα∂xµ

∂xβηνµ .

Si derivamos respecto a xγ tendremos que

0 = ηνµ

(∂2xν

∂xα∂xγ∂xµ

∂xβ+∂xν

∂xα∂2xµ

∂xβ∂xγ

Como la cantidad dentro del parentesis se anula podemos jugar con esta para descubrir algunas consecuenciasocultas. Es de hacer notar que esa cantidad tiene tres ındices libres y por lo tanto son 64 ecuaciones que se

Borra

dor Pre

limin

anulan. Eso significa que le podemos anadir y sustraer cualesquieras otras con los ındices intercambiados. Su-pongamos que al parentesis anulado le anadimos una con los ındices α y γ intercambiados y, adicionalmente,le sustraemos una con los ındices γ y β intercambiados. Claramente, estamos anadiendo y sustrayendo ceros.

0 = ηνµ

(∂2xν

∂xα∂xγ∂xµ

∂xβ+∂xν

∂xα∂2xµ

∂xβ∂xγ+

∂2xν

∂xγ∂xα∂xµ

∂xβ+∂xν

∂xγ∂2xµ

∂xβ∂xα− ∂2xν

∂xα∂xβ∂xµ

∂xγ− ∂xν

∂xα∂2xµ

∂xγ∂xβ

Con este truco, vemos que el ultimo termino anula el segundo y el penultimo el cuarto, de forma y maneraque nos queda

0 = 2ηνµ∂2xν

∂xα∂xγ∂xµ

∂xβ,

Con lo cual la unica posibilidad que nos queda es

0 =∂2xν

∂xα∂xγ⇒ xν = Λνµx

µ + aν con Λνµ y aν constantes .

Estas transformaciones lineales se conocen como las transformaciones (inhomogeneas) de Lorentz o tambienlas transformaciones de Poincare. Estas transformaciones forman grupo y, uno de los posibles subgrupos loconstituye el conjunto de transformaciones propias de Lorentz de la forma

Λ00 = 1, Λi0 = Λ0

j = 0, y Λij = Rij con i, j = 1, 2, 3; y

donde Rij es una matriz de rotacion.Supongamos el caso mas sencillo de este grupo de transformaciones: aν = 0. Explıcitamente hemos

identificado una transformacion de la forma

xα = Λα0x0 + Λα1x

1 + Λα2x2 + Λα3x

3 ,

la cual, por construccion, deja invariante el intervalo tedra dimensional

ds2 = dt2 − dx2 = ηµνdxµdxν con dx = dx0 ı + dx1 + dx3 k y

con ηµν el tensor metrico. Es inmediato demostrar que este tipo de transformaciones deja invariante elintervalo. Primero, notemos que

ηµν = ΛµαΛνβηαβ ⇒ ηµνηνγ = δµγ = ΛµαΛνβη

αβηνγ ⇒ ΛµαΛαγ = δµγ

entonces, como

dxµ = Λµαdxα ⇒ ds2 = ηµνdxµdxν ≡ ηµνΛµαdxαΛνβdxβ = ηαβdxαdxβ = ds2 .

Para construir una de las expresiones mas utilizadas del grupo de Lorentz consideramos la siguiente situacionfısica. Un observador, xµ, ve moverse una partıcula con una velocidad v, mientras que un segundo observador,xµ, la percibe en reposo. Entonces, para el observador que registra la partıcula en reposo dx = dxi = 0

dxµ = Λµαdxα ⇒

dt = Λ00 dt

dxi = Λiαdxα = Λi0 dt con i = 1, 2, 3.

Ahora bien, como

v =dx

dt⇒ vi =

dxi

dt⇒ Λi0 = vi Λ0

0 ,

Borra

dor Pre

limin

ηαβ = ΛµαΛνβηµν ⇒ 1 = Λµ0 Λν0ηµν =(Λ0

)2 − (Λ10

)2 − (Λ20

)2 − (Λ30

)2,

con una solucion de la forma

Λ00 = γ , Λi0 = γ vi donde γ =

1√1− (v)2

≡ 1√1− vivi

≡ 1√1−

((v1)

2+ (v2)

2+ (v3)

2) ,

los otros terminos Λij no quedan unıvocamente determinados porque esta de por medio la arbitrariedad de

una rotacion Rij . Por ello, una seleccion arbitraria pero razonable de todos los terminos Λij es

Λij = δij + vivjγ − 1

(v)2≡ δij + vivj

γ − 1

vkvk

De esta forma quedan determinados todos los elementos de las transformaciones de Lorentz.Los observadores lorentzianos son los equivalentes a los observadores galileanos en las teorıas newtonianas:

son observadores que se mueven uno respecto al otro con una velocidad constante y, desempenan el mismopapel que los observadores inerciales. Quiza la consecuencia mas impactante de la necesidad de vincularmediciones de distintos observadores lorentzianos a traves de transformaciones de Lorentz, lo ilustra laevolucion distinta del tiempo medido por los diferentes observadores. Un observador en reposo respecto a unreloj, ve avanzar el tiempo con tic separados dt = ∆t ya que su reposo respecto al reloj implica dx = dxi = 0,por lo tanto la separacion espacio temporal sera:

ds2 = dt2 − dx2 = (∆t)2

mientras que un segundo observador tendra el mismo elemento de lınea pero expresado como

ds2 = dt2 − dx2 =(1− v2

)dt ⇒ dt =

∆t√1− v2

y claramente indica que tiempo evoluciona mas lento para relojes en movimento.

3.8.3. Ejercicios

1. Si Aijk es un tensor covariante de orden 3 y Blmno un tensor contravariante de orden 4, pruebe queAijkB

jkno es un tensor mixto de orden 3.

2. En el espacio euclideano 3D y en coordenadas cartesianas no distinguimos entre vectores y uno-formasdebido a que sus componentes transforman de la misma manera. Demuestre que

a) ai = Λijaj ∧ bj = Λijbi son la misma transformacion si la matriz Λij es igual a la transpuesta de

su inversa, es decir, si es ortogonal.

b) Considere dos observadores O → x, y ↔ x1, x2 y O → x, y ↔ x1, x2 y sus sistemas de coordenadasasociados.

1) Considere la siguiente transformacion de coordenadas de Galileo

x1 = V 1t+

√2

2x1 −

√2

2x2 y x2 =

√2

2x1 +

√2

2x2

con V 1 una constante que representa la velocidad relativa entre O−O y t al tiempo, parametrode esta transformacion. A continuacion suponga una partıcula que describe un movimientorespecto a O siguiendo una trayectoria recta. Esto es x2 = αx1, donde α es una constante yencuentre como lo describirıa el observador O respecto a sus coordenadas x1, x2 (3ptos).

Borra

dor Pre

limin

2) Considere ahora la generalizacion de la transformacion de coordenadas anterior

x1 = V 1t+

√2

2x1 −

√2

2x2 y x2 = V 2t+

√2

2x1 +

√2

2x2

con V 1 y V 2 las componentes de una velocidad relativa entre O− O y t al tiempo, parametrode esta transformacion. Muestre que este tipo de transformaciones de coordenadas forman ungrupo (3ptos)

3) Muestre que la norma de cualquier vector queda invariante respecto a una transformacion decoordenadas como la anterior y encuentre la matriz de transformacion (3ptos).

c) Dado un espacio minkowskiano y un observador O que describe los eventos en el espacio-tiemporespecto a un sistema de coordenadas xα donde α = 0, 1, 2 y η = diag[−1, 1, 1, ] el tensormetrico. Considere entonces la siguiente transformacion de coordenadas

x0 = γ(x0 − βx1) x1 = γ(x1 − βx0) y x2 = x2 con γ =1√

1− β2

y β = v/c es la velocidad relativa entre O y O.

1) Otra vez suponga que una partıcula describe una linea recta respecto a O: x2 = αx1, dondeα es una constante. Esta vez encuentre como lo describirıa el otro observador O respecto asus coordenadas x0, x1, x2 (3ptos)

2) Encuentre la expresion para la transformacion de coordenadas, ∂xα

∂xβ= Λαβ (transformacion

de Lorentz) entre estos sistemas relativistas y muestre como la norma, xαxα = xαxβηαβ , decualquier vector se conserva (3ptos)

3) Considere el Tensor de Maxwell definido como

Fµα =

0 Ex Ey

−Ex 0 Bz

−Ey −Bz 0

otra vez con ηµν =

−1 0 00 1 00 0 1

donde ~E = (Ex, Ey) y ~B = (Bx, By) son los campos electricos y magneticos (respectivamente)

medidos por un observador O. Si un observador mide un campo electrico ~E = Ex ı y ninguncampo magnetico. ¿Cuales campos, Fµα medira otro observador que viaja con una velocidad~β = vı, ? (3ptos)

4) Muestre que las ecuaciones de Maxwell

∇× ~B − ∂

∂t~E = 4π ~J , ∇× ~E − ∂

∂t~B = 0 , ∇ · ~B = 0 , y ∇ · ~E = 4πρ

se pueden escribir como

∂

∂xνFµν = Fµν ,ν = 4πJµ donde Jµ = (ρ, J1, J2) y ~J = (J1, J2)

(4ptos)

Borra

dor Pre

limin

3.9. Bases continuas

Haremos una digresion para fijar conceptos y extender algunos de los razonamientos que hemos desa-rrollado hasta aquı. Tal y como vimos anteriormente, la representacion de un vector |F 〉 en un espa-cio vectorial abstracto V puede darse en termino de una base ortonormal de vectores (discreta y finitaBDF = |e1〉 , |e2〉 , |e3〉 , · · · |en〉 o discreta e infinita BDI = |e1〉 , |e2〉 , |e3〉 · · · |en〉 · · · ) de la forma:

|F 〉 =

ci |ei〉 =⟨ei∣∣ F 〉 |ei〉 ⇐ BDF = |e1〉 , |e2〉 , |e3〉 · · · |en〉

ci |ei〉 =⟨ei∣∣ F 〉 |ei〉 ⇐ BDI = |e1〉 , |e2〉 , |e3〉 · · · |en〉 · · ·

donde en ambos casos:ci =

⟨ei∣∣ F 〉 = cj

⟨ei |ej〉 = cj δij

Ahora bien, si estamos tratando el espacio vectorial de funciones de cuadrado integrable L2, definidas en R3

tendremos que

|F 〉 = ci |ei〉 ≡⟨ei∣∣ F 〉 |ei〉 =

∞∑i=0

(∫ ∞−∞

d3r′ξ∗i (r′) f (r′)

)|ei〉

que se reescribe en terminos de funciones como

f (r) =

∞∑i=0

(∫ ∞−∞

d3r′ξ∗i (r′) f (r′)

)ξi (r)

Es claro que se pueden intercambiar los sımbolos de∫

y∑

, por lo cual

f (r) =

∫ ∞−∞

d3r′ f (r′)

[ ∞∑i=0

ξ∗i (r′) ξi (r)

]︸︷︷︸

G(r′,r)

la funcion G(r′, r) que depende de los argumentos, r′ y r, vive dentro de las integrales y convierte

f (r) =

∫ ∞−∞

d3r′ f (r′) G(r′, r)

Este tipo de funciones (transformadas integrales) se conoce como la funcion distribucion delta de Dirac

f (r) =

∫ ∞−∞

d3r′ f (r′) δ(r′ − r)

Esto sugiere la generalizacion de bases discretas a continua |wα〉 de tal forma que transformamos el ındicede la sumatoria en la variable de una integral

|Ψ〉 =

∫dα c (α) |wα〉

donde

c (β) = 〈wβ |Ψ〉 =

∫dα c (α) 〈wβ |wα〉 =

∫dα c (α) δ (α− β)

donde δ (α− β) es la Delta de Dirac. Ası, los dos conceptos expresados hasta ahora tienen una expresion:

Borra

dor Pre

limin

Propiedad\Base Discreta Continua

Ortogonalidad⟨ui |uj〉 = δij 〈wβ |wα〉 = δ (α− β)

Cierre 1 =∑∞j=0 |uj〉

⟨uj∣∣ 1 =

∫dα |wα〉〈wα|

Expansion |F 〉 =∑∞i=0 c

i |ui〉 |Ψ〉 =∫

dα c (α) |wα〉Componentes ci =

⟨ui∣∣ F 〉 c (β) = 〈wβ |Ψ〉

Producto Interno 〈G| F 〉 =∑∞i=0 gi∗ fi 〈G| F 〉 =

∫dα g∗ (α) f (α)

Norma 〈F | F 〉 =∑∞i=0 |fi|

2 〈F | F 〉 =∫

dα |f (α)|2

3.9.1. Bases de ondas planas

Como un ejemplo de lo anterior consideraremos la base de las ondas planas. En el capıtulo de transforma-das integrales consideraremos un caso particular de las transformada de Fourier compleja para una funcion,vale decir

F (s) =

∫ ∞−∞

dt ei st f(t) f(t) =

∫ ∞−∞

ds e−i st F (s)

las cuales podemos re-escribir en terminos mas familiares a la comunidad de fısicos como

ψ (x) =1√2π~

∫ ∞−∞

dp ei px/~ ψ (p) ψ (p) =1√2π~

∫ ∞−∞

dx e−i px/~ ψ (x)

Hemos tenido cuidado de incluir los factores de normalizacion adecuados para el caso de las descripcionesen mecanica cuantica. Estas formulas pueden ser re-interpretadas en funcion de los conceptos anteriormenteexpuestos y podemos definir una base continua de la forma

ψ (x) =1√2π~

∫ ∞−∞

(1√2π~

ei px/~)

︸︷︷︸vp(x)

ψ (p) ψ (p) =1√2π~

∫ ∞−∞

(1√2π~

e−i px/~)

︸︷︷︸vxp (x)

ψ (x)

por lo cual

ψ (x) =

∫ ∞−∞

dp vp (x) ψ (p) ψ (p) =

∫ ∞−∞

dx v∗p (x) ψ (x)

Diremos que la funcion ψ (x) esta expresada en la base de ondas planas vp (x) = 1√2π~e

i px/~.

Notese:

El ındice p de vp (x) varıa de forma continua entre −∞ a ∞.

Que vp (x) = 1√2π~e

i px/~ /∈ L2, es decir, no pertenece al espacio vectorial de funciones de cuadrado

integrable ya que su norma diverge

〈vp| vp〉 =

∫ ∞−∞

dx |vp (x)|2 =

∫ ∞−∞

dx1

2π~→∞

Que las proyecciones de ψ (x) sobre la base de ondas planas es: ψ (p) = 〈vp| ψ〉

La relacion de cierre para esta base se expresa como

∫dα |vα〉〈vα|

∫ ∞−∞

dp v∗p (x′) vp (x) =

∫ ∞−∞

dp1

2π~ei p(x

′−x)/~ = δ (x′ − x)

Borra

dor Pre

limin

mientras que de la definicion de producto interno uno obtiene

〈vp′ | vp〉 =

∫ ∞−∞

dx v∗p′ (x) vp (x) =

∫ ∞−∞

dp1

2π~ei x(p

′−p)/~ = δ (p′ − p)

En este mismo orden de ideas podemos construir otra base continua ξr0 (r) a partir de la utilizacion delas propiedades de la delta de Dirac. Esto es

ψ (r) =

∫ ∞−∞

d3r0 ψ (r0) δ(r0 − r)︸︷︷︸ξr0 (r)

ψ (r0) =

∫ ∞−∞

d3r ψ (r) δ (r− r0)

por lo cual la re-interpretacion es inmediata

ψ (r) =

∫ ∞−∞

d3r0 ψ (r0) ξr0 (r) con ψ (r0) = 〈ξr0 | ψ〉 =

∫ ∞−∞

d3r ξ∗r0 (r) ψ (r)

mas aun la ortogonalidad queda garantizada por la relacion de cierre

〈ξr0 | ξr0〉 =

∫ ∞−∞

d3r0 ξ∗r0 (r) ξr0 (r′) =

∫ ∞−∞

d3r0 δ (r− r0) δ (r′ − r0) = δ (r′ − r)

al igual que

〈ξr0 | ξr′0⟩

∫ ∞−∞

d3r ξ∗r0 (r) ξr′0 (r) =

∫ ∞−∞

d3r δ (r− r0) δ (r− r′0) = δ (r′0 − r0)

3.9.2. Las Representaciones |r〉 y |p〉A partir de las bases de ondas planas vp0 (x), y de distribuciones, ξr0 (r), construimos las llamadas

representaciones |r〉 y |p〉 de la forma siguiente. Asociamos

ξr0 (r) |r0〉

vp0 (x) |p0〉

De esta forma dada las bases ξr0 (r) y vp0 (x) para el espacio vectorial V definiremos dos “representacio-nes”, la representacion de coordenadas, |r0〉 , y la representacion de momentos |p0〉 de V, respectivamente.De tal modo que

〈r0| r′0〉 =

∫ ∞−∞

d3r ξ∗r0 (r) ξr′0 (r) = δ (r′0 − r0)

1 =

∫d3r0 |r0〉〈r0|

〈p0| p′0〉 =

∫ ∞−∞

d3r v∗p′0 (r) vp0 (r) =

∫ ∞−∞

d3r1

2π~e−i r0·p0/~ = δ (p′0 − p0)

1 =

∫d3p0 |p0〉〈p0|

Borra

dor Pre

limin

Podemos, entonces expresar el producto interno para la representacion de coordenadas como

〈Φ |Ψ〉 = 〈Φ|(∫

d3r0 |r0〉〈r0|)

︸︷︷︸1

|Ψ〉 =

∫d3r0 φ

∗(r0)ψ(r0)

y equivalentemente para la representacion de momentos

〈Φ |Ψ〉 = 〈Φ|(∫

d3p0 |p0〉〈p0|)

︸︷︷︸1

|Ψ〉 =

∫d3p0 φ

∗(p0)ψ(p0)

por lo cual hemos encontrado que

|Ψ〉 =

∫d3r0 |r0〉〈r0| Ψ〉 =

∫d3p0 |p0〉〈p0| Ψ〉

ψ(r0) = 〈r0 |Ψ〉 y ψ(p0) = 〈p0 |Ψ〉

que es la representacion de |Ψ〉 en coordenadas, ψ(r0), y en momentos, ψ(p0).Adicionalmente cuando |Ψ〉 = |p〉 tendremos que

〈r0 |p0〉 = 〈r0|(∫

d3r′0 |r′0〉〈r′0|)

︸︷︷︸1

|p0〉 = (2π~)−3/2∫

d3r′0 δ (r′0 − r0) ei~p0·r0

〈r0 |p0〉 = (2π~)−3/2ei~p0·r0

con lo cual ψ(p0) puede considerarse la transformada de Fourier de ψ(r0), y denotaremos de ahora en adelantelas bases |r0〉 ≡ |r〉 y |p0〉 ≡ |p〉.

Estos ındices continuos, r0 y p0, representan tres ındices continuos r (x, y, z) y p (px, py, pz). Laproyeccion de un vector abstracto |Ψ〉 en la representacion |r〉 sera considerada como su expresion en elespacio de coordenadas, igualmente su proyeccion 〈p |Ψ〉 sera su expresion en el espacio de los momentos.Eso nos permitira hacer corresponder los elementos de espacios vectoriales abstractos con, con elementos deun espacio vectorial de funciones. Por lo tanto todas las formulas de proyeccion quedan como

〈r |Ψ〉 = ψ(r) y 〈p |Ψ〉 = ψ(p)

mientras que las relaciones de cierre y ortonormalizacion

〈r| r′〉 = δ (r′ − r) y 1 =

∫d3r |r〉〈r|

〈p| p〉 = δ (p′ − p) y 1 =

∫d3p |p〉〈p| ,

por su parte, la relacion de cierre hara corresponder a la expresion de el producto interno de dos vectores,tanto en la representacion de las coordenadas como en la representacion de momentos, en la forma

〈Φ|(∫

d3r |r〉〈r|)|Ψ〉 =

∫d3r φ∗(r) ψ(r)

m〈Φ |Ψ〉m

〈Φ|(∫

d3p |p〉〈p|)|Ψ〉 =

∫d3p φ∗(p) ψ(p)

Borra

dor Pre

limin

donde φ∗(p) y ψ(p) son las transformadas de Fourier de φ∗(r) y ψ(r), respectivamente. La afirmacion anteriorqueda evidentemente demostrada del cambio entre las bases |r〉 y |p〉. Esto es

〈r |p〉 = 〈p |r〉∗ = (2π~)−3/2ei~p·r

por lo cual

ψ(r) = 〈r |Ψ〉 = 〈r|(∫

d3p |p〉〈p|)|Ψ〉 =

∫d3p 〈r |p〉〈p| Ψ〉 = (2π~)−3/2

∫d3p e

i~p·r ψ(p)

e inversamente

ψ(p) = 〈p |Ψ〉 = 〈p|(∫

d3r |r〉〈r|)|Ψ〉 =

∫d3r 〈p |r〉〈r| Ψ〉 = (2π~)−3/2

∫d3r e

−i~ p·rψ(r) .

Borra

dor Pre

limin

3.10. Ejercicios propuestos

1. Dado Fijk un tensor totalmente antisimetrico respecto a sus ındices ijk, demuestre que

rot [Fijk] = ∂mFijk − ∂iFjkm + ∂jFkmi − ∂kFmij ≡∂Fijk∂xm

− ∂Fjkm∂xi

+∂jFkmi∂xj

− ∂kFmij∂xk

rot [Fijk] = Fijk,m − Fjkm,i + Fkmi,j − Fmij,k ≡ ∂mFijk − ∂iFjkm + ∂jFkmi − ∂kFmij

2. El momento de inercia se define como

Iij =

∫V

dvρ (r)(δij(xkxk

)− xixj

)con xi = x, y, z y dv = dx dy dz

a) Muestre que Iij es un tensor

b) Encuentre la representacion matricial para Iij

c) Considere un cubo de lado l y masa total M tal que tres de sus aristas coinciden con un sistemade coordenadas cartesiano. Encuentre el tensor momento de inercia, Iij .

3. Para un sistema de n partıculas rıgidamente unidas, la cantidad de movimiento p y cantidad demovimiento angular L vienen definidas por

pα = mα vα = mα (ω × rα) ≡ εijkωjxk |ei〉

L =∑α

(r× p)α ≡ εijkxkpk |ei〉 ;

con α = 1, 2, · · · , n, |ei〉 = i, j,k y xi = x, y, zMuestre que:

a) L =∑αmα [(r · r)α ω − rα (rα · ω)].

b) Li = Iijωj , donde Iij =

∑αmα

(δij(xkxk

)− xixj

)es el tensor momento de inercia para un sistema

de n partıculas rı gidamente unidas.

4. Dado un tensor generico de segundo orden Tij . Demostrar

a) Que el determinante det [T] ≡ det[T ij]

= T y la traza tr[T ij]

= T ii son invariantes, en otras

palabras, det[T ij]

y tr[T ij]

son escalares respecto a transformaciones de coordenadas.

b) Si definimos la matriz adjunta adj [A], como la traspuesta de la matriz de cofactores

adj [A] = (Ac)T ⇒ adj

[Aij]

(Ac)ij

)T= (Ac)

donde la matriz de cofactores (Ac)ij viene dada por

Aij =

a11 a1

2 a13

a21 a2

2 a23

a31 a3

2 a33

⇒ (Ac)ij =

(Ac)11 (Ac)

12 (Ac)

(Ac)21 (Ac)

22 (Ac)

(Ac)31 (Ac)

32 (Ac)

Borra

dor Pre

limin

y los cofactores son

(Ac)11 = (−1)

1+1

∣∣∣∣ a22 a2

a32 a3

∣∣∣∣ (Ac)12 = (−1)

1+2

∣∣∣∣ a21 a2

a31 a3

∣∣∣∣ (Ac)13 = (−1)

1+3

∣∣∣∣ a22 a2

a32 a3

∣∣∣∣(Ac)

21 = (−1)

2+1

∣∣∣∣ a12 a1

a32 a3

∣∣∣∣ (Ac)22 = (−1)

2+2

∣∣∣∣ a11 a1

a31 a3

∣∣∣∣ (Ac)23 = (−1)

2+3

∣∣∣∣ a11 a1

a31 a3

∣∣∣∣(Ac)

31 = (−1)

3+1

∣∣∣∣ a12 a1

a22 a2

∣∣∣∣ (Ac)32 = (−1)

3+2

∣∣∣∣ a11 a1

a21 a2

∣∣∣∣ (Ac)33 = (−1)

3+3

∣∣∣∣ a11 a1

a21 a2

∣∣∣∣Para la transformacion xi = a xi con a un escalar constante, muestre que

1) τ ij =adj[T ij ]T es un tensor

2) Su determinante det[τ ij]

= τ y su traza tr[τ ij]

= τ ii , tambien seran invariantes.

3) T ij =adj[τ ij ]τ

4) τT = 1

5. Dados dos sistemas de coordenadas ortogonales O (x, y, z) y O (x, y, z), donde el sistema decoordenas O se obtiene a rotando O, π

6 alrededor del eje z, para rotarlo π2 alrededor del eje x con lo

cual los ejes y y z coinciden.

a) Si tenemos los vectoresA = i + 2j + 3k B = i + 2j + 3k

Expreselos en el sistema de coordenadas O (x, y, z).

b) El tensor de esfuerzos (tensiones normales y tangenciales a una determinada superficie) se expresaen el sistema O (x, y, z) como

P ij =

P1 0 P4

0 P2 00 0 P3

¿Cual sera su expresion en el sistema de coordenadas O (x, y, z)?

6. Suponga un sistema de coordenadas ortogonales generalizadas(q1, q2, q3

)las cuales tienen las siguiente

relacion funcional con las coordenadas cartesianas

q1 = x+ y; q2 = x− y; q3 = 2z;

a) Compruebe que el sistema(q1, q2, q3

)conforma un sistema de coordenadas ortogonales

b) Encuentre los vectores base para este sistema de coordenadas

c) Encuentre el tensor metrico y el elemento de volumen en estas coordenadas.

d) Encuentre las expresiones en el sistema(q1, q2, q3

)para los vectores

A = 2j ; B = i + 2j ; C = i + 7j + 3k

Borra

dor Pre

limin

e) Encuentre en el sistema(q1, q2, q3

)la expresion para las siguientes relaciones vectoriales

A×B ; A ·C ; (A×B) ·C

¿Que puede decir si compara esas expresiones en ambos sistemas de coordenadas?

7. La relacion entre las coordenadas cartesianas (x, y) y las coordenadas bipolares (ξ, ζ) viene dada por

x =a sinh(ξ)

cosh(ξ) + cos(ζ); y =

a sin(ζ)

cosh(ξ) + cos(ζ); con a = const

a) Compruebe si los vectores base para las coordenadas bipolares son ortogonales

b) Encuentre el tensor metrico para las coordenadas bipolares

c) Escriba las componentes covariantes y contravariantes para los vectores i, j y i + 2j.