Реферат: Линейное пространство


Линейное пространство


В математике (речь идёт не только о геометрии) многие объекты обладают естественной структурой линейного пространства. Уже знакомый пример – интуитивно-геометрические векторы (направленные отрезки), которые можно складывать и умножать на числа. Наличие этих двух операций (с выполнением определённого набора свойств) и составляет суть понятия “линейное пространство”. Дадим сейчас общее достаточно абстрактное определение.

Определение. Множество V называется линейным пространством (линеалом), а его элементы – векторами (обозначаться они будут a, b, …), если в нём определены операции сложения элементов и умножения на вещественные числа (т.е. любым двум векторам a и b по определённому правилу ставится в соответствие некоторый новый вектор, обозначаемый a + b и называемый суммой векторов a и b; также любому вектору a и любому вещественному числу k ставится в соответствие некоторый новый вектор, обозначаемый ka и называемый произведением вектора a на число k) и при этом выполнены следующие свойства (аксиомы линейного пространства):

(a + b) + c = a + (b + c);

a + b = b + a;

 0  V : 0 + a = a  a  V;

 a  V  (-a)  V : a + (-a) = 0;

(k + l)a = ka + la;

(kl)a = k(la);

k(a + b) = ka + kb;

1a = a.

Равенства выполняются  a, b, c  V,  k, l  R. Вектор 0  V называется нулевым, а вектор –a называется противоположным вектору а. Вектор b + (-a), называемый разностью векторов b и a, принято обозначать b –a.


Данное определение не накладывает никаких ограничений на природу элементов множества ^ V и на конкретное воплощение операций сложения и умножения на числа.


Замечание. Если вместо поля R в определении участвует поле C, то линейное пространство называется комплексным.


Примеры.

1) Множество, состоящее из одного элемента – нулевого вектора 0.

2) Интуитивно-геометрические векторы, т.е. направленные отрезки (равные по длине направленные отрезки, лежащие на параллельных прямых и направленные в одну сторону, отождествляются). Известны правила, по которым направленные отрезки складываются и умножаются на числа. Проверка аксиом не представляет труда. Понятно, что рассматривая отрезки на прямой, на плоскости или в пространстве, мы получаем три разных линейных пространства.

3) Пусть X – произвольное множество, F(X) = {f : X → R} – множество всех вещественных функций, определённых на множестве X. Положив


(f + g)(x) = f(x) + g(x), (kf)(x) = k·f(x) (x  X),


мы превратим F(X) в линейное пространство. Выполнение аксиом очевидно (линейные операции сводятся к сложению и умножению вещественных чисел). В роли векторов здесь выступают функции.

4) Если X есть подмножество R, то можно рассмотреть подмножество множества ^ F(X), состоящее из всех функций, непрерывных на множестве X. Оно обозначается C(X). Из курса математического анализа известно, что сумма непрерывных функций и произведение непрерывной функции на число есть непрерывная функция. Следовательно, по отношению к уже введённым операциям C(X) является линейным пространством (аксиомы уже проверены для F(X)).

5) Множество всех дифференцируемых функций.

6) Все многочлены от одной переменной с вещественными коэффициентами.

7) Многочлены степени не выше данной.

8) Линейное пространство в этом примере далее будет рассматриваться в качестве эталона конечномерного вещественного линейного пространства. Обозначим Rn = {(a1, …, an): ai  R } – множество всех n-членных последовательностей вещественных чисел. Введём линейные операции покомпонентно,


(a1, …, an) + (b1, …, bn) = (a1 + b1, …, an + bn), k·(a1, …, an) = (ka1, …, kan),


превращая Rn в линейное пространство. Оно называется арифметическим n-мерным вещественным линейным пространством.


^ Простейшие следствия из аксиом.

1) Нулевой элемент в линейном пространстве единственный. Действительно, пусть 01 и 02 обладают свойством нулевого элемента: 01 + a = a, 02 + a = a. Но тогда 01 +02 = 02, 02 + 01 = 01 ⇒ 01 = 02.

2) Противоположный элемент единственный. Действительно, если a + b = 0 и a + c = 0, то b = 0 + b = (c + a) + b = c + (a + b) = c + 0 = c.

3) x + a = b ⇔ x = b – a (вычитание есть действие обратное к сложению).

Действительно,

x + a = b ⇒ x = x + (a + (-a)) = (x + a) + (-a) = b + (-a) = b – a.

Наоборот,

(b + (-a)) + a = b + ((-a) + a) = b + 0 = b.

4) 0·a = 0.

Действительно, 0·a = (0 + 0)·a = 0·a + 0·a ⇒ 0·a = 0·a - 0·a = 0.

5) k·0 = 0 (аналогично).

6) (-1) ·a = -a.

Действительно,

(-1) ·a + a = (-1) ·a + 1·a = (-1 + 1) ·a = 0·a = 0 ⇒ (-1) ·a = -a.


Замечание. Аксиома ассоциативности утверждает, что сумма трёх векторов не зависит от расстановки скобок, т.е. от порядка, в котором она вычисляется. Аналогичное утверждение справедливо для суммы любого числа слагаемых.


Линейная зависимость


Пусть V - некоторое линейное пространство и a1, …, am - произвольное семейство (m-членная последовательность) векторов этого пространства.


Определение. Линейной комбинацией векторов a1, …, am с коэффициентами k1, …, km называется вектор k1a1 + … + kmam. Про всякий такой вектор говорят также, что он линейно выражается через векторы a1, …, am.


Если хотя бы один из коэффициентов отличен от нуля, то линейная комбинация называется нетривиальной. В противном случае – тривиальной. Тривиальная линейная комбинация есть, конечно, нулевой вектор. Но равной нулю может быть и нетривиальная линейная комбинация.


Определение. Семейство векторов a1, …, am отличен называется линейно зависимым, если существует равная нулю нетривиальная линейная комбинация этих векторов, т.е. если существуют такие числа k1, …, km  R, не все равные нулю, что k1a1 + … + kmam = 0.


В противном случае, т.е. k1a1 + … + kmam = 0 ⇒ k1 = k2 = … = km = 0, семейство называется линейно независимым.

Если семейство с повторениями или в семействе есть нулевой вектор, то оно, конечно, линейно зависимо. Кроме того, на свойство семейства быть линейно зависимым не влияет порядок следования векторов. Поэтому можно говорить о линейной зависимости множества векторов. Принято считать пустое множество линейно независимым. Множество, состоящее из одного вектора, линейно независимо (конечно, при условии, что этот вектор не равен нулю).

Перечислим некоторые свойства введённого понятия.

1) Если вектор a линейно выражается через векторы a1, …, am, а каждый вектор ai линейно выражается через векторы b1, …, bn, то a линейно выражается через векторы b1, …, bn (очевидно).

2) Семейство (множество) векторов, обладающее линейно зависимым подсемейством (подмножеством), линейно зависимо. Это простое соображение помогает распространить понятие линейной зависимости на бесконечные множества векторов.

Определение. Бесконечное множество векторов называется линейно зависимым, если оно обладает конечным линейно зависимым подмножеством, и линейно независимым, если любое его конечное подмножество линейно независимо.

3) Семейство (множество) векторов линейно зависимо ⇔ хотя бы один из его векторов линейно выражается через остальные. Для семейств (где важен порядок следования элементов) имеет место и более тонкий результат: семейство a1, …, am линейно зависимо ⇔ некоторый вектор ai (1 ≤ i ≤ m) линейно выражается через предыдущие векторы a1, …, ai-1.

Действительно, пусть семейство a1, …, am линейно зависимо. Тогда найдётся наименьшее натуральное i, 1 ≤ i ≤ m, такое, что семейство a1, …, ai линейно зависимо. Имеем нетривиальную линейную комбинацию k1a1 + … + kiai = 0, причём ki ≠ 0, ибо в противном случае линейно зависимым было бы семейство a1, …, ai-1. Но тогда ai = (-k1/ki)a1 + … + (-ki-1/ki)ai-1. Обратно, если ai = l1a1 + … + li-1ai-1, то имеем нетривиальную линейную комбинацию l1a1 + … + li-1ai-1 + (-1)ai + … + 0·am = 0.

4) Семейство a1, …, am линейно независимо ⇔ любой вектор, линейно выражающийся через векторы этого семейства, выражается через них единственным образом.

Действительно, пусть a = k1a1 + … + kmam = l1a1 + … + lmam, где ki ≠ li для некоторого i ⇒ нетривиальная линейная комбинация (k1 – l1)a1 + … + (km – lm)am = 0. Наоборот, если существует нетривиальная линейная комбинация λ1a1 + … + λmam = 0 и a = k1a1 + … + kmam , то для вектора a имеет место и другое представление a = (k1 + λ1)a1 + … + (km + λm)am .


Теорема о линейной зависимости. Пусть каждый вектор семейства a1, …, am линейно выражается через векторы b1, …, bn. Если m > n, то семейство a1, …, am линейно зависимо.


Доказательство. Предположим, что m > n, но семейство a1, …, am линейно независимо. Рассмотрим семейство a1, b1, …, bn. Очевидно, оно линейно зависимо. Тогда некоторый вектор этого семейства (отличный от a1) линейно выражается через предыдущие. Удалив его, получим снова систему из n векторов a1, c1, …, cn-1, обладающую тем свойством, что оставшиеся векторы a2, …, am линейно через них выражаются. Дальше рассуждения повторяются. Система a1, a2, c1, …, cn-1 линейно зависима и, следовательно, некоторый вектор (отличный от a1 и a2) линейно выражается через предыдущие. Вычёркивая этот вектор, получаем систему a1, a2, d1, …, dn-2 из n векторов такую, что векторы a2, …, am через неё линейно выражаются. Продолжая эту процедуру, на n-м шаге (ибо m > n по предположению) получим систему a1, a2, …, an и при этом векторы an+1, …, am через неё линейно выражаются. Мы пришли к противоречию, т.к. вначале предположили, что система a1, …, am линейно независима.


Базис и координаты


Определение. Семейство векторов a1, …, am линеала V называется полным, если любой вектор из V линейно выражается через векторы a1, …, am. Линеал V называется конечномерным, если в нём существует (конечное) полное семейство векторов.


От полного семейства векторов всегда можно перейти к полному линейно независимому семейству, удаляя из исходного полного семейства векторы, линейно выражающиеся через предыдущие (если такие есть) – полнота при этом, очевидно, не нарушается в силу свойства транзитивности линейной зависимости.


Определение. Всякое полное линейно независимое семейство векторов конечномерного линеала V называется базисом линеала V.


Замечание. Базисом мы назвали семейство векторов, т.е. важен порядок. Конечно, при любой перестановке векторов базиса и линейная независисмость, и полнота сохраняются, так что снова получаются базисы. Но считается, что другие.


Легко видеть, что количество векторов в базисе является инвариантом линейного пространства. Оно называется размерностью линейного пространства и обозначается dimV. Если dimV = n, то линеал V называется n-мерным.

Действительно, если e1, …, en - базис, а a1, …, am - некоторое семейство векторов линеала, то из линейной независимости семейства вытекает, что m ≤ n, а из полноты – что m ≥ n (по теореме о линейной зависимости).


В курсе аналитической геометрии рассматриваются конечномерные линейные пространства (бесконечномерные – в анализе). Примем этот за аксиому.

9) dimV = n.


Отметим также, что в n-мерном линеале всякое семейство, состоящее из n векторов, полно тогда и только тогда, когда оно линейно независимо. Действительно, если семейство a1, …, an полно и линейно зависимо, то, удалив из него подходящий вектор, мы получим полное семейство, состоящее из (n – 1)-го вектора, что невозможно в силу теоремы о линейной зависимости и того факта, что dimV = n. Наоборот, пусть семейство a1, …, an линейно независимо. Для произвольного вектора a  V рассмотрим семейство a1, …, an, a. Оно содержит (n + 1) вектор и, следовательно, линейно зависимо (поскольку dimV = n). Значит, некоторый вектор этого семейства линейно выражается через предыдущие. Это может быть только a, поскольку a1, …, an линейно независимы. Получили, что произвольный вектор a линейно выражается через a1, …, an , т.е. это семейство полно.

Зафиксируем произвольный базис e1, …, en линеала V. Тогда  a  V  такие однозначно определённые числа a1, …, an (верхние индексы – это номера, а не показатели степени), что a = a1e1 + … + anen (существование обеспечивается полнотой базиса, а единственность – линейной независимостью, что в данном случае одно и то же). Эти числа, являющиеся коэффициентами в линейной комбинации, называются координатами вектора a в базисе e1, …, en, а само равенство a = a1e1 + … + anen называется разложением вектора a по базису e1, …, en. Принято также писать a = aiei , опуская знак суммы (по общепринятому соглашению, знак суммы опускается, если в общем члене суммы индекс суммирования повторяется два, – и только два, – раза, причём один раз вверху, а другой раз внизу). Имеем a + b = (a1e1 + … + anen) + (b1e1 + … + bnen) = a1e1 + b1e1 + … + anen + bnen = (a1 + b1)e1 + … + (an + bn)en; ka = k·(a1e1 + … + anen) = k·(a1e1) + … + k·(anen) = (ka1)e1 + … + (kan)en (короче: aiei + biei = (ai + bi)ei, k·(aiei) = (kai)ei). Итак, при сложении векторов их координаты с одинаковыми номерами складываются, а при умножении вектора на число его координаты умножаются на то же число.


Изоморфизмы линейных пространств


Пусть V и V´ - два линейных пространства.

Определение. Биективное отображение Φ : V → V΄ называется изоморфизмом, если сохраняет линейные операции: Φ(a + b) = Φ(a) + Φ(b), Φ(ka) = k·Φ(a)  a, b  V,  k  R. Если существует изоморфизм V на V΄, то эти пространства называются изоморфными. Пишут V ≈ V΄.

Ясно, что тождественное отображение ^ V на себя является изоморфизмом (V ≈ V), отображение, обратное к изоморфизму, является изоморфизмом (V ≈ V΄ ⇒ V΄ ≈ V ), и композиция изоморфизмов также является изоморфизмом (V ≈ V΄ , V΄ ≈ V΄΄ ⇒ V ≈ V΄΄ ). Таким образом, отношение изоморфности является отношением эквивалентности. И по этому отношению все линейные пространства (над одним и тем же полем) сортируются в непересекающиеся классы.

В аксиоматической теории линейных пространств интересуются теми их свойствами, которые могут быть выражены в терминах операций сложения и умножения на числа. Но у изоморфных пространств эти свойства одинаковы. Например, линейная независимость, полнота при изоморфизмах сохраняются ⇒ изоморфные пространства обязательно имеют одинаковую размерность. Поэтому изоморфные пространства отождествляются. Утверждения, доказанные для одного пространства, можно применять ко всем пространствам, ему изоморфным. Сейчас мы покажем, что V ≈ Rn, если dimV = n. Отсюда будет следовать изоморфность всех вещественных пространств одинаковой размерности. Это также означает, что при исследовании свойств, связанных с основными операциями, можно заменять произвольное n-мерное вещественное пространство конкретным пространством Rn, в котором работают лишь с числами.

Каждый вектор a n-мерного линеала V однозначно задаётся своими координатами в фиксированном базисе: a = a1e1 + … + anen. Но упорядоченный набор координат можно рассматривать как элемент (a1, …, an) арифметического пространства Rn. Возникает отображение
Φ
a  V ————→ (a1, …, an)  Rn,

e1, …, en


являющееся, очевидно, биекцией V на Rn. Кроме того, ранее было показано, что координаты суммы векторов равны суммам координат векторов, а координаты произведения вектора на число равны произведениям координат вектора на это число. Вспоминая, как выглядят линейные операции в Rn, получаем Φ(a + b) = Φ(a) + Φ(b) и Φ(ka) = k·Φ(a).

Итак, Φ : V → Rn – изоморфизм. Он называется координатным изоморфизмом, определяемым базисом e1, …, en. Векторы (1, 0, …, 0), (0, 1, 0, …, 0), …, (0, …, 0, 1) пространства Rn образуют базис, называемый стандартным. Координатами вектора (a1, …, an)  Rn в этом базисе будут как раз числа a1, …, an : (a1, …, an) = a1·(1, 0, …, 0) + … + an·(0, …, 0, 1). Координатный изоморфизм есть ни что иное как такой изоморфизм V на Rn, который переводит данный базис e^ Уравнения прямой

Если в A выбрана точка O – начало отсчёта, то, поскольку M0M = OM – OM0 = r – r0, получаем векторное параметрическое уравнение прямой r = r0 + ta (-∞ < t < +∞ ).

Прямая, проходящая через 2 разные точки M0 и M1 , имеет параметрическое уравнение r = r0 + t(r – r0), или r = (1 – t)r0 + tr1 (-∞ < t < +∞ )

При наличии в A аффинной координатной системы Oe1…en можем записать эти уравнения в координатной форме : xi = xi0 + tai, или xi = (1 – t)xi0 + txi1 (i = 1…n; -∞ < t < +∞). Здесь xi (xi0) – координаты точки M (M0) прямой в заданной системе, т.е. координаты радиус-вектора r (r0) в базисе e1,…,en ; ai – координаты вектора a .

В случае плоскости (n = 2) имеем x = x0 + tl, y = y0 + tm (здесь M0(x0;y0), a (l,m)).

Эти параметрические уравнения равносильны одному уравнению l(y – y0) – m(x – x0) = 0 (если, например, l  0, то t = (x – x0) / l, а если m  0, то t = (y – y0) / m). Условимся последнее уравнение записывать в виде (x – x0) / l = (y – y0) / m. При l = 0 (m ≠ 0) запись означает, что x = x0, а при m = 0 (l ≠ 0), что y = y0. Это – каноническое уравнение прямой, заданное точкой M0(x0;y0) и вектором a. Если прямая проводится через точки M0 M1 ,то каноническое уравнение примет вид :

(x – x0) / (x1 – x0) = (y – y0) / y1 – y0)

Для придания большей симметрии записи l∙(y – y0) – m∙(x – x0) = 0 обозначим B = l , A = – m: A∙(x – x0) + B∙(y – y0) = 0, а если ещё ввести обозначение C = – Ax0 – By0, то получим Ax + By + C = 0 (|A| + |B| ≠ 0).

Нас интересует соответствие между прямыми на аффинной плоскости, на которой задана аффинная система координат Oe1e2, и линейными уравнениями вида Ax + By + C = 0 (|A| + |B| ≠ 0). Мы видим, что каждая прямая является решением уравнения такого вида, т.е. точка с координатами (x;y)  прямой тогда и только тогда, когда её координаты удовлетворяют уравнению. Наоборот, если есть такое уравнение, в котором, например, A ≠ 0, то возьмём точку M0 (– C/A;0) и проведём через неё прямую параллельно вектору a(B;–A). Она будет решением этого уравнения. Будет ли рассматриваемое соответствие взаимно однозначным? Покажем, что различные (непропорциональные) уравнения не могут задавать одну и ту же прямую. Пусть уравнения Aix + Biy + Ci = 0 (|Ai| + |Bi| ≠ 0, i = 0;1) различны. Значит, либо A0 / A1 ≠ B0 / B1 , либо A0 / A1 = B0 / B1 ≠ С0 / С1 (если A0 / A1 = B0 / B1 = С0 / С1, то уравнения совпадают).


Замечание. Соотношения вида A0 / A1 = B0 / B1 рассматривается не как равенство чисел, а как пропорция. Это подразумевает, что существует ρ ≠ 0 : A0 = ρA1, B0 = ρB1. Не исключён и случай, когда один и только один из знаменателей равен 0. Тогда соответствующий числитель тоже равен 0.


В первом случае (прямые не параллельны, т.е. направляющие векторы не коллинеарны) у двух уравнений есть лишь одно общее решение (прямые имеют лишь одну общую точку) x0 = (B0C1 – C0B1) / (A0B1 – A1B0) ,

y0 = (A1C0 – A0C1) / (A0B1 – B0A1).

Во втором случае (прямые параллельны) предположение о существовании хотя бы одной общей точки приводит к противоречию : A0 = ρA1 , B0 = ρB1 ⇒ C0 = ρC1 , так что в этом случае общих точек вообще нет – прямые не пересекаются.

^ Уравнение пучка прямых

Пара непараллельных прямых Aix + Biy + Ci= 0 (|Ai| + |Bi| ≠ 0, i = 0;1) определяет точку M0 их пересечения.

Предложение. Прямая проходит через точку M0 ⇔ прямая имеет уравнение

(A0μ + A1ν)x + (B0μ + B1ν)y + C0μ + C1ν = 0 для некоторых (μ, ν) ≠ (0, 0). Это уравнение называется уравнением пучка прямых, определяемых парой непараллельных прямых.

Замечание. Из условия непараллельности исходных прямых вытекает, что при (μ, ν) ≠ (0, 0) одновременное обращение в 0 коэффициентов при x и y невозможно. Так что справа действительно имеем уравнение прямой.

Необходимость очевидна :

(A0μ + A1ν)x0 + (B0μ + B1ν)y0 + C0μ + C1ν = (A0μ + A1ν)x + (B0μ + B1ν)y + C0μ + C1ν = 0.

Достаточность: Пусть уравнение прямой есть Ax + By + C= 0. Опять же ввиду непараллельности исходных прямых мы можем единственным образом подобрать числа μ0, ν0 так, чтобы A0μ + A1ν = A, B0μ + B1ν =B. Эти числа одновременно не равны нулю, так как |A| + |B| ≠ 0. Кроме того, имеем

A0x0 + B0y0 + C0 = 0 | ∙ μ0

+

A1x0 + B1y0 + C1 = 0 | ∙ ν0

Ax0 + By0 + C0μ0 + C1ν0 = 0

Но Ax0 + By0 + C = 0 ⇒ С = C0μ0 + C1ν0 .

Полуплоскость

Далее для удобства будем использовать обозначение F(x,y) ≡ Ax + By + C.

Определение. Две различные точки плоскости M0 и M1 называются неразделёнными этой прямой, еcли отрезок [M0;M1] (т.е. множество всех точек M прямой M0M , для которых равенство M0M = t⋅M0M1 достигается при t ∈ [0;1] ) не имеет общих точек с этой прямой.

Предложение. Точки M1(x1;y1), M2(x2;y2) не разделяются прямой

F(x,y) = 0 ⇔ F(x1,y1)⋅F(x2,y2) > 0.

Замечание. Поскольку точки не лежат на прямой, F(x1,y1)⋅F(x2,y2) ≠ 0.

Доказательство. Точка пересечения прямых M1M2 и F(x,y) = 0 отыскивается из уравнения F((1 – t)⋅x1 + t⋅x2 ; (1 – t)⋅y1 + t⋅y2) ≡ (1 – t)⋅F(x1,y1) + t⋅F(x2,y2) ≡ F(x1,y1) + t⋅(F(x2,y2) – F(x1,y1)) = 0, так что точки разделены тогда и только тогда, когда

F(x1,y1) ≠ F(x2,y2) и 0 < t = F(x1,y1) / (F(x1,y1) – F(x2,y2)) < 1. Правая часть неравенства есть F(x2,y2) / (F(x1,y1) – F(x2,y2)) < 0. Следовательно, в случае, когда точки разделены, числа F(x1,y1) и F(x2,y2) имеют разные знаки.

^ Замена базиса и системы координат


Краткие сведения из алгебры.
Матрицей называется прямоугольная таблица, состоящая из элементов (чисел, матриц, векторов и т.д.) aij (i – номер строки, j – номер столбца)


a11

a12







a1n




























a1

a21

a22







a2n




























a2





















a1

a2







an






















































am1

am2







amn




























am


Матрица размера m×n Матрица - строка Матрица - столбец


Если элементы матрицы – вещественные числа, то её строки (столбцы) есть элементы Rn (Rm ) и можно говорить о линейной зависимости (независимости) строк (столбцов). Более того, определив для матриц (одинаковой размерности) операции покомпонентного сложения и умножения на числа, мы превратим множество матриц одинаковой размерности в линейное пространство, лишь способом записи элементов отличающееся от Rn . Та роль, которую матрицы играют в математике, проистекает из того, что для некоторых матриц определена ещё одна алгебраическая операция – умножение, и использование свойств этой операции берёт на себя ряд трудоёмких вычислительных процедур.


A × B = C , где сij= aik · bkj (суммирование по k от 1 до n)

m×n n×p m×p i = 1,...,m; j = 1,...,p


Эта операция ассоциативна (AB)C = A(BC). Действительно,

Матрица (AB)C имеет элементы (aikbkl)clj, а матрица A(BC) – элементы aik(bklclj). Меняем местами порядок суммирования, отчего сумма не меняется.

Важный частный получается, когда рассматриваются квадратные матрицы n×n. Любые такие матрицы можно перемножать, получая снова такого же размера матрицы. Единицей умножения является матрица





1

0



0




0

1



0

E =























0

0



1


(других единиц нет), а дистрибутивность и однородность умножения (т.е. равенства A(B + C) = AB +AC и k(AB) = (kA)B = A(kB), справедливые для любых k ∈ R и матриц A, B) проверяются тривиально.

Поэтому множество квадратных матриц фиксированного размера является алгеброй (над полем R). Надо отметить, что умножение матриц некоммутативно: для многих матриц AB ≠ BA.

Важнейший вопрос во всякой алгебре – существование обратного элемента A-1, т.е. такой матрицы, для которой A-1A = E (⇒ AA-1 = E). В отличие от поля действительных чисел, такой элемент для матриц существует далеко не всегда. В случае, когда существует, матрица называется обратимой. Обратная матрица A-1 – единственна. Все обратимые матрицы образуют группу по умножению.

Очень важно уметь проверять обратимость. Обратимость, как нетрудно видеть, равносильна тому, что столбцы (строки) линейно независимы (как элементы линейного пространства Rn). По-другому эта задача может быть решена при помощи следующего очень важного понятия.

Каждой квадратной матрице A ставится в соответствие по определённому правилу некоторое вещественное число, называемое её определителем и обозначаемое detA. Таким образом, на множестве матриц определена некоторая числовая функция

A → detA ∈ R .


Не будем сейчас подробно обсуждать свойства этой функции (это будет сделано в курсе алгебры). Отметим лишь, что она является многочленом от элементов матрицы, det (AB) = det A ∙ det B и det E = 1, откуда вытекает, что det A-1 = 1 / det A, т.е. необходимым условием обратимости является условие невырожденности detA ≠ 0. Оно оказывается и достаточным. Это будет доказано в курсе алгебры.


Перейдём теперь к геометрии. Пусть в n-мерном линеале V имеются 2 базиса

e1, …, en и f1, …, fn. Разложим векторы второго базиса по первому:

fj= aij ∙ ei(j = 1…n). Составим из чисел aij квадратную матрицу A размера n×n (она называется матрицей перехода от e к f; её столбцы состоят из координат второго базиса в первом), а векторы базисов объединим в строки.

e = (e1…en) и f = (f1…fn) – это матрицы-строки, составленные из векторов.

Формулы перехода можно записать компактно, в виде матричного равенства:

f = e ∙ A. Но компактная запись – ещё не аргумент в пользу введения матриц. Преимущества начнут проявляться очень скоро. Пусть у нас есть третий базис g = (g1, …, gn) , и B – матрица перехода от f к g. Тогда

g = f ∙ B = (e ∙ A) ∙ B = e ∙ (AB), так что матрица перехода от e к g есть произведение матрицы перехода от e к f и матрицы перехода от f к g. Далее, если в качестве e взять g, то получится AB = E, т.е. всякая матрица перехода обратима и обратной к ней является матрица перехода от второго базиса к первому.

Заметим, также, что вообще любая невырожденная квадратная матрица является матрицей перехода от одного базиса к другому. Выбираем произвольным образом исходный базис e1,…en. Тогда система векторов f1,…fn, где f = e ∙ A также образует базис (ибо столбцы линейно независимы, так что g1, …, gnлинейно независимы).

Вспомним теперь, что всякий изоморфизм линеала ^ V на себя реализуется как переход от одного базиса к другому, т.е. если в V зафиксирован базис e, то задать изоморфизм Φ – это всё равно, что указать новый базис f.

Φ Ψ

V —————→ V, V —————→ V

e AΦ f e AΨ g


Возникает матрица перехода AΦ от e к f, f = eAΦ. Другой изоморфизм Ψ порождается некоторым базисом g, ему отвечает матрица AΨ перехода от e к g, g = eAΨ . Выясним, какая матрица отвечает композиции изоморфизмов Ψ◦Φ. Надо посмотреть, во что переходит базис e под действием отображения Ψ◦Φ :


(Ψ◦Φ)(e) = Ψ(f) = Ψ(eAΦ) = Ψ(e)AΦ = gAΦ = (eAΨ)AΦ = e(AΨAΦ).


Итак, если изоморфизму Φ отвечает матрица AΦ , а изоморфизму Ψ – матрица AΨ, то композиции Ψ◦Φ отвечает произведение матриц AΨAΦ. Обратному изоморфизму Φ-1 отвечает AΦ-1. Поэтому группа автоморфизмов линеала V может быть отождествлена с группой невырожденных матриц n×n. Это отождествление связано с выбором базиса e в V.

Пусть теперь имеем произвольный вектор x ∈ V. Разложим его по базису e1,…en, а затем по базису f1,…fn. Как связаны координаты одного и того же вектора в разных базисах?

Имеем x = xiei = x´ifi. Если составить из координат вектора x матрицы-столбцы x = (x1, . . ., xn)T , x´ = (x´1, . . ., x´n)T, то можно записать, что x = e∙x = f∙x´ =(e ∙ A) ∙x´=e ∙ (A ∙x´) ⇒ x = A ∙x´, т.е. та же матрица A описывает переход от новых координат к старым. Но стоит она слева.

Преобразование координат точек в аффинном пространстве при переходе от одной аффинной системы координат к другой связано лишь с одним дополнительным фактором – изменением положения начала отсчёта.

Пусть имеются две координатные системы Oe1…enи O´e´1…e´n, xi (x´i) – координаты вектора OM (O´M) в базисе e1,…en(e´1,…e´n). Записывая векторное равенствоOM = OO´ + O´M в координатах в базисе e1,…en, получим xi= bi + cjix´j (i = 1, …, n) или, в матричной форме, x = b + C∙x´. Здесь b есть столбец координат нового начала координат O´ в старой системе координат Oe1…en, а C есть матрица перехода от базиса e1,…enк базису e´1,…e´n.

Ориентация

Определение. Пусть e´= e ∙ С. Если det C > 0 , то базисы e и e´ называются одноимёнными, в противном случае – разноимёнными.

Замечание. Очевидно, отношение одноимённости есть отношение эквивалентности, причём есть ровно 2 класса эквивалентности.

Определение. Деформацией базисов a1, …, anи b1, …, bn называется такое семейство вектор-функций a1(t),…an(t) t  [0;1] , что

 t  [0;1] векторы a1(t),…an(t) составляют базис ^ V

ai(0) = ai ,ai(1) = bi (i = 1…n).

Замечание. Непрерывность вектор-функции t  [0;1] → a(t)  V по определению означает, что в некотором базисе (а значит и в любом другом) все её координатные функции aj(t) (t  [0;1], j = 1…n) непрерывны (при изменении базиса координатные функции преобразуются при помощи линейных комбинаций с постоянными коэффициентами, а значит остаются непрерывными).

Отношение непрерывности есть отношение эквивалентности.

Рефлексивность: a деформируется в a при помощи ai(t) = ai.

Симметричность: если a деформируется в b при помощи ai(t), то b деформируется в a при помощи bi(t) = aj(1 – t).

Транзитивность: если a деформируется в b при помощи ai(t), b деформируется в c при помощи bi(t), то a деформируется в c при помощи деформации ci(t), где ci(t) = ai(2t) при t  [0;½] и ci(t) = bi(2t – 1) при t  [½;1].

Все базисы ^ V распадаются на непересекающиеся классы деформируемых друг в друга базисов. Эти классы называются ориентациями линеала V (или аффинного пространства, с которым ассоциирован этот линеал).

Примеры.

n = 1. Базисы a и b = δa (δ ≠ 0) деформируемы друг в друга  δ > 0 (Действительно, если δ > 0 , то деформация – bi(t) = (1+ t(δ – 1))a t  [0;1] , а если есть деформация, то она обязательно имеет вид b(t) = δ(t)a. При этом δ(t) непрерывна на [0;1], δ(0) = 1 и в ноль на [0;1] не обращается 

δ(1) = δ > 0. Наглядно условие δ > 0 означает, что векторы a и b имеют одно и тоже направление. Таким образом, задание ориентации на прямой равносильно заданию на ней одного из 2 возможных направлений (2 ориентации).

n = 2. На плоскости каждый базис a1,a2 задаёт некоторое направление вращения, а именно, направление, в котором следует вращать a1, чтобы кратчайшим путём совместить его направление с направлением a2. Интуитивно ясно, что деформируемые базисы задают одно и то же направление вращения и, напротив, базис, задающий вращение по часовой стрелке, нельзя продеформировать в базис, задающий вращение против часовой стрелки.

Теорема. Два базиса деформируемы тогда и только тогда, когда они одноимённы.

Достаточность. Пусть a1(t),…an(t) - деформация, связывающая

a1,…, anи b1,…, bn , и (t) – определитель матрицы перехода от базиса a1,…anк базису a1(t),…an(t). Тогда (t) есть непрерывная функция на [0;1] и если бы она имела на концах отрезка значения разных знаков, то внутри отрезка нашлась бы точка, в которой (t) = 0, что невозможно в силу невырожденности матрицы перехода. Следовательно (1) > 0, поскольку (0) = 1 > 0.

Необходимость доказать не так просто. Для этого нам понадобится ряд вспомогательных понятий и утверждений, имеющих и самостоятельное значение.

Определение1. Преобразования базисов вида

(a1,a2,…,an) → (a1+ka2,a2,…,an) или (a1,a2,…,an) → (λa1, λ-1a2,…,an) (k и λ – произвольные числа, λ ≠ 0) называются элементарными.

Замечания. 1) роль первого и второго векторов чисто случайна; 2) при элементарных преобразованиях линейная зависимость не нарушается, т.е. базис переходит в базис; 3) при элементарных преобразованиях сохраняется объём параллелепипеда, построенного на векторах базиса.


Лемма 1. Если базис b1,…bn получен из a1,…anэлементарным преобразованием, то базис a деформируется в базис b.

Доказательство. Если элементарное преобразование первого типа, то деформацию можно определить формулами

a1(t) = a1 + tka2, a2(t) = a2,. . . ,an(t) = an.

Если элементарное преобразование второго типа и λ > 0, то положим

a1(t) = (1 + t(λ – 1))a1, a2(t) = (1 + t(λ-1 – 1))a2,…,an(t) = an.

При λ < 0 разложим такое элементарное преобразование второго типа в композицию

(a1,a2,…,an) → (‌‌‌‌λa1, λ-1a2,…,an) и (a1,a2,…,an) → (-a1,-a2,a3…,an).

Первое из этих преобразований - это уже рассмотренный случай,

а для второго положим

a1(t) = сos(t)a1 – sin(t)a2 a1(t) = sin(t)a1 + сos(t)a2,…,an(t) = an

Определение 2. Два базиса называются унимодулярно эквивалентными, если от одного к другому можно перейти цепочкой элементарных преобразований.

(Очевидно, отношение унимодулярной эквивалентности есть действительно отношение эквивалентности, т.е. рефлексивно, симметрично и транзитивно).

Следствие. Унимодулярно эквивалентные базисы деформируемы.

Лемма 2. Базис b1,b2,…,bn унимодулярно эквивалентен базису

(det C)a1,a2,…,an, где b = aС.

Доказательство. Элементарные преобразования базиса b соответствуют элементарным преобразованиям столбцов матрицы перехода C. Но, как известно из курса алгебры, элементарными преобразованиями столбцов всякую невырожденную матрицу C можно привести к диагональному виду



det C

0

0



0

0

1

0



0

0

0

1



0











0

0

0



1



.


Полученная матрица означает переход к базису (det C)a1,a2,…,an, следовательно, элементарными преобразованиями базис b переводится в указанный базис.

Замечание. Матрицы перехода, отвечающие элементарным преобразованиям, имеют вид


1

0

0



0




λ

0

0



0

k

1

0



0




0

λ-1

0



0

0

0

1



0

и

0

0

1



0
























0

0

0



1




0

0

0



1


и равный 1 определитель. Композиции элементарных преобразований отвечает произведение матриц перехода, значит, для унимодулярно эквивалентных базисов матрица перехода имеет равный 1 определитель. Обратное утверждение следует из леммы 2.

Закончим доказательство теоремы.

Пусть базисы a1,a2,…,anиb1,b2,…,bn одноимённы, т.е. det C > 0 .

Тогда базис b1,b2,…,bnдеформируется в базис (det C)a1,a2,…,an в силу леммы 2, а последний деформируется в a1,a2,…,an при помощи отображения

a1(t) = (1+ t(det C – 1))a, a2(t) = a2, . . . , an(t) = an (поскольку det C > 0, коэффициент при a1 в ноль на отрезке [0;1] не обращается). Теорема доказана.

Теперь можно сказать, что ориентации линейного (или аффинного) пространства – это в точности классы одноимённых базисов (координатных систем). Поэтому ориентаций в точности 2, они называются противоположными. Базисы (или координатные системы), задающие одну и ту же ориентацию, называются одинаково ориентированными (одинаково ориентированные – значит одноимённые). Пространство, в котором выбрана ориентация, называется ориентированным. Считается, что выбрав в пространстве базис, мы уже выбрали ориентацию. Автоморфизмом ориентированного линейного (аффинного) пространства называется всякий сохраняющий ориентацию автоморфизм линейного (аффинного) пространства. Последнее требование равносильно тому, что для любого положительно ориентированного базиса матрица автоморфизма имеет положительный определитель.

^ Элементы теории поливекторов

Далее мы основательно проэксплуатируем уже введённое нами более тонкое (по сравнению с одноимённостью) понятие унимодулярной эквивалентности. Это приведёт нас к теории поливекторов, тесно связанных с кососимметрическими полилинейными формами.

Определение. Классы унимодулярно эквивалентных линейно независимых семейств из m векторов линеала ^ V называются m-векторами (конечно,

m  n = dim V ). Такой m-вектор, содержащий семейство a1,a2,…,am, называется внешним произведением векторов a1,a2,…,am и обозначается

a1a2…am.

К m-векторам дополнительно причисляется нулевой m-вектор, по определению состоящий из всех m-членных линейно зависимых семейств. (Определение нуля здесь следует воспринимать формально, т.к. никакой операции сложения на множестве m-векторов у нас пока нет).

Итак, a1a2…am= 0 означает, что векторы a1,a2,…,am линейно зависимы, а равенство a1a2…am= b1b2…bmговорит о том, что от системы a1,a2,…,am цепочкой элементарных преобразований можно перейти к системе b1,b2,…,bm, или, что тоже самое, данные семейства линейно эквивалентны (векторы одного семейства линейно выражаются через векторы другого) и матрица перехода унимодулярна.


Замечание. При m = 1 условие унимодулярной эквивалентности двух векторов a и b означает, что a = b, так что 1-вектор – это просто вектор.


Далее для простоты изложения мы построим теорию поливекторов в трёхмерном пространстве (n = dim^ V= 3). В случае трёхмерного линеала V содержа
еще рефераты
Еще работы по разное