Как не ошибаться - Страница 125


К оглавлению

125

Что я могу сказать? Математика помогает нам не ошибаться, но она не позволяет не ошибаться во всем. (Извините, плата за книгу возврату не подлежит!) Склонность к ошибкам подобна первородному греху: мы рождены с нею, и она остается с нами всегда, поэтому необходимо постоянно проявлять бдительность, если мы хотим ограничить сферу влияния этого качества на наши действия. Существует реальная опасность, что, усиливая способность анализировать некоторые вопросы математическими методами, мы обретаем общую уверенность в своих убеждениях, которая необоснованно распространяется и на то, в чем мы все же ошибаемся. В итоге мы уподобляемся тем благочестивым людям, у которых со временем возникает столь сильное ощущение собственной добродетели, что они считают благими даже плохие дела, которые совершают.

Я делаю все возможное, чтобы устоять против такого искушения. Но следите за мной внимательно.

Приключения Карла Пирсона в десятом измерении

Трудно переоценить влияние созданной Гальтоном концепции корреляции на тот концептуальный мир, в котором мы сейчас обитаем, – не только в статистике, но и во всех областях научной деятельности. Следует помнить, что корреляция не подразумевает наличия причинно-следственной связи: в понимании Гальтона два явления могут быть коррелированы между собой, даже если одно не приводит к возникновению другого. Само по себе это не было новостью. Безусловно, люди понимали, что родные братья и сестры чаще других пар людей обладают общими физическими характеристиками, но причина не в том, что сестры становятся высокими под влиянием высоких братьев. Тем не менее даже здесь где-то в тени притаилась причинно-следственная связь: высокий рост обоих детей обусловлен генетическим наследием родителей. В постгальтоновском мире стало возможным говорить о связи между двумя переменными, полностью отрицая существование любой конкретной причинно-следственной связи, прямой или косвенной. Порожденная Гальтоном концептуальная революция имеет нечто общее с выводами его знаменитого родственника, Чарльза Дарвина. Дарвин показал, что можно содержательно рассуждать о прогрессе без всякой необходимости упоминать о цели. Гальтон показал, что можно содержательно рассуждать о связи между явлениями без всякой необходимости упоминать о глубинной причине.

Исходное определение корреляции Гальтона было несколько ограниченным, распространяясь только на те переменные, распределение значений которых подчиняется закону нормального распределения, упоминавшемуся в . Однако Карл Пирсон быстро адаптировал и обобщил эту концепцию так, чтобы ее можно было применять к любым переменным.

Если я написал бы здесь формулу Пирсона или если вы сами нашли бы ее в других источниках, вы увидели бы кучу квадратных корней и коэффициентов, которые не помогли бы вам понять суть этого вопроса, если только не владеете декартовой геометрией. Однако на самом деле формула Пирсона имеет очень простое геометрическое описание. Со времен Декарта математики пользуются замечательной возможностью переходить от алгебраических к геометрическим описаниям мира и наоборот. Преимущество алгебры состоит в том, что ее легче формализовать и ввести в компьютер. Преимущество геометрии в том, что она позволяет нам использовать свою физическую интуицию применительно к соответствующей ситуации, особенно когда можно нарисовать рисунок. У меня редко бывает такое чувство, что я действительно понял ту или иную математическую концепцию, пока не сформулирую все это на языке геометрии.

Так что же такое корреляция с точки зрения геометра? Давайте рассмотрим это на примере. Посмотрите еще раз на представленные выше таблицы, в которых указана средняя январская температура в десяти городах Калифорнии в 2011–2012 годах. Как мы уже видели, между показателями температуры за 2011 и 2012 год есть сильная положительная корреляция; формула Пирсона дает очень высокое значение корреляции в данном случае – 0,989.

Если нам необходимо изучить связь между показателями температуры за два разных года, изменение каждого элемента таблицы на одну и ту же величину не повлечет за собой никаких последствий. Если температура за 2011 год связана с температурой за 2012 год, эта связь сохранится и с показателями «температура за 2012 год + 5 градусов». Вот еще один способ сформулировать эту идею: если взять точки, изображенные на представленной выше диаграмме, и сдвинуть их на десять сантиметров вверх, это не изменит форму эллипса Гальтона, изменится только его местоположение. Как оказалось, полезно изменить значения температуры на одинаковую величину, причем такую, чтобы среднее значение было равным нулю как в 2011, так и в 2012 году. В итоге мы получим такую таблицу.



Отрицательные числа находятся в строках таблицы, соответствующих холодным городам, таким как Траки, а положительные – в строках городов с более мягким климатом, таких как Сан-Диего.

Хитрость вот в чем. Столбец из десяти чисел, соответствующих значениям температуры в январе 2011 года, – да, это ряд чисел. Но это также и точка. Как такое может быть? Все началось с нашего героя – Декарта. Пару чисел (x, y) можно рассматривать как точку на плоскости, которая находится на x единиц направо и y единиц вверх от начала координат. На самом деле мы можем нарисовать небольшую стрелку, указывающую от начала координат к нашей точке (x, y); эта стрелка называется «вектор».

125