Инструмент… креативности

2 март, 2009 - 11:55Андрей Зубинский

На этот раз мы начнем совсем уж издалека. С недавнего... заявления министра образования Российской Федерации А. Фурсенко о смертоносности высшей математики для... креативности юных умов. Что в юности смертельно, то, очевидно, и в зрелости здоровья не прибавляет. Учитывая потенциальную опасность, мы поговорим только об одном фрагменте этого убийственно опасного.

Теуво Кохонен, почетный профессор Академии наук Финляндии, академик, автор новых направлений и концепций в исследований нейронных сетей

Автору статьи очень трудно дать точное определение понятию «креативность». Нет, конечно же, можно сослаться на статью википедии (ru.wikipedia.org/wiki/Креативность), можно даже принять сердцем то, что в ней написано, но есть одно «но» – даже принятое сердцем, это нельзя измерить. Увы. А что неизмеримо – тому место в областях интересных, но весьма далеких от прозаической повседневности, в которой всего несколько поколений людей далеко не всех стран уже считают совершенно нормальным на самом деле чуть ли не волшебное – в требуемых количествах энергию, пресную воду, пищу и информацию. Для функционирования этого волшебства (а если начинать интересоваться всерьез, как это все работает, с какого-то момента действительно начинает казаться, что имеешь дело с магией, преобразующей таланты, усилия, идеи и разрозненные цели миллионов людей в громадные цельные системы), без сомнения, требуется и «креативность», и точный расчет. Иногда невычисляемой креативности (в ее «википедийном» смысле) и точности расчета требуется чудовищно много – как, скажем, для создания систем спутниковой навигации. Иногда, на первый взгляд, – и вовсе ничего, как, например, для построения сети сбыта крышек для консервирования (если, конечно, не относить к «креативности» какую-нибудь античеловечески нахрапистую рекламную акцию с бездарной ковровой бомбардировкой потенциальных аудиторий боеприпасами, снаряженными правилом «sex sells» и ненормативной лексикой). Но в любом случае, если мы говорим об артефактах – объектах физического мира, «креативность» (пока она закавычена – подразумевается википедийное определение) без способности к абстрактному мышлению и развитых инструментов никакой ценности не имеет. По каким критериям ее ни оценивай – ни беглая генерация идей конкретным мышлением (классические примеры которого – утверждения «человек – это Вася» и «пять – это яблок»), ни нереализуемые в реальности идеи (оценка реализуемости идей требует куда большего, чем «креативности») никому не нужны. К счастью, из всех наук именно математика обладает самой развитой системой абстракций и методов оперирования ими. То есть она сама является прекрасным инструментом и «тренировки» креативности, и трансформации абстракций в объекты реального мира. Если бы все было не так, вы бы смогли прочесть эту статью при свете лучины, записанную от руки, на долбленой шкуре, монахом ближайшего монастыря со слов паломника, который о ней также слышал, лет эдак через тридцать после того, как автор закончил скрипеть пером в своей келье. Ну а что школьная программа математики на самом деле никакого отношения к математике не имеет и ни в коем случае не направлена на развитие у детей абстрактного мышления и умений творчески оперировать абстракциями – это проблема из совершенно другой области и других инстанций. Нам же главное – понять: после прочтения этой статьи (и прочих статей и книг о математике) ваша многострадальная креативность не погибнет в страшных муках. Тем более если этого с ней не случилось даже под воздействием креативных позитивных актуальных телепередач.

Обучение с учителем

Давайте сразу откроем карты – мы будем говорить всего об одном математическом методе, для которого создана мощная программная инструментальная поддержка (и даже очень специфические аппаратные средства). Но не это главное. Поисковые машины для одного из названий этого метода из двух слов выдают ссылки примерно на двадцать тысяч уникальных страниц, для комбинации названия со словом business – на порядка пять тысяч страниц, для комбинации со словосочетанием «data mining» – почти на десять тысяч. С какой-то степенью уверенности, и достаточно немалой, можно говорить о том, что мы будем иметь дело с методом, весьма востребованном в современном бизнесе. А также – в инженерии, в научных исследованиях, в менеджменте, при этом – в колоссально широком диапазоне областей человеческой деятельности, от агрономии до интернет-маркетинга. Причем инструментальная поддержка метода – более чем доступна, многие программы легально бесплатны и поставляются с открытыми исходными текстами. Правда, и здесь есть одно очень важное «но» – та самая школьная математика, из-под убийственного обстрела которой большинство спасало свою «креативность». Из-за этого теперь многие не просто не располагают нужными для использования мощных инструментов знаниями, а и вовсе боятся. C первым, кстати, именно в этом случае можно даже и не бороться – профессиональные математики мирового уровня отзываются об этом методе так: «несмотря на широкое использование и разнообразие реализаций... это алгоритм, неожиданно очень сопротивляющийся полному математическому исследованию». А страх мы попробуем преодолеть. Заодно и немного сократить дистанцию, отделяющую потенциального пользователя от специалиста – ведь для применения развитых инструментов требуются их знания.

Давайте представим себе простую задачу – перед вами таблица с ежемесячными оценками работы какого-то подразделения компании, и вам надо посмотреть на результаты, например с целью сравнения. Как вы это будете делать? Очевидно, если в таблице всего одна оценка, можно построить двухмерный график, по оси X – месяц, по оси Y – оценка, и задача решена. На этом графике сразу видны провалы, пики и «области стабильности», где наблюдаемая оценка почти не изменяется. А если оценок – две? Три? Сорок? Несколько сотен? И все они – независимы, т. е., группы их не могут быть отображены каким-то «собирательным» показателем? Построить сорок графиков и смотреть на них? И что это созерцание даст? С одной стороны, мы ведь не способны визуально воспринимать пространства с числом измерений, большим трех, а с другой, например, в управлении процессами проектирования для отдельных этапов используются сотни оценок, и способность ориентироваться в этом многомерном пространстве – не «сумасшедшинка», а более чем реальные, выражающиеся цифрами с семью нулями, суммы денег. Как решать подобную задачу – увидеть принципиально ненаблюдаемое и получить возможность оперировать данными в многомерных пространствах?

Для ответа на этот вопрос и с целью предварительного знакомства с самоорганизующимися картами (SOM, Self-Organized Maps, их еще называют по имени автора – картами Кохонена) придется сделать неизбежные отступления для пояснения базовых понятий. На самом деле мы вторгаемся в междисциплинарную область, которую можно относить и к прикладной математике, и к теории искусственного интеллекта, и даже, в каком-то смысле, к нейрофизиологии. И при этом пробуем обойтись без ужасов математических формул.

Первые два фундаментальных понятия, классификация и кластеризация, весьма близки. То, что в этой статье делает автор, – это и есть классификация: читателю так показываются некоторые сложные объекты в паре с названиями-ярлыками, чтобы читатель обучился и впоследствии мог выполнять процедуру этого соотнесения самостоятельно. Возвращаясь к нашему примеру с оценками работы подразделения, классификация – это когда опытный управляющий учит начинающего распознавать в столбцах оценок за месяц «нормальное функционирование», «надвигающуюся катастрофу» или «ожидаемый рост». Все взятые в кавычки понятия – это и есть названия-ярлыки. А наборы оценок работы – это предъявляемые классификатору наборы параметров, которые он должен соотнести с известными названиями-ярлыками, которым обучен. Что сразу должно броситься в глаза – классификатор может «навешивать» на наборы параметров только те ярлыки, которые ему известны. То есть которым он обучен. Соответственно, с понятием классификации непосредственно связано понятие обучения с учителем – тем, кто показывает будущему классификатору наборы параметров и сообщает о названиях-ярлыках, которым они соответствуют. В отличие от уютно устроившегося классификатора, кластеризатору по штату не положен учитель, его задача – самостоятельно изучать наборы параметров и формулировать гипотезы о том, что у некоторых подмножеств наборов параметров есть что-то в некоторой степени общее. Задача более сложная, но менее ответственная, поскольку определить факт, что у набора показателей за октябрь есть «что-то общее» с наборами за март, февраль и июнь прошлого года, и выявить «критическую ситуацию» – задачи разные. Но это, конечно, если мы используем нарочито утрированные организационные модели. На самом же деле речь идет о математических методах и реализующих их алгоритмах. В основе этих методов лежат различия между наборами показателей, математические (точнее геометрические) характеристики которых называются расстояниями. Если считать каждый набор показателей координатами точки в пространстве с числом измерений, равным числу показателей набора, то можно предположить, что расстояния между некоторыми точками будут заметно меньше, чем от этих же точек до других. Например, ранее сказанное «у набора показателей за октябрь есть «что-то общее» с наборами за март, февраль и июнь прошлого года» теперь можно трансформировать в краткое «точки, соответствующие октябрю, марту, февралю и июню прошлого года, близки». Как именно измеряется расстояние – вопрос отдельный, для разных по специфике параметров-данных и их наборов существуют разные методы измерения (расчета) расстояния. В целях корректности следует заметить, что любое множество, для элементов которого это понятие определено, в математике называется метрическим пространством, а любому из нас известно по крайней мере одно метрическое пространство из бесконечного множества возможных – евклидово.

Итак, не прибегнув ни к одной формуле, мы уже можем интуитивно-математически описать задачи классификации и кластеризации. В первом случае на этапе обучения классификатор получает от учителя один за одним элементы множества некоторого метрического пространства (точки) и соответствующие им названия-ярлыки. Алгоритм классификатора на основании расстояний между точками порождает набор правил, позволяющий впоследствии, на этапе собственно классификации, с какой-то степенью уверенности прикреплять к новым точкам известные названия-ярлыки. Алгоритм кластеризатора же постоянно самообучается, формируя и корректируя как правила отнесения новых наборов данных к группам близко расположенных точек, так и сами эти группы.

Для реализации кластеризаторов можно использовать разные механизмы, теории и приемы. Но один из самых интересных методов – конкурентное обучение. Часто при его описании применяется заимствованная из нейронных сетей терминология, но это не совсем правомочно, потому что ключевой элемент механизма конкурентного обучения ничего общего не имеет ни с биологическим нейроном, ни с его аналогом из мира искусственных нейронных сетей. Мы уже говорили о точках некоторого метрического пространства как о наборах параметров. Эти точки были, если можно так сказать, «пассивны» – результаты работы за июль как стали точкой метрического пространства, так и остаются ею, неподвижной и навсегда зафиксированной на своем месте. А теперь представим себе, что в этом же метрическом пространстве существуют весьма специфические, активные точки (назовем их узлами), способные самостоятельно изменять свое положение на основании несложного алгоритма, учитывающего положения пассивных точек. Несмотря на простоту формул, описывающих изменение положения узла, воспользуемся вербальной моделью основной цели этих изменений – чем «плотнее», ближе друг к другу в метрическом пространстве размещены пассивные точки, тем в ближе к ним всем одновременно стремится переместиться находящийся неподалеку узел. Иными словами, узлы ищут себе в пространстве ближайшую тесную компанию пассивных точек и стремятся стать ее «центром». Так как реализация узла – некий простой алгоритм (формула), и количество пассивных, статических точек постоянно изменяется, то за одно исполнение алгоритма принципиально невозможно найти требуемое положение узла в пространстве, следовательно, мы говорим об итеративном процессе. В действительности так и есть – конкурентное обучение требует большого числа циклически повторяемых операций, да еще и с объемными данными (координаты точек – это ведь наборы, множества параметров), что сразу подсказывает – программные реализации механизмов конкурентного обучения весьма ресурсоемки. Благо производительность современных ПК такова, что более чем непростые задачи можно решать с помощью даже программ, написанных на интерпретируемых высокоуровневых языках.

Итак, в процессе конкурентного обучения оснащенные примитивным искусственным интеллектом узлы «расползаются» по пространству в поисках локальных скоплений статических точек. Полученные от узлов сведения об их положении сами по себе представляют ценность, но... Финский математик, с 60-х годов прошлого века специализирующийся в теории нейронных сетей, Теуво Кохонен, более чем за четверть столетия научной работы, решая задачу распознавания речи для японского химического концерна Asahi (пример одновременно и интеграции, и широты интересов крупных японских промышленных объединений), существенно модифицировал оригинальную идею конкурентного обучения. Причем суть модификации можно объяснить, опять же, не прибегая к математике. Основа идеи Кохонена – помещение узлов-точек в узлах эластичной сетки. При этом узлы-точки также продолжают «расползаться» в центры скоплений статических точек, но они «растягивают» нити сети, которые сопротивляются движениям. Не будем спешить с ответом на вопрос «что получается в результате», давайте пока обратим внимание на очевидное. А именно на то, что теперь у узла-точки появляются две характеристики – положение в многомерном пространстве и, естественно, деформации нитей сети, прикрепленных к нему. Также заметим, что эластическая сеть – это не имеющая толщины поверхность в многомерном пространстве, и, раз мы говорим поверхность, то речь идет всего лишь о двухмерном объекте. Мы способны видеть двухмерные объекты, но, увы, не настолько специфические, у которых каждая точка имеет множество координат. Зато мы получаем возможность оперировать длинами нитей и информацией о присоединении нитей к узлам-точкам. Что это может дать?

Представим себе, что в результате конкурентного обучения узлы-точки удачно «расползлись» и мы получили их положения. Эти данные свидетельствуют о том, что поблизости от указываемых ими точек в пространстве находятся чем-то похожие точки. Но. Никакой информации о том, как взаимно расположены такие области, мы с помощью конкурентного обучения не получим. А эта-то информация жизненно необходима. Если мы знаем, что одна группа близких по свойствам объектов достаточно близка с другой группой и при этом обе далеки от третьей, это позволяет нам делать обоснованные предположения о характере групп, об их, если хотите, смысле. То есть полностью и окончательно заменить учителя – выявить суть разведанных в результате самообучения данных и присвоить им названия. Больше того, таким способом даже можно открывать смыслы, для которых еще не было придумано названий.

Впоследствии мы поговорим о механизмах визуализации карт Кохонена, о программных продуктах, с помощью которых можно, например, владея только Microsoft Excel, получить настоящую учебную парту, позволяющую перейти от вербальных описаний к предельно простым и прозрачным реализациям. И, что главное, мы ознакомимся с реальными задачами из совершенно разных областей человеческой деятельности, в которых использование SOM позволило добиться немыслимых как для традиционных, «креативных», так и для классических строго математических подходов результатов.