Knowledge and its Representation in the Computer Era
Table of contents
Share
Metrics
Knowledge and its Representation in the Computer Era
Annotation
PII
S023620070005953-5-1
DOI
10.31857/S023620070005953-5
Publication type
Review
Status
Published
Authors
Sergei P. Kovalyov 
Occupation: Leading research fellow
Affiliation: RAS Institute of Control Sciences
Address: 65 Profsoyuznaya Str., Moscow 117997, Russian Federation
Andrei V. Rodin
Occupation: Senior research fellow
Affiliation: RAS Institute of Philosophy
Address: 12/1 Goncharnaya Str., Moscow 109240, Russian Federation
Pages
94-112
Abstract

Knowledge Representation (KR) is a research area at the borderline between Computer Science and Philosophical Epistemology. Technically KR can be described as a division of Artificial Intelligence focused on prospective information and communication technologies aiming at the efficient use of large data sets.  On the other hand, knowledge and its representation is a central theme of philosophical reflection and analysis; this remark concerns not only the traditional philosophy but also the Analytic philosophy of the 20th century, which essentially uses formal logical methods.  The participants discussed new epistemic practices made possible by new computer-based technologies of knowledge representation.

Keywords
knowledge representation, artificial intelligence, neural networks, ontologies, expert knowledge
Received
23.07.2019
Date of publication
30.07.2019
Number of purchasers
37
Views
512
Readers community rating
0.0 (0 votes)
Cite Download pdf 100 RUB / 1.0 SU

To download PDF you should sign in

Full text is available to subscribers only
Subscribe right now
Only article and additional services
Whole issue and additional services
All issues and additional services for 2019
1 Ю.В. Синеокая. Дорогие друзья, сегодняшний диалог из цикла “Реплики”, совместного проекта Института философии РАН и библиотеки им. Ф.М. Достоевского «Анатомия философии: как работает текст» будет посвящен проблеме современного представления знаний. Философ-эпистемолог А.В. Родин и эксперт в области компьютерного представления знаний С.П. Ковалёв обсудят важнейший феномен конца ХХ столетия: массовое распространение вычислительной техники и создание глобальной информационной сети. В чем заключается смысл и каковы будут последствия этого нового шага в развитии информационных технологий? Речь пойдет о существующих и перспективных технологиях компьютерного представления знаний, о новых возможностях, которые эти технологии дают для познания и для практических нужд.
2 А.В. Родин. Знание является предметом исследования для философской дисциплины эпистемологии. Понятие представления знаний указывает на формальный и материальный аспекты знания. Компьютерная революция последних десятилетий затрагивает оба этих аспекта и заставляет серьезно переосмыслить многие привычные эпистемические практики. Я начну с материального аспекта проблемы, а потом немного скажу о формальном.
3 По крайней мере, для людей моего поколения самым привычным материальным носителем знаний является книга и другие виды печатных текстов. Но представление, что печатные тексты — это некие сосуды, содержащие своего рода нематериальную субстанцию, которую мы называем знанием, конечно, очень наивно. Книгами мы называем не просто материальные объекты, обладающие определенными физическими характеристиками, а объекты, которые мы определенным образом используем. Подобным образом устроены такие обиходные понятия как «молоток», «посуда» и многие другие. Знание не «содержится» в книгах в буквальном смысле; скорее можно сказать, что книга — это инструмент вроде молотка, который используется в сложном социальном процессе, включающем в себя обучение, исследования, проверку, распространение, применение и другие эпистемические (связанные со знаниями) процедуры. Книги используются и для других целей, которые не связаны напрямую со знаниями — в частности, для эстетических целей; но такие способы использования книг мы в этом разговоре оставим в стороне.
4 Чтобы понять, каким образом знания представлены в книгах, нужно прежде всего обратить внимание на то, как люди пользуются книгами. Здесь я имею в виду не только индивидуальные практики чтения и написания книг, но и социальные практики и институты, такие, как издательства, редакционные коллегии, научные и учебные библиотеки, исследовательские институты. Хотя базовые характеристики всей этой сложной инфраструктуры определяются многими факторами, технологические факторы, связанные с книгопечатанием, играют большую роль и накладывают определенные ограничения на возможные инфраструктурные решения. Наши привычные образовательные, исследовательские и просветительские институты (в частности, публичные библиотеки) приспособлены именно для работы с книгами и другими печатными текстами. С книжной культурой, по-видимому, тесно связано и традиционное деление знаний на различные разделы и дисциплины, которое отражается в институциональных делениях между факультетами университетов и между различными академическими специальностями. Я, конечно, не утверждаю, что особенности технологии книгопечатания полностью определяют дисциплинарную и институциональную структуру традиционных образовательных и исследовательских институтов. Но в рамках такой традиционной институциональной структуры эпистемические задачи решаются именно с помощью книг и других печатных текстов, и этот материальный аспект традиционной эпистемической практики нельзя игнорировать.
5 Но в какой степени традиционные эпистемические институты позволяют нам реализовать новые возможности, открываемые компьютерными технологиями? Я говорю сейчас только о таких возможностях, реализация которых способствует достижению эпистемических целей. Вопрос о том, каковы именно эти цели, и сам заслуживает обсуждения в каждом конкретном случае. Я не думаю, что всякая новая технология требует повсеместного внедрения только потому, что она новая. Однако нетрудно найти примеры того, как компьютерные технологии помогают эффективнее достигать таких общепризнанных эпистемических целей, как обеспечение массового открытого доступ к существующим знаниям и обеспечение обмена знаниями между экспертами разного профиля. Наверняка не все согласны с тем, что открытой доступ к знаниям любого рода является желательным, но я сейчас не буду начинать дискуссию по этому вопросу и приму тезис о желательности такого доступа в качестве рабочей гипотезы.
6 Для ученого-гуманитария вроде меня самая очевидная польза компьютера и интернета состоит в том, что они позволят делать привычные нам вещи более эффективно, то есть с меньшими усилиями. Я имею в виду создание, редактирование, публикацию, распространение и обмен текстами в электронной форме. И хотя за эти преимущества приходится платить временем и усилиями на приобретение компьютерной грамотности, эти усилия очень быстро окупаются.
7 На первый взгляд, в подобных случаях новые технологии не приносят ничего существенно нового и ничем не угрожают привычным институтам и практикам: мы делаем то же, что делали и в докомпьютерную эпоху, только тратим меньше времени на техническую рутину вроде переписывания и перепечатывания черновых вариантов текста, выписывания цитат из книг в читальном зале и проч. Однако это только на первый взгляд. Википедию нельзя назвать академическим проектом, но она на сегодняшний день является очень эффективным инструментом для представления и распространения знаний. Главное отличие Вики от традиционных бумажных энциклопедий в том, что у нее нет ни главного редактора, ни редакционной коллегии, ни специально отобранной группы авторов: роль авторов и редакторов выполняют активные пользователи. Администрация Вики минимальна (главная ее задача — борьба со злонамеренным вандализмом, а не контроль качества статей) и по большей части также состоит из волонтеров. Ничего подобного невозможно было бы организовать, используя традиционную бумажную технологию представления знаний.
8 Таким образом, Вики — это пример того, как развитие материальной базы технологий представления знаний приводит к возникновению новых социальных форм эпистемических практик. Другим таким примером является бурное развитие т.н. массовых открытых онлайновых курсов (Massive Open Online Courses – MOOC), которое, по всей видимости, обещает очень существенно видоизменить существующие сегодня образовательные институты, в первую очередь университеты, обеспечив доступ к качественному образованию миллионам и миллиардам молодых людей из бедных стран.
9 Разумеется, новые электронные технологии представления и распространения знаний не только открывают новые возможности, но и ставят новые проблемы. Скажу только об одной такой проблеме, которой, на мой взгляд, пока не уделяют достаточно внимания. Что будет с нашими электронными публикациями через 50, 100 и 500 лет? В наших библиотеках есть книги и рукописи, появившиеся на свет в разное время. Ответственность библиотекарей перед будущими поколениями состоит в том, чтобы в последующие века и эпохи все эти тексты, включая самые старые, оставались по-прежнему доступны в неизменном виде. Важно сохранить и передать в пользование потомкам не только сами тексты, перенесенные на новый носитель, но и материальные артефакты: старые книги и рукописи. Дело не только в романтических эмоциях, которые многие испытывают, прикасаясь к старым предметам, но и в том, что материальные артефакты представляют собой самые надежные исторические свидетельства времени, места и других обстоятельств собственного происхождения, которые можно проверить с помощью радиоизотопного анализа и других объективных методов. Как подобная задача может и должна решаться в случае электронных текстов и других медиа (аудио-и видеозаписей), остается неясным. У человечества пока нет такого опыта. Существующие технологии позволяют хранить большие объемы информации в компактном виде, но вопрос о том, насколько такое хранение является надежным на исторических временах порядка столетий, остается пока открытым1. Под надежностью хранения информации в этом случае нужно понимать не только идентичность во времени последовательностей битов на подходящем для этих целей носителе, но и какие-то гарантии того, что ключи к расшифровке и правильной интерпретации этих последовательностей не будут утеряны в ходе последующих технологических революций и возможных исторических катаклизмов.
1. Проект, направленный на решение этой проблемы, осуществляется в настоящее время под эгидой Российского фонда перспективных исследований в лаборатории лазерного наноструктурирования стекла Российского химико-технологического университета им. Менделеева под руководством профессора Владимира Сигаева. Сайт проекта: >>>>
10 Возможность легко исправлять и заново переписывать тексты, которую предоставляют нам компьютерные технологии, не во всех ситуациях оказывается эпистемическим преимуществом. Я, тем не менее, думаю, что в будущем найдутся технические решения, которые позволят сочетать простоту ревизии знаний с надежностью их сохранения и таким образом облегчат работу будущим поколениям историков.
11 До сих пор мы говорили о знаниях, представленных в традиционной текстовой форме на том или ином естественном языке, возможно, расширенном специальным профессиональным жаргоном, символьными обозначениями, подобными тем, что используются в математике, а также чертежами и другими изображениями. Однако значение современных информационных технологий для представления знаний состоит не только в возможностях эффективно создавать, копировать и распространять традиционные тексты. Компьютерные технологии дают также широкие возможности для развития новых форматов представления знаний, включая создание специально предназначенных для этой цели искусственных языков. Здесь мы касаемся темы «представления знаний» в более специальном и техническом смысле слова: в компьютерных науках так называют специальную область исследований по Искусственному Интеллекту (ИИ), в которой рассматривается теория программных средств для представления знаний. Такие средства уже используются в некоторых областях техники. Но и в этой специальной сфере важную роль может играть эпистемологическая экспертиза.
12 Базовый элемент Представления Знаний (ПЗ) — это спецификация онтологии (это тоже термин, используемый в компьютерных науках, а не только в философии!), то есть спецификация основных типов объектов данной области знаний, отношений между объектами, правил и аксиом, регулирующих объекты и отношения, и, возможно, других подобных принципов и элементов. Для задач ПЗ важно, чтобы онтология данной области знаний была сформулирована не просто в общих словах на естественном языке, но и формально, с использованием символьного логико-математического формализма, который далее сможет быть реализован в программном коде.
13 Слушатели, знакомые хотя бы в общих чертах с аналитической философией ХХ века, сразу заметят, что использование одного и того же термина “онтология” в философии и компьютерных науках не случайно: начиная, по крайней мере, с “Философии логического атомизма” Рассела (1918), в рамках этой философской традиции ставились и по-разному решались задачи формального представления знаний. Сегодня формальная онтология — это та область, где философы, логики и специалисты в компьютерных науках активно сотрудничают. В числе пионеров такого сотрудничества со стороны философии можно назвать Барри Смита (Barry Smith) из университета Буффало.
14 Аналогично дело обстоит с формальной эпистемологией — более новой философской дисциплиной, которая пользуется формальными логическими методами для решения традиционных и новых эпистемологических проблем. Хотя связь между формальной философской логикой и работами по искусственному интеллекту и компьютерному представлению знаний кажется очевидной, на самом деле философски мотивированные логические схемы и конструкции очень редко можно применить на практике, реализуя их напрямую в виде программного кода. Дело в том, что философски мотивированная формальная логика в ХХ веке, как правило, не принимала в расчет ограниченность вычислительных ресурсов и ресурсов памяти, а ставила и решала свои проблемы “в принципе”, то есть с помощью сильных идеализаций. Исключением является конструктивное направление в логике, которое с самого начала было мотивировано идеей вычислительной реализации. Можно сказать, что в современных исследовательских работах в области ПЗ и в практических технологических проектах, относящихся к этой области, проверяются на практике многие теоретические идеи и подходы, ранее разработанные в рамках логически ориентированной аналитической онтологии и эпистемологии. Как обычно бывает в подобных случаях, практика оказывается во многих отношениях богаче теории и дает новый материал для теоретических построений и философских рефлексий.
15 Таким образом, исследование формальных аспектов представления знаний оказывается той областью, где философы и специалисты в области компьютерных наук могут продуктивно сотрудничать. Наш общий с Сергеем Ковалёвым проект “Логические и эпистемологические аспекты конструктивного знания”, поддержанный Российским государственным гуманитарным фондом, как раз может служить примером такого сотрудничества.
16 Хочу еще раз подчеркнуть, что социальные формы, в которых существуют человеческие знания, тесно связаны с форматами представлений этих знаний. Я уже говорил о значении книжных форматов для традиционных образовательных и исследовательских институтов, таких как школы, академии и университеты. Контуры новых институтов, адекватные новым формам представления знаний, только начинаются прорисовываться. Эту метафору не нужно понимать так, что речь идет о каком-то естественном процессе, за которым мы наблюдаем со стороны. Речь идет о социальном, техническом и научном прогрессе, в котором мы все тем или иным образом участвуем. Будущее наших институтов и наших технологий в той или иной мере зависит от усилий каждого из нас: даже когда мы выступаем только в роли потребителей, мы выбираем между разными сервисами, и совокупный эффект таких потребительских выборов благодаря экономическим и другим социальным механизмам может быть очень значительным. Именно поэтому важно обсуждать подобные вопросы публично. Я надеюсь, что наша сегодняшняя встреча поможет прийти к общему пониманию эпистемологических проблем и сюжетов, связанных с развитием информационных технологий.
17 С.П. Ковалёв. Многие вопросы, которые затронул Андрей, демонстрируют наличие одной крупной проблемы, которую я сейчас сформулирую. Проблема состоит в неконтролируемом количественном росте знаний. Современное состояние человечества отличается от исторического прошлого, в числе прочего, такими факторами, как увеличение численности людей, объема свободного времени, доступности образования, пропускной способности коммуникационных каналов. Все эти факторы способствуют повышению объема производства знаний. На протяжении всей истории люди считали, что чем больше у них знаний, тем лучше. Что мы имеем в итоге? Сегодня знания имеют тенденцию к размножению, к катастрофическому количественному росту, который, надо признать, во многих случаях влечет за собой рост качества знаний. Но при этом отсутствуют механизмы обратной связи, которые позволяли бы контролировать этот процесс и делать его целенаправленным, делать знания полезными в широком смысле этого слова. Эту ситуацию можно сравнить с попаданием кроликов в Австралию. В Европе у кроликов есть естественные враги, такие как волки и лисы, благодаря чему европейская популяция кроликов остается ограниченной. Когда кроликов в середине XIX века завезли в Австралию, где у них не оказалось естественных врагов, они начали катастрофически размножаться: их стало намного больше, чем людей, которые могли бы их истреблять и ими питаться. Это привело к экологической катастрофе в масштабах целого континента. Есть и другие примеры подобных экологических катастроф.
18 Ситуация во многих областях знания сегодня схожая. Имеются огромные объемы знаний, которые мало кто способен «переварить», оценить и, тем более, применить. Приведу пример из математики. Речь идет о классификации всех простых конечных групп — результате, который был получен группой из примерно 100 математиков (часть из них работала совместно, а часть — независимо друг от друга) и опубликован в виде нескольких сотен журнальных статей в период с 1950-х до начала 2000-х годов. Если сформулировать этот результат в виде одной теоремы, то ее доказательство займет около 15 000 печатных страниц математического текста [3]. Проблема состоит в том, что это доказательство могут понять едва ли несколько человек в мире, причем ни один из них не способен проверить все шаги этого доказательства. Несмотря на такие трудности, эти несколько человек договорились о том, чтобы признать данную классификацию конечных простых групп правильной. Можно согласиться с тем, что эта классификация — значительное достижение в области чистой математики. Но давайте спросим себя: зачем оно нужно? Если бы эту теорему можно было включить в обычный университетский учебник, то студенты, изучающие эту теорему, могли бы пытаться применить ее в новых компьютерных технологиях или где-то еще. Если бы эта теорема была доступна экспертам в разных областях знаний — будь то космология, археология или какая-то другая область, — они могли бы пытаться ее использовать для решения задач в своих специальных областях. Но в данном случае это, очевидно, невозможно. Как и в случае кроликов в Австралии, причина этой проблемы состоит, на мой взгляд, в отсутствии обратной связи, которая бы регулировала количество и полезность знания в соответствии с той или иной шкалой ценностей. При отсутствии такой обратной связи неконтролируемое развитие может иметь гораздо больше отрицательных и вредных последствий, чем положительных и полезных.
19 А.В. Родин. Я по старинке считаю, что “чем больше знаний, тем лучше”, и не считаю, что бурный рост количества знаний составляет какую-то проблему сам по себе. Другое дело, что существующие эпистемические институты и практики не справляются с таким быстрым ростом и нуждаются в модернизации и реформировании. Разумеется, ситуация, при которой математическая или любая другая научная теория доступна пониманию только небольшой группы экспертов, тогда как все остальное научное сообщество и другая публика вынуждена доверять этим экспертам, не имея никакой возможности проверить их суждения и выводы, не является нормальной. Она возвращает нас к донаучным, псевдо-научным и просто ненаучным формам знания, таким как “сакральное знание”, которое предполагает, что знаниями во всей полноте владеют только члены специальной касты жрецов, тогда как все другие члены общества могут пользоваться этими знаниями только под непосредственным руководством жрецов при условии безусловного признания их авторитета. Открытость и публичность — это фундаментальные характеристики именно научного знания, которую подчеркивали многие философы прошлого, включая, например, Фрэнсиса Бэкона. Мой общий энтузиазм по поводу эпистемологического значения новых компьютерных технологий связан именно с этим моментом: поскольку такие технологии обеспечивают знаниям большую публичность и открытость и дают дополнительные возможности для коммуникации, их следует считать благом для науки, несмотря на сопутствующие новые проблемы, с которыми мы при этом сталкиваемся и которые приходится решать.
20 Я также разделяю более специальную озабоченность, о которой сказал Сергей в связи с тем же примером: для прогресса науки и технологии имеет значение не просто доступность новых знаний широкой публике, но и доступность их экспертам разного профиля, которые могут использовать эти знания в областях своей компетенции. Такое “перекрестное опыление” между разными областями знания — важнейший механизм прогресса, который, конечно, перестает работать, когда какое-то знание оказывается доступным только узкой группе специалистов.
21 Я готов называть только что описанные проблемы “проблемами роста” или даже “проблемами взрывного роста” знаний, но не считаю, что их нужно решать с помощью какого-то регулирования и ограничения этого роста или с помощью подчинения научного прогресса каким-то внешним целям, которые позволят нам отличить полезное знание от бесполезного, ограничить рост знания и направить этот рост в нужное нам русло. Биологическая аналогия, которую использовал Сергей, на мой взгляд, применима только внутри науки или даже только внутри каждой отдельной узкой научной дисциплины. Конкуренция научных теорий и инженерных решений действительно играет важную роль в развитии любой области знания: каждая научная теория и каждая инженерная идея проходят проверку временем, конкурируя с альтернативными теориями и идеями; в этом отношении аналогия с дарвиновским “выживанием самых приспособленных” представляется уместной. Однако Сергей использует эту аналогию иначе, говоря о том, что процесс получения новых знаний (то есть познание) должен быть подчинен каким-то высшим целям социального и этического характера. Знания тут играют роль кроликов, а социальные цели — роль хищников, которые питаются этими кроликами. Я допускаю, что социальные интересы и этические принципы могут входить в конфликт с эпистемическими интересами в определенных ситуациях, но, на мой взгляд, отсюда не следует, что вторые должны быть подчинены первым. И я не знаю примеров из истории науки, когда конфликты такого рода были продуктивными. Их, на мой взгляд, лучше по возможности избегать.
22 Можно привести и прагматический аргумент в пользу автономии науки и против идеи регулировать развитие знаний ради каких бы то ни было внешних целей. Ситуация, когда знания, которые были получены под влиянием исключительно внутренних мотиваций (таких, как стремление ответить на открытый математический вопрос), впоследствии применяются на практике, например, в технике, и таким образом оказываются полезными, — это скорее правило, чем исключение. С позиции научного реализма объяснить такое положение вещей нетрудно: чтобы как-либо использовать знания в собственных интересах, нужно сначала разобраться с тем, как устроен мир, безотносительно к любым социальным и практическим интересам, включая общечеловеческие. Если бы наши знания о мире были всегда ограничены теми аспектами, которые непосредственно связаны с текущими практическими интересами самого исследователя или его социальной группы (в качестве упражнения рекомендую слушателям попробовать составить список подобных интересов для сообщества наших предков, живших в эпоху палеолита), — то такие знания не могли бы в принципе обеспечить технический и социальный прогресс человечества в том виде, в котором он наблюдался на протяжении последних веков и тысячелетий. Я сознаю, что отказ от прогресса тоже может быть продуманной позицией, но хочу подчеркнуть, как много тут ставится на карту.
23 Что касается примера математического доказательства длиной в 15 000 страниц, то с ним также связана проблема, о которой Сергей не упомянул. Если это доказательство способны понять лишь несколько человек в мире, и никто не способен его аккуратно проверить, то откуда у нас уверенность в том, что это доказательство не содержит ошибок? Почему мы должны считать эту теорему надежно установленным математическим результатом? Я думаю, что ключ к решению этой проблемы, а также многих других, о которых говорил Сергей, лежит в математической теории и связанной с этой теорией компьютерной технологии. В истории математики есть примеры того, как ранее построенные теории удавалось существенно упростить и таким образом сделать более доступными для всех заинтересованных людей с помощью аксиоматизации. Так случилось, например, с теорией топосов, которая сначала была построена в неформальном виде А. Гротендиком в конце 1950-х, а затем аксиоматизирована Б. Лавером в начале 1970-х. В наши дни профессор Принстонского института наш соотечественник Владимир Воеводский возглавляет проект, который он назвал «Унивалентные основания математики». Речь идет о создании стандартного формализма, позволяющего записывать математические доказательства в виде компьютерного кода и проверять корректность этих доказательств с помощью компьютера [1]. В настоящее время уже удалось формализовать таким образом доказательства ряда важных математических теорем, и вполне вероятно, что и у 15 000-страничного доказательства, о котором упомянул Сергей, также вскоре появится формальная компьютерная версия, допускающая такую проверку. Такой путь решения проблемы длинных доказательств и других аналогичных эпистемологических проблем мне кажется и более эффективным, и более оправданным с эпистемологической точки зрения, чем подчинение развития науки социальным ценностям или другим внешним регуляторам.
24 С.П. Ковалёв. С последним утверждением я согласен: регулирование в экологических системах, на которое я указал в качестве аналогии, также является внутренним, а не внешним. Но сейчас я хотел бы выйти за пределы круга тех проблем, которые мы обсуждаем сейчас. В развитии технологий представления знания существует «развилка», имеющая не только техническое, но и эпистемологическое значение: хотим ли мы с помощью компьютеров воспроизводить или имитировать только результаты человеческой деятельности по получению и обработке знаний или же мы хотим воспроизводить или имитировать также и те когнитивные механизмы, которые лежат в основе этой деятельности? Например, упоминавшиеся традиционные программные средства доказательства теорем воспроизводят готовые математические доказательства, но не когнитивные механизмы, которые позволяют математикам находить эти доказательства.
25 Однако в последние годы активно развивается альтернативный подход к компьютерному формированию и обработке знаний, основанный на идее имитации когнитивных механизмов, с помощью которых человек формирует и обрабатывает знания. Речь идет о так называемых искусственных нейронных сетях. Идея нейронной сети впервые была высказана уже более 70 лет назад. Состоит она в следующем. Нейрон человеческого мозга можно смоделировать на компьютере в виде простого элемента, имитирующего биологическую функцию раздражимости. На входы такого элемента поступают различные сигналы (скажем, электрические), и как только суммарный уровень поступающих сигналов превышает определенный порог, этот элемент, в свою очередь, выдает сигнал на выходе, то есть «откликается на раздражение». Далее такие элементы соединяются друг с другом таким образом, что выходные сигналы одних элементов подаются на входы других. Оказывается, что достаточно многокомпонентные и подходящим образом организованные системы подобного рода могут имитировать сложные функции мозга, такие как как распознавание образов. Допустим, у нас есть картинки. На некоторых из них изображены кошки, а на других — собаки. Если человека соответствующим образом проинструктировать, он может не реагировать на изображения кошек, а при предъявлении изображения собаки, например, поднимать руку. Такое поведение можно имитировать с помощью искусственной нейронной сети, состоящей из нескольких десятков или сотен нейронов, если ее соответствующим образом обучить. На входные нейроны сети нужно подавать цифровое представление изображения, а с выходных нейронов снимать сигнал ответа. Сеть в подавляющем большинстве случаев будет выдавать выходной сигнал при предъявлении изображения собаки и не выдавать такого сигнала при предъявлении изображения кошки. Процесс обучения нейронной сети выглядит следующим образом. Сначала мы разрешаем сети работать произвольно, то есть реагировать на предъявляемые изображения случайным образом. Далее собирается статистика, которая учитывает доли “правильных” и “ошибочных” реакций, и данные этой статистики используются для корректировки удельных весов соответствующих сигналов в связях между нейронами. После этого процесс повторяется. При правильно подобранных алгоритмах корректировки весов доля ошибок при последующих итерациях обучения будет снижаться. При достаточном числе итераций сеть начинает отличать кошек от собак с высокой степенью надежности. Все это кажется похожим на то, что происходит в более обычной ситуации, когда роль обучаемого играет не машина, а человек, которого хвалят за правильную реакцию и ругают за неправильную.
26 Первые лабораторные эксперименты с нейронными сетями были проведены более 50 лет назад. С помощью нейронных сетей исследователи пытаются, в частности, решать инженерные задачи, такие как распознавание свойств композиционных материалов на основе их структуры. Опытный машиностроитель может предсказать «на слух», сколько прослужит та или иная конструкция, постучав по ней молотком. Конечно, явно сформулировать какие-то формальные основания для своего суждения он не может. В начале 2000-х годов проводились эксперименты, в которых подобные компетенции удавалось до некоторой степени развить у компьютеров с помощью нейронных сетей. Однако прогресс тормозился недостатком компьютерных ресурсов — вычислительной мощности и памяти. Прорыв в этой области произошел в районе 2015 года, когда стали доступными графические ускорители и возникла возможность конструировать большие нейронные сети буквально на одном кристалле. Значительный прогресс в последние годы был достигнут и в области программного обеспечения, используемого при конструировании нейронных сетей. Сегодня нейронные сети уже умеют порождать осмысленные тексты на естественных и искусственных языках (включая языки программирования), распознавать тексты и речь, сочинять музыку и т. д. Такого рода примеров можно найти очень много, однако важно ответить, что весь этот прогресс до сих пор (по состоянию на 2016 год) практически не служит решению инженерных задач. Самая свежая работа, в которой предлагается использовать нейронные сети для предсказания свойств композиционных материалов, как ни странно, датируется примерно 2004 годом. Некоторые специалисты считают, что более новые работы в этой области просто засекречены в интересах военных ведомств, однако мне такое объяснение не представляется достаточным. Я вижу проблему в том, что, как правильно сказал Андрей, существует разрыв между традиционными математическими подходами в науке вообще и в материаловедении в частности, и новыми подходами, в нашем случае подходами, основанными на нейронных сетях. До сих пор в материаловедении доминирует старомодная идея, что свойства материалов можно наилучшим образом описать с помощью математических уравнений. Вычислительные подходы используются в первую очередь для того, чтобы решать (или в некоторых случаях порождать) эти уравнения. Таким образом, компьютер имитирует только результаты человеческой когнитивной деятельности. Идея же, что компьютерные технологии могут позволить имитировать также и сами когнитивные механизмы человека, как это уже делается в компьютерных нейронных сетях, до сих пор встречает значительное сопротивление.
27 А.В. Родин. Идея, что техника имитирует какие-то естественные процессы и их результаты, включая когнитивную деятельность человека и результаты такой деятельности, играет важную эвристическую роль в развитии техники, но ее значение все же не нужно преувеличивать. Такой технический инструмент, как молоток, ничего не имитирует, а, скорее, расширяет возможности человека по преобразованию окружающей среды. С компьютерной техникой дело обстоит аналогично. Существенный вопрос, на мой взгляд, состоит не в том, в какой степени искусственные нейронные сети имитируют результаты когнитивной деятельности человека и естественные когнитивные механизмы, а в том, в какой степени и каким именно образом эти когнитивные возможности расширяются за счет использования нейронных сетей и других новых компьютерных технологий.
28 С.П. Ковалёв. Я с этим согласен и могу привести пример ограниченности основанного на имитации подхода к нейронным сетям. Если в деталях знать алгоритмы, по которым происходит обучение нейронной сети, то натренированную сеть можно обмануть с помощью очень небольших и незаметных для человеческого глаза модификаций предъявляемых изображений, так что эта сеть будет принимать, например, кошку за страуса [2]. Это показывает, что системы, основанные на имитации нейронных связей, работают неустойчиво. Когда изображение анализирует человек, то наряду с биологическим механизмом, который, как можно предположить, функционирует подобным образом, важную роль играет понимание структуры изображения, расположения и связей между частями изображенного объекта. Так что я согласен, что попытки имитировать какую-то определенную биологическую функцию очень быстро себя исчерпывают и что самые интересные технические решения обычно ничего не имитируют, а имеют самостоятельную ценность. Вместе с тем хочу отметить, что в области представления знаний таких решений на сегодняшний день нет, так что они остаются делом будущего.
29 Ю.В. Синеокая. Спасибо. Теперь переходим к вопросам и репликам слушателей.
30 Вопрос из зала. Можно ли сказать, что в компьютерных системах представления знаний, знания всегда представляются в виде текстовых нарративов?
31 А.В. Родин. Я думаю, что нет. Тот способ представления знаний, о котором вы говорите, связан скорее с книжной эпохой, с идеей, что книга и текст на естественном языке — это универсальные инструменты для фиксации, сохранения и передачи любого рода знаний. На практике далеко не все виды знаний передавались таким способом: многие практические знания передавались и до сих пор передаются из рук в руки от более опытных людей к менее опытным. Письменные, да и вообще словесно сформулированные инструкции могут играть при этом какую-то роль, но всегда главную. В качестве примера можно привести знание того, как управлять автомобилем. Если же теперь посмотреть, что происходит со знаниями в электронных коммуникациях, то даже если оставить в стороне специальные вопросы, связанные с использованием искусственных программных языков для представления знаний, можно заметить существенные отличия от стандартного книжного формата. Как я уже говорил, хотя Википедия для пассивного пользователя выглядит как обычная бумажная энциклопедия, на самом деле она устроена совершенно иначе. Главное отличие, на которое я обращаю внимание, состоит в том, что Википедия — это постоянно обновляемая динамическая структура, которая задает иную динамику формирования, распространения и ревизии знаний по сравнению с обычными бумажными энциклопедиями. Если распечатать все страницы Википедии и опубликовать их в виде одного многотомного бумажного издания, то есть в виде большого нарратива, то такой бумажный вариант Википедии просто не сможет функционировать в прежнем виде, то есть существенные характеристики архитектуры Википедии окажутся утеряны. Если же принять во внимание более технические аспекты, о которых говорил Сергей, то таких отличий от традиционного книжного формата представления знания можно найти еще больше.
32 Вопрос из зала. Не считаете ли вы, что современный информационный коллапс связан с тем, что инженеры не обращают внимания на слова классиков, включая Колмогорова, Винера и Шеннона, подчеркивавших, что знания и информация — это не одно и то же. Возможно, проблема состоит в том, что это важное различие не учитывается в приложениях теории информации.
33 С.П. Ковалёв. В современных компьютерных технологиях теория информации почти не используется. Поэтому даже если она является некорректной, это не оказывает существенного влияния на разработку новых компьютерных технологий. Проблема, скорее, в том, что у нас, разработчиков компьютерных систем, на сегодняшний день для теории информации просто нет подходящей замены. Я имею в виду даже не обязательно математическую, но также и философскую теорию. Классическая наука индустриальной эпохи до Второй мировой войны вполне обходилась тем математическим и философским базисом, который заложили Ньютон, Лейбниц и другие классики. Это позволяло успешно развивать технику, используя результаты фундаментальных наук, прежде всего физики и химии. Однако начиная со Второй мировой войны нам пришлось иметь дело с более сложными техническими системами, включая информационные системы и сложные многокомпонентные материалы, чьи свойства и характеристики не описываются стандартными математическими средствами, такими как системы дифференциальных уравнений. Что касается технической стороны проблемы, то ее удается в какой-то степени решать за счет использования новых или во всяком случае непривычных для техники математических теорий, таких как теория графов или теория категорий. Более существенно, что в настоящее время не существует никакого общего философского представления о том, каким образом связаны между собой современные фундаментальные научные знания и их технические приложения. Такой философской теории нам, практикам в области создания информационных систем, катастрофически не хватает. Примерно в то же время, когда такой запрос был явно сформулирован, то есть в середине ХХ века, философия по каким-то причинам сфокусировала усилия на решении проблем совсем другого рода — с некоторыми исключениями, которые подтверждают это правило. Во всяком случае, мои попытки найти в современной философской литературе ответы на интересующие меня философские вопросы не дали никакого результата. На мой взгляд, это гораздо более серьезная проблема, чем возможные ошибки в стандартной теории информации.
34 Вопрос из зала. Можно провести аналогию между развитием знания и биологической эволюцией. Некоторые знания устаревают, появляются новые знания и так далее. Вопрос состоит в том, кто властен над этим процессом, как им можно управлять и как определить приоритетные направления развития. Или же этот процесс нужно предоставить самому себе?
35 А.В. Родин. Я согласен с этой биологической аналогией и думаю, что изучение эпистемических проблем в контексте биологии вообще и эволюционной теории в частности, может быть очень интересным и продуктивным. Если опираться на эту аналогию, то можно сказать, что знания, как и жизнь на нашей планете, регулируют сами себя и не нуждаются ни в каком внешнем контроле.
36 С.П. Ковалёв. Мой тезис о важности экологии знаний также опирается на эту биологическую аналогию.
37 А.В. Родин. Давайте попробуем немного развить эту аналогию, чтобы применить ее к вопросу о контроле и регулировании научных исследований и вообще процессу получения новых знаний. Поскольку мы, люди, являемся биологическим видом наряду с другими биологическими видами, населяющими нашу планету, мы, разумеется, влияем на ход биологической эволюции уже постольку, поскольку в ней участвуем: боремся за выживание и процветание нашего вида, как это делают и представители любых других биологических видов, включая тех из них, которые в эволюционном отношении находятся очень далеко от человека. Наши знания о мире и основанные на этих знаниях технологии, включая, в частности, генную инженерию, ставят нас в особое положение и позволяют влиять на развитие жизни на планете более глубоко и более эффективно, чем это могли делать наши предки. Однако те же самые научные знания о нашей планете, ее биосфере и наших собственных обществах дают нам и серьезные поводы опасаться, что непродуманное использование этой технологической мощи может легко привести наш вид, а может быть, и всю жизнь на планете, к катастрофе. Изучение такого рода обстоятельств и контекстов и является предметом экологии. Понятия регулирования и контроля играют в практических аспектах экологии важную роль, но нужно отдавать себе отчет, что в таких случаях речь идет не о полном контроле за ситуацией, а только об осмысленном принятии коллективных решений, последствия которых могут затрагивать состояние биосферы, а значит и коллективных человеческих интересов (формулировка которых также остается предметом дебатов).
38 Если теперь перейти к вопросу о контроле и регулировании научных исследований, то нужно прежде всего уточнить, что именно мы рассматриваем в качестве субъекта контроля, а что — в качестве объекта контроля. Во-первых, как я уже говорил, вопрос о приоритетных направлениях исследований решается внутри самого научного сообщества. В разных его стратах это происходит по-разному с использованием разных институциональных механизмов. Подобного рода решения могут иметь различную степень обязательности: часто речь идет просто о фактических приоритетах в выборе научных программ. Во-вторых, нужно, конечно, иметь в виду, что современная наука стоит больших денег, источником которых во многих случаях являются государственные и даже межгосударственные (как в случае Европейского Научного Фонда) бюджеты. Это важная, но не единственная причина, по которой научное сообщество не является полностью автономным и зависит от поддержки государств и других общественно-политических объединений. Если речь идет о государственном финансировании научных исследований, то научное сообщество, конечно, вынуждено каким-то образом объяснять свои цели всем налогоплательщикам. Впрочем, сказанное относится только к демократическим государствам, тогда как в государствах авторитарного типа для получения необходимого финансирования может быть достаточно убедить одного человека или небольшую группу людей. Как и в случае управления биологическими процессами, при этом нужно иметь в виду, что ни общество в целом, ни отдельный просвещенный диктатор не может в полном смысле слова «быть властным» над процессом получения новых знаний. Главным регулятором развития науки служит сама Природа, которая заставляет ученых отбрасывать некорректные теории, принимать более корректные и развивать с их помощью более эффективные технологии. Хотя вопрос о целях, для достижения которых нам служат наши технологии, относится уже к прагматическим и этическим аспектам техники и ее философии. Природа в таких случаях также играет роль регулятора: если мы, коллективное человечество, сильно промахнемся в постановке наших глобальных целей или даже если нам удастся поставить цели разумно, но мы не сможем их реализовать, то наш биологический вид может вскоре просто уйти с мировой сцены. Чтобы избежать этого трагического сценария или, по крайней мере, отодвинуть его на неопределенный срок, нам нужно, на мой взгляд, не пытаться поставить эволюцию жизни на планете и человеческую историю под чей-то безусловный контроль, а научиться ставить практические цели в соответствии с правильно сформулированным общими человеческими интересами и с человеческими возможностями, и достигать этих целей, используя все доступные технологические ресурсы. Условием для такого разумного и эффективного отношения к природе и человеку является понимание того, как устроен окружающий нас природный мир без учета специальных человеческих целей. Именно в этом состоит, на мой взгляд, фундаментальное значение естественных наук для человечества.
39 Ю.В. Синеокая. Благодарю наших блестящих докладчиков и до следующего четверга!

References

1. Rodin A. Axiomatic Method and Category Theory (Synthese Library, vol. 364). Cham: Springer, 2014.

2. Szegedy Ch., Zaremba W., Ilya Sutskever, Bruna J., Erhan D., Goodfellow Ia., and Fergus R. Intriguing properties of neural networks, URL: /arxiv.org/abs/1312.6199 (last revised 19 Feb 2014).

3. Weisstein, E.W. Classification Theorem of Finite Groups. URL: http://mathworld.wolfram.com/ClassificationTheoremofFiniteGroups.html

Comments

No posts found

Write a review
Translate