Методики измерения интеллекта: сравнительный анализ исследовательских подходов


Научные исследования – это неисчерпаемый источник информации практически на любую тему, и в особенности это касается человеческого мышления. Благодаря стараниям ученых сегодня даже совершенно обычный человек может узнать о мозге и интеллекте то, что поможет ему становиться умнее, достигать успехов и расширять свои границы.

В нашей статье «Развитие мышления. Что делать, чтобы стать умнее» мы подробно говорили о том, для чего вообще нужно становиться умным, и даже приводили интересную статистику и научные данные. Однако имеющееся сегодня у человечества сведения до сих пор оставляют без ответа массу вопросов на тему того, как думает человек, что такое мысли, из чего складывается интеллект и т.д.

В нашем сегодняшнем материале мы хотим вкратце рассказать вам о десяти любопытных теориях о человеческом интеллекте, изучением которых занимаются ученые. Часть из них уже опровергнута, другая часть подвергается критике, но все же нельзя исключать, что в один прекрасный день специалисты найдут доказательства той или иной теории, после чего понимание интеллекта и его механизмов в корне поменяется.

Так или иначе, мы считаем, что эта информация может показаться интересной каждому, кто занимается саморазвитием и стремится стать умнее. Вполне возможно, после прочтения этой статьи у вас появятся какие-то новые идеи, которые вы сможете успешно использовать в своей жизни.

Последовательность рождения

Ученые уже не одно десятилетие пытаются понять, как последовательность рождения сказывается на том, что влияет на интеллект человека. Но в одном из последних исследований, проведенном Американской психологической ассоциацией, говорится, что между порядком рождения детей в семье и уровнем их интеллекта никакой прямой взаимосвязи нет.

Еще не так давно специалисты считали, что лучшие результаты в текстах на интеллект показывают именно первенцы. Объясняли они это отсутствием конкуренции за внимание и заботу родителей, что позволяет детям уделять больше времени на получение и усвоение новой информации. А дети, которые были рождены позже, по мнению ученых, испытывали дефицит родительской опеки и, как следствие, показывали на тестах уже не такие хорошие результаты.

Что же касается конкретно последнего исследования, то в нем сравнивали братьев и сестер, не касаясь при этом последовательности рождения. И удалось установить, что между порядком рождения и умственными характеристиками отсутствует какая-либо существенная взаимосвязь.

Тесты на интеллект

Тесты на IQ применяются, как правило, для оценки когнитивных способностей, коэффициента интеллекта и уровня достижений. Более всего распространены стандартные тесты на интеллект, например, тест SAT (Академический оценочный тест) и тест Стенфорд-Бине для одаренных детей. С помощью этих тестов оцениваются когнитивные навыки человека и сравниваются с показателями основной массы людей.

Подобные тесты популярны уже не один десяток лет и среди обычных людей, но, несмотря на это, сегодня они все больше подвергаются критике. Некоторые специалисты, например, убеждены, что в этих тестах присутствует определенное смещение по разным признакам: расовому, половому, культурному и социально-экономическому.

Подобные IQ-тесты основываются на уже неактуальных представлениях, что сила человеческого интеллекта является чем-то, что определяется при рождении и что не претерпевает серьезных изменений в течение жизни. Поэтому ученые, разделяющие мнение о предвзятости «старых» тестов, рекомендуют всем, кто их проходит, не относиться к получаемым результатам слишком серьезно.

V.МЕТОДИКИ ИССЛЕДОВАНИЯ ИНТЕЛЛЕКТА

Задача установления уровня интеллекта является одной из самых главных в психологии с момента оформления этой науки. Именно интеллектуальный показатель человека позволил охарактеризовать его психические и моральные качества. Установление количественных и качественных зависимостей этих показателей от уровня развития интеллекта позволил разработать разнообразные методики исследования интеллекта и связанных с ним качеств. Оценка интеллекта как специфической деятельности человека дала начало методикам подобно тесту Айзенка. Установление его структуры породило огромное количество тестов, исследуемых различные аспекты. Так появились тесты логического, образного, творческого и технического мышления. Тесно связанные с уровнем интеллекта оказались и тесты профессиональной пригодности. Более того, для получения должности государственного служащего США, претендент должен показать уровень IQ не ниже 100, а аттестация на получение профессиональной квалификационной категории предполагает, кроме демонстрации производственных навыков, прохождение целого комплекса подобных тестов.

В программу образования школ США и других развитых стран Европы включено использование методик проверки интеллекта в качестве оценочного, стимулирующего средства, вызывающего дополнительные мотивационные изменения. Таким образом, показатель интеллекта (не обязательно IQ) стал одним из важнейших показателей человеческой пригодности к той или иной деятельности, а в конечном итоге полезности человека как такового.

Следует различать тесты развития интеллекта и тесты интеллекта как такового. В первый, как правило, включены вопросы образовательного характера, стандартизированные задания с жесткой структурой. Эта группа методик предназначена для оценки образованности человека, скорости и качества его мышления, быстроты реакции и способности переключаться с одного вида деятельности на другой. Человек тестируется лишь как исполнитель, проверяется по стандартной шкале не имея возможности выделиться из общей схемы. Этого недостатка лишены методики второй группы, они определяют преобладающий тип мышления, методологию поиска решения поставленной задачи, не стандартность подхода, творческие способности, умения оперировать понятиями. Такие методы никогда не бывают жестко установленными, они составляются на основе креативных тестов, тестов интуитивного характера, где оцениваются не скорость, а манера решения той или иной задачи, уровень понятийных связей, нестандартность мышления, эффективность подхода. Однако для проведения массовой проверки подобные тесты не пригодны из-за своей сугубо индивидуальности, сложности оценки и больших затрат времени на обработку результата. В обще принятом понимании, проверка интеллекта сводится к решению одного или серии, тестов оценивающих общеобразовательный уровень человека, то есть тестов первой группы.

Методики исследования интеллекта грубо делятся на: экспериментальные, опросные и креативные (интуитивные).

Первые дают наиболее быстрый и четкий результат.

Вторые позволяют серию корелирующихся между собой данных, но чуть более сложны в обработке.

Третий тип вынесен в особый класс, является наиболее информативным, но представляет значительные трудности в обработке результата и его трактовки, более того результаты полученные с помощью этой группы методик не всегда явно связаны с аналогичными результатами другой группы.

Ниже будут приведены примеры из первой и второй группы для исследования взрослых. Чтобы избежать неоднозначных интерпретаций и большого теоретического обоснования.

Тесты Стэнфорд – Бинэ

Среди многих переводов и адаптации шкал Бинэ наиболее жизнеспособным оказался один из американских вариантов — Стэнфордская редакция.

Первый вариант редакции, подготовленный Терменом и его коллегами по Стэнфордскому университету в 1916 г., внес так много изменений и добавлений в первоисточник, что в сущности представлял собой новую шкалу. Именно в этом варианте был впервые использован коэффициент интеллектуальности (IQ), или отношение между умственным и хронологическим возрастом. Третья редакция Стэнфордской шкалы (1960) применяется и в настоящее время. Рассмотрим основные ее черты.

Тесты в ней сгруппированы по возрастным уровням: начиная с 2 лет до 5 они расположены с полугодовыми интервалами; для возрастов от 5 до 14 лет — годовые интервалы; оставшиеся уровни обозначены как средний взрослый и высший взрослый уровни (1, 2, 3). Интервалы между ними больше, чем один год.

Каждому испытуемому предъявляются только те задания, которые адресованы к его собственному возрастному уровню. Обычно процедура тестирования начинается с заданий, относящихся к более низкому уровню, чем ожидаемый умственный возраст испытуемого. Для испытуемого определяют тот уровень, на котором он справляется со всеми заданиями. Этот уровень называется основным возрастом. Затем тестирование продолжается до тех пор, пока не находят уровень, на котором во всех тестах испытуемый терпит неудачу. Этот уровень называется предельным возрастом. По достижении этого уровня тестирование заканчивается.

Обработка отдельных тестов шкалы Стэнфорд — Бинэ происходит по принципу всё или ничего. В руководстве для каждого теста устанавливается тот минимальный уровень исполнения, с которого тест считается выполненным. Умственный возраст субъекта в шкалах Стэнфорд — Бинэ находится путем приписывания ему его основного возраста и добавления к этому возрасту нескольких месяцев за каждый правильно решенный тест, находящийся выше базального уровня. Большинство тестов Стэнфорд — Бинэ непригодны для взрослых, так как характер заданий не позволяет достичь потолка возрастного уровня.

В первоначальном определении психологический тест был назван стандартизированным измерением, с достаточной степенью надежности.

Проблема валидности тестов Стэнфорд — Бинэ решается с разных сторон. Изучение заданий, предлагаемых в тестах, дает некоторую информацию в отношении их валидности. Содержание этих заданий расположено в диапазоне от простого манипулирования до абстрактного рассуждения. По мнению А. Анастази (1S72), можно утверждать, что Стэнфордская шкала валидна по содержанию, поскольку все изучаемые в ней функции релевантны тому, что обычно рассматривается как «ум».

Валидность, обозначаемая как релевантность внешнему критерию, определяется главным образом путем корреляций умственного уровня, полученного по шкале, с разнообразными показателями школьных достижений. Большинство этих корреляций, согласно литературным данным, расположены в диапазоне от 0,40 до 0,75.

Оценки по Стэнфордской шкале довольно высоко коррелируют также с обучаемостью в высших учебных заведениях (0,40-0,70).

Шкала Стэнфорд — Бинэ в течение многих лет служила единственным инструментом для измерения интеллектуальных способностей, а также использовалась в качестве критерия валидности новых интеллектуальных тестов. Этим в значительной степени объясняется тот факт, что IQ стал представляться символом интеллекта, а не показателем по определенному тесту.

Тест Векслера.

Еще один тип индивидуальных интеллектуальных тестов представлен шкалами интеллекта Векслера. Эти шкалы отличаются от тестов Стэнфорд — Бинэ некоторыми важными чертами, делающими их похожими по форме на групповые тесты. Другая характерная особенность шкал Векслера состоит во введении двух видов методик — вербальных тестов и тестов на исполнение (так называют задания невербального, действенного характера, например сложить фигуру из частей и т. д.).

Опубликованная в 1955 г. шкала Векслера для взрослых содержит 11 тестов. Шесть из них сгруппированы в вербальную шкалу и пять — в шкалу исполнения. В вербальную шкалу входят задания, требующие осведомленности в некоторых областях знания, задания на понимание (смысла пословиц, поведения в некоторых обстоятельствах и т. д.), арифметические задачи (в пределах начальной школы), нахождение сходства, определение словарного запаса, запоминание цифр. Шкала исполнения включает задания на завершение картинок, конструирование блоков (из кубиков), расположение картинок по порядку и некоторые другие.

Примеры заданий

1. Общая осведомленность.

2. Общее понимание.

3. Арифметическое рассуждение.

4. Цифры вперед и назад.

5. Сходство (Испытуемого просят рассказать о том, чем похожи следующие пары)

При выполнении тестов принимается в расчет как скорость, так и точность.

Тесты Векслера нормировались на выборке в 1700 человек (возраст от 16 до 64 лет). Средний IQ по выборе равен 100 при 10=15. Надежность тестов высока: для полной шкалы она составляет 0,97, для вербальных тестов — 0,96, для тестов исполнения — 0,94.

Данные о валидности шкалы Векслера получены отдельно для вербальных тестов и тестов исполнения. Корреляция оценок по тестам исполнения с успешностью деятельности канцелярских служащих равна 0,30, а корреляции показателей вербальных тестов с учебой в колледже не превышают 0,50. Помимо этого проверка по валидности осуществлялась путем корреляции шкал Векслера со шкалами Стэнфорд — Бинэ. Получены коэффициенты порядка 0,80 и ниже.

Тест Айзенка

Этот тест состоит из восьми субтестов, пять из которых предназначаются для оценки общего уровня интеллектуального развития человека, а три — для оценки степени развитости у него специальных способностей: математических, лингвистических и тех способностей, которые нужны в таких видах деятельности, где активно используется образно-логическое мышление.

Только при условии выполнения всех восьми субтестов можно дать полную оценку, как уровня общего интеллектуального развития человека, так и степени развитости у него специальных способностей.

На выполнение теста дается 30 минут в течении которого испытуемый должен отвечать на поставленные вопросы. Тестирование завершается по истечении указанного времени или при ответе на все 40 вопросов.

Ответы на задания состоят из одного числа, буквы или слова. Точки, в задании, обозначают количество букв в пропущенном слове. Например (….) означает, что пропущенное слово состоит из четырех букв. Ответ пишется в текстовой строке под заданием или вариантами ответа цифрами или прописными (маленькими) буквами кириллицы (русский алфавит). Испытуемому советуют не задерживаться слишком долго над одним заданием и помнить, что к концу серии задания становятся в общем сложнее.

В норме минимальный уровень IQ = 70, максимальный 180. Средний уровень IQ колеблится от 100 до 120 баллов. В компьютерных вариантах теста результат может быть предъявлен виде следующей таблицы:

Оценка уровня развития соответствующих способностей производится по общему числу правильно решенных за это время задач путем сравнения числа решенных задач с нормативными показателями, проводимыми далее в виде графиков.

График № 1 График № 2

Для оценки лингвистических способностей Для оценки математических способностей

Количество правильно решенных задач Количество правильно решенных задач

Найдя, пользуясь графиком, соответствующую точку на нижней оси, восстановив из нее перпендикуляр до пересечения с линией графика и далее опустив его из точки пересечения с линией графика и далее опустив его из точки пересечения на вертикальную ось, можно определить коэффициент интеллектуального развития испытуемого по данному виду мышления.

Стимульный материал по данному материалу широко представлен в литературе и Интернете в виде готовых программ тестирования.

4. Прогрессивные матрицы Равена*

В 1936 году Равеном совместно с Пенроузом был предложен тест Progressive Matrices для измерения уровня развития общего интеллекта. В основу заданий теста положены теория гештальта и теория интеллекта К. Спирмена. Предполагается, что испытуемый первоначально воспринимает задание как целое, затем выделяет закономерности изменения элементов образа, после чего выделенные элементы включаются в целостный образ, и находится недостающая часть изображения.

В качестве материала были выбраны абстрактные геометрические фигуры с рисунком, организованным определенным образом.

Сконструированы три основных варианта теста: 1) более простой, цветной тест, предназначенный для детей от 5 до 11 лет; 2) черно-белый вариант для детей и подростков от 8 до 14 лет и взрослых от 20 до 65 лет; 3) вариант теста, сконструированный в 1977 году Д. Равеном в сотрудничестве с Д. Кортом и предназначенный для лиц с высокими интеллектуальными достижениями; он включает в себя не только невербальную, но и вербальную части.

Тест проводится как с ограничением времени выполнения заданий, так и без ограничения.

Материал черно-белого варианта состоит из 60 матриц или композиции с пропущенным элементом.

Задания разделены на пять серей (A, B, C, D, E) по 12 однотипных, но возрастающих сложности матриц в каждой серии. Трудность заданий возрастает при переходе от серии к серии. Обследуемый должен выбрать не достающий элемент матрицы среди 6-8 предложенных вариантов. При необходимости первые 5 серий А обследуемый выполняет с помощью экспериментатора.

При разработке теста была сделана попытка реализовать принцип “прогрессивности”, заключающийся в том что выполнение предшествующих заданий из серий является как бы подготовкой испытуемого к выполнению последующих. Происходит обучение выполнению более трудных заданий. Каждая серия заданий составлена по определенным принципам.

Серия А. От обследуемого требуется дополнение недостающей части изображения, считается, что при работе с матрицами этой серии реализуется следующие мыслительные процессы: a) дифференциация основных элементов структуры и раскрытие связи между ними; б) идентификация недостающей части структуры и сличения ее с определенными образцами.

Серия B. Сводится к нахождению аналогии между двумя парами фигур. Обследуемый раскрывает этот принцип путем постепенной дифференциации элементов.

Серия С. задания этой серии содержит сложные изменения фигур в соответствие с принципом их непрерывного развития, обобщения по вертикале и горизонтали.

Серия D. Состоит по принципу перестановки фигур в матрице по горизонтальному и вертикальному направлениям.

Серия Е. Наиболее сложная. Процесс решений заданий в этой серии заключается в анализе фигур основного изображения и последующей “сборки” недостающей фигуры по частям (аналитико-синтетическая мыслительная деятельность).

Обработка полученных результатов проста. Каждое верное решение оценивается в 1 балл. Подчитывается общая сумма полученных баллов, а также число правильных решений в каждой из пяти серий. Первичные оценки по таблицам проводятся в соответствии с возрастными нормами в соответствии в процентили или станайты. Предусмотрена возможность перевода полученных результатов в IQ показатель.

Существенным этапом количественной обра­ботки результатов обследования с помощью Р.п.м.. является вычисление «индекса вариабельности». Индекс определяется исходя из таб­лиц распределения числа правильных решений в каждой из пяти серий. Варианты распределений решений в сериях были получены эмпирическим путем при анализе выполнения теста испытуе­мыми из выборки стандартизации. Варианты распределения по таблице определяются, а соответ­ствии с общей суммой баллов во всех сериях. Например, при общей оценке в 26 «сырых» баллов оценки по отдельным сериям распределяются следующим образом: А — 10; B—7; С — 5; D — 3; E — 1. Табличное распределение сравни­вается с полученным в конкретном случае, раз­ности ожидаемых и наличных оценок в каждой серии (без учета знака) суммируются. Получен­ная величина и является «индексом вариабельности». Нормальные значения индекса в пределах 0—4 свидетельствуют о достоверности результа­та исследования. При увеличении индекса до критических значений (7 и более) разные теста считаются недостоверными.

Сопоставление реального и ожидаемого рас­пределения числа правильных решений в сериях направлено на выявление испытуемых, выпол­нявших задание путем угадывания. Значение индекса вариабельности может оказаться значи­тельно выше критического в случае установки испытуемого симулировать низкий результат по тесту (демонстрация несостоятельности в решении самых простых задач).

Цветной вариант Р. п. м. состоит из трех серий — А, Ав, В по 12 матриц в каждой серии. Обработка полученных результатов такая же, как в черно-белом варианте Р. п. м. Оба вариан­та могут быть использованы как в качестве теста скорости (с ограничением времени выполнения заданий), так и теста результативности (без ограничения времени) (Дж. Равен, 1963).

Данные, полученные с помощью Р. л. м., хорошо согласуются с показателями других распространенных тестов общих способностей. Так коэффициенты корреляции между результатами теста (форма A B C D E) и wisc-r составляет 0.75-0.74: для испытуемых в возрасти 9-10 лет –0.91: Стенфорд – Бине умственного развития шкалы – 0.66: Выготского – Сахарова теста – 0.54. наиболее высока корреляция оценок Р.п.м. с группой арифметических тестов (0.74 – 0.87). Коэффициент надежности теста, по данных различных исследований, варьирует от 0.70 до 0.89. Средняя трудность заданий теста – 32.12%. показатель валидности прогностической теста – 0.72.

Коэффициент надежности теста, по денным различных исследований, варьирует от- 0.70 до 0.89. Средняя трудность заданий теста—32.12%. Показатель валидности прогностической теста (по связи с критериями успеваемости) — 0,72.

Существуют модификации Р. п. м. Одна из таких модификаций предложена автором (Дж. Равен в сотрудничестве с Д. Кортом, 1977. 1982). Оригинальный материал теста претерпел значительные изменения (усложнение задании, введение новых серии). Существенной особенностью является дополнение теста вербальной шкалой (Mill Hill Vocabulary Scales) что, по мнению разработчиков, в немалой мере способствует расширению области применения теста. Интересная модификация Р. п. м., а также процедуры обследования предложена югославскими психологами (3. Буяс, 1961). В этом случае предусмотрена дифференцированная форма оценки ответов обследуемую. От них требуется указать на три фрагмента из тех, которые предложены для восполнения матрицы: точно подходящей, подходящий более-менее и совершенно не подходящий. Это дает возможность качественной оценки резуль­татов, отпадает также необходимость в исполь­зовании индекса вариабельности — Р. п. м. бла­годаря простоте применения, валидности и надежности результатов, возможности группового обследования получили широкое распростране­ние в психодиагностике.

В отечественных исследованиях тест успешно используется при обследовании детей и взрослых (С. М. Морозов, 1979. 1990 и др.).

Тест Кеттела

Краниометрия

В 19 столетии ученые считали, что оценить интеллект человека можно, если измерить его череп и лицевую структуру. В самом начале развития этой теории французский хирург Поль Брока сделал и противоположное предположение: он считал, что на уровень интеллекта влияет величина отношения длины предплечья к длине плеча.

Ученый попытался доказать, что самая интеллектуально развитая раса – это раса белых людей, при этом основываясь лишь на длине руки, но у него это не получилось. Тогда он решил измерить череп и лицевые структуры для определения того, мозг какого объема способен поместиться внутри черепа того или иного человека. Данный способ показался ему более подходящим для оценки. Это и называлось краниометрией.

Согласно краниометрии, чем крупнее кости черепа, тем больше и мозг, который в нем находится, а это значит, что человек обладает высоким интеллектом. Однако методика подвергалась постоянной критике: многие нашли в ней расовые предрассудки, а также указывали на отсутствие доказательной базы. В итоге в начале 20 века краниометрия прекратила свое существование как методика оценки интеллекта.

Но все же стоит заметить, что исследования в краниометрии поспособствовали нахождению мозговых речевых центров и выявлению концепций интеллектуального фактора, которые все мы сегодня знаем как коэффициент интеллекта.

Наследственность

Многие считают, что если ребенок рождается в семье умных родителей, значит, и он тоже будет умным, но так ли это? Часть исследований подтверждает это, а часть отрицает, но точно известно, что наследственность все же оказывает влияние на IQ человека.

Однако нельзя забывать и об окружающих условиях и о том, что в формировании интеллекта человека играет роль культура. А вот насчет генов интеллекта уверенно сказать ничего нельзя. Исследования в этой области говорят о том, что количество генов, ответственных за интеллект, может составлять и 40, и 80 процентов.

Ученые сегодня активно изучают как влияние на интеллект генов, так и влияние воспитания. Данная область еще только набирает обороты, а исследователи надеются, что соответствующие эксперименты помогут не только понять, как функционирует разум, но и лучше разобраться в тонкостях характера человека и его поведения, а также в особенностях психики.

При этом особое значение имеет тот факт, что на разум человека не влияет раса, а наследственность нельзя рассматривать в качестве единственного фактора, определяющего интеллектуальный потенциал.

Покажи мне, как ты умеешь двигаться (глубокие подделки и генеративные сети)

Пока что мы говорили о МО-моделях, предназначенных для распознавания: скажи мне, что изображено на картинке, скажи мне, что сказал человек. Но эти модели способны на большее – сегодняшние модели ГО можно использовать и для создания контента.
Это имеется в виду, когда люди рассказывают о deepfake – невероятно реалистичных поддельных видеороликах и изображениях, созданных с использованием ГО. Некоторое время назад один сотрудник немецкого телевидения вызвал обширную политическую дискуссию, создав поддельное видео, на котором министр финансов Греции показывал Германии средний палец. Для создания этого видео потребовалась команда редакторов, работавших для создания телепередачи, но в современном мире это может за несколько минут сделать любой человек с доступом к игровому компьютеру средней мощности.

Всё это довольно грустно, но не в этой области так мрачно – вверху показано моё любимое видео на тему этой технологии.

Эта команда создала модель, способная обработать видеоролик с танцевальными движениями одного человека и создать видео с другим человеком, повторяющим эти движения, волшебным образом выполняя их на уровне эксперта. Также интересно почитать сопутствующую этому научную работу.

Можно представить, что, используя все рассмотренные нами техники, возможно обучить сеть, получающую изображение танцора и сообщающую, где находятся его руки и ноги. А в таком случае, очевидно, на каком-то уровне сеть обучилась тому, как связывать пиксели в изображении с расположением конечностей человека. Учитывая то, что нейросеть – это просто данные, хранящиеся на компьютере, а не биологический мозг, должно быть возможно взять эти данные и пойти в обратную сторону – чтобы получить пиксели, соответствующие расположению конечностей.

Начните с сети, извлекающей позы из изображений людей

МО-модели, способные делать это, называются генеративными [англ. generate – порождать, производить, создавать / прим. перев.]. Все предыдущие рассмотренные нами модели называются дискриминационными [англ. discriminate – различать / прим. перев.]. Разницу между ними можно представить себе так: дискриминационная модель для кошек смотрит на фотографии и различает фото, содержащие кошек, и фото, где их нет. Генеративная модель создаёт изображения кошек на основе, допустим, описания того, какая это должна быть кошка.

Генеративные модели, «рисующие» изображения объектов, создаются при помощи тех же СНС-структур, что и модели, использующиеся для распознавания этих объектов. И эти модели можно обучать в основном так же, как и другие модели МО.

Однако хитрость заключается в том, чтобы придумать для их обучения «оценку». При обучении дискриминационной модели есть простой способ оценить правильность и неправильность ответа – типа, правильно ли сеть отличила собаку от кошки. Однако как оценить качество полученного рисунка кошки, или его точность?

И вот тут для человека, любящего теории заговоров и считающего, что мы все обречены, ситуация становится немного страшноватой. Видите ли, лучший из придуманных нами способов для обучения генеративных сетей заключается в том, чтобы не делать этого самостоятельно. Для этого мы просто используем другую нейросеть.

Эта технология называется генеративно-состязательная сеть, или ГСС. Вы заставляете две нейросети состязаться друг с другом: одна сеть пытается создавать подделки, к примеру, рисуя нового танцора на основе поз старого. Другая сеть обучена на поиск разницы между реальными и поддельными примерами с использованием кучи примеров реальных танцоров.

И две эти сети играют в состязательную игру. Отсюда и слово «состязательный» в названии. Генеративная сеть пытается делать убедительные подделки, а дискриминационная пытается понять, где подделка, а где реальная вещь.

В случае видеоролика с танцором в процессе обучения была создана отдельная дискриминационная сеть, выдававшая простые ответы да/нет. Она смотрела на изображение человека и на описание положения его конечностей, и решала, является ли изображение реальной фотографией или картинкой, нарисованной генеративной моделью.


ГСС заставляют две сети состязаться друг с другом: одна выдаёт «фейки», а другая пытается отличать фейк от оригинала


В итоговом рабочем процессе используется только генеративная модель, создающая нужные изображения

Во время повторяющихся раундов обучения модели становились всё лучше и лучше. Это похоже на состязание эксперта по ювелирным подделкам со специалистом по оценке – соревнуясь с сильным соперником, каждый из них становится сильнее и умнее. Наконец, когда работа моделей оказывается достаточно хорошей, можно взять генеративную модель и использовать её отдельно.

Генеративные модели после обучения могут оказаться очень полезными для создания контента. К примеру, они могут генерировать изображения лиц (которые можно использовать для обучения программ по распознаванию лиц), или фонов для видеоигр.

Чтобы всё это работало правильно, требуется большая работа по подстройкам и исправлениям, но по сути человек тут выступает в роли арбитра. Именно ИИ работают друг против друга, внося основные улучшения.

Первичный потенциал интеллекта

В начале 20 века американский психолог Луис Терстоун предположил, что интеллект состоит из семи компонентов. Эта теория существенно разнилась с бытовавшими в то время представлениями об интеллекте, согласно которым интеллект основывался на одном факторе (о том, что именно это за фактор, понятия не было).

По мнению Терстоуна, в число семи компонентов, на которых основывается интеллект, входили:

  • владение словом;
  • вербальное понимание;
  • скорость восприятия;
  • способность считать;
  • способность логически мыслить;
  • ассоциативная память;
  • пространственная визуализация.

Теория Терстоуна не смога пройти испытание временем, но его изыскания даже сегодня находят сторонников, особенно в области психометрии – науки, которая проводит количественные исследования психологических измерений.

Интеллект и пол

Все мы сегодня обращаем внимание на то, что мышление мужчин и женщин отличается, однако никаких фактов, которые бы подтверждали, что один пол умнее другого, все-таки нет. Хотя исследования в этой области сегодня очень популярны.

Ученным удалось определить два типа человеческого мозга. Мозг первого типа содержит в себе наибольшее количество серого вещества, отвечающего за обработку информации, а мозг второго типа содержит большее количество белого вещества – ткани, соединяющей серое вещество. Так вот исследования показывают, что в мозге мужчин в 6,5 раз больше серого вещества, а в мозге женщин в 10 раз больше белого.

Какие выводы можно сделать? Если говорить коротко, то преобладание того или иного типа мозговой ткани не влияет на производительность мозга. Разница лишь в том, что мужчины и женщины немного по-разному решают разные задачи и добиваются в этом разных результатов.

Глубокое обучение

Глубокое обучение – это машинное обучение, использующее модель определённого вида: глубокие нейросети.
Нейросети – это тип модели МО, использующей структуру, напоминающую нейроны в мозге, для вычислений и предсказаний. Нейроны в нейросетях организуются послойно: каждый слой выполняет набор простых вычислений и передаёт ответ следующему.

Послойная модель позволяет проводить более сложные вычисления. Простой сети с небольшим количеством слоёв нейронов достаточно для воспроизводства использовавшейся нами выше прямой или параболы. Глубокие нейросети – это нейросети с большим количеством слоёв, с десятками, или даже сотнями; отсюда и их название. С таким количеством слоёв можно создавать невероятно мощные модели.

Эта возможность – одна из основных причин огромной популярности глубоких нейросетей в последнее время. Они могут обучаться различным сложным вещам, не заставляя человека-исследователя определять какие-то правила, и это позволило нам создать алгоритмы, способные решать самые разные задачи, к которым раньше компьютеры не могли подступиться.

Однако в успех нейросетей сделал свой вклад и ещё один аспект: обучение.

«Память» модели – это набор числовых параметров, определяющий то, как она выдаёт ответы на задаваемые ей вопросы. Обучать модель – значит, подстраивать эти параметры так, чтобы модель выдавала наилучшие ответы из возможных.

В нашей модели с инжиром мы искали уравнение прямой. Это задача простой регрессии, и существуют формулы, которые дадут вам ответ за один шаг.

Простая нейросеть и глубокая нейросеть
С более сложными моделями всё не так просто. Прямую и параболу легко представить несколькими числами, но глубокая нейросеть может иметь миллионы параметров, а набор данных для её обучения также может состоять из миллионов примеров. Аналитического решения в один шаг не существует.

К счастью, существует один странный трюк: можно начать с плохой нейросети, а потом улучшать её при помощи постепенных подстроек.

Обучение модели МО таким способом похоже на проверку ученика при помощи тестов. Каждый раз мы получаем оценку, сравнивая то, какие ответы должны быть по мнению модели, с «правильными» ответами в обучающих данных. Затем мы проводим улучшение и запускаем проверку снова.

Как мы узнаем, какие параметры надо подстраивать, и насколько? У нейросетей есть такое прикольное свойство, когда для многих видов обучения можно не только получить оценку в тесте, но и подсчитать, насколько именно она изменится в ответ на изменение каждого параметра. Говоря математическим языком, оценка – это функция значения, и для большинства таких функций мы легко можем подсчитать градиент этой функции относительно пространства параметров.

Теперь мы точно знаем, в какую сторону надо подстраивать параметры для увеличения оценки, и можно подстраивать сеть последовательными шагами во всё лучших и лучших «направлениях», пока вы не дойдёте до точки, в которой уже ничего нельзя улучшить. Это часто называют восхождением на холм, поскольку это действительно похоже на движение вверх по холму: если постоянно двигаться вверх, в итоге попадёшь на вершину.


Видали? Вершина!

Благодаря этому нейросеть улучшать легко. Если ваша сеть обладает хорошей структурой, получив новые данные, вам не нужно начинать с нуля. Можно начать с имеющихся параметров, и заново обучиться на новых данных. Ваша сеть будет постепенно улучшаться. Наиболее видные из сегодняшних ИИ – от распознавания кошек на Facebook до технологий, которые (наверное) использует Amazon в магазинах без продавцов – построены на этом простом факте.

Это ключ ещё к одной причине, по которой ГО распространилось так быстро и так широко: восхождение на холм позволяет взять одну нейросеть, обученную какой-то задаче, и переобучить её на выполнение другой, но сходной. Если вы обучили ИИ хорошо распознавать кошек, эту сеть можно использовать для обучения ИИ, распознающего собак, или жирафов, без необходимости начинать с нуля. Начните с ИИ для кошек, оценивайте его по качеству распознавания собак, и потом забирайтесь на холм, улучшая сеть!

Поэтому в последние 5-6 лет произошло резкое улучшение возможностей ИИ. Несколько кусочков головоломки сложились синергетическим образом: интернет сгенерировал огромный объём данных, на котором можно учиться. Вычисления, особенно параллельные вычисления на графических процессорах сделали возможной обработку этих огромных наборов. Наконец, глубокие нейросети позволили воспользоваться преимуществами этих наборов и создать невероятно мощные модели МО.

И всё это означает, что некоторые вещи, бывшие ранее крайне сложными, теперь делать очень легко.

Общий интеллект

В нашей статье мы не можем не упомянуть об идее общего интеллекта, ведь на ней строятся многие теории, в том числе и теория, называемая фактором G. Научные исследования говорят о том, что есть общий интеллект, и он не зависит от результатов, показываемых каким-то одним человеком по сравнению с общей массой людей.

Обычно информация об особенностях работы человеческого интеллекта получается посредством психометрии. Но теперь есть инновационные методики, использование которых позволило ученым предположить, что в мозге есть особые отделы и нейронные связи, способствующие созданию общего интеллекта.

Эта теория продолжает активно изучаться, и вполне вероятно, что уже совсем скоро ученые смогут доказать, что биологическая основа есть как у индивидуального, так и у общечеловеческого интеллекта.

Множественный интеллект

Согласно теории множественного интеллекта, разум человека включает в себя целый набор разных типов интеллекта. Автор этой теории – американский психолог Говард Гарднер говорит, что интеллект – это способность к созданию и поддержанию ценностей, решению проблем и расширению своих знаний посредством решения этих проблем.

Ученый считает, что один уникальный интеллект каждого человека состоит из девяти типов интеллекта, среди которых:

  • пространственный интеллект;
  • музыкальный интеллект;
  • экзистенциальный интеллект;
  • внутриличностный интеллект;
  • межличностный интеллект;
  • кинестетический (телесный) интеллект;
  • лингвистический интеллект;
  • натуралистский интеллект;
  • математический (логический) интеллект.

Интересно то, что с момента разработки этой теории в 1983 году она, в отличие от многих других, так и не устарела и не была никем опровергнута. Но, конечно же, чтобы полностью ее подтвердить, требуется провести еще немало исследований и экспериментов.

Как превратить алгоритм в сверхскоростную пифию

В середине XX века количественная модель интеллекта нашла свое ответвление в идее нейронных сетей. Нейрофизиология рассматривает мозг как последовательность нейронов, связанных друг с другом синапсами и разветвленных в густую ретикулярную сеть. Нейроны передают друг другу информацию в виде биоэлектрических импульсов. А значит, в определенном важном смысле мозг — это компьютер, а принципы его работы в принципе такие же, как у ЭВМ.

Искусственные нейронные сети были придуманы кибернетиками. Связи между нейронами уподоблялись формальным связям в математической логике, а целый мозг — вычислительному устройству, компьютеру с распределенной архитектурой.

Нейрон — это базовая вычислительная единица, которая производит простейшие вычислительные операции над полученной информацией и передает ее далее своим «соседям». Многослойная нейронная сеть получает вводную информацию, производит над ней требуемые манипуляции и выводит полученный результат.

Сегодня нейросети используются для автоматического выполнения таких задач, как классификация (распределение данных по параметрам), предсказание (прогноз следующего шага на основе предыдущих), распознавание («считывания» определенных черт или паттернов). Согласитесь, эти задачи довольно похожи на то, что проверяется в психометрических тестах! «Умственные» способности нейросетей во многом аналогичны тем способностям, которые измеряются в тестах IQ, ведь оба явления основаны на общей интуиции: разумность может быть измерена и просчитана.

К примеру, в нейропсихологии иногда используется задача «n-назад» для оценки подвижного интеллекта. В ней испытуемому показывают ряд элементов — символов, изображений или звуков. Ему нужно определить, встречается ли определенный элемент в ряду n позиций назад. Задачу используют для «тренировки» определенных участков мозга, улучшения рабочей памяти и логического мышления. В то же время понятно, что с такой задачей неплохо справится нейросеть, если «накормить» ее достаточным объемом релевантных данных, на которых она научится выполнять эту задачу лучше, чем человек. Ее «кратковременная память» способна удержать в себе куда больше информации, чем скромные 5–7 ± 2 смысловых элементов у человека.

Можно провести аналогию между «слабым» ИИ и подвижным человеческим интеллектом — с одной стороны, и «сильным» ИИ и кристаллизовавшимся интеллектом — с другой.

Как считают философы, «слабый» ИИ способен имитировать отдельные когнитивные способности людей, решать познавательные задачи определенного узкого спектра лучше и эффективнее. Но в остальном он бессилен. Проще говоря, «слабый» ИИ — это синтетическая версия отдельных способностей подвижного интеллекта, он умеет строить логические гипотезы, умозаключать или видеть связи.

Это «аутичный» ИИ, ведь известно, что подвижный интеллект гипертрофирован у людей с расстройствами аутистического спектра. «Сильный» ИИ, напротив, во всей полноте воспроизводит человеческий опыт, способен к многопрофильному обучению, и этим аналогичен кристаллизовавшемуся интеллекту в психодиагностике. Чем дольше он живет и развивается, тем более сложным и разветвленным становится его опыт (а может быть, ему даже потребуется психоаналитик). Как видим, именно «сильный» ИИ, синтетическое сознание, может развить в себе такой интеллект.

Работа нейросетей подчинена алгоритмам — правилам рассуждения или действия. Многим алгоритмы знакомы по блок-схемам или графам на уроках информатики в школе. Порядок действий в них представлен наглядно и интерпретирует их так, чтобы их понимал человек.

Говоря более строго, алгоритм — это ограниченный набор инструкций по решению определенного рода задач. Ему следует определенная система, выполняющая поставленную задачу. Таким образом, следуя определенному набору правил, можно гарантированно достичь результата. Если что-то пошло не так, то проблема не в алгоритме, а его исполнителе — человеке или машине.

Если какую-то задачу можно разбить на простые пошаговые действия, то говорят, что она алгоритмизируема, то есть имеется пошаговая процедура ее разрешения. А раз алгоритмизированную задачу можно «загнать» в машину и обучить ее выполнять эту задачу быстрее и эффективнее, чем человек, то эта задача может быть автоматизирована.

Как говорил классик философии ИИ Джон Хогленд, если система действует, строго соблюдая алгоритм задачи, то ее действия могут быть автоматизированы. И речь идет не об узкоспециальных научно-технологических задачах, а об огромном поле возможностей. Например, ученые разработали нейронную сеть по имени Пифия, которая дешифрует надписи на античных артефактах и угадывает пропущенные слова или утраченные фрагменты текстов. Делает она это в целом куда успешнее и быстрее, чем эксперты-люди.

А такие масштабные инициативы, как Human Brain Project (Евросоюз) и Blue Brain Project (Швейцария и IBM), занимаются разработкой суперкомпьютерной инфраструктуры для точного виртуального моделирования человеческого мозга, проектированием нейроморфных вычислительных систем и их внедрением в управлении и автоматизируемой медицине. Это уже не что иное, как торжество количественного понимания интеллекта. Достаточно дополнить это тенденцией скачкообразного, энтропийного роста количества данных, обрабатываемых машинами на сверхвысоких скоростях, чтобы в самом деле задаться вопросом: неужели все эти машины уже мыслят, да еще и быстрее и лучше нас? Сейчас мы увидим, что на деле всё не так просто.

Tabula rasa

«Табула раса» (в переводе с латинского языка означает «чистая доска») – это теория, гласящая, что с рождения люди являются «чистыми умами». В течение многих столетий эта теория поддерживается психологами и философами. Предполагает же она, что в момент рождения ум человека пуст и свеж, обладает огромным потенциалом и ожидает наполнения жизненным опытом и эмоциями.

Как мы уже говорили, сегодня продолжаются активные споры о том, что же обладает наибольшим значением для интеллекта – воспитание или генетика, стоит ли считать человека исключительно творением природы или же окружающая среда играет большую роль?

В последние десятилетия было проведено немало исследований, в которых ученые изучали разлученных при рождении близнецов, ведь в них «содержится» один и тот же генетический материал, а среда, в которой они растут и развиваются, – различна. И, по мнению ученых, разум человека, как и другие его индивидуальные черты (например, все та же гендерная идентичность), является комбинацией наследуемых генов, получаемого опыта и влияния окружающей среды.

Неоднозначные метрики: в чем связь уровня IQ и расизма

Нейросеть, как и любая обучаемая машина, учится тому, что мы в нее заложили. Уже известны прецеденты, когда чат-бот научился у своих собеседников обсценной лексике и расизму, искусственный HR-специалист дискриминировал потенциальных сотрудников по гендерному признаку, а автоматическая система распознавания лиц «реагирует» только на белый цвет кожи.

Можно подумать, что это всего лишь курьезы и побочные эффекты новых технологий. Но сомнительный политический шлейф следует за психометрией и количественными моделями интеллекта уже достаточно давно.

Фрэнсис Гальтон, английский ученый и эрудит, вдохновлялся книгой «Происхождение видов» своего кузена Чарлза Дарвина. Его настолько впечатлили идеи наследственной изменчивости видов и выживания наиболее приспособленных, что он решил исследовать эти процессы в человеческой популяции.

В фокус внимания попал вопрос «наследственного гения» — одаренности и таланта. Он пытался создать научно выверенную количественную модель интеллекта, применимую к статистически большому количеству людей. Гальтон предположил, что умственные характеристики наследуются точно так же, как физические. А это значит, что у талантливого человека больше шансов родить и воспитать одаренного ребенка, чем у человека «обычного». Свои догадки он подкрепил статистическими выкладками и тщательным анализом биографий и генеалогий выдающихся личностей.

Он предложил целенаправленно использовать отбор в общественной организации. Так были бы созданы благоприятные условия для появления большего числа людей с высоким уровнем интеллекта и врожденными талантами и снижения числа «бесталанных» и «умственно отстающих». Свой метод улучшения человеческой породы он назвал евгеникой и активно внедрял ее в тогдашнее британское общество — например, сочетая свои идеи о наследственности интеллекта с антропометрией и краниометрией в криминалистике.

И этот эпизод далеко не единственный в перипетиях истории научного моделирования интеллекта. Уже совсем недавно, в середине 1990-х, американцы Ричард Херрнстайн и Чарльз Мюррей опубликовали монументальный труд «Колоколообразная кривая» (The Bell Curve) о зависимости между интеллектом, наследственностью и социальной средой. Они считали, что уровень интеллекта является определяющей характеристикой в социальном положении индивида.

Скандал вызвала глава книги, в которой они указывали на значимость расовых и этнических различий для статистического распределения уровня интеллекта в американском обществе. Авторы утверждали, что чернокожие люди в среднем обладают более низким интеллектом, чем белые, и говорили, что следует распределять ресурсы между более «одаренными» и «умными» людьми, чтобы создать «когнитивную элиту».

Критики были возмущены тем, с какой легкостью Херрнстайн и Мюррей перенесли искусственный конструкт измеряемого интеллекта на тех, кому в силу классовой, расовой или гендерной принадлежности было отказано в получении образования. Ведь в конечном счете показатель IQ отображает не уровень интеллекта «вообще», а уровень осведомленности в тех дисциплинах и мыслительных навыках, которые считает важными современный западный человек.

Критики этого исследования справедливо указывали на то, что в «узловых» моментах своей аргументации в пользу зависимости интеллекта, расы и класса Херрнстайн и Мюррей оказываются солидарны с оголтелыми расистами. Предлагаемые же ими политические рекомендации, в сущности, воспроизводили требования ограничить или квотировать представленность людей из различных социальных групп в политической иерархии.

С точки зрения методологии исследования здесь возникает еще и проблема курицы и яйца: считать ли низкий уровень IQ причиной или следствием низкого положения людей в социальной иерархии?

Очевидно, что это вопрос не биологических задатков и наследственной «одаренности», а экономического неравенства и дискриминации. К тому же в большинстве случаев зависимость между генами и IQ оказалась ложноположительной. А дискуссия вокруг этого исследования стала уроком о неоднозначности и опасности одностороннего некритического переноса естественнонаучных представлений о «природе человека» на острые социальные проблемы.

Когда Кеттел, Гальтон или Бине создавали свои версии метрик умственного развития, они ведь исследовали те модели интеллекта, которые усвоили сами, восприняв представления своего времени. Создав свои шкалы, они, по сути, спроецировали на подопытных эти штампы, наделив их статусом объективных истин о человеке.

А значит, нам следует задуматься над вопросом: нет ли зависимости между тем, как мы понимаем интеллект, и непредсказуемыми и странными последствиями в виде нейросетей-расистов или коллаборационистов с полицейским государством? Может быть, интеллект — это не только количественно определимая способность, но и что-то еще?

Философ Катрин Малабу обыгрывает смысловые оттенки английского слова “intelligence”. Одно из значений этого слова — разведка, которая объединяет стратегии и тактики слежки и шпионажа, техники и процедуры дознания, и насильственные методы получения признательных показаний. Стало быть, искусственные интеллектуальные системы — это, буквально, сообщники спецслужб, секретных и не очень, техническая инфраструктура общества слежения (surveillance society).

Можно представить себе мрачные картины в духе сериала «Черное зеркало», помноженные на расизм, сексизм и дискриминацию, чтобы задуматься над тем, не требует ли машинное обучение такой же этической осознанности, как и остальные разделы педагогики? Ведь машины учатся навыкам у нас, людей, накапливая и обрабатывая информацию о нас, выслеживая наши действия, подражая нам (а точнее — нашим представлениям об интеллекте). Тогда в самом деле автоматизированный количественный интеллект очень далек от подлинно человеческого интеллекта, он лишь моделирует западные представления о рациональности.

Триархическая теория интеллекта

Автором данной теории является американский психолог Роберт Стернберг. Разрабатывая ее, он пошел наперекор всем представлениям и предположениям об общем интеллекте и стандартных умственных способностях. Интеллект для ученого не был просто академическим фактором. Стернберг выдвинул гипотезу, что каждый человек обладает практическим интеллектом, существенно отличающимся от академического, но по значимости ему равноценным.

Триархическая теория интеллекта включает в себя три подтеории:

  • контекстуальная теория о взаимодействии интеллекта с опытом внешнего мира;
  • компонентная теория о связи интеллекта с внутренним миром;
  • эмпирическая теория о способности человека к адаптации к ситуациям и выполнению определенных задач.

Последняя подтеория подразделяется на два направления:

  • как человек справляется с новыми впечатлениями и задачами;
  • как человек справляется с хорошо известными впечатлениями и задачами.

Триархическая теория оказалась очень интересной, но у нее, конечно же, появились и критики. Они говорят, что она более похожа на описание набора практических навыков, необходимых человеку, нежели объясняет, как функционирует интеллект, а также, что Стернберг не в состоянии предоставить информацию, основанную на непосредственных наблюдениях.

Рейтинг
( 1 оценка, среднее 4 из 5 )
Понравилась статья? Поделиться с друзьями:
Для любых предложений по сайту: [email protected]