огромные боевые человекоподобные нейронные сети
Оригинал взят у
klapauzius в огромные боевые человекоподобные нейронные сети
Наткнулся недавно в одной книге по нейронным сетям (Круглов В.В., Борисов В. В. Искусственные нейронные сети. Теория и практика. -2-е изд., М.: Горячая линия-Телеком, 2002.) на следующую задачу. Процитирую ее постановку:
Данная задача стала классической для демонстрации работы нейросетевого классификатора. Она компактна, значения всех обучающих параметров представляются в форме «Да-Нет», основана на реальных данных и дает хороший результат. Содержательная постановка задачи взята из книги: Горбань А. Н., Россиев Д. А. Нейронные сети на персональном компьютере. - Новосибирск: Наука, 1996.
Рассмотрим использование нейроимитатора на примере предсказания итогов выборов президента США.
На первый взгляд кажется, что итоги выборов зависит только от личностей кандидатов и от их программ. Однако и программы, и образы кандидатов создаются профессионалами. Оказывается, что если предвыборные компании всех кандидатов отработаны добросовестно и все участники сделали все возможное, то выбор практически предопределяется лишь объективными признаками сложившейся накануне выборов ситуации в стране. А кто победит, можно решать на основании ответов на следующие вопросы.
1) Правящая партия у власти более 1 срока?
2) Правящая партия получила больше 50 % на прошлых выборах?
3) В год выборов была активна третья партия?
4) Была серьезная конкуренция при выдвижении кандидата от правящей партии?
5) Кандидат от правящей партии был президентом в год выборов?
6) Был ли год выборов временем спада или депрессии?
7) Был ли рост среднего национального валового продукта на душу населения более 2,1%?
8) Произвел ли правящий президент существенные изменения в политике?
9) Во время правления были существенные социальные волнения'?
10) Администрация правящей партии виновна в серьезной ошибке или скандале?
11) Кандидат правящей партии - национальный герой?
12) Кандидат оппозиционной партии - национальный герой?
Далее в книге приведены ответы на все 12 вопросов по 31 случаю выборов президентов в США. Вплоть до случая Буш-старший / Клинтон.
Построенная ими (и мной) по этим данным нейронная сеть действительно с большой легкостью предсказывает победу Клинтону, ну и точность ее прогнозов превышает 96%.
И это поразительная точность, ведь,как я вчера узнал всем известно, что система выборов президентов США позволяет решать исход выборов деньгами, потраченными в малом количестве округов. Например, Калифорния заранее отдана Обаме, и политтехнологи на нее не обращают внимания.
Поэтому, считая количество денег и с той и с другой стороны бесконечным, мы приходим к асимптотическому поведению, где результат выборов - ничья или около того.
Даже проколы со стороны команды того или иного кандидата быстро компенсируются. Это система с обратной связью через опросы. Если политтехнологи видят, что был прокол и их кандидат теряет позиции - они прибавляют денег, выступлений, и т.п.
Более того в тех немногих округах в которых результат заранее неизвестен - не штатах а округах - городках, микрорайонах - технология позволяет построить профайл избирателя на которого можно надавить, и т.д. и т.п.
Короче, предсказать результаты выборов практически невозможно. А тут какая-товшивая нейронная сеть предсказывает результаты с очень высокой точностью.
Разумеется, я решил узнать, кто же победит на следующих выборах и поделиться тут со всеми этой информацией.
Я ответил на поставленные вопросы. Потом на всякий случай попросил ответить на эти вопросы еще одного человека, а чуть позже – другого (который, кстати, живет в США). Сегодня добавился четвертый отвечающий. И вот что получилось, из четырех человек, нельзя выбрать ни одной пары отвечавших, где ответы совпали хотя бы на 10 вопросов.
Из последующего обсуждения я произвольно повыдирал несколько фраз:
А маккейн не национальный герой разве? / измерение внп в долларах при падающем долларе - это полная профанация / ну и какие же изменения в политике произвел текущий президент? / а что 911 – это не волнения социальные? / да какие у маккейна были конкуренты - после первых же праймариз конкурентов у него перестало есть быть / 50% чего? если от способного голосовать населения то гадом буду – меньше
В общем, всем сразу стало ясно, в чем проблема подобных предсказаний. И проблема, очевидно, не в нейронных сетях.
Тут уж я копнул дальше. Использовал деревья классификации и выяснил, что значимыми являются лишь четыре вопроса. Остальные вообще можно выкинуть, при этом на точность прогноза их отсутствие не повлияет.
Первый и самый главный вопрос – четвертый (Была серьезная конкуренция при выдвижении кандидата от правящей партии?). Если ответом будет «нет», то задавать вопрос 12. Если на него будет ответ положительный, то победит оппозиция, при отрицательном – кандидат от правящей партии.
Если ответ на вопрос 4 - «да», то задаем 8-ой вопрос, при отрицательном ответе на который побеждает оппозиция, при положительном надо задать еще и 9-ый вопрос. При ответе да – победит оппозиция, нет – правящая партия.
Что в этом дереве, точно предсказывающем результаты практически всех предыдущих выборов, бросается в глаза? А то, что сюда не вошел ни один вопрос, ответ на который является однозначным для всех фактом. Остаются одни лишь «объективные признаки сложившейся накануне выборов ситуации в стране».
Если, при построении нейронной сети, убрать все вопросы, ответы к которым могут разниться в зависимости от отвечающего, то точность прогнозов новой нейронной сети и дерева классификации будет порядка 60% :)
А что представляют собой оставшиеся вопросы этого списка? Является ли Обама или Маккейн, например, национальными лидерами? Ну, для этого надо опросить население соединенных штатов. Т.е. по сути, провести те же выборы. Задним числом, то, конечно, мы сразу про них все поймем, а так же определим, была ли на самом деле тяжелая ситуация у Маккейна с выдвижением от партии власти :)
Получается, что заполняя исходную табличку с данными, автор этой задачи, в своих ответах невольно опирался на уже известные результаты выборов. Задача основана на «реальных данных», ага. Если даже ответы на эти вопросы были приведены в каких-нибудь исторических изысканиях, можно с уверенностью заявить, что они так же опирались на «реальные данные».
Когда же, наконец, включат отопление?
Данная задача стала классической для демонстрации работы нейросетевого классификатора. Она компактна, значения всех обучающих параметров представляются в форме «Да-Нет», основана на реальных данных и дает хороший результат. Содержательная постановка задачи взята из книги: Горбань А. Н., Россиев Д. А. Нейронные сети на персональном компьютере. - Новосибирск: Наука, 1996.
Рассмотрим использование нейроимитатора на примере предсказания итогов выборов президента США.
На первый взгляд кажется, что итоги выборов зависит только от личностей кандидатов и от их программ. Однако и программы, и образы кандидатов создаются профессионалами. Оказывается, что если предвыборные компании всех кандидатов отработаны добросовестно и все участники сделали все возможное, то выбор практически предопределяется лишь объективными признаками сложившейся накануне выборов ситуации в стране. А кто победит, можно решать на основании ответов на следующие вопросы.
1) Правящая партия у власти более 1 срока?
2) Правящая партия получила больше 50 % на прошлых выборах?
3) В год выборов была активна третья партия?
4) Была серьезная конкуренция при выдвижении кандидата от правящей партии?
5) Кандидат от правящей партии был президентом в год выборов?
6) Был ли год выборов временем спада или депрессии?
7) Был ли рост среднего национального валового продукта на душу населения более 2,1%?
8) Произвел ли правящий президент существенные изменения в политике?
9) Во время правления были существенные социальные волнения'?
10) Администрация правящей партии виновна в серьезной ошибке или скандале?
11) Кандидат правящей партии - национальный герой?
12) Кандидат оппозиционной партии - национальный герой?
Далее в книге приведены ответы на все 12 вопросов по 31 случаю выборов президентов в США. Вплоть до случая Буш-старший / Клинтон.
Построенная ими (и мной) по этим данным нейронная сеть действительно с большой легкостью предсказывает победу Клинтону, ну и точность ее прогнозов превышает 96%.
И это поразительная точность, ведь,
Поэтому, считая количество денег и с той и с другой стороны бесконечным, мы приходим к асимптотическому поведению, где результат выборов - ничья или около того.
Даже проколы со стороны команды того или иного кандидата быстро компенсируются. Это система с обратной связью через опросы. Если политтехнологи видят, что был прокол и их кандидат теряет позиции - они прибавляют денег, выступлений, и т.п.
Более того в тех немногих округах в которых результат заранее неизвестен - не штатах а округах - городках, микрорайонах - технология позволяет построить профайл избирателя на которого можно надавить, и т.д. и т.п.
Короче, предсказать результаты выборов практически невозможно. А тут какая-то
Разумеется, я решил узнать, кто же победит на следующих выборах и поделиться тут со всеми этой информацией.
Я ответил на поставленные вопросы. Потом на всякий случай попросил ответить на эти вопросы еще одного человека, а чуть позже – другого (который, кстати, живет в США). Сегодня добавился четвертый отвечающий. И вот что получилось, из четырех человек, нельзя выбрать ни одной пары отвечавших, где ответы совпали хотя бы на 10 вопросов.
Из последующего обсуждения я произвольно повыдирал несколько фраз:
А маккейн не национальный герой разве? / измерение внп в долларах при падающем долларе - это полная профанация / ну и какие же изменения в политике произвел текущий президент? / а что 911 – это не волнения социальные? / да какие у маккейна были конкуренты - после первых же праймариз конкурентов у него перестало есть быть / 50% чего? если от способного голосовать населения то гадом буду – меньше
В общем, всем сразу стало ясно, в чем проблема подобных предсказаний. И проблема, очевидно, не в нейронных сетях.
Тут уж я копнул дальше. Использовал деревья классификации и выяснил, что значимыми являются лишь четыре вопроса. Остальные вообще можно выкинуть, при этом на точность прогноза их отсутствие не повлияет.
Первый и самый главный вопрос – четвертый (Была серьезная конкуренция при выдвижении кандидата от правящей партии?). Если ответом будет «нет», то задавать вопрос 12. Если на него будет ответ положительный, то победит оппозиция, при отрицательном – кандидат от правящей партии.
Если ответ на вопрос 4 - «да», то задаем 8-ой вопрос, при отрицательном ответе на который побеждает оппозиция, при положительном надо задать еще и 9-ый вопрос. При ответе да – победит оппозиция, нет – правящая партия.
Что в этом дереве, точно предсказывающем результаты практически всех предыдущих выборов, бросается в глаза? А то, что сюда не вошел ни один вопрос, ответ на который является однозначным для всех фактом. Остаются одни лишь «объективные признаки сложившейся накануне выборов ситуации в стране».
Если, при построении нейронной сети, убрать все вопросы, ответы к которым могут разниться в зависимости от отвечающего, то точность прогнозов новой нейронной сети и дерева классификации будет порядка 60% :)
А что представляют собой оставшиеся вопросы этого списка? Является ли Обама или Маккейн, например, национальными лидерами? Ну, для этого надо опросить население соединенных штатов. Т.е. по сути, провести те же выборы. Задним числом, то, конечно, мы сразу про них все поймем, а так же определим, была ли на самом деле тяжелая ситуация у Маккейна с выдвижением от партии власти :)
Получается, что заполняя исходную табличку с данными, автор этой задачи, в своих ответах невольно опирался на уже известные результаты выборов. Задача основана на «реальных данных», ага. Если даже ответы на эти вопросы были приведены в каких-нибудь исторических изысканиях, можно с уверенностью заявить, что они так же опирались на «реальные данные».
Когда же, наконец, включат отопление?