Теория самообучающейся программы - Форум «Всё о Паскале»

IPB

Правила форума :: Скачать Pascal :: FAQ // Ада–2020 :: Скачать GNAT :: OEM–2015 :: Ada -> C/C++

Помощь Регистрация Поиск

Теория самообучающейся программы, на примере монополии

RathaR	1.08.2009 17:30 Сообщение #1
Знаток Группа: Пользователи Сообщений: 346 Пол: Мужской Реальное имя: Иван Репутация: 7	Вот, меня весьма заинтересовала идея Lappa , о написании кокой нибуть вариации монополии, с самообучающимся ИИ. Погуглил я на эту тему, но единственное что нашёл, это описание принципа роботы с крестиками-ноликами и много бредней про то что машины зохавают мир Поэтому и решил создать тему здесь, об самообучении ИИ в общем, и об монополии в частности. Так вот, как я это представляю: допустим в игре участтвуэт самообучающийся ИИ, и человек/жёстко заданый ИИ. Весь процес самообучения происходит следующим образом (поправте или скоординируйте меня если неправ): Человек/жёстко заданый ИИ делает ход, попадая на определённый участок(правила монополии я думаю всем известны ему нужно определить что делать дальше - либо купить его либо пустить на аукцион. Этот выбор он делает исходя их жёстких формул, определяя степень "необходимости" для него этого участка, он учитывает его стоимость, наличие у него участков такогоже цвета, арендную плату, суму денег в наличии а также степень нужности этого участка для противника, а если противнику он некчему, то может сдать этот участок на аукцион(!) чтобы попробывать купить его подешевле. В это время самообучающийся ИИ следит за действиями человека/жёстко заданого ИИ, и у себя в памяти записывает ситуацию и решение опонента(допустим у него в памяти есть ячейка для каждого участка, и в соответствующую ячейку он записывает: суму денег которая была у опонента, кол-во участков, как других так и такогоже цвета, рентабельность участка, и т.д, ну и наконец решение которое принял его опонент) дальше если в игре самообучающийся ИИ попадёт на етот участок, он сравнит ту ситуацию что сейчас у него (суму денег друг участки, рентабельность), и те ситуации что были у его противника, что у него записаны, и выберет то решение которое противник принял в наиболее похожей ситуации (тоесть под ситуацией я подразумеваю економ состояние игрока). Вот так и будет продолжаться игра, кроме того, самообучающийся ИИ будет записывать каждый раз когда его опонент заложит какой либо участок, или возьмёт зсуду в банке, и в случае возникновения похожей ситуации, будет поступать также, брать похожую зсуду, закладывать примерно равноценный участок. Ставить дома и отели на своих участках он тоже будет только после того как "научиться " этого у опонента. Хух, теперь о следуюющем После всего этого у меня возник ряд вопросов: 1) Всётаки монополия - это не крестики нолики, и каждая игра займёт время, такчто обучаться он будет медленно, в связи с этим появляеться необходимость сделать "автоматический режим " в игре, когда она будет играть сама з собой опр кол-во партий, чтобы достигнуть того или иного уровня знаний? 2) А вообще реально ли это зделать?, я имею в виду, не будет ли это всё занимать огромные обьёмы памяти, и не будет ли ИИ думать по 10 мин? ( прошу дать хоть приблизительную оценку, по даному алгоритму, потомучто мне самому очень тяжело об этом судить) 3) Правильно я уразумел алгоритм хотябы в общих чертах? Очень прошу поправить меня там где неправ И с удовольствием выслушаю другие идеи по поводу этой же темы, или алгоритма. И вообще мне кажеться что всё это не очень сложно в реализации, сложности могут возникнуть лишь с интерфейсом, графикой, а в общих чертах алгоритм сравнительно прост, или я не прав? З.Ы. Lappу +1 за идею (уж очень она мне понравилась ) Сообщение отредактировано: RathaR - 1.08.2009 21:15 -------------------- Считающий себя единственым здравомыслящим человеком сумасшедший? Если да, возможно я псих... Пусть умолкнет всякий критик! Я - системный аналитик!

2 страниц

< 1 2

Ответить

Открыть новую тему

Ответов(20 - 22)

Lapp	31.10.2009 5:13 Сообщение #21
Уникум Группа: Пользователи Сообщений: 6 823 Пол: Мужской Реальное имя: Лопáрь (Андрей) Репутация: 159	Цитата(RathaR @ 30.10.2009 15:34) может существуют другие самообучающиеся алгоритмы, которые можна применять в играх?(без всяких нейронных сетей, чтото более-менее простое ), или же все последующие алгоритмы исходят из этого, тоесть кнута и пряника? Мне представляется, что другого метода не может быть в принципе. Точнее, все другие методы обучения предполагают наличие изначального интеллекта, который, в принципе, может представлять из себя программу, заменяющая эти самые кнут и пряник. Собственно, нейронные сети - тоже кнут и пряник. Почему тебе вдруг пришла в голову идея отказаться от такого действенного движителя прогресса? )) -------------------- я - ветер, я северный холодный ветер я час расставанья, я год возвращенья домой

andriano	31.10.2009 14:03 Сообщение #22
Гуру Группа: Пользователи Сообщений: 1 168 Пол: Мужской Реальное имя: Сергей Андрианов Репутация: 28	Самообучение подразумевает обязательное наличие обратной связи. Если эта послядняя и названа "кнутом и пряником", то - да, без нее никак. Собственно, любое обучение подразумевает наличие обратной связи, но без "само-" она может быть внешней. Кстати, тут пришло в голову любопытное соображение: в технике для обеспечения устойчивости используется отрицательная обратная связь, а при обучении НС, как правило, положительная. С чего бы это?

Lapp	3.11.2009 12:42 Сообщение #23
Уникум Группа: Пользователи Сообщений: 6 823 Пол: Мужской Реальное имя: Лопáрь (Андрей) Репутация: 159	Цитата(andriano @ 31.10.2009 10:03) пришло в голову любопытное соображение: в технике для обеспечения устойчивости используется отрицательная обратная связь, а при обучении НС, как правило, положительная. С чего бы это? Интересное наблюдение. Видимо, система, в которой нужно обеспечить устойчивость, можно назвать уже обученной, использующей набранные знания для определенной цели. Если на то пошло - есть еще один метод обучения: внешний ввод информации. Там система находится в безразличном состоянии: все, что от нее требуется - воспринимать информацию без проявления инициативы. Обратная связь - только контроль за выполнением. Результаты этого процесса мы все с вами хорошо знаем.. )) -------------------- я - ветер, я северный холодный ветер я час расставанья, я год возвращенья домой

« Предыдущая тема · Алгоритмы · Следующая тема »

2 страниц

< 1 2

Ответить

Открыть новую тему

2 чел. читают эту тему (гостей: 2, скрытых пользователей: 0)

Пользователей: 0

Режим отображения: Переключить на: Стандартный · Линейный · Переключить на: Древовидный

Подписка на тему · Сообщить другу · Версия для печати · Подписка на этот форум

Текстовая версия

20.05.2024 13:29

500Gb HDD, 6Gb RAM, 2 Cores, 7 EUR в месяц — такие хостинги правда бывают

Связь с администрацией: bu_gen в домене octagram.name