IPB
ЛогинПароль:

> Теория самообучающейся программы, на примере монополии
сообщение
Сообщение #1


Знаток
****

Группа: Пользователи
Сообщений: 346
Пол: Мужской
Реальное имя: Иван

Репутация: -  7  +


Вот, меня весьма заинтересовала идея Lappa , о написании кокой нибуть вариации монополии, с самообучающимся ИИ. Погуглил я на эту тему, но единственное что нашёл, это описание принципа роботы с крестиками-ноликами и много бредней про то что машины зохавают мир smile.gif
Поэтому и решил создать тему здесь, об самообучении ИИ в общем, и об монополии в частности.
Так вот, как я это представляю:
допустим в игре участтвуэт самообучающийся ИИ, и человек/жёстко заданый ИИ.
Весь процес самообучения происходит следующим образом (поправте или скоординируйте меня если неправ):
Человек/жёстко заданый ИИ делает ход, попадая на определённый участок(правила монополии я думаю всем известны smile.gif ему нужно определить что делать дальше - либо купить его либо пустить на аукцион. Этот выбор он делает исходя их жёстких формул, определяя степень "необходимости" для него этого участка, он учитывает его стоимость, наличие у него участков такогоже цвета, арендную плату, суму денег в наличии а также степень нужности этого участка для противника, а если противнику он некчему, то может сдать этот участок на аукцион(!) чтобы попробывать купить его подешевле. В это время самообучающийся ИИ следит за действиями человека/жёстко заданого ИИ, и у себя в памяти записывает ситуацию и решение опонента(допустим у него в памяти есть ячейка для каждого участка, и в соответствующую ячейку он записывает: суму денег которая была у опонента, кол-во участков, как других так и такогоже цвета, рентабельность участка, и т.д, ну и наконец решение которое принял его опонент) дальше если в игре самообучающийся ИИ попадёт на етот участок, он сравнит ту ситуацию что сейчас у него (суму денег друг участки, рентабельность), и те ситуации что были у его противника, что у него записаны, и выберет то решение которое противник принял в наиболее похожей ситуации (тоесть под ситуацией я подразумеваю економ состояние игрока).
Вот так и будет продолжаться игра, кроме того, самообучающийся ИИ будет записывать каждый раз когда его опонент заложит какой либо участок, или возьмёт зсуду в банке, и в случае возникновения похожей ситуации, будет поступать также, брать похожую зсуду, закладывать примерно равноценный участок.
Ставить дома и отели на своих участках он тоже будет только после того как "научиться " этого у опонента.

Хух, теперь о следуюющем smile.gif
После всего этого у меня возник ряд вопросов:
1) Всётаки монополия - это не крестики нолики, и каждая игра займёт время, такчто обучаться он будет медленно, в связи с этим появляеться необходимость сделать "автоматический режим " в игре, когда она будет играть сама з собой опр кол-во партий, чтобы достигнуть того или иного уровня знаний?
2) А вообще реально ли это зделать?, я имею в виду, не будет ли это всё занимать огромные обьёмы памяти, и не будет ли ИИ думать по 10 мин? ( прошу дать хоть приблизительную оценку, по даному алгоритму, потомучто мне самому очень тяжело об этом судить)
3) Правильно я уразумел алгоритм хотябы в общих чертах?

Очень прошу поправить меня там где неправ unsure.gif
И с удовольствием выслушаю другие идеи по поводу этой же темы, или алгоритма.
И вообще мне кажеться что всё это не очень сложно в реализации, сложности могут возникнуть лишь с интерфейсом, графикой, а в общих чертах алгоритм сравнительно прост, или я не прав?

З.Ы. Lappу +1 за идею (уж очень она мне понравилась smile.gif )

Сообщение отредактировано: RathaR -


--------------------
Считающий себя единственым здравомыслящим человеком сумасшедший? Если да, возможно я псих...
Пусть умолкнет всякий критик!
Я - системный аналитик!
 Оффлайн  Профиль  PM 
 К началу страницы 
+ Ответить 

Сообщений в этой теме
RathaR   Теория самообучающейся программы   1.08.2009 17:30
Lapp   +1 за идею (уж очень она мне понравилась :) )bltzИ…   2.08.2009 13:02
RathaR   эм...я,не сильно розбираюсь в теории графов, скаж…   2.08.2009 17:29
Lapp   эм...я,не сильно розбираюсь в теории графов, …   8.08.2009 5:28
RathaR   Я обещал "покумекать и написать" - вот,…   9.08.2009 3:19
Гость   > признателен что эта тема не канула в небытие …   9.08.2009 7:16
Lapp   Предыдущий пост мой. Странно, вроде я входил...   9.08.2009 7:24
RathaR   Я так понял что речь идёт о приоритетах при срав…   9.08.2009 16:17
andriano   1. Под обучением обычно понимается совсем не тот п…   14.09.2009 16:26
Lapp   1. Под обучением обычно понимается совсем не тот п…   15.09.2009 4:52
andriano   ...ходы ... победителя считаются хорошими, и их ве…   15.09.2009 21:36
Lapp   Ну, в частном случае может быть и так.Я и не говор…   16.09.2009 5:44
RathaR   [b]RathaR, ты следишь за темой? И как дела с тво…   16.09.2009 23:03
andriano   Я не спец в этой терминологии, но трудно согласить…   17.09.2009 21:30
Shuruper   Я представляю решение этой задачи путем анализа ош…   20.09.2009 23:35
Lapp   (гипотеза!)Гипотезы - это хорошо, но ты не ука…   21.09.2009 14:10
Shuruper   - вот с этого места, пожалуйста, поподробнее.. И…   21.09.2009 18:51
Lapp   файл может содержать все что угодно, начиная прост…   22.09.2009 4:54
andriano   Гипотезы - это хорошо, но ты не указал ни механиз…   22.09.2009 2:15
RathaR   По поводу самого алгоритма "300 коробков…   30.10.2009 19:34
Lapp   может существуют другие самообучающиеся алгоритмы,…   31.10.2009 5:13
andriano   Самообучение подразумевает обязательное наличие об…   31.10.2009 14:03
Lapp   пришло в голову любопытное соображение: в технике …   3.11.2009 12:42


 Ответить  Открыть новую тему 
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0

 





- Текстовая версия 25.04.2024 21:33
500Gb HDD, 6Gb RAM, 2 Cores, 7 EUR в месяц — такие хостинги правда бывают
Связь с администрацией: bu_gen в домене octagram.name