IPB
ЛогинПароль:

> Прочтите прежде чем задавать вопрос!

1. Заголовок темы должен быть информативным. В противном случае тема удаляется ...
2. Все тексты программ должны помещаться в теги [code=pas] ... [/code], либо быть опубликованы на нашем PasteBin в режиме вечного хранения.
3. Прежде чем задавать вопрос, см. "FAQ", если там не нашли ответа, воспользуйтесь ПОИСКОМ, возможно такую задачу уже решали!
4. Не предлагайте свои решения на других языках, кроме Паскаля (исключение - только с согласия модератора).
5. НЕ используйте форум для личного общения, все что не относится к обсуждению темы - на PM!
6. Одна тема - один вопрос (задача)
7. Проверяйте программы перед тем, как разместить их на форуме!!!
8. Спрашивайте и отвечайте четко и по существу!!!

 
 Ответить  Открыть новую тему 
> частотный словарь, запара
сообщение
Сообщение #1


Гость






вообще моя задача выглядит так:
На входе текстовый файл на языке логлан. Результат работы — алфавитно-частотный словарь лексем заданного текста. В полученном файле должно быть указано следующее: лексема, ее принадлежность к тому или иному грамматическому классу, частота лексемы, ранг.
Логлан — язык аналитического типа. Грамматических классов три: предикаты, имена, «грамматические слова». Предикаты характеризуются наличием стыка согласных, оканчиваются на гласную. Имена оканчиваются на согласный звук. «Грамматические слова» не имеют стыков согласных и обязательно оканчиваются на гласную. Гласные: a, e, i, o, u, y. Согласные: b, c, d, f, g, h, j, k, l, m, n, p, q, r, s, t, v, z.

например текст
Ne Rorlensia
Coi la Djeimz Djeninz
Na lepo mi pa hijra lo terkea guo, mi madzo ne sanbruci je li, Ae lo pucka ga kinci tu, lu. I, na lepa ckemo, le sinma ji nu namci liegei, Star Wars, gei ga mutce rornurfundi.
Zou, liu puckai, napa siftoa liu pucka, ja pa mela Nevesefon, purda.
Mi respli levi sanbruci vi le sensi fikco rizgru. I la Maik, ji fremi je mi, ganble lemi sanbruci, e kendiu le jursaa je sei. I Mai ze mi dislu lo nu balci lengu giazu.
Na le fucdei, mi godzi le terkea komta ci rizgru kruma. I, vi kei, ba tokri barta, e fu srite lemi nu sanbruci. Isui, le tokri barta ga fu srite ro notlenfoa je seo. I mi kacycea lepo ri, nei nursrisu, ikou su, nei nu kotlensri, iceci su, nei nu lensri le nersornumsio, iceci su, nei nu lensri le danse mrenu tojo smisrisio pe la Crrlak Holmz. Ibuo ro, nei nu lensri lo natra lengu. I leu natra lengu ga nu setpai lau lo junga, lo arba, lo polka, ro notbi. I ri le rizgrudjo pa kendiu su nei ri le terkea ge lengu galpai.
La Maik, pa mi hijra. I na lepo vizka mi guo, Mai cutse li, Tu tsedaspa ti! lu.

буду очень признательна даже на маленький намёк по концепции решения... а то моих знаний явно на хватает, а попытки приводят к ...
спасибо
 К началу страницы 
+ Ответить 
сообщение
Сообщение #2


Ищущий истину
******

Группа: Пользователи
Сообщений: 4 825
Пол: Мужской
Реальное имя: Олег

Репутация: -  45  +


Смысл задачи состоит в разборе читаемых строк.
Общий алгоритм таков:

1.читаем очередную строку.
2. разбираем ее на слова.
3. анализируем слова.

Это называется структурный метод решения задачи, а теперь разбьираем каждый пункт подробнее, подробнее, до тех пор, пока это можно будет описать в виде предложений на алгоритмическом языке Паскаль...


--------------------
Помогая друг другу, мы справимся с любыми трудностями!
"Не опускать крылья!" (С)
 Оффлайн  Профиль  PM 
 К началу страницы 
+ Ответить 
сообщение
Сообщение #3


Гость






Гость_annie
Ну Вы же все сами объяснили: в чем же проблема?

1. читаем след. слово из файла.
2. проверяем список уже обработанных лексем, если текущее слово находится там - идем на п.1, увеличив в таблице частот значание для текущей лексемы.
2. каждое слово проверяем на принадлежность тому или иному грамматическому классу (согласно приведенным критериям - проблемы быть не должно)...
3. увеличиваем количество (частоту) соответствующей лексемы (и заносим ее в список уже обработанных)
4. идем на п.1

как только файл закончился - распечатываем список обработанных лексем вместе с частотами в любом порядке (или в порядке прочтения, или по принадлежности к классу...)

p.s. кстати, что есть "ранг?"

Oleg_Z
Писали вместе lol.gif

Сообщение отредактировано: volvo -
 К началу страницы 
+ Ответить 
сообщение
Сообщение #4


Гость






чем выше частота лексемы, тем выше ранг, т.е. самая частая лексема д.б. первой в ранговом перечислении, но при этом слова пишутся по алфавиту. короче, я запуталась
 К началу страницы 
+ Ответить 
сообщение
Сообщение #5


Ищущий истину
******

Группа: Пользователи
Сообщений: 4 825
Пол: Мужской
Реальное имя: Олег

Репутация: -  45  +


Цитата
Писали вместе 

земтно :D
Я старался тебя обогнать (видимо печатаю медленне) поэтому менее раскрыто написал smile.gif :D :P

Цитата
короче, я запуталась

Давайте сначала.
1.Итак читаем стрку. (это мы умеем)
2. разбираем на слова (это тоже умеем, таких задач здесьрешено много).
3. Анализируем слова.
Все сводится к анализу слов!


--------------------
Помогая друг другу, мы справимся с любыми трудностями!
"Не опускать крылья!" (С)
 Оффлайн  Профиль  PM 
 К началу страницы 
+ Ответить 
сообщение
Сообщение #6


Гость






Гость_annie

:p2: Я тут набросал тестовую версию (с анализом строк на входе, но без сортировки на выходе). Дальше дело за Вами - сортируйте, как Вам нужно... Будут вопросы - пожалуйста ...


Прикрепленные файлы
Прикрепленный файл  LOGLAN.PAS ( 2.69 килобайт ) Кол-во скачиваний: 487
 К началу страницы 
+ Ответить 
сообщение
Сообщение #7


Новичок
*

Группа: Пользователи
Сообщений: 33
Пол: Мужской

Репутация: -  0  +


Я скачал файл LogLan.pas, но там отсутствуют комментарии к функциям и процедурам. Можно ли их сделать?
Что необходимо подать на вход и как увидеть результат.

Сообщение отредактировано: ProtasSoft -
 Оффлайн  Профиль  PM 
 К началу страницы 
+ Ответить 
сообщение
Сообщение #8


Гость






На вход (в текстовом файле LEXEMA.LGL) подается анализируемый текст (скопируй его из первого поста), а результат будет распечатан по окончании обработки файла. Комментарии не делал, т.к. все совершенно прозрачно...
 К началу страницы 
+ Ответить 
сообщение
Сообщение #9


Новичок
*

Группа: Пользователи
Сообщений: 33
Пол: Мужской

Репутация: -  0  +


unsure.gif
Можно все-таки расчитывать на прояснение прозрачности.
 Оффлайн  Профиль  PM 
 К началу страницы 
+ Ответить 
сообщение
Сообщение #10


Гость






Эх, вообще подобные задачи решаются с помощью n-нарных деревьев. Такой словарь в памяти в виде дерева занимает не больше 200Кб, а в файл заносится расшифрованное дерево, пройденное снизу вверх.

К чему здесь Эхи и Ахи? Хочется показаться умным? приведи код.
А пытаться себя так вот показать - первый признак невоспитаности!!!


Сообщение отредактировано: Oleg_Z -
 К началу страницы 
+ Ответить 

 Ответить  Открыть новую тему 
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0

 





- Текстовая версия 26.04.2024 6:38
500Gb HDD, 6Gb RAM, 2 Cores, 7 EUR в месяц — такие хостинги правда бывают
Связь с администрацией: bu_gen в домене octagram.name