Версия для печати темы

Нажмите сюда для просмотра этой темы в обычном формате

Форум «Всё о Паскале» _ Задачи _ Сортировка большого кол-ва элементов.

Автор: iRish88 30.09.2007 19:28

День добрый.
Столкнулся с такой проблемой, нужно отсортировать 100000 (сто тысяч) элементов. В массив не лезет. Организовал работу с файлом (с 2-я, если быть точным) - работает очень медленно. Подумал на постоянные read/write, оптимизировал, считывает из файла сразу большое кол-во элементов в массив, сортирует, сливает в файл. Быстрее почти не стало. Я так понимаю такой варинт оптимизировать для работы со 100000 эл-ми не удастя...

В памяти сортировать тоже не получается, грешит на нехватку места. Поискал, увидел, что паскаль дает не больше 640 кб на всю программу.

Подскажите, какие есть варианты сортировки такой большой штуковины?

Спасибо.

Автор: volvo 30.09.2007 19:33

100000 элементов какого типа?

Автор: мисс_граффити 30.09.2007 19:54

внешние сортировки....
поищи по форуму (вроде было) сортировку слиянием, например.

Автор: volvo 30.09.2007 19:56

Цитата
внешние сортировки....

Это и есть:
Цитата
Организовал работу с файлом (с 2-я, если быть точным) - работает очень медленно


Для того, чтобы ускорить - надо знать, ЧТО сортируется... Иначе Google -> "Форум телепатов"

Автор: hardcase 30.09.2007 22:35

Цитата(iRish88 @ 30.09.2007 16:28) *

Подскажите, какие есть варианты сортировки такой большой штуковины?

Сто тысяч элементов (при размере 1 элемента ~100 байт) это не так уж и много.
Переходи на 32-битный компилятор, и будет тебе щщастье!

Автор: мисс_граффити 30.09.2007 22:49

Цитата(volvo @ 30.09.2007 16:56) *

Это и есть...

Ну, можно на файлах сортировку вставками реализовать. Или пузырьком. Выбором - используя 2 файла.
Работать будет....
К сожалению, автор не уточнил, каким алгоритмом пользуется.

Автор: iRish88 30.09.2007 23:41

Прошу прощения, в голове туча мыслей, поэтому пост такой сумбурный. Пока что применял метод пузырька, потому что в работе с отдельными "блоками" другими известными мне алгоритмами (правда не так много я их знаю) будет пользоваться, как мне кажется, неудобно.

Элемент - вещественная переменная.

Попробовал загонять в нетипизированный файл сразу по 10000 эл-тов за раз... в ходе написания кода, понял что могу ограничить элементы типом single (4 байта) и уложиться в отведенные 500+ Кб. smile.gif

Всем спасибо, кажется проблем возникнуть больше не должно. По крайней мере с общим объемом.

Автор: volvo 30.09.2007 23:59

Цитата
кажется проблем возникнуть больше не должно

Проблемы возникнут с тем, что ты не сможешь за один раз выделить блок больше 64К (ни статически, ни динамически), но это решается довольно просто...

Автор: iRish88 1.10.2007 0:34

Ну я сейчас реализовываю массив из 10 нетипизированных указателей по 40 Кб. Как раз на 100000 синглов хватит.

Автор: hardcase 1.10.2007 1:19

Цитата(iRish88 @ 30.09.2007 20:41) *
Элемент - вещественная переменная.

Сомневаюсь, что за приемлемое время можно отсортировать 100000 элементов пузырьком через файлы...
Есть алгоритм http://algolist.ru/sort/quick_sort.php. Результаты сортировки каждого блока можно попарно слить как упорядоченные последовательности.

Автор: volvo 1.10.2007 1:28

Во-первых, кто сказал, что будет использоваться именно метод пузырька? hardcase, тебе что, автор об этом сообщил? Или это чья-то творческая придумка? Так вот не надо ничего придумывать...

Кстати, ничего более НЕкорректного, чем посоветовать для сортировки 100000 (СТА ТЫСЯЧ!!!) элементов РЕКУРСИВНУЮ быструю сортировку я не видел... dry.gif Тем более НЕ в разделе 32-битных компиляторов (хотя и там тоже ресурсы не безграничны)

(Только не надо ничего говорить об избавлении от рекурсии в QuickSort... Это потребует ЕЩЕ дополнительной памяти, которая и так на пределе...)

Автор: Michael_Rybak 3.10.2007 7:26

Цитата(iRish88 @ 30.09.2007 19:41) *

Пока что применял метод пузырька, потому что в работе с отдельными "блоками" другими известными мне алгоритмами (правда не так много я их знаю) будет пользоваться, как мне кажется, неудобно.
крайней мере с общим объемом.



Цитата(volvo @ 30.09.2007 21:28) *

Во-первых, кто сказал, что будет использоваться именно метод пузырька? hardcase, тебе что, автор об этом сообщил?