Помощь - Поиск - Пользователи - Календарь
Полная версия: Задача на сортировку стрингов.
Форум «Всё о Паскале» > Pascal, Object Pascal > Задачи
forscripts
Итак, суть задачи: дан файл input.txt, содержащий в первой строке число - количество строк, а затем строку в каждой строке. Необходимо отсортировать эти строки в порядке убывания, при этом создав файл config.txt вида
Код
1 1 1

//Первое число показывает, стоит урезать пробелы или нет.
Если надо обрезать пробелы, ставим 1. Если не надо, 0.
Пример:
При сравнении строк "А Б В" и " АБВ" со значением опции 1 в выходной файл будут выведены
строки "АБВ" и "АБВ", со значением опции 0 - " АБВ" и "А Б В" соответственно.

//Второе число показывает, считать большие буквы равные маленьким, или нет.
Если считать большие буквы равные маленьким, ставим 1. Если считать их разными, 0.
Пример:
При сравнении строк "абв" и "АБВ" со значением опции 1 в выходной файл будут выведены "АБВ"
и "АБВ". При значении опции 0 - "АБВ" и "абв" соответственно.

//Третье число показывает, транслитерировать русские названия или нет.
Если надо транслитерировать русские названия, все кириллические символы будут переведены в
символы латиницы. Если нет, то русские символы останутся на месте, а все русские строки
в выходном файле будут расположены после латинских.
Пример:
При сравнении строк "zak" и "абв" при значении опции 1 в выходной файл будут выведены "abv"
и "zak", при значении опции 0 - "zak" и "абв" соответственно.


Результат должен быть выведен в файл output.txt

Моя программа (все текстовые файлы и исходник программы) добавлена в прикрепления.

Вот код основной программы:


program strsort;
 var f1,f2,conf:text; 
	 n:integer;
	 a:array[1..1000] of string; 
	 i,k,e,q:integer; 
	 r:integer; 
	 s,s1,s2,t:string;
	 opt1,opt2,opt3:integer; 
 function trlit(a:string):string;
 var s:string;
	 q:string;
	 t,k:integer;
 begin
  q:='';
  s:='';
  k:=1;
  t:=length(a);
  while k<=t do begin
  case a[k] of
			... (тут все буквы большого и малого регистра кириллицы и их аналоги в транслите)
			else s:=a[k];
			end;
 if length(s)>=2 then begin t:=t+length(s); k:=k+length(s); end;
 q:=q+s;
 k:=k+1;
 end;
 trlit:=q;
 end;
 function up(s:string):string;
  var stmp:string;
	  z:byte;
	  c:char;
  begin
   stmp:='';
	for z:=1 to length(s) do
	begin
	 c:=s[z];
	 case c of
	  'а'..'п':stmp:=stmp+chr(ord(c)-32);
	  'р'..'я':stmp:=stmp+chr(ord(c)-80);
	  else stmp:=stmp+upcase(c);
	 end;
	end;
  up:=stmp;
 end;
 function sravn(s1,s2:char):integer;
 begin
  if s1<s2 then sravn:=1;
  if s1=s2 then sravn:=0;
  if s1>s2 then sravn:=2;
 end;
 function probel(s:string):string;
  var i,l:integer;
 begin
  l:=length(s); 
  for k:=1 to l do for i:=1 to l do if s[i]=' ' then begin delete(s,i,1); l:=l-1; end;
  probel:=s;
 end;
begin
 assign(f1,'input.txt');
 assign(f2,'output.txt');
 assign(conf,'config.txt');
 reset(conf);
 read(conf,opt1,opt2,opt3);
 close(conf);
 if ((opt1<>0) and (opt1<>1)) or ((opt2<>0) and (opt2<>1)) or ((opt3<>0) and (opt3<>1)) then
 begin
  writeln('Ошибка при чтении конфигурационных данных.');
  writeln('Поломался файл config.txt ');
  readln;
  halt;
 end;
 reset(f1);
 readln(f1,n);
 for i:=1 to n do readln(f1,a[i]); 
 close(f1);
 if opt1=1 then for i:=1 to n do a[i]:=probel(a[i]);
 if opt2=1 then for i:=1 to n do a[i]:=up(a[i]); 
 if opt3=1 then for i:=1 to n do a[i]:=trlit(a[i]); 
 k:=1; 
 while k<n do begin
 for i:=1 to n-1 do begin
  r:=0; q:=1;
  while r=0 do begin 
   s1:=a[i]; 
   s2:=a[i+1];
   r:=sravn(s1[q],s2[q]);
   if (q>length(s1)) or (q>length(s2)) then r:=1;
   q:=q+1;
  end;
  if r=2 then begin s:=a[i]; a[i]:=a[i+1]; a[i+1]:=s; end;
 end;
 k:=k+1;
 end;
 rewrite(f2);
 for i:=1 to n do writeln(f2,a[i]);
 close(f2);
end.



Программа компилируется и абсолютно корректно работает со строками в латинице и кириллице с отключенными опциями 2 (перевод с верхний регистр) и 3 (транслитерация). С включенными опциями 2 и 3 программа с кириллицей работает некорректно. Если я правильно понимаю, скомпиленная ФриПаскалем прога не может корректно работать с виндовскими текстовыми файлами, и поэтому считывает кириллицу некорректно. Подскажите, пожалуйста, что делать, и как научить прогу полностью корректно обращаться с кириллицей.
Спасибо.
andriano
Судя по функции up - приведение к верхнему регистру - она ориентирована на 866 кодовую страницу (используемую в DOS), и даже для нее неверно обрабатывает букву "ё". В виндах обычно испольуется 1251 кодовая страница (в GUI, и 866 - в консоли). Неплохо бы предусмотреть в программе переключение между кодировками - в Виндах может понадобиться и та, и другая.

По поводу работы с кодировками.
Рекомендую воспользоваться чем-то вроде:
var
  i,j,k : integer;
  f : file;
begin
  assign(f,'ascii.cod');
  rewrite(f,1);
  for j := 0 to 15 do begin
    for i := 0 to 15 do begin
      k := i + j*16;
      blockwrite(f,k,1);
    end;
    k := 13;
    blockwrite(f,k,1);
    k := 10;
    blockwrite(f,k,1);
  end;
  close(f);
end.

Полученный таким образом файл можно прсматривать в различных кодирвках встроенными во вьюеры Total Commander'а или FAR'а для выявления закономерностей перекодирования.
Могу сразу сказать, что для ВСЕХ символов нижнего регистра (включая "ё") в 1251 от их кода надо отнимать 32. Только диапазоны будут несколько другими.
volvo
forscripts, для начала разберись с компилятором. Если ты используешь FPC (а то, что ты не пользуешься TP - это однозначно, у меня нет дефектов зрения, присущих другим), то используй и AnsiUpperCase/AnsiLowerCase для перевода в нужный регистр. При правильном использовании они работают с любой кодовой страницей.

А вообще вопрос надо бы передвинуть... В 32-бита...
andriano
Цитата(volvo @ 15.12.2007 17:43) *
А вообще вопрос надо бы передвинуть... В 32-бита...
А зачем?
Неужели 1000 строк следует обрабатывать другим алгоритмом, нежели 200?
forscripts
andriano, спасибо за помощь, попробую так...
Я пробовал и тупо отнимать 32 от численного значения символа в кириллице (методом проб и ошибок определил, под какими номерами стоят буквы кириллицы), но все равно не работало корректно(((
volvo апкейс не работает корректно, к сожалению, тоже. Юзаю ФПК, да.
andriano
Так надо отнимать не от ЛЮБОГО символа кириллицы, а только от СТРОЧНОГО.
forscripts
я понял, просто неправильно выразился))
все равно корректно не работало.
andriano
Да, для ё и некоторых букв украинского/белорусского алфавита отнимать надо 16.
Это текстовая версия — только основной контент. Для просмотра полной версии этой страницы, пожалуйста, нажмите сюда.