12.6.1. Текст-ориентированные процедуры и функции

We use cookies. Read the Privacy and Cookie Policy

Кроме общих для всех файлов процедур и функций, определены еще несколько, работающих только с текстовыми файлами (табл. 12.3).

Таблица 12.3

Процедуры и функции

Действие

SetTextBuf( VAR f : Text; VAR Buf [; BufSize : Word]

Устанавливает размер буфера файла f равным BufSize байт. Должна выполняться перед открытием файла f. Буфер размещается в переменной Buf.

Append( VAR f : Text)

Открывает текстовый файл f для дозаписи в конец файла

- 232 -

Flush( VAR f : Text)

Выводит текущее содержимое буфера f в физический файл, не дожидаясь заполнения буфера до конца. Имеет смысл только при записи в файл

EOLn( VAR f : Text) : Boolean

Функция возвращает True, если текущая позиция в файле — конец строки или конец файла, и False, если нет

SeekEOLn( VAR f : Text) : Boolean

Функция возвращает True, если достигнут конец строки или конец файла, или перед ними стоят лишь пробелы и (или) символы табуляции (#9)

SeekEOF( VAR f : Text) : Boolean

Функция возвращает True, если достигнут конец файла или перед ними стоят лишь пробелы, признаки концов строк и (или) символы табуляции

12.6.1.1. Процедура SetTextBuf(VAR I: Text; VAR Buf [;BufSize: Word]). Эта процедура служит для увеличения или уменьшения буфера ввода-вывода текстового файла f. Автоматическое значение размера буфера для текстовых файлов равно 128 байт. При интенсивном обращении к физическим файлам на диске мы рекомендуем увеличить это число до нескольких килобайт, что существенно ускорит процесс. При этом не так жестоко будут эксплуатироваться головки дисковода. Увеличение буфера должно произойти после связывания логического файла с физическим, но до первой операции ввода или вывода. Советуем взять за правило менять буфер до открытия файла. Это дает гарантию безопасности данных.

Задавая новый буфер, мы должны передать процедуре SetTextBuf не только логический файл f, но и переменную Buf, в которой этот буфер расположится. Это означает, что если под рукой нет пока незанятой переменной, то придется ввести еще одну, соответствующего размера. Тип переменной Buf не имеет значения. Важен ее размер. Буфер файла начнется с первого байта, отведенного Buf, и займет столько байт, сколько задано в необязательном параметре BufSize. Если в вызове процедуры число BufSize не указано, то

- 233 -

считается, что оно равно размеру переменной Buf. Задание BufSize больше, чем размер самой Buf, приведет к потере данных, «соседних» по памяти с Buf.

Рассмотрим вариант использования SetTextBuf (рис. 12.2).

| VAR

| ft : Text; { текстовый логический файл }

| Buf : Array [1..4*1024] of Byte; { его новый буфер }

| BEGIN

| Assign(ft,'TEXTFILE.DOC'); {файл связывается с диском }

| SetTextBuf( ft, Buf ); {меняется буфер (теперь он }

| {в переменной размером 4K) }

| Reset( ft ); {открытие файла }

| Read( ft,...) {операции ввода - все как обычно }

| Reset( ft ); { возврат в самое начало файла }

| { буфер no-прежнему в Buf, 4K }

| Прочие действия с файлом ft

| ...

| END.

Рис. 12.2

Будучи однажды установленным для файла ft, буфер не меняет своего места и (или) размера до следующего вызова SetTextBuf или Assign с той же файловой переменной ft.

Переменная, отводимая под буфер, должна быть глобальной или, по крайней мере, существовать до конца работы с данным файлом. В самом деле, если создать конструкцию типа рис. 12.3, то все как будто должно работать, но не будет.

| PROCEDURE GetFileAndOpenIt( VAR f : Text );

| VAR

| Buffer : Array [1..16*1024] of Byte; { буфер }

| FileName : String; { имя файла }

| BEGIN

| ReadLn( FileName ); { считывается имя файла }

| Assign( f, FileName );

| SetTextBuf( f, Buffer ); { назначение буфера }

| Rewrite( f ) { открытие файла f }

| END;

Рис. 12.3

- 234 -

| VAR

| ff : Text;

| BEGIN { основная часть примера }

| GetFileAndOpenIt( ff );

| Write{ ff, ... ); { попытка записи в файл ff }

| { Дальше неважно, что будет. Все равно результат уже }

| { будет неверный. }

| END.

Рис. 12.3 (окончание)

Дело в том, что локальная переменная Buffer (а именно в ней мы размещаем буфер открываемого файла) существует лишь во время выполнения процедуры. После окончания она исчезает, область буфера становится общедоступной и наверняка очень быстро заполнится совершенно «посторонними» значениями, а переданный в вызывающий блок файл f (ff) будет вести себя непредсказуемо. При всем этом не возникнет ни ошибки компиляции, ни ошибки во время счета.

Если размещать буфер в статической переменной, то он «съедает» часть области данных или стека. А они ограничены размером 64K, что вовсе, не так много. Выгоднее было бы размещать буфер в динамической памяти (куче). Для этого надо объявить указатель на место буфера в куче (рис. 12.4).

| VAR

| ft : Text; { файл типа текст }

| PBuf : Pointer; { ссылка на буфер }

| CONST

| BufSize=1024; { размер буфера }

| BEGIN

| Assign( ft, 'TEXTFILE.DOC' );

| GetMem( PBuf, BufSize); { в памяти отводится }

| { блок размером с буфер }

| SetTextBuf( ft, PBuf^,BufSize ); { Задается буфер в }

| { динамической памяти. }

| Reset( ft ); { открытие файла }

| { . . . } { работа с файлом ft }

| Close( ft };

| FreeMem(Pbuf, BufSize); { Буфер удаляется из }

| { памяти (кучи). }

| END.

Рис. 12.4

- 235 -

В этом случае нужно отводить и освобождать память под буфер, а в SetTextBuf обязательно указывать его размер, так как блок памяти с началом в PBuf^ «не знает» своего размера.

В заключение посоветуем выбирать размер буфера кратным 512 байт. Диск читается по секторам и дорожкам, и длина считываемой в одном месте порции информации колеблется от 512 до 4096 байт для гибких и жестких дисков.

12.6.1.2.Процедура Append(VAR f : Text). Эта процедура служит для специального открытия файлов для записи. Она применима только к уже существующим физическим файлам и открывает их для дозаписи, т.е. файл не стирается, как при вызове Rewrite, а подготавливается к записи элемента в конец файла. Если Append применяется к несуществующему файлу, то возникнет ошибка времени счета. Новый файл может быть создан только процедурой Rewrite. Как автоматически выбрать соответствующую процедуру открытия файла — Append или Rewrite, описано в разд. 12.11.

После открытия файла процедурой Append запись в него будет происходить с того места, где находился признак конца файла (код 26). При необходимости поменять текстовый буфер надо сделать это до открытия файла процедурой Append. Вообще говоря, процедура Append, кроме способа открытия файла (с конца), ничем не отличается от процедуры Rewrite.

12.6.1.3. Процедура Flush( VAR f: Text). Эта процедура применяется к файлам, открытым для записи (процедурами Rewrite или Append). Данные для записи накапливаются в буфере файла и только после полного его заполнения записываются в физический файл. Процедура Flush принудительно записывает данные из буфера в файл независимо от степени его заполнения. Когда буфер имеет большую емкость, его содержимое может не попасть в физический файл, если программа внезапно прервется в процессе счета. Этого можно избежать, если перед «аварийными» частями программы ставить вызовы Flush.

Процедура Flush не закрывает файл и не влияет на последовательность вывода. Flush может найти применение при работе со стандартными файлами MS-DOS: устройствами AUX, или COM1, COM2,...,PRN, или LPT1 LPT3. При работе с ними данным незачем «отстаиваться » в буфере, и процедура Flush, поставленная после Write, снимет эффект задержки буфера файла.

12.6.1.4. Функция EOLn( VAR f: Text) : Boolean. Эта функция анализирует текущее положение в текстовом файле f, открытом для чтения. Расшифровка этой функции говорит сама за себя:

- 236 -

«End-Of-Line» — конец строки. EOLn возвращает значение True, если следующей операцией будет прочитан признак конца строки (символ #13) или конца файла (символ #26) и False во всех прочих случаях. Функция как бы предчувствует результат предстоящего чтения и анализирует его. Необходимость в EOLn( f ) возникает всякий раз, когда заранее не известно, где встретится конец строки. Пусть у нас имеется файл со столбцами цифр (рис. 12.5).

DIGITS.DAT

12.3 13.2 14.4 5.7 126.0[13][10]

17.8 -7.6 100 456 987.6[13][10]

55.5 6.06 7.8 0.00 10.11[13][10]

[26]

Рис. 12.5

Как автоматически определить число столбцов в нем и наладить чтение? С помощью EOLn (рис. 12.6).

| VAR

| f :Text; { логический текстовый файл }

| NCol :Byte; { счетчик числа столбцов }

| R :Real; { число для чтения из файла }

| BEGIN

| Assign( f, 'DIGITS.DAT' ); { связывание файлов }

| Reset ( f ); { открытие f для чтения }

| Ncol := 0; { стартовое значение Ncol}

| while NOT EOLn(f) do

| begin { Цикл до конца строки: }

| Read( f, R ); { чтение вправо по строке}

| Inc( Ncol ) { увеличение счетчика столбцов }

| end; {while} { конец цикла счета столбцов }

| Reset( f ); { возврат на 1-ю позицию в файле }

| { ... и повторение чтения, уже зная число столбцов }

| END.

Рис. 12.6

Существует разновидность функции EOLn без параметров. В этом случае считается, что действие ее относится к стандартному файлу Input, т.е. вводу с клавиатуры. Здесь функция EOLn возвращает True не перед, а после прохождения признака конца строки: сразу после нажатия клавиши ввода. Более того, от EOLn без параметра не дождетесь значения False. Она «подвешивает» программу и возвра-

- 237 -

щает управление следующему оператору только после нажатия ввода. В руководстве языка приводится способ организовать паузу до нажатия ввода:

WriteLn(EOLn);

12.6.1.5. Функция SeekEOLn( VAR f: Text): Boolean.Эта функция является «ближайшей родственницей» функции EOLn (f). Файл f должен быть текстовым и открытым для чтения. Функция возвращает значение True, если до конца строки (символ #13) или конца файла (символ #26) могут быть считаны только пробелы и (или) символы табуляции (символ #9). Значение True также вернется, если текущее положение в файле непосредственно предшествует символам #13 или #26. Другими словами, SeekEOLn всегда вернет True, если EOLn на ее месте вернет True. Но в отличие от EOLn функция SeekEOLn как бы «видит» конец строки (или файла) через пробелы и знаки табуляции.

SeekEOLn ориентирована, главным образом, на работу с текстовыми файлами чисел. Последний пример из описания EOLn можно было бы переписать, заменив EOLn на SeekEOLn. От этого он заработал бы только лучше. Действительно, чтобы EOLn вернула True, нужно «упереться» в признак конца. А для этого надо убедиться, что «пустопорожние» пробелы после последнего числа в строке не являются числами: съедается время. SeekEoLn же игнорирует все пробелы и табуляции и «видит» конец издалека, ускоряя обработку.

12.6.1.6. Функция SeekEOF( VAR : Text) : Boolean. Эта функция замыкает ряд функций, начатый EOLn и SeekEOLn. Если отнять у SeekEOLn способность реагировать на признак конца строки, то получится функция SeekEOF, которая возвращает True, если только следующий за текущим положением символ — конец файла (#26), или если перед концом файла имеются только пробелы и (или) символы табуляции (#9), и (или) признаки конца строки (#13). Короче говоря, символы #9, #13, #32(пробел) для SeekEOF являются «прозрачными», и если сквозь них «виден» конец файла #26, то функция возвращает значение True. Во всех прочих случаях вернется значение False.

Функция позволяет найти смысловой конец файла, а не физический. Это полезно при работе с числами (реже с символами). Так, цикл чтения из файла f

while not EOF( f ) do Read( f, ... );

остановится только после полного истощения файла, даже если

- 238 -

последние 1024 строк его были пустыми. Если переписать цикл в виде

while not SeekEOF( f ) do Read( f, ... );

он станет работать более эффективно.

Как и SeekEOLn, функция SeekEOF применима только к открытым для чтения текстовым файлам.