Как хранится информация?

Как хранится информация?

Теперь, если вас спросят, как хранится информация на вашем компьютере, вы можете ответить так:

? Где именно? – на дорожках и секторах жесткого диска (или, на логическом уровне – в виде кластеров на логических дисках).

? Как именно? – в виде логических нулей и единиц (битов), а также их групп (байтов).

Все это правильно... Но все равно непонятно. Компьютеру так, может, и проще, ведь ему абсолютно безразлично, чем именно мы забиваем винчестер – документами ли, музыкой или картинками. Для него все это – информация, которую нужно лишь разбить на определенные кусочки – и в любой момент знать, где именно находится тот или иной кусочек. Но нам, пользователям, придется иметь дело не с битами и байтами. И уж тем более – не с кластерами и секторами. Нам же интересно другое деление информации – логическое. Содержательное. Следовательно, нам нужно принять новую единицу, новую точку отсчета. Такими единицами и станут для нас файл и папка.

Файлы

Файл (File) в переводе с английского – лист, на котором может быть записана некая информация. Неважно, что это – код программы или созданный вами текст. Важно другое – каждый такой листок является чем-то логически завершенным, законченным.

Файл может хранить в себе любую информацию – текст, графическую информацию, программный код и так далее (хотя бывают и некие комбинированные файлы, включающие, к примеру, картинку, текст и элемент программы). Главное, чтобы мы, пользователи, всегда могли отличить один «кусочек информации» от другого и знали, как именно нам работать с каждым типом файлов.

Как это делается? Очень просто: каждый файл, подобно человеку, имеет собственное «имя» и «фамилию» (ее называют «типом» файла).

Имя файла чаще всего может быть выбрано произвольно самим пользователем. Скажем, вы создали файл-документ с текстом своего договора с фирмой – его можно назвать «Договор», «Документ 4155» или вообще «Апрельские тезисы». Раньше, в эпоху DOS, имена файлов могли состоять максимум из восьми букв латинского алфавита – сегодня их может быть до 256 и никаких языковых ограничений не осталось. Работая с русской версией Windows, мы можем давать нашим документам-файлам русские имена, а китайцы, к примеру, могут с легкостью использовать свои иероглифы. Другой вопрос, что такой документ не всегда можно открыть на других компьютерах – «американская» Windows может не понять китайское имя, ну а наша, российская версия частенько спотыкается на западноевропейских символах.

Тип файла показывает, какого рода начинка хранится в каждом информационном «контейнере» – рисунок ли это, текст или программа.

О типе файла рассказывает его расширение – часть имени из трех (редко – из четырех) букв, отделенное от основной части названия точкой. Например, файл, в котором хранится эта книга, называется Compbook.doc.

В компьютерном мире существует бесчисленное множество расширений – запомнить все просто нереально.

Однако основных расширений не так уж много:

? ехе – обозначает «исполняемый» файл, хранящий в себе программу. Например, winword.exe;

? com – другой тип программного файла. Обычно файлы.com соответствуют небольшим (до сотни килобайт) программкам. Часто встречались в эпоху DOS, однако сегодня практически сошли со сцены;

? bat – так называемый пакетный файл, предназначенный для последовательного запуска нескольких программ (или команд). По сути дела, это обычный текстовый файл, в котором набраны названия программных файлов, которые вы хотите выполнить в необходимом вам порядке. Пример – файл autoexec.bat, автоматически выполняющийся в момент загрузки компьютера;

? cfg – конфигурационный файл, в котором программа указывает параметры своей работы;

? dll – так называемая динамически подключающаяся библиотека данных, к которой могут обратиться по мере надобности сразу несколько программ;

? hlp – файл справки, в котором хранятся «подсказки», а иногда и полное руководство по той или иной программе;

? txt, doc – текстовые файлы;

? htm, html – гипертекстовый документ Интернета;

? xls – электронная таблица;

? dat – файл данных;

? wav, mp3 – звук в цифровом формате;

? bmp, jpg – графическая информация, картинки;

? arj, zip, rar, 7z – файлы архивов, то есть сжатой с помощью специальных программ «архиваторов» информации. В одном архивном файле на самом деле может храниться множество файлов. И так далее.

Работая в Windows, вы чаще всего будете видеть не расширение файла, а соответствующий ему графический значок. Например, лист с текстом и буквой W покажет, что перед вами – документ, созданный в программе Microsoft Word. Это, конечно, удобно – но только не забывайте, что значки могут меняться в зависимости от того, к какой именно программе привязан тот или иной тип файла. К тому же одним значком могут обозначаться файлы сразу нескольких типов. Расширение же во всех случаях остается неизменным. Есть у файла и еще один признак, называемый атрибутом. Однако, в отличие от имени и расширения (а в Windows – значка определенного типа) его-то пользователь как раз и не видит. Зато великолепно видит и понимает компьютер.

Вот лишь некоторые из этих атрибутов:

Скрытый (Hidden). Файлы с этими атрибутами обычно не видны пользователю. Для перестраховки – как правило, файлы эти весьма важные для функционирования системы. Хотя опытному юзеру не составит труда настроить программу просмотра файлов (файловый менеджер) таким образом, что все скрытые файлы будут видны как на ладони.

Только для чтения (Read-Only). А вот эти файлы всегда открыты любопытному взору... Но и только. Изменить их содержание нельзя – по крайней мере, без специальной команды пользователя, дабы последний был полностью уверен в том, что именно он делает.

Системный (System). Этим атрибутом, как особым знаком отличия, отмечены самые важные файлы в операционной системе, отвечающие за загрузку компьютера. Их повреждение или удаление всегда влечет за собой самые тяжкие последствия, поэтому щедрый компьютер, не скупясь, «награждает» их заодно и двумя предыдущими атрибутами – «только для чтения» и «скрытый».

Архивный (Archive). Этот атрибут устанавливается обычно во время работы с файлом, при его изменении. По окончании сеанса работы он, как правило, снимается.

Папки

Если мы сравнили файлы с листиками, то почему бы нам не продолжить аналогию дальше? Где же те деревья, на которых растут такие полезные листики? Сравнение с деревом тут не случайно. Ведь расположение файлов на жестком диске и называется именно древовидной структурой. Есть листья. Они растут на веточках. Веточки в свою очередь растут на ветках. Ветки... Ну, скажем, на сучьях. А уж сучья... И так до бесконечности. Понятно, что держать совершенно разные файлы в одной куче нельзя. Их надо упорядочивать. Каждому сверчку – свой шесток, каждой семье – отдельную квартиру... Ну и так далее.

Файлы объединены в особые структуры – папки. Или – каталоги. Или – директории. Или – фолдеры. Совершенно непонятно, зачем понадобилось создавать такую кучу терминов для одного-единственного предмета. Папка – самый поздний термин и, на мой взгляд, самый удачный. Именно в папке лежат листочки-файлы. Папка, которую в любой момент можно открыть и отыскать нужный листок. Папка, в которую, кстати говоря, можно вложить другую папку...

Обычно каждый программный пакет, установленный на вашем компьютере, занимает свою, отдельную папку. Однако бывает и так, что программа, словно хитрая птица-кукушка, раскидывает свои файлы по многим папкам. Особенно это любят делать программные пакеты, работающие под операционной системой Windows.

Как отличить папку от файла? Не так уж и сложно. Во-первых, папки не имеют расширения и обозначаются в Windows особыми значками – как раз в виде открывающейся папки. Во-вторых, в отношении папки нельзя применить операции редактирования. Переименовать, перенести, удалить – пожалуйста. И, конечно же, папку можно открыть, чтобы посмотреть, что в ней находится. Для этого достаточно просто щелкнуть по ней дважды левой кнопкой мыши.

Ну а теперь разберемся, как выглядит логический адрес любого файла или папки на нашем жестком диске. Первый элемент этого адреса – имя диска. Состоит оно из одной буквы, двоеточия и обратной косой черты, называемой на компьютерном жаргоне бэк-слэш:

А: С: D: Е:

Диском А: чаще всего называется дисковод и, пока вы не вставите в него дискету, этого диска у вас как бы и не будет. И бог с ним: и без него дисков хватает.

Диск С: – главный жесткий диск вашего компьютера (либо логический диск в основном разделе). Именно с этого диска производится загрузка системы, именно на нем «живет» большинство ваших программ и документов.

Если в вашей системе больше одного жесткого диска или единственный жесткий диск разбит на несколько разделов, эти разделы будут носить имена, соответствующие следующим буквам латинского алфавита. А последняя буква-имя обычно обозначает дисковод CD-ROM.

С дисками разобрались. Дальше следуют директории – папки и подпапки. Например, адрес папки, в которой установлена ваша операционная система Windows, обычно выглядит так:

C:WINDOWS.

Ну а третий элемент адреса – имя самого файла. Например, адрес

C:WINDOWS egedit.exe

соответствует программе для редактирования системного реестра Windows, которая находится на диске C: в папке Windows.

Файловая система

Что ж, теперь мы с вами поняли, как компьютеру удобнее хранить данные и в каком виде предпочитаем видеть их мы. Осталось за кадром лишь одно – каким же образом секторы и кластеры, забитые под завязку битами и байтами, превращаются в удобные для нас файлы и папки! Мистика, волшебство? Ничуть. Просто, рассказывая о логической структуре жесткого диска, мы намеренно пропустили очень важный этап – создание файловой системы. А именно она позволяет окончательно упорядочить данные на нашем жестком диске и в любой момент извлекать из этой информационной кладовой нужный кусочек.

Когда мы записываем на винчестер файлы и папки, компьютер разбивает их на привычные ему кластеры и раскидывает по всему пространству жесткого диска. Файл, конечно же, в одном кластере не помещается. Проживает он сразу в нескольких, причем совершенно не обязательно, что кластеры эти будут жить рядышком, как горошины в стручке. Чаще случается наоборот: файл хранится на диске в раздробленном виде – «голова» в одном участке диска, «ноги» в другом... Чтобы не заблудиться в собственных «закромах», компьютер создает в самом начале жесткого диска специальный «путеводитель» по его содержанию – FAT, таблицу размещения файлов. Именно в FAT хранятся все сведения о том, какие именно кластеры занимает тот или иной файл или папка, а также – их заголовки. С одной стороны, это удобно: при таком способе размещения компьютер не должен лихорадочно искать на жестком диске кусок именно такого размера, который подходит для конкретного файла. Пиши куда вздумается! Да и удалять файлы и папки становится проще – не нужно стирать содержимое принадлежащих им кластеров, достаточно просто объявить их свободными, изменив пару байт в FAT. Да и у пользователя остается возможность быстро их восстановить с помощью все той же пары байт...

Таблица размещения файлов – это часть файловой системы, ответственной за хранение данных на нашем компьютере. Файловая система создается на жестком диске на заключительном этапе форматирования, и именно от нее зависят такие важные параметры, как размер кластера, количество (или вид) символов в имени файла, возможности работы с папками и многое другое – вплоть до максимального размера жесткого диска...

Существует несколько стандартных файловых систем, привязанных к конкретным операционным системам.

Например, древняя DOS и первые версии Windows использовали 16-разрядную файловую систему FAT16, в которой отсутствовала поддержка длинных имен, а объем логического диска не мог превышать 4 Гб (65536 кластеров по 64 кб). В частности, именно этот фактор заставлял владельцев винчестеров большой емкости «разбивать» его на несколько разделов – иначе работать с диском было невозможно.

Для Windows 95 была создана новая модификация файловой системы – 32-битная FAT32, которая позволяла использовать так полюбившиеся нам длинные имена. Уменьшился максимальный размер кластера – до 16 кб (стандартный же размер составлял 4 кб). А главное, увеличился максимальный размер жесткого диска – до 4 Тб! Впрочем, довольно скоро выяснилось, что и FAT32 работает небезупречно: несмотря на декларированную поддержку до 4 Тб дисковой памяти, стандартные утилиты позволяли создавать логические разделы объемом лишь до 32 Гб. К тому же размер файла в FAT32 не мог превышать 4 Гб, что крайне осложняло работу любителям цифрового видео (ведь оцифрованный фильм может занять на диске сотни гигабайт!). Так что задуматься о смене файловой системы пришлось довольно скоро, хотя и сегодня FAT32 используется, например, при создании DVD-дисков. А семь лет назад мир потихоньку начал переходить на файловую систему нового типа – NTFS, количественные изменения в который были куда менее интересны, чем качественные. Да, благодаря NTFS удалось снять ограничения на объем файла – теперь он может занимать хоть весь жесткий диск целиком – а максимальный размер дискового раздела увеличился до 12 Тб. Однако куда интереснее были новые возможности: помимо привычных логических дисков фиксированного размера NTFS позволяет создавать еще и динамические жесткие диски, поддерживает шифрование и защиту паролем отдельных разделов и папок.

Главное качество новой системы – надежность хранения данных: если «уронить» жесткий диск с FAT32 было легче легкого, то под защитой NTFS ваши данные будут чувствовать себя гораздо увереннее. NTFS ведет свой собственный журнал операций, который позволяет защитить данные в случае сбоя.

Попробуйте внезапно выключить компьютер при копировании или удалении файла в FAT32 – и, скорее всего, вы поплатитесь за такую вольность потерей данных. Ведь изменения в таблице размещения файлов не будут сохранены, и ваш документ превратится в кучу «потерянных кластеров». Поэтому FAT всегда хранится в 2-х экземплярах! NTFS же вносит изменения в таблицу лишь тогда, когда операция успешно завершена, а «журнал» помогает застраховать файлы от преждевременной кончины.

Увы – ради надежности приходится жертвовать совместимостью:

Если жесткие диски, отформатированные в FAT16 и FAT32, способны увидеть практически все версии Windows (а также операционные системы семейства Linux), то при использовании NTFS вы намертво привязаны к линейке Windows 2000 —ХР —Vista.

Если на вашем компьютере уместилось две операционные системы – старая Windows ME и новая Windows ХР (с файловой системой NTFS), – то содержимое «икспишного» раздела или целого диска останется невидимым для ME. Более того – вы теряете возможность работать с диском, загружаясь в режиме «командной строки» с компакт-диска или «загрузочной» дискеты – для DOS файловая система NTFS тоже как бы не существует.

Наконец, если преобразовать файловую систему FAT32 в NTFS не составит никакого труда даже с помощью штатных программ Windows, причем с полным сохранением всей информации, то выполнить обратное преобразование в большинстве случаев просто невозможно без форматирования диска. И, как следствие, утраты всей информации...

Конечно, существуют специальные программы для работы с разделами и файловыми системами – например Partition Magic, которая умеет конвертировать диск NTFS в FAT32 без потери информации. Но их использование сопряжено с немалыми трудностями – в особенности для новичков... И все же, несмотря на все недостатки, использование NTFS сегодня дает куда больше преимуществ, чем неудобств. Поэтому уверенно отвечайте «Да!» на вопрос о переводе в NTFS – и окончательно прощайтесь с прошлым.

Данный текст является ознакомительным фрагментом.