Что такое файл и типы файлов. Что такое файл (file) и файловая система? Расширение имени файла

Особое значение в терминологии Windows играет понятие файла. ? Файлом (от англ. file - цепочка) называется последовательный набор данных, хранящийся на каком-либо физическом носителе и имеющий собственные имя и расширение. Расширение файла предназначено для однозначной и исчерпывающей идентификации типа файлового объекта; оно записывается справа от имени файла и отделяется от него точкой. В данном случае тип файлового объекта - это функциональная характеристика файла, с помощью которой операционная система определяет набор программ, способных обрабатывать или использовать данный файл. Если мы рассмотрим в качестве примера некий абстрактный файл README.TXT, то здесь именем файла является строка README, а его расширением - .ТХТ, которое указывает на то, что данный файловый объект относится к типу «текстовый файл» и может быть обработан с использованием какого-либо текстового редактора, например стандартной программы Блокнот из комплекта поставки Windows.

Согласно устоявшейся практике, принято делить все многообразие существующих на сегодняшний день файлов на несколько различных классов по признаку их функционального применения. К первому из упомянутых выше классов относятся так называемые файлы пользователя - текстовые документы, рисунки, веб-страницы и прочие файловые объекты, создаваемые пользователем компьютера для какой-либо определенной цели или для собственных нужд. Для таких файлов пользователь может назначать произвольные имена, соответствующие, однако, принятому в Windows стандарту. Расширения пользовательских файлов, как правило, автоматически присваиваются им программами, при помощи которых эти файлы создаются, либо указываются пользователем вручную исходя из типа каждого конкретного файлового объекта и способа его дальнейшего применения. Ко второму классу относятся системные файлы - то есть файлы, используемые операционной системой в процессе ее работы. Имена и расширения таких файлов заранее определены разработчиками Windows, и любое их изменение потенциально способно привести к нарушению работоспособности системы. Третий класс включает программные файлы, используемые установленным на вашем компьютере программным обеспечением. Их имена и расширения назначаются разработчиками соответствующих программ. Как уже упоминалось выше, файловые объекты принято также классифицировать по их типам в соответствии с набором приложений, которые могут эти файлы обрабатывать, - в частности, к различным типам файлов относятся текстовые документы, документы Microsoft Word, архивы (файлы, содержащие какие-либо сжатые данные), исполняемые файлы (файлы, которые могут быть запущены в операционной системе в режиме программы) и т. д.

Имена файлов в операционной системе Microsoft Windows могут быть записаны с использованием цифр, символов латинского или национального алфавитов, знака «дефис». Допускается запись имен как в верхнем, так и в нижнем регистре. Предельная длина имени файла с учетом пробелов и расширения не может составлять более 255 знаков. Имена файлов не должны содержать следующие символы: \ / : * ? » | { }.

Допускается (но не рекомендуется) использование символов «пробел», «подчеркивание», «точка», «запятая», «точка с запятой», «апостроф», а также: А! @ # $ % & Поскольку эти символы являются для системы «служебными» и Windows интерпретирует их особым образом, их не следует применять без крайней необходимости. Если первым символом в имени файла является пробел, Windows его игнорирует.
Файлы в Windows отображаются с использованием специальных графических изображений, называемых значками. Внешний вид значков зависит от типа соответствующего им файлового объекта.

Проводя доступную параллель между системой хранения файлов и папок в Windows и обычной бумажной книгой, можно привести следующий пример: на вашей книжной полке может храниться несколько книг, так же, как и в компьютере может одновременно работать несколько дисков. Каждая книга имеет корешок, к которому крепятся ее страницы, - каждый диск имеет корневую папку, обозначаемую символом «\», где расположено все информационное содержимое диска. В книге имеются главы, каждой из которых присвоено собственное название, - в корневой директории содержатся папки, имеющие собственные имена. Главы книги могут содержать подразделы более низкого уровня - папки могут иметь вложенные подпапки. И наконец, в подглавах книги содержатся текст и иллюстрации, которые и являются полезным наполнением издания, - в папках хранятся файлы, в том числе, например, текстовые и графические, содержимое которых можно при желании прочитать или просмотреть на экране. Запомнив эту несложную аналогию, вы сможете лучше понять принцип хранения информации в современных компьютерах.

Здравствуйте, уважаемые читатели блога сайт! Файл является одним из самых важных понятий, которые определяют передачу и хранение информации в интернете и на устройствах, посредством которых мы получаем доступ к Мировой Паутине. Английский термин «file» появился в середине прошлого столетия, когда зарождалась эпоха компьютеров.

Мы довольно часто используем этот термин, но лишь немногие из нас понимают его глубинный смысл. Обычные пользователи совершают различные действия над файлами, полностью не понимая их сущности. В большинстве случаев доскональное знание и не требуется, если вы среднестатистический юзер. Но ежели ваша деятельность в интернете носит профессиональный характер, представления о файлах, их именах и расширениях должны быть шире.

В этой статье я попытаюсь дать необходимые разъяснения по термину «file» и всему, что с ним связано, именно для обычных пользователей на доступном им языке и постараюсь не прибегать к малопонятным сугубо техническим определениям.

Форматы (типы) и расширения файлов

Итак, говоря простым языком и не углубляясь в детали, можно констатировать, что file — это специальный именованный сегмент для хранения информации. В большинстве операционных систем (ОС) используется имя файла , состоящее из собственно его названия и расширения, что дает возможность его идентифицировать и определить тип содержимого, то есть формат. Расширение файла отделяется от его названия точкой:

Instruction.pdf

Если иметь ввиду приведенный пример, то каждый мало-мальски опытный пользователь знает, что подобный пдф файл можно открыть с помощью известной программы Adobe Reader (к слову, одноименная корпорация является его разработчиком).

Таким образом, во многих операционных системах, включая самую популярную — Windows, расширения играют определяющую роль. Это позволяет открывать нужные файлы в подходящем им софте. Когда пользователь открывает file, автоматически запускается соответствующая его расширению программа либо оную можно определить по формату файла.

Вы, наверное, уже поняли, что тип (или формат) файла определяется его расширением . Причем, в Виндоус можно визуально (по характерным иконкам) отличать разные типы. Например, документ для Adobe, архивы ZIP и RAR, всем известный исполняемый файл EXE для любого приложения и file динамически подключаемой библиотеки DLL будут отображены так:


А, скажем, файлы видео (в форматах MP4 и WMV), аудио (MP3) или изображений (в форматах JPG и PNG) выглядят вот таким образом:


Но ОС Виндовс предназначена для широкого пользования, поэтому по умолчанию расширения в ней не отображаются. Это сделано для того, чтобы пользователь при редактировании названия файла случайно не изменил бы также и его расширение, что может привести к нарушению соответствия, в результате чего file в дальнейшем не откроется в нужной программе.

Однако, если вы хотите добиться отображения расширений, то в Windows 7, например, это можно сделать следующим образом. Переходите из меню «Пуск» в раздел «Компьютер», там находите пункт «Упорядочить» и из выпадающего меню выбираете «Параметры папок и поиска»:

Откроется диалоговое окно, где во вкладке «Вид» находите строчку «Скрывать расширения для зарегистрированных типов файлов» , напротив которой убираете галочку, и жмете «OK»:

Существует еще несколько классификаций файлов, из которых я выделю одну. Все файлы обычно подразделяются на две большие группы: пользовательские и системные . Принадлежащие первой группе обычно скачиваются извне или создаются самими пользователями и в результате открытия соответствующим софтом отображают свое содержание (видео, музыка, изображения).

Системные же файлы служат для обеспечения продуктивной и надежной работы операционной системы. Их несанкционированное редактирование может привести к плачевным последствиям, поэтому в Виндоус, к примеру, по умолчанию они скрыты.

Когда вы станете продвинутым пользователем, можно открыть их, сняв галочку напротив пункта «Скрывать защищенные системные файлы (рекомендуется)» в той же вкладке «Вид»:

Представляю наиболее часто используемые расширения по типу файлов в форме таблицы:

Расширение Тип файла Примеры
exe приложения (программы) CCleaner.exe
doc документы (Microsoft Word) План работы.doc
xls таблицы (Microsoft Excel) Реестр.xls
txt простые текстовые документы текст.txt
ppt презентации (Microsoft PowerPoint) Моя Презентация.ppt
html вебстраницы из Интернета Руководство.html
png изображение, фотография изображение1.png
jpg Фото.jpg
gif изображение2.gif
mp3 Аудио Музыкальная композиция.mp3
mp4 видео Видеоролик.mp4
zip Архивы (ZIP, WinRAR) Видеокурс.zip
rar Видеокурс.rar

Конечно, это далеко не все возможные данные. Более подробный список популярных форматов и расширений вы сможете почерпнуть с данной страницы , которая весьма информативна в этом плане. Кто предпочитает видеоформат, может просмотреть качественный ролик

Файл - это фрагмент информации, хранящийся в компьютере. По-английски file - скоросшиватель, папка для бумаг. Такое название используется, видимо, потому, что традиционно в кабинетах информация хранится в бумажном виде в скоросшивателях. Прослеживается некоторая аналогия с компьютерными файлами, не правда ли? Хотя лично мне это сравнение не кажется очень удачным.

Теперь забудем обо всяких скоросшивателях. Компьютерный файл - контейнер. Он может быть как очень большим, так и очень маленьким. В отличие от листа бумаги он может содержать большой объем информации. Контейнер объединяет всю эту информацию и отделяет ее от информации, хранящейся в других контейнерах.

Файл действительно представляет собой только хранилище - место, где в компьютере хранятся фрагменты информации.

Мне слово файл кажется неудачным дай обозначения хранилища данных в компьютере. Если бы я стоял у истоков компьютерной технологии, то назвал бы его контейнером или емкостью и может быть просто только для красоты перевел бы эти слова на греческий или латынь. Проблема заключается в том, что слово «файл» неточное и двусмысленное, поэтому плохо отражает сущность компьютерного «хранилища данных». Как и многие компьютерные термины, в английском языке слово file используется и как существительное, и как глагол - оно означает и папку дам хранения документов в определенном порядке и само хранение, приведение в порядок или архивацию документов.

Специальное значение в терминах Windows любой версии играет понятие файла. Файлом, что с английского переводится — цепочка, называется хранящийся на каком-либо физическом носителе последовательный набор данных, который имеет собственные расширение и имя.

Тип файла - это функциональная характеристика файла, с помощью которой ОС определяет набор программ, которые способны использовать или обрабатывать данный файл.

Расширение файла нужно для однозначной и исчерпывающей идентификации типа файлового объекта; оно отделяется от него точкой и записывается справа от имени файла. Если рассмотреть в качестве примера абстрактный файл FILE.TXT, то здесь именем файла является строка FILE, а его расширением - .ТХТ, оно указывает на то, что данный файл относится к типу «текстовый файл» и его можно открыть и отредактировать при помощи какого-либо текстового редактора, например обычного Блокнота, который есть в любом Windows.

Согласно нынешним правилам, принято делить все существующие файлы на несколько классов, характеризующих признаки их функционального применения.

К первому классу относятся системные файлы - то есть файлы, которые используются Windows в процессе работы.Расширения и имена этих файлов заранее определили разработчики операционной системы, и любое их изменение способно привести к нарушению работоспособности Windows.

Ко второму классу относятся файлы пользователя - рисунки, веб-страницы, текстовые документы и прочие файлы, создаваемые пользователем компьютера для собственных нужд или для какой-либо определенной цели.Для этих файлов можно назначить произвольным образом имена, соответствующие принятому стандарту Windows.Расширения файлов автоматически присваиваются создающими их программами, либо указываются юзером вручную смотря на тип каждого конкретного файла и способа его дальнейшего применения в Windows.

Третий класс — программные файлы , которые используются программным обеспечением, установленным на вашем персональном компьютере. Разработчиками соответствующих программ определяются имена и расширение этих файлов. Что такое файлы разных типов? Файлы также принято классифицировать по их типам в соответствии с набором тех программ, которые могут эти файлы обрабатывать, к различным типам файлов относятся например текстовые документы (.txt), документы Microsoft Word (.doc .xdoc), архивы (.rar .zip), исполняемые файлы (.exe), рисунки, картинки (. jpg . png) и др.

Можно использовать в имени файла знаки «запятая», «точка с запятой», «апостроф», «пробел», «подчеркивание», «точка», а также: А! @ # $ % & Но эти символы являются для операционной системы «служебными» и система использует их особым образом, поэтому их не следует применять. Windows игнорирует «пробел», если он будет первым символом в имени файла.

Имена файлов в операционной системе Windows могут быть записаны только с использованием цифр, символов алфавитов, знака «дефис». Можно записывать имена файлов как в нижнем, так и в верхнем регистре. Самая большая длина имени файла с учетом пробелов и расширения не может быть больше 255 знаков. Имена файлов не должны содержать эти спецсимволы: \ /: * ? ” | {}.
Теперь обобщим что такое файлы? Файлы в операционной системе отображаются с использованием значков. Внешний вид значка зависит от типа соответствующего им файла.

вполне закономерен.

Файл - это последовательная цепочка набора данных, которая имеет название и расширение (расширение может отсутствовать - в таком случае Windows будет воспринимать файл неопределяемым). Файл это информационная сущность, поэтому он хранится на физическом носителе (жестком диске, флешке и так далее). Для того, чтобы файл можно было полноценно идентифицировать, полное имя файла, состоящее из имени, точки и расширения (последовательность именно такая), должно быть уникальными в рамках одного хранилища (в терминологии Windows каталога). Расширение файла позволяет системе определить какие из программ могут корректно открывать, запускать, считывать и использовать данный файл.

Стоит знать, что каталог это такой же файл, но со специфическими особенностями. В отличии от обычных файлов, он не может содержать данные, однако может включать в себя файлы или другие каталоги. Аналогично документам в архивах. Есть папки, внутри которых лежат листочки (файлы). А есть более толстые папки, внутри которых лежат другие каталоги.

Рассмотрим пример. Файл "document.doc". Здесь "document" это имя файла, а "doc" это расширение, которое указывает Windows, что данный файл необходимо открывать и редактировать с помощью текстовых процессоров, таких как Microsoft Word или OpenOffice Writer. В случае если расширение не известно Windows (не установлено необходимых программ), то система предложит выбрать программу вручную. Стоит знать, что в Windows есть предопределенные наборы известных расширений, таких как txt (текстовый файл), exe (исполняемая программа) и прочие.

Классификация файлов по функциональному применению

Все разнообразие типов файлов принято делить по их функциональному применению. Это не является обязательным критерием, однако позволяет легче понимать назначение файлов. Кроме того, важно знать, что классификация по функциональному применению никак не ограничивает набор расширений. Например, каждый из классов может содержать архивы, документы, исполняемые файлы и прочее.

1. Файлы пользователя - рисунки, веб-страницы, документы, таблицы и прочие файлы, которые пользователи используют для собственных задач. Имена таких файлов ограничены лишь стандартом имен Windows. Расширения таких файлов обычно не задаются пользователями, а автоматически проставляются используемыми программами, во время создания файлов. Например, программа Microsoft Word выставляет расширение "doc" или "docx" (в зависимости от версии), а OpenOffice Writer устанавливает "odt".

2. Системные файлы - все файлы, которые необходимы Windows для нормального функционирования. Имена таких файлов так же не противоречат стандарту имен Windows, однако они предопределены еще до установки операционной системы. Поэтому такие файлы нельзя переименовывать или изменять пользователям, так как это чревато возникновением ошибок.

3. Программные файлы - все те файлы, которые используются установленным программным обеспечением. С точки зрения формирования имени, они аналогичны системным файлам. Другими словами, так же не противоречат стандарту имен, но имеют фиксированные имена, которые были определены автором. Стоит знать, что программы могут так же создавать программные файлы во время своего функционирования. Например, файлы журнала ошибок или файлы конфигурации. Эти файлы должны редактироваться только самой программой, в противном случае могут возникать ошибки (при условии, что программное обеспечение не предусматривает обратного).

Стандарт имен файлов в операционной системе Windows.

Рассмотрим стандарт имен файлов в операционной системе Windows. Имеется два набора символов:

1. Рекомендуемый набор символов . В имени файлов допускается использование цифр, символов латинского, русского и любых других национальных алфавитов. Так же поддерживается знак дефис. Все буквы языков можно писать в разных регистрах (верхний и нижний).

2. Допустимый набор символов . Сюда входит пробел, подчеркивание, апостроф, точка с запятой, точка, запятая, а так же специальные символы " ! @ # $ % & " (и часть специальных символов основной кодировки). Стоит знать, что этот набор символов интерпретируется Windows специфически. Поэтому по возможности не стоит их применять. Тем не менее, с символами пробела, точки, запятой и подчеркивания редко возникают проблемы. А вот при использовании остальных символов могут возникать ошибки. Особенно, с некоторыми спецсимволами. Так же стоит знать, что если вам нужны файлы, которые будут нормально открываться и в других операционных системах, то стоит ограничиваться только цифрами и латинским алфавитом, а точку использовать только для разделения имени и расширения.

Запрещенный набор символов - в именах файлов нельзя использовать: \ /: * ? < > |

Что такое файл в графическом интерфейсе ? Windows имеет собственную графическую оболочку, которая позволяет пользователям взаимодействовать с компьютером. В этом интерфейсе файлы показываются в виде небольших изображений, которые так же еще называют иконками или значками, и имени с расширением (при определенных настройках расширения файлов не отображаются). Обычно, если тип расширения известен Windows, то иконка такого файла будет специфической. Например, текстовые файлы с расширением "txt" обычно представлены значком блокнота.

Как формируется полный путь до файла . У компьютера есть диски, они представлены латинской буквой. Это первая составляющая пути. После нее ставится разделитель в виде двоеточия и косой черты ":\". В случае если файл лежит в корне диска, то далее идет полное имя файла (далее по тексту просто имя файла). Если же файл лежит в каталоге, вначале указывается имя каталога, затем ставится символ "\" и указывается имя файла. Если же файл находится в подкаталоге каталога, то после каталога так же должно идти имя подкаталога и "\". Далее по аналогии. В данном случае символ "\" является разделителем, который позволяет идентифицировать каждую часть полного пути до файла.

История

Файл перфокарт

Слово file впервые применено к компьютерному хранилищу в 1950 году. Реклама памяти на запоминающих ЭЛТ фирмы RCA в журнале «Popular Science » гласила:

…результаты бесчисленных вычислений можно держать «в картотеке» (on file ) и получать снова. Эта «картотека» теперь существует в запоминающей трубке, разработанной в лабораториях RCA. Она электрически сохраняет цифры, отправленные в вычислительную машину, и держит их в хранилище, заодно запоминая новые - ускоряя интеллектуальные решения в лабиринтах математики.

В 1952 году слово file отнесли к колоде перфокарт . Поначалу словом file называли само устройство памяти, а не его содержимое (см. Регистровый файл). Например, диски IBM 350, использовавшиеся, например, в машине IBM 305, назывались disk files . Системы наподобие Compatible Time-Sharing System ввели концепцию файловой системы, когда на одном запоминающем устройстве существует несколько виртуальных «устройств памяти», что и дало слову «файл» современное значение. Имена файлов в CTTS состояли из двух частей, «основного имени» и «дополнительного имени» (последнее существует и поныне как расширение имени файла).

Файловая система

По мере развития вычислительной техники файлов в системах становилось всё больше. Для удобства работы с ними, их, как и другие данные, стали организовывать в структуры (тогда же появились символьные имена). Вначале это был простой массив , «привязанный» к конкретному носителю информации. В настоящее время наибольшее распространение получила древовидная организация с возможностью монтирования и вставки дополнительных связей (то есть ссылок). Соответственно, имя файла приобрело характер пути к файлу : перечисление узлов дерева файловой системы, которые нужно пройти, чтобы до него добраться.

Файл как объект API операционной системы

Операционная система предоставляет приложениям набор функций и структур для работы с файлами. Возможности операционной системы накладывают дополнительные ограничения на ограничения файловой системы. С точки зрения API файл - объект, по отношению к которому могут быть применены функции этого API. На уровне API уже не существенно, существует ли файл как объект файловой системы или является, например, устройством ввода/вывода.

Свойства файла

В зависимости от файловой системы, файл может обладать различным набором свойств.

Имя файла

В большинстве файловых систем имя файла используется для указания, к какому именно файлу производится обращение. В различных файловых системах ограничения на имя файла сильно различаются: в FAT16 и FAT12 размер имени файла ограничен 8.3 знаками (8 на имя и 3 на расширение); в других системах имя файла ограничено обычно в 255 байт; в NTFS имя ограничено в некоторых ОС 255 символами Unicode (по спецификации - 32 768 символов).

Помимо ограничений файловой системы, интерфейсы операционной системы дополнительно ограничивают набор символов, который допустим при работе с файлами.

Большинство операционных систем требуют уникальности имени файла в одном каталоге, хотя некоторые системы допускают файлы с одинаковыми именами (например, при работе с ленточными накопителями).

Расширение имени файла

Расширение имени файла (часто расширение файла или расширение) как самостоятельный атрибут файла существует в файловых системах FAT16 , FAT32 , NTFS , используемых операционными системами MS-DOS, DR-DOS, PC DOS, MS Windows и используется для определения типа файла. Оно позволяет системе определить, каким приложением следует открывать данный файл. По умолчанию в операционной системе Windows расширение скрыто от пользователя.

В остальных файловых системах расширение - условность, часть имени, отделённая самой правой точкой в имени.

Атрибуты

В некоторых файловых системах, таких как NTFS, предусмотрены атрибуты (обычно это бинарное значение «да»/«нет», кодируемое одним битом). Во многих современных операционных системах атрибуты практически не влияют на возможность доступа к файлам, для этого в некоторых операционных и файловых системах существуют .

Название атрибута перевод значение файловые системы операционные системы
READ ONLY только для чтения в файл запрещено писать DOS, OS/2 , Windows
SYSTEM системный критический для работы операционной системы файл FAT32, FAT12, FAT16, NTFS, HPFS, VFAT DOS, OS/2, Windows
HIDDEN скрытый файл скрывается от показа, пока явно не указано обратное FAT32, FAT12, FAT16, NTFS, HPFS, VFAT DOS, OS/2, Windows
ARCHIVE архивный (требующий архивации) файл изменён после резервного копирования или не был скопирован программами резервного копирования FAT32, FAT12, FAT16, NTFS, HPFS, VFAT DOS, OS/2, Windows
SUID Установка пользовательского ID выполнение программы от имени владельца ext2 Unix-like
SGID Установка группового ID выполнение программы от имени группы (для каталогов: любой файл созданный в каталоге с установленным SGID, получит заданную группу-владельца) ext2 Unix-like
Sticky Bit липкий бит изначально предписывал ядру не выгружать завершившуюся программу из памяти сразу, а лишь спустя некоторое время, чтобы избежать постоянной загрузки с диска наиболее часто используемых программ, в настоящее время в разных ОС используется по разному ext2 Unix-like

Время

Для файла могут быть определены временные метки создания, модификации и последнего доступа.

Владелец и группа файла

В некоторых файловых системах предусмотрено указание на владельца файла и группу-владельца.

Права доступа

В некоторых файловых системах предусмотрена возможность для ограничения доступа пользователей к содержимому файла

В UNIX-подобных операционных системах для файлов обычно выделяют три типа прав: на запись, чтение и выполнение.

Каждое право задаётся раздельно для владельца, для группы и для всех остальных. ACL позволяют расширить этот список.

См. также

Примечания