Расширение текстового файла: типы и основные аспекты определения принадлежности к программам. Текстовые файлы Что такое текстовый файл

Принадлежащих тому или иному набору символов). Это символы обычно сгруппированы в строки (англ. lines, rows ). В современных системах строки разделяются разделителями строк , в прошлом же применялось хранение строк в виде записей постоянной или переменной длины (см.: Перфокарта). Иногда конец текстового файла (особенно если в файловой системе не хранится информация о размере файла) также отмечается одним или более специальными знаками, известными как маркеры конца файла .

Текстовой файл может содержать как форматированный , так и неформатированный текст.

Преимущества и недостатки

Преимущества:

  • Универсальность - текстовый файл может быть прочитан (так или иначе) на любой системе или ОС , особенно если речь идёт об однобайтных кодировках вроде ASCII , которые не подвержены проблеме, характерной для других форматов файлов - для них не важна разница в порядке байтов или длине машинного слова на разных платформах .
  • Устойчивость - каждое слово и символ в таком файле самодостаточны и, если случится повреждение байтов в таком файле, то обычно легче восстановить данные и продолжить обработку остального содержимого, в то время как у сжатых или двоичных файлов повреждении нескольких байтов может привести к невозможности восстановить всё содержимое файла. Многие системы управления версиями рассчитаны на текстовые файлы и с двоичными файлами могут работать только как с единым целым.
  • Формат текстового файла крайне прост и его можно изменять текстовым редактором - программой, входящей в комплект практически любой ОС .

Недостатки:

  • У больших несжатых текстовых файлов низкая информационная энтропия - эти файлы занимают больше места, нежели минимально необходимо. Хотя эта избыточность и определяет повышенную устойчивость к сбоям в каналах передачи данных и при получении данных с носителей , например, с магнитной ленты .
  • Некоторые операции с текстовыми файлами неэффективны. Например, если в файле встретится число, вычислительная система до начала операций с ним должна будет перевести его в свой внутренний формат, применив сравнительно сложную процедуру конвертации числа; чтобы перейти на 1000-ю строку, требуется считать 999 строк, идущих до неё; сложно заменить одну строку другой и т. д. Поэтому при работе с большими объёмами данных текстовые файлы применяют только как промежуточный формат, обеспечивающий интероперабельность .

Форматы, основанные на текстовых файлах

В силу своей простоты текстовые файлы нередко используются для хранения служебной информации (например, логов). Текстовый формат служит основой для многих более специализированных форматов (например, .ini , SGML , HTML , XML , TeX , исходных текстов языков программирования).

В текстовом файле текст может храниться как в неформатированном, так и форматированном или размеченном виде (например, Rich Text Format , HTML), где к каждому символу может быть применено форматирование (шрифт, начертание, размер и т. п.).

Расширения имён файлов

Unicode в текстовых файлах

Применение Unicode в текстовых файлах хотя в основном решает «проблему кодировок» и стандартизирует употребление управляющих символов, но создаёт свои проблемы. В большинстве современных систем неделимой единицей информации в потоке данных является байт (8 бит) , которых для кодирования одного символа из Юникода требуется несколько. В качестве решения применяются несовместимые между собой системы UTF-8 и две версии UTF-16 (UTF-16LE и UTF-16BE с противоположным порядком байтов). Иногда в начало файла добавляют специальный символ-маркер (U+FEFF ), позволяющий распознать формат однозначно. UTF-8 имеет преимущество обратной совместимости с ASCII, однако программная обработка текста в UTF-8 усложняется непостоянным размером символа. Также, тексты в Юникоде отличаются ещё большей избыточностью , нежели 8-битные.

Управляющие символы

Различные операционные системы придерживаются своего представления перевода строки и конца файла. В UNIX перевод строки состоит из одного символа LF (код 10), в Mac OS - из символа CR (код 13), а в DOS и Windows перевод строки кодируется последовательностью двух символов: CR и LF.

Помимо названных, в текстовых файлах применяются такие символы, как табуляция (код 9) и перевод страницы (код 12).

См. также

  • Текст как изображение

Примечания


Wikimedia Foundation . 2010 .

Смотреть что такое "Текстовый файл" в других словарях:

    текстовый файл - Файл, содержащий строки написанной информации, которую можно непосредственно вывести на экран дисплея или принтер, используя обычные команды операционной системы. Файлы, создаваемые текстовыми процессорами не являются текстовыми, т.к. содержат… …

    Файл (англ. file папка, скоросшиватель) концепция в вычислительной технике: сущность, позволяющая получить доступ к какому либо ресурсу вычислительной системы и обладающая рядом признаков: фиксированное имя (последовательность символов, число или … Википедия

    - (текстовый редактор), компьютерная система, предназначенная для создания и обработки текста. Если система может применяться только для этой цели, тогда она называется специализированным текстовым процессором. Более распространен персональный… … Научно-технический энциклопедический словарь

    файл ASCII - Текстовый файл, содержащий только символы с кодами до 127 (набор символов семибитовой кодировки ASCII). Такой файл не содержит символы национальных алфавитов и символы псевдографики. Тематики информационные технологииСправочник технического переводчика

    файл определения - Специальный текстовый файл, содержащий директивы, используемые для связывания объектных составляющих программ (или библиотеки) в выполняемый файл. [Е.С.Алексеев, А.А.Мячев. Англо русский толковый словарь по системотехнике ЭВМ. Москва 1993]… … Справочник технического переводчика

    файл инициализации - Специальный текстовый файл, используемый при загрузке среды и отдельных программ для начальной установки параметров. [Е.С.Алексеев, А.А.Мячев. Англо русский толковый словарь по системотехнике ЭВМ. Москва 1993] Тематики информационные технологии в … Справочник технического переводчика

    У этого термина существуют и другие значения, см. Файл (значения). Файл (англ. file) блок информации на внешнем запоминающем устройстве компьютера, имеющий определённое логическое представление (начиная от простой последовательности… … Википедия

    Сущ., м., употр. сравн. часто Морфология: (нет) чего? файла, нет? файлу, (вижу) что? файл, чем? файлом, о чём? о файле; мн. что? файлы, (нет) чего? файлов, чем? файлам, (вижу) что? файлы, чем? файлами, о чём? о файлах 1. Файлом называется массив… … Толковый словарь Дмитриева

    Или конфигурационный файл используется для хранения настроек компьютерных программ, в том числе и операционных систем. Как правило, конфигурационные файлы имеют текстовый формат и могут быть прочитаны и отредактированы пользователем программы.… … Википедия

    файл со словами, разделенными для переноса - Файл, содержащий текстовый документ, в словах которого расставлены переносы с помощью специальной функции расстановки. Тематики информационные технологии в целом EN hyphenation file … Справочник технического переводчика

Книги

  • Портфолио первоклассника. Программа внеурочной деятельности. Методическое пособие (+CD) , Умнова Марина Сергеевна , Данная рабочая программа предназначена для организации работы с портфолио обучающихся 1 класса в рамках внеурочной деятельности. Программа разработана и составлена с учетом Федерального… Категория: Учебно-воспитательная работа в школе Серия: Классное руководство Издатель:

Принадлежащих тому или иному набору символов). Это символы обычно сгруппированы в строки (англ. lines, rows ). В современных системах строки разделяются разделителями строк , в прошлом же применялось хранение строк в виде записей постоянной или переменной длины (см.: Перфокарта). Иногда конец текстового файла (особенно если в файловой системе не хранится информация о размере файла) также отмечается одним или более специальными знаками, известными как маркеры конца файла .

Текстовой файл может содержать как форматированный , так и неформатированный текст.

Преимущества и недостатки

Преимущества:

  • Универсальность - текстовый файл может быть прочитан (так или иначе) на любой системе или ОС , особенно если речь идёт об однобайтных кодировках вроде ASCII , которые не подвержены проблеме, характерной для других форматов файлов - для них не важна разница в порядке байтов или длине машинного слова на разных платформах .
  • Устойчивость - каждое слово и символ в таком файле самодостаточны и, если случится повреждение байтов в таком файле, то обычно легче восстановить данные и продолжить обработку остального содержимого, в то время как у сжатых или двоичных файлов повреждении нескольких байтов может привести к невозможности восстановить всё содержимое файла. Многие системы управления версиями рассчитаны на текстовые файлы и с двоичными файлами могут работать только как с единым целым.
  • Формат текстового файла крайне прост и его можно изменять текстовым редактором - программой, входящей в комплект практически любой ОС .

Недостатки:

  • У больших несжатых текстовых файлов низкая информационная энтропия - эти файлы занимают больше места, нежели минимально необходимо. Хотя эта избыточность и определяет повышенную устойчивость к сбоям в каналах передачи данных и при получении данных с носителей , например, с магнитной ленты .
  • Некоторые операции с текстовыми файлами неэффективны. Например, если в файле встретится число, вычислительная система до начала операций с ним должна будет перевести его в свой внутренний формат, применив сравнительно сложную процедуру конвертации числа; чтобы перейти на 1000-ю строку, требуется считать 999 строк, идущих до неё; сложно заменить одну строку другой и т. д. Поэтому при работе с большими объёмами данных текстовые файлы применяют только как промежуточный формат, обеспечивающий интероперабельность .

Форматы, основанные на текстовых файлах

В силу своей простоты текстовые файлы нередко используются для хранения служебной информации (например, логов). Текстовый формат служит основой для многих более специализированных форматов (например, .ini , SGML , HTML , XML , TeX , исходных текстов языков программирования).

В текстовом файле текст может храниться как в неформатированном, так и форматированном или размеченном виде (например, Rich Text Format , HTML), где к каждому символу может быть применено форматирование (шрифт, начертание, размер и т. п.).

Расширения имён файлов

Unicode в текстовых файлах

Применение Unicode в текстовых файлах хотя в основном решает «проблему кодировок» и стандартизирует употребление управляющих символов, но создаёт свои проблемы. В большинстве современных систем неделимой единицей информации в потоке данных является байт (8 бит) , которых для кодирования одного символа из Юникода требуется несколько. В качестве решения применяются несовместимые между собой системы UTF-8 и две версии UTF-16 (UTF-16LE и UTF-16BE с противоположным порядком байтов). Иногда в начало файла добавляют специальный символ-маркер (U+FEFF ), позволяющий распознать формат однозначно. UTF-8 имеет преимущество обратной совместимости с ASCII, однако программная обработка текста в UTF-8 усложняется непостоянным размером символа. Также, тексты в Юникоде отличаются ещё большей избыточностью , нежели 8-битные.

Управляющие символы

Различные операционные системы придерживаются своего представления перевода строки и конца файла. В UNIX перевод строки состоит из одного символа LF (код 10), в Mac OS - из символа CR (код 13), а в DOS и Windows перевод строки кодируется последовательностью двух символов: CR и LF.

Помимо названных, в текстовых файлах применяются такие символы, как табуляция (код 9) и перевод страницы (код 12).

См. также

  • Текст как изображение

Примечания


Wikimedia Foundation . 2010 .

  • Библейские имена
  • Движение за права сексуальных и гендерных меньшинств

Смотреть что такое "Текстовый файл" в других словарях:

    текстовый файл - Файл, содержащий строки написанной информации, которую можно непосредственно вывести на экран дисплея или принтер, используя обычные команды операционной системы. Файлы, создаваемые текстовыми процессорами не являются текстовыми, т.к. содержат… …

    Файл (компьютер) - Файл (англ. file папка, скоросшиватель) концепция в вычислительной технике: сущность, позволяющая получить доступ к какому либо ресурсу вычислительной системы и обладающая рядом признаков: фиксированное имя (последовательность символов, число или … Википедия

    ТЕКСТОВЫЙ ПРОЦЕССОР - (текстовый редактор), компьютерная система, предназначенная для создания и обработки текста. Если система может применяться только для этой цели, тогда она называется специализированным текстовым процессором. Более распространен персональный… … Научно-технический энциклопедический словарь

    файл ASCII - Текстовый файл, содержащий только символы с кодами до 127 (набор символов семибитовой кодировки ASCII). Такой файл не содержит символы национальных алфавитов и символы псевдографики. Тематики информационные технологии … Справочник технического переводчика

    файл определения - Специальный текстовый файл, содержащий директивы, используемые для связывания объектных составляющих программ (или библиотеки) в выполняемый файл. [Е.С.Алексеев, А.А.Мячев. Англо русский толковый словарь по системотехнике ЭВМ. Москва 1993]… … Справочник технического переводчика

    файл инициализации - Специальный текстовый файл, используемый при загрузке среды и отдельных программ для начальной установки параметров. [Е.С.Алексеев, А.А.Мячев. Англо русский толковый словарь по системотехнике ЭВМ. Москва 1993] Тематики информационные технологии в … Справочник технического переводчика

    Файл - У этого термина существуют и другие значения, см. Файл (значения). Файл (англ. file) блок информации на внешнем запоминающем устройстве компьютера, имеющий определённое логическое представление (начиная от простой последовательности… … Википедия

    файл - сущ., м., употр. сравн. часто Морфология: (нет) чего? файла, нет? файлу, (вижу) что? файл, чем? файлом, о чём? о файле; мн. что? файлы, (нет) чего? файлов, чем? файлам, (вижу) что? файлы, чем? файлами, о чём? о файлах 1. Файлом называется массив… … Толковый словарь Дмитриева

    Файл конфигурации - или конфигурационный файл используется для хранения настроек компьютерных программ, в том числе и операционных систем. Как правило, конфигурационные файлы имеют текстовый формат и могут быть прочитаны и отредактированы пользователем программы.… … Википедия

    файл со словами, разделенными для переноса - Файл, содержащий текстовый документ, в словах которого расставлены переносы с помощью специальной функции расстановки. Тематики информационные технологии в целом EN hyphenation file … Справочник технического переводчика

Книги

  • Портфолио первоклассника. Программа внеурочной деятельности. Методическое пособие (+CD) , Умнова Марина Сергеевна , Данная рабочая программа предназначена для организации работы с портфолио обучающихся 1 класса в рамках внеурочной деятельности. Программа разработана и составлена с учетом Федерального… Категория: Учебно-воспитательная работа в школе Серия: Классное руководство Издатель:

Подготавливая на компьютере текстовые документы, вы не могли не обратить внимание на большое количество форматов текстовых файлов. Давайте попробуем разобраться в этом изобилии форматов и посмотрим, для чего каждый из них предназначен.

TXT

Данный формат появился вместе с первым компьютером. В *.txt-файле содержится только текстовая информация и ничего больше – данные о форматировании, шрифтах, картинках там сохранить не получится. Формат является наиболее универсальным – он может открыться на всех устройствах с помощью любого приложения.

RTF

Расширенный текстовый формат (Rich Text Format) был разработан компанией Microsoft как универсальный кросс-платформенный формат для хранения текстовой информации. Сохраняет данные форматирования, позволяет производить вставку дополнительных объектов:

  • Формул;
  • Таблиц;
  • Сносок и др.

Основная «фишка» rtf-формата – использование специальных «управляющих» слов, выделенных спецсимволами, что приводит к значительному увеличению объема файла.

DOC

Формат *.doc также разработан корпорацией Microsoft и использовался в текстовом редакторе . Если быть точным, то doc-файлы на самом деле бинарные, их можно открыть в большинстве современных текстовых редакторов. Имеют возможности сохранения форматирования, стилевого оформления, вложения картинок и других объектов в текст, а также поддержку гиперссылок.

DOCX

Усовершенствованный и лицензированный формат от Microsoft, появившийся впервые с пакетом Office 2007. Представляет собой следующий этап формата *.doc.

HTML

Достаточно популярны сейчас форматы, основанные на Hyper Text Markup Language (HTML) – HTM, CHM, MHT и др. Язык HTML был разработан специально для создания веб-страниц, но благодаря своей универсальности, удобству и небольшому размеру стал широко использоваться для хранения текстовых данных. Любой HTML-документ можно прочитать с помощью стандартных инструментов операционной системы, без использования сторонних программ.

PDF

Формат разработан компанией Adobe специально для нужд полиграфии. Впоследствии пользователи оценили удобство использования pdf-файлов, и этот формат стал стандартом для обмена документами.

ODT

Текстовые файлы

Для начала разберемся, что такое текстовые файлы и в чем их различие от двоичных файлов. Текстовые файлы являются подмножеством двоичных файлов, но в отличии от двоичных не могут содержать весь набор символов. Вся информация в файле разбивается на строки, ограниченные символам возврат каретки (CR) и перевод строки (LF). Допустимые символы это символы с кодами от 32 до 255, символы с кодами ниже 32 являются управляющими и допустимы только следующие коды:

· 08 (BS) - возврат на шаг

· 09 (TAB) - табуляция

· 0A (LF) - перевод строки

· 0C (FF) – перевод листа

· 0D (CR) – возврат каретки

· 1A (EOF) – конец файла

Такая ситуация сложилась в стародавние время, когда устройством вывода были телетайпы, затем пишущие машинки и потом появились дисплеи. А каналы связи не позволяли передавать двоичные данные, да и сам они были сначала 5 битные, затем 7 битные и только потом таблицу символов расширили до 8 бит, для поддержки национальных языков и для полной совместимости с компьютерами, где основной единицей был байт. Остальные коды использовались или для управления каналом передачи или для управления специальными устройствами.

Паскаль поддерживает работу с такими файлами, через файловую переменную типа TextFile, где основной единицей является строка, состоящая из основных базовых типов (в текстовом виде, разделенных пробелом), наиболее часто это просто строка, как набор символов. В качестве примера напишем программу преобразования из DOS кодировки (OEM) в Windows (ANSI). Техническое задание:

1. Программа должна работать в консольном режиме и получать входные параметры через командную строку.

2. Программа называется Oem2Ansi

3. На вход поступают два параметра, имя исходного файла и имя выходного файла;

4. Имя выходного файла может быть опущено, в этом случае используется имя входного файла, с изменением расширения выходного на.ANS;

5. Если имена не указаны, то должна выводиться справка о синтаксисе команды;

6. ошибки обрабатывать будем в минимальном объеме, коды ошибок выдаются как ErrorLevel и доступны для обработки в.bat файле.

Текстпрограммы Oem2Ansi

program Oem2Ansi; {$APPTYPE CONSOLE} uses Windows, SysUtils; var InFile: TextFile; OutFile: TextFile; InFilename: string; OutFilename: string; S: string; begin if ParamCount = 0 then begin WriteLn("Syntax is: Oem2Ansi Infile "); Halt(1);// Ошибкасинтаксиса end; InFilename:= ParamStr(1); if ParamCount = 2 then OutFileName:= ParamStr(1) else OutFileName:= ChangeFileExt(InFilename, ".ans"); AssignFile(InFile, InFilename);// связываемвходнойфайл AssignFile(OutFile, OutFilename);// ивыходнойфайл try try Reset(InFile);// открываем входной файл Rewrite(OutFile);// создаем выходной файл while not EOF(InFile) do// крутимпоканеконецфайла begin Readln(Infile, S);// читаемстроку if Length(S) > 0// на вход функции можно then// подавать только не пустые строки begin OemToChar(Pchar(S), Pchar(S)); WriteLn(Outfile, S);// записываемстроку end else begin WriteLn(Outfile);// записываем пустую строку end; end; except Halt(2);// любаяошибка // не удалось преобразовать файлы end; finally CloseFile(InFile); CloseFile(OutFile); end; end.

Разберем работу программы по кусочкам. Вначале объявляются две файловые переменные текстового типа и две переменные для имен файлов, а также одна переменная для хранения и обработки строки. Затем анализируются входные параметры, если параметры не указываются, то выводится сообщение об ошибки и программа заканчивается с кодом выхода 1. Обратите внимание на форму процедуру WriteLn, если в параметрах не указывается файловая переменная, то вывод производится на консоль, что удобно для выдачи различных сообщений, данная форма возможна только для консольного приложения и не применима в GUI приложении.

После этого первый параметр копируется в переменную InFilename, если параметров два, то второй параметр копируется в переменную OutFilename, иначе используется имя входного файла и изменяется расширение, на расширение по умолчанию.ANS

После этого имена файлов связываются с файловыми переменными. Теперь мы готовы к преобразованию файла, которое будет делаться в двух защищенных блоках, первый блок для защиты ресурсов, а второй блок для защиты от возможных ошибок при работе с файлами, для любых ошибок возвращается код ошибки 2.

Первое действие состоит в открытии файлов, входной файл открывается с помощью процедуры Reset -это открытие текстового файла в режиме чтения, а второй с помощью Rewrite – открытие в режиме записи, если файл существует, то он переписывается. Есть еще одна форма открытия текстовых файлов, это функция Append(FileVar), открытие в режиме добавления строк, если файл существует, то курсор позиционируется в конец файла и файл открывается в режиме записи, если файла нет, то он создается. После нее управление передается в блок finally. В случае ошибки управление сначала передается в блок except, а затем в блок finally.

После этого создается цикл чтения сток пока не будет, достигнут конец файла, или физический или будет встречен символ EOF. Функция EOF(FileVar).

Внутри цикла читается строка во временную переменную Readln(Infile, S) и тут принята одна предосторожность, в функцию Oem2Char НЕЛЬЗЯ передавать пустые строки, поэтому производится анализ длины строки, если строка не нулевая, то производится конвертирования и запись ее в выходной файл, процедурой WriteLn(Outfile, S), иначе в файл пишется пустая строка.

По окончанию цикла или в случае ошибки управление поступает в защищенный блок finally, где оба файла закрываются и управление передается операционной системе.

Домашнее задание - переписать в Ansi2Oem для выполнения обратной функции, с тем же техническим заданием, расширение по умолчанию OEM

Для особо желающих сделать GUI версию, с диалогами выбора файлов, с прогресс-бар, с предварительным просмотром первых 10-20 строк входного файла (переключение кнопкой OEM/ANSI), с целью определения направления перекодирования, с остальными наворотами, которые сумеет придумать душа, например пакетная обработка всех файлов из папки.

Файл (англ. file — скоросшиватель) — концепция в вычислительной технике: сущность, позволяющая получить доступ к какому-либо ресурсу вычислительной системы и обладающая рядом признаков:

  • фиксированное имя (последовательность символов, число или что-то иное, однозначно характеризующее файл);
  • определённое логическое представление и соответствующие ему операции чтения/записи.

Может быть любой — от последовательности бит(хотя читаем именно байтами, а точнее словами-группами из байт, по четыре, по восемь, по шестнадцать) до базы данных с произвольной организацией или любым промежуточным вариантом; многомерной базой данных, строго упорядоченной.

Первому случаю соответствуют операции чтения/записи потока и/или массива (то есть последовательные или с доступом по индексу), второму — команды СУБД. Промежуточные варианты — чтение и разбор всевозможных форматов файлов.

(Материал из Википедии — свободной энциклопедии)

Господи, какой бред (© olivur77).

Вы что-нибудь поняли? Я нет. Определение в википедии, конечно, скорее всего корректно, но никакого понимания для простых смертных (таких как я) оно не дает.

Что такое файл? Объяснение на нормальном языке.

Давайте я опять на примерах объясню, что такое файл , а то академическое толкование, и, особенно перевод с английского, навевает скуку.

Вы никогда не задумывались, почему щелкая мышкой «по маленькой фотографии» (), открывается программа (тоже файл, а иногда несколько файлов) для просмотра фотографий? Когда щелкаем по ярлыку с фильмом (), запускается программа для просмотра фильма? Когда щелкаем по ярлыку (кстати тоже файл) для халявного общения (например ), открывается программа, по которой мы бесплатно общаемся с друзьями и родственниками, да еще и видим друг друга?

Почему так происходит? Если Вы думаете, что операционная система Windows такая умная, то Вы глубоко ошибаетесь.

Я хочу развеять миф об «умности» операционной системы Windows и поближе познакомить Вас такими понятиями как «файл», «расширение», «формат» .

Слова на первый взгляд страшные и непонятные, но на самом деле все довольно просто и в этом мы скоро убедимся.

Давайте сделаем одну настройку (как показано на рисунке ниже), которая поможет нам разобраться с этими понятиями.

Нажимаем кнопку «Пуск», выберем «Панель управления»(если хотите подробнее узнать что это такое, пройдите ). Если у Вас вид «Панели управления» не такой, как на картинке (а, скорее всего «вид по категориям», так как этот вид установлен по умолчанию), то щелкните левой кнопкой мыши по надписи «Переключение к классическому виду».

Затем щелкните два раза быстро левой кнопкой мыши по значку «Свойства папки» — Вам откроется настройка свойств папок. По умолчанию Вы попадаете на вкладку «Общие». Щелкните левой кнопкой мыши по вкладке «Вид».

Уберите галочку напротив «Скрывать расширения для зарегистрированных типов файлов», щелкнув по ней левой кнопкой мыши. Если у Вас не видно этой надписи, воспользуйтесь правым ползунком (полоса прокрутки) и «промотайте» в конец меню (подведите указатель мышки на ползунок, нажмите левую кнопку мыши и удерживая кнопку нажатой, перетащите ползунок вниз).

Как создать файл? На примере txt.

Начнем с простого примера. Создадим на своем рабочем столе обычный текстовый документ (файл). Сделаем мы это следующим образом.

Расположите указатель мыши (курсор) в области рабочего стола, где нет ярлыков. Щелкаем правой кнопкой мыши, выбираем левой кнопкой мыши «Создать» — «Текстовый документ».

На рабочем столе должен появиться ярлычок с изображением «перекидного блокнота на пружинках как бы с текстом» под названием «Текстовый документ.txt».

Говоря компьютерным языком, мы создали текстовый файл. Обратите внимание, что помимо понятных нам слов, в названии файла есть какая-то точка и непонятные три английские (латинские) буквы. К чему это все и для чего это надо? Давайте по порядку.

Текстовый документ.txt — это, собственно, название самого файла, которое состоит из:

    1. Имени

В данном случае имя файла — Текстовый документ (В принципе, имя файла может быть любым, состоять из одного или нескольких слов, может включать в себя специальные символы, например подчеркивание, тире или пробел. В нашем случае имя файла состоит из 2-х слов и одного специального символа (как ни странно) — пробела. т. е. если для нас это понятное сочетание слов Текстовый документ, то компьютер воспримет это имя как Текстовыйпробелдокумент (Это для справки, к нашей теме это никакого отношения не имеет. Просто с этим Вы в дальнейшем можете столкнуться, так чтобы это не было для Вас неожиданностью).

    1. Разделителя

Точка (.) — это символ, который разделяет имя файла и расширение файла. Почему именно точка? Исторически с покон веков. Просто так решили давным давно, когда только зарождались программы. Да в общем-то и симпатично — ничего лишнего и глаз не режет.

    1. Расширения

Само слово расширение, мне кажется, понять проще. Вот есть имя файла, его взяли да и расширили какими-то буквами и название файла стало шире (ну или длиннее). В нашем случае расширение имеет вид txt . Вот это вот txt и указывает операционной системе (Windows), какой программой открывать этот файл, чтобы мы могли посмотреть (прочитать), что там написано в этом файле (в данном случае текстовый файл), ну или написать туда что-нибудь. Еще говорят, что этот файл текстового формата (о форматах подробнее чуть позже).

Если пока понятно, что такое расширение файла , то я дам взрослую формулировку: Расширение файла указывает операционной системе на его формат, в нашем случае файл имеет формат txt.

Я долго думал, делать экскурс в историю в рамках этой темы или нет, но все-таки решил написать, так как в этом экскурсе Вы найдете еще несколько ответов на вопросы «почему …».

Когда-то давно, когда компьютеры были большими и слабенькими , не было той красивой разноцветной графики, которую Вы видите сейчас на экране монитора своего компьютера, да и называть компьютеры в Советском Союзе было принято ЭВМ (электронно — вычислительная машина или ПЭВМ, где «П» означало персональная), а программистов математиками. Тогда на экране монитора можно было видеть только текст белого или зеленого цвета на черном фоне. Компьютеры тогда были 8-разрядные (не забивайте сейчас этим себе голову, примите на веру). Борьба тогда шла за каждый бит информации. Разрабатывались различные стандарты.

Так вот в эту эпоху и было принято одно из решений, что название файла будет иметь вид имя/разделитель/расширение.

Опять же из-за скудности ресурсов, под имя файла выделили 8 символов (скажем так, не более 8-ми символов, т. е. меньше можно, а больше 8-ми нельзя), разделителем сделать точку, а для расширения отвести только 3 символа (буквы).

Шло время. Прогресс не стоял на месте. Компьютеры стали маленькими и мощными с прекрасной красивой цветной графикой, которая радует наш глаз. Разрядность персональных компьютеров увеличилась уже в 8 раз. И теперь перед Вами теперь находится 32-х или 64-х разрядный компьютер с 32-х или 64-х разрядной операционной системой (скорее всего Windows).

Поскольку компьютеры стали мощными, то и ограничение на длину имени файла стало не таким критичным. На сегодняшний день это где то до 256 символов.

Так вот. Поскольку имен файлов во всем мире миллиарды и эти имена могут быть любыми, то и этих 256 символов за глаза хватает. Интереснее с расширениями. На самом деле форматов файлов не так уж и много (относительно конечно) и до сих пор хватает, в общем-то, и 3-х символов. Сейчас есть и 4 символа (есть и больше) в расширении файлов, но это скорее преемственность. Например, файл, созданный тестовым редактором Word из пакета Microsoft Office 2003 имеет расширение.doc, а файл, созданный тестовым редактором Word из пакета Microsoft Office 2007 (более свежая версия этого пакета), имеет расширение.docx.

Еще один интересный момент. Как только компьютеры достигли своего развития, когда на мониторах начала появляться графика, а не только текст, тогда же появились и ярлыки (Да, собственно, и манипулятор мышь. Мыши советского производства имели довольно большой размер, поэтому их презрительно называли крысами). Так вот маленькие картинки на ярлыках (в нашем случае это изображением «перекидного блокнота на пружинках как бы с текстом») — это тоже часто отдельные файлы, в то время, в основном, имели расширение.ico сокращение до 3-х символов английского слова icon, которое в английском языке означает икона, символ, знаковый образ. С тех пор эти маленькие изображения называют иконками. Другие названия этих маленьких изображений — пиктограмма, значок.

И так, вернемся к нашим баранам, т. е. к файлу «Текстовый документ.txt» на нашем рабочем столе.

Щелкаем левой кнопкой мыши 2 раза быстро по ярлыку созданного нами файла «Текстовый документ.txt». Гм. (А вот интересно, у Вас получается для открытия файла 2 раза быстро по нему щелкнуть? Причем мышку в это время двигать нельзя, потому что если сдвинем мышку между щелчками это самое открытие не сработает. У меня получается через раз. За 15 лет я так и не научился 2 раза подряд быстро щелкать левую кнопку мыши. Наверно мои кривые руки, скорее всего, заточены под кувалду. Поэтому я пользуюсь старым «дедовским» методом, который экономит мои нервные клетки.) Я, правда, открываю файлы по другому. Щелкаю правой кнопкой мыши по ярлыку, выбираю в меню самый верхний пункт меню «Открыть» и нажимаю по нему левой кнопкой мыши. (Мы очень часто пользуемся мышкой. Если вы не умеете или плохо с ней работаете, то можете пройти два урока о и о )

Что мы видим? Мы видим пустой файл, открытый программой «Блокнот» (пустой, потому что мы туда еще ничего не писали — это недолго сделать, напишем еще).

Кстати, давайте и напишем. Мне, как человеку по жизни ленивому, просто набирать текст на клавиатуре влом. Тем более, когда это можно и не делать. Я его (текст) просто откуда-нибудь скопирую. Чтобы текст был осмысленным и полезным по жизни, я скопирую сюда из интернета рецепт моих любимых блинчиков. Они получаются настолько тонкие, что даже просвечиваются.

Пусть наш текстовый документ остается на рабочем столе. А мы зайдем в интернет на сайт бесплатного клавиатурного тренажера на страничку по адресу http://stamina.ru/blog/pitanie/blini и скопируем оттуда кусочек рецепта следующим образом.

Подводим указатель мыши к началу текста, который мы хотим выделить, а точнее чуть левее, нажимаем левую кнопку мыши, и, Удерживая кнопку мыши нажатой, «ведем» указатель мыши к концу фрагмента нужного нам текста. Если нас устраивает выделенная область текста, то отпускаем левую кнопку мыши и тут же нажимаем на правую кнопку мыши (на рисунке описан другой вариант того_же самого действия). Появиться меню, в котором подводим указатель мыши к пункту меню «Копировать» и щелкаем левой кнопкой мыши.

Ну и возьмем какой-нибудь эталонный диск. К примеру на компьютере есть диск «G:» размером 10 Гб (гигабайт). Или если в байтах 10 000 000 000 байт (на самом деле немного больше, но для нас это сейчас не принципиально).

Нетрудно подсчитать, что таких файлов, как наш «Рецепт блинчиков.txt» на этом диске поместится: 10 Гб делим на наши 507 байт и получается примерно 19 723 866 файлов (на самом деле немного меньше, но для нас это сейчас тоже не принципиально).

Грубо говоря на нашем диске в 10 Гб мы можем разместить 20 миллионов таких файлов, как наш «Рецепт блинчиков.txt».

На этом я хочу закончить 1-ую часть статьи, в которой на примере простого текстового файла, мы начали рассматривать значение таких понятий как «файл», «формат», «расширение». В , мы рассмотрим эти понятия уже на более «тяжелых» форматах файлов таких как файлы изображений, музыкальные и видео файлы, ну и многое другое, что этому сопутствует.

На этом все. Всем удачи и творческих успехов. 🙂

P.S. Так же читайте вторую часть статьи, о и третью — о .