Элемент разметки ISINDEX


Содержание

Элемент разметки ISINDEX

Тег применяется для создания шаблона поиска в виде однострокового окна для ввода текста. Внешне браузеры могут по-разному отображать данный тег, но все они отрисовывают верхнюю и нижнюю границу блока в виде тонких линий. Тег давно вышел их употребления в HTML ввиду своих ограниченных возможностей. Opera его не поддерживает.

Отправлять данные запроса поисковой программе можно двумя способами. Первый. Изменить базовый адрес страницы поиска при помощи тега — на базовый адрес CGI-программы на сервере. Этот способ не работает в IE. Второй. Указать адрес поисковой программы в значении атрибута action тега , но надо учитывать, что данный атрибут отсутствует в спецификации HTML и код будет невалидным. Этот способ работает только в IE.

Сами данные браузер отправляет поисковой программе методом GET, то есть непосредственно в URL. Происходит это так. В конце адреса указанного в или теге (атрибут action ) браузер добавляет знак вопроса (?), после которого указывает данные. Если в запросе присутствуют пробелы, то они заменяются знаком плюс (+). Кроме этого, некоторые браузеры заменяют нелатинские буквы на ACSII символы. После того, как сервер получает данные — он запускает CGI-программу и передает их ей. Обработав данные, программа возвращает новую HTML-страницу.

Тег является устаревшим. Вместо него рекомендуется использовать .

Атрибуты

  • action — Задает адрес поисковой программы. Не поддерживается спецификацией HTML.
  • prompt — Пояснительная текстовая строка, подсказывающая каким образом лучше осуществлять поиск.
  • class — задает имя класса или классов тега, используемых в CSS (Каскадные таблицы стилей).
  • dir — указывает направление текста внутри элемента.
  • id — задает имя идентификатора HTML-тега, который может использоваться в качестве «якоря» или в таблицах стилей.
  • lang — указывает язык, на котором написан текст внутри HTML-элемента.
  • style — необходим для применения встроенных стилей CSS к тегу.
  • title — выводит всплывающую подсказку при наведении курсора мыши на HTML-элемент.

Тип тега

Модель тега: block (блочный, уровня блока). Также допускается размещение одного тега в «шапке» документа, элементе .

Может содержать: данный элемент является пустым/Empty.

Открывающий тег: необходим. Закрывающий тег: запрещен.

Синтаксис

Пример HTML: применение тега ISINDEX

Результат. Применение тега ISINDEX.

Поддержка версиями HTML

Версия: HTML 4.01 HTML 5 XHTML 1.0 XHTML 1.1
Поддержка: Частично Нет Частично Нет

В HTML 4.01 и XHTML 1.0 использовать тег допускается только с Transitional и Frameset, в противном случае будет невалидный код.

17 Формы

Оглавление

17.1 Введение

Форма HTML это раздел документа, содержащий обычные данные, разметку, специальные элементы, называемые «элементы управления» (переключатель, radio-кнопка, меню и т.д.), и лэйблы для этих элементов управления.
Пользователи обычно «заполняют» форму, изменяя содержимое её элементов (вводя текст, выбирая пункты меню и т.д.), прежде чем отправить её агенту для обработки (напр., Web-серверу, mai-серверу и т.п.)

Вот пример простой формы, включающей лэйблы, radio-кнопки и кнопки push (для очистки или отправки формы):

Примечание. Эта спецификация содержит более развёрнутую информацию о формах в разделе вопросы отображения форм.

17.2 Элементы управления

Имя элемента управления (ЭУ), , задаётся атрибутом name . Областью видимости атрибута name ЭУ внутри формы является элемент FORM .

Каждый ЭУ имеет начальное и текущее значение типа «символьная строка». См. определение каждого ЭУ для спецификации начальных значений и возможные ограничения значений, принимаемых ЭУ. В целом, может быть установлено атрибутом value ЭУ. Однако начальное значение ЭУ TEXTAREA задаётся его содержимым, а начальное значение ЭУ OBJECT в форме определяется реализацией данного объекта (т.е. находится вне пределов данной спецификации).

ЭУ вначале устанавливается в первоначальное значение. После этого текущее значение ЭУ можно изменять, взаимодействуя с пользователем, и с помощью скриптов (сценариев).

Начальное значение ЭУ не изменяется. Таким образом, при очистке формы текущее значение каждого ЭУ устанавливается в начальное значение.
Если ЭУ не имеет начального значения, воздействие очистки формы на данный ЭУ не определено.

При отправке формы на обработку, некоторые ЭУ образуют пары «имя/значение», которые затем пересылаются с формой. ЭУ, чьи пары имя/значение высланы, называются «действующие ЭУ».

17.2.1 Типы элементов управления формы (ЭУ)

HTML определяет следующие типы ЭУ:

кнопки Авторы могут создавать кнопки трёх типов:

  • кнопки submit : при активации кнопка submit отправляет форму. Форма может содержать несколько кнопок submit;
  • кнопки reset : при активации кнопка reset устанавливает все ЭУ в их начальные значения;
  • кнопки push : кнопки push не имеют предопределённых функций. Каждая кнопка push может иметь клиентский сценарий (выполняемый на стороне клиента), ассоциированный с атрибутом event/событие. При возникновении события (напр., пользователь нажал кнопку, отпустил её и т.д.), включается ассоциированный сценарий (скрипт).

Автор должен указать язык сценария кнопки push путём объявления языка скриптов по умолчанию (в элементе META ).

Авторы создают кнопки, используя ЭУ BUTTON , или ЭУ INPUT . См. определение этих ЭУ .

Примечание. Авторы должны иметь в виду, что возможности ЭУ BUTTON богаче, чем у INPUT .

Несколько переключателей в форме могут использовать одно имя ЭУ. Так, например, переключатели позволяют пользователям выбрать несколько значений для одного свойства. ЭУ INPUT используется для создания переключателей.

radio-кнопки Radio-кнопки похожи на переключатели/checkboxes, за исключением того, что, при использовании одного и того же имени ЭУ, они действуют взаимоисключающе: если одна выбрана «включено», все остальные с тем же именем «выключены». Элемент INPUT используется для создания ЭУ «radio-кнопка». Если ни одна radio-кнопка из использующих общее имя первоначально не установлена во «включено», поведение пользовательского агента (ПА) по установлению того, какая из кнопок включена, не определено.
Примечание. Поскольку существующие приложения обрабатывают эту ситуацию по-разному, данная спецификация отличается от RFC 1866 ([RFC1866] раздел 8.1.2.4) в следующем:

В определённый момент времени только одна radio-кнопка из набора может быть «включена». Если ни один из элементов набора radio-кнопок не установлен (`CHECKED’), тогда ПА обязан вначале включить первую из кнопок набора.

Поскольку поведение ПА различно, авторы должны убедиться, что в каждом наборе radio-кнопок одна «включена».

меню Меню дают возможность выбора из списка значений. Элемент SELECT создаёт меню в комбинации с элементами OPTGROUP и OPTION .
текстовые поля
Авторы могут создавать поля для ввода текста двух видов. Элемент INPUT создаёт однострочный ЭУ, а элемент TEXTAREA — многострочный. В обоих случаях, введённый текст становится текущим значением.
выбор файла/file select
ЭУ этого типа позволяют пользователям выбрать файлы, и их содержимое может пересылаться с формой. Элемент INPUT используется для создания ЭУ выбор файла/file select.
hidden control/скрытый ЭУ
Авторы могут создавать невидимые ЭУ, значения которых пересылаются вместе с формой. Обычно ЭУ этого типа используются для хранения информации при обмене клиент/сервер, которая иначе может быть утеряна из-за нестатичной природы HTTP (см. [RFC2616]). Элемент INPUT используется для создание скрытых ЭУ/hidden control.
ЭУ object
Авторы могут вставлять в форму общие объекты, чьи ассоциированные значения пересылаются вместе с другими данными. Авторы создают объект с помощью ЭУ OBJECT .

Элементы, используемые для создания ЭУ, обычно размещаются внутри элемента FORM , но могут также находиться и вне объявления элемента FORM , если используются для создания пользовательского интерфейса. Этот вопрос рассматривается в разделе внутренние события. Обратите внимание — ЭУ вне формы не могут быть «действующими ЭУ».

17.3 Элемент FORM

Начальный тег: необходим, Конечный тег: необходим

action = uri [CT] Определяет обработчик формы. Поведение пользовательского агента (ПА) для значений, отличных от HTTP URI не определено. method = get|post [CI] Определяет, какой метод HTTP используется для отправки набора данных формы. Возможные (нечувствительные к регистру) значения — «get» (по умолчанию) и «post». См. родственную информацию в разделе отправка формы. enctype = content-type [CI] Определяет тип содержимого/content type при отправке формы на сервер (если значение method’a — «post»). Значением по умолчанию этого атрибута является «application/x-www-form-urlencoded» . Значение «multipart/form-data» должно использоваться в комбинации с элементом INPUT , type =»file». accept-charset = список наборов символов [CI] Определяет список кодировок для вводимых данных, принимаемых сервером, обрабатывающим данную форму. Значением является список наборов символов, разделённых пробелами и/или запятыми. Клиент должен интерпретировать этот список как список XOR (exclusive-or), т.е. сервер может принять любой отдельный символ кодировки на каждый полученный объект. Значением по умолчанию этого атрибута является зарезервированная строка «UNKNOWN».
ПА могут интерпретировать это значение как кодировку символов, использованную для передачи документа, содержащего форму FORM . accept = content-type-list [CI] Определяет список разделённых запятыми типов содержимого, которые сервер-обработчик формы будет обрабатывать корректно. ПА могут использовать эту информацию для фильтрации несоответствующих файлов при запросе пользователя на выбор файлов, пересылаемых серверу (сравните элемент INPUT с type =»file»). name = cdata [CI] Этот атрибут именует элементы таким образом, что на них можно ссылаться из таблицы стилей или скрипта (сценария).
Примечание. Этот атрибут введён для обеспечения обратной совместимости. Приложения должны использовать атрибут id для идентификации элементов.

Атрибуты, определённые в другом месте

Элемент FORM действует как контейнер для ЭУ. Он определяет:

  • Вид формы (в зависимости от содержимого элементов).
  • Программу, которая будет обрабатывать заполненную и отправленную форму — обработчик формы (указанный в атрибуте action ). Программа должна разбирать пары имя/значение для их последующего использования.
  • Метод отправки данных пользователя на сервер (атрибут method ).
  • Кодировку символов, понимаемую сервером — для обработки формы (атрибут accept-charset ).
    ПА должны уведомлять пользователя о значении атрибута accept-charset и/или ограничивать возможность введения пользователем нераспознаваемых символов.

Форма может содержать текст и разметку (параграфы, списки и т.п.) в дополнение к ЭУ формы.

В следующем примере показана форма, обрабатываемая программой «adduser» после отправки.
Форма будет отправлена программе методом «post».

См. раздел отправка формы о том, как ПА должны готовить данные формы для сервера и как ПА должны обработать ожидаемый ответ.

Примечание. Обсуждение работы сервера, принимающего данные формы, находится за рамками данной спецификации.

17.4 Элемент INPUT

Начальный тег: необходим, Конечный тег: запрещён

type = text|password|checkbox|radio|submit|reset|file|hidden|image|button [CI] Определяет тип создаваемого ЭУ. Значение этого атрибута по умолчанию — «text». name = cdata [CI] Имя ЭУ. value = cdata [CA] Начальное значение ЭУ. Не обязательно, если только атрибут type не имеет значение «radio» или «checkbox». size = cdata [CN] Сообщает пользовательскому агенту начальную ширину ЭУ. Ширина задаётся в пикселах, за исключением случаев, когда атрибут type имеет значение «text» или «password». В этом случае значение атрибута — (integer) целое число символов. maxlength = number [CN] Если атрибут type имеет значение «text» или «password», этот атрибут определяет максимальное количество символов, которое может ввести пользователь. Это число может оказаться больше установленного размера ( size ) . В этом случае ПА должен предоставить возможность прокрутки. По умолчанию значением этого атрибута является неограниченное количество. checked [CI] Если атрибут type имеет значение «radio» или «checkbox», данный булев атрибут определяет , что кнопка нажата. ПА должны игнорировать этот атрибут в ЭУ всех других типов. src = uri [CT] Если атрибут type имеет значение «image», этот атрибут устанавливает место нахождения изображения, используемого в качестве кнопки submit.

Атрибуты, определённые в другом месте

17.4.1 Типы ЭУ, создаваемых в элементе INPUT

Тип ЭУ, определяемый элементом INPUT , зависит от значения атрибута type :

text Однострочный ЭУ для ввода текста. password Как «text», но вводимый текст изображается так, чтобы скрыть вводимые символы (напр., серией «звёздочек»). ЭУ этого типа часто используется для ввода специальной информации, напр., пароля. Заметьте, что текущее значение, это текст, введённый пользователем, а не текст, изображаемый ПА.

Примечание. Разработчики программного обеспечения должны иметь в виду, что этот механизм обеспечивает лишь некоторую защиту. Хотя пароль маскируется ПАгентом от случайного просмотра, он передаётся на сервер в виде обычного текста и может быть прочитан кем-нибудь, имеющим низкоуровневый доступ к сети.

Если для щелчка на кнопке image используется указательное устройство (мышь и т.п.), форма отправляется и координаты щелчка передаются серверу. Значение Х измеряется в пикселах от левого края изображения, а значение У — в пикселах от верхнего края изображения. Отправленные данные включают значения name.x=x-value и name.y=y-value, где «name» это значение атрибута name , а x-value и y-value это значения координат x и y соответственно.

Если сервер выполняет разные действия в зависимости от места нажатия на элементе, пользователи неграфических браузеров окажутся в затруднительном положении. По этим причинам авторы должны предусматривать дополнительные варианты:

  • Использовать несколько кнопок submit (каждая со своим изображением) вместо единой графической кнопки submit. Авторы могут использовать таблицы стилей для управления положением кнопок.
  • Использовать клиентские карты изображений в сочетании со скриптами.

reset Создаёт a кнопку reset. button Создаёт кнопку push. ПА должны использовать значение атрибута value как лэйбла кнопки. hidden Создаёт элемент hidden. file Создаёт ЭУ file select. ПА могут использовать значение атрибута value начальное имя файла.

17.4.2 Примеры форм, содержащих ЭУ в элементе INPUT

Следующий фрагмент HTML определяет простую форму, которая даёт пользователю возможность ввести имя, фамилию, email адрес и пол. При активации кнопки submit, форма посылается программе, указанной в атрибуте action .

Эта форма будет выглядеть примерно так:

В разделе элемента LABEL мы обсуждаем установку лэйблов, таких как «First name».

В этом примере, функция verify JavaScript включается при возникновении события «onclick»:

См. раздел внутренние события о сценариях и событиях.

В следующем примере показано, как содержимое определённого пользователем файла может пересылаться с формой. Пользователь запрашивается о его (или её) имени и списке имён файлов, содержимое которых должно быть отправлено с формой. При установке значения enctype в «multipart/form-data» содержимое каждого файла упаковывается для отправки отдельным разделом составного документа.

17.5 Элемент BUTTON

Начальный тег: необходим, Конечный тег: необходим

name = cdata[CI] Определяет имя ЭУ. value = cdata[CS] Устанавливает начальное значение кнопки. type = submit|button|reset [CI] Объявляет тип кнопки. Возможные значения:

  • submit: создаёт кнопку submit. Это значение по умолчанию.
  • reset: создаёт кнопку reset.
  • button: создаёт кнопку push.

Атрибуты, определённые в другом месте

Кнопки, созданные элементом BUTTON работают почти так же, как и кнопки, созданные элементом INPUT , но дают больше возможностей представления: элемент BUTTON может иметь содержимое. Например, элемент BUTTON , содержащий изображение, работает и может выглядеть как элемент INPUT , чей type установлен «image», но элемент BUTTON может иметь содержимое.

Визуальные ПА могу представлять кнопку BUTTON с рельефом и смещением вверх/вниз при нажатии, в то время как они могут рассматривать кнопки INPUT только как «плоские» изображения.

Этот пример расширяет предыдущий, но создаёт кнопки submit и reset элементом BUTTON вместо INPUT . Кнопки содержат изображения так же, как элемент IMG .

Напоминаем, что авторы должны указывать альтернативный текст для элемента IMG .

Недопустимо ассоциировать карту изображений с IMG , который является содержимым элемента BUTTON .

НЕВЕРНОЕ ИСПОЛЬЗОВАНИЕ:
Это неверный HTML.

Начальный тег: необходим, Конечный тег: необходим

Определения атрибутов элемента SELECT

name = cdata [CI] Устанавливает имя ЭУ. size = number [CN] Если элемент SELECT представлен в виде прокручиваемого списка, этот атрибут определяет количество видимых одновременно рядов в списке. Визуальные ПА не требуют представления элемента SELECT как прокручиваемого списка; они могут использовать для этого ниспадающее меню. multiple [CI] При установке это булев атрибут разрешает множественный выбор. Если не установлен, элемент SELECT допускает выбор только одной позиции.

Атрибуты, определённые в другом месте

Элемент SELECT создаёт меню. Каждая опция выбора представляется элементом OPTION . Элемент SELECT должен содержать не менее одного элемента OPTION .

Элемент OPTGROUP позволяет группировать опции логически. Это особенно удобно, когда пользователь должен выбрать из большого списка опций: группы связанных опций легче осмыслить и запомнить, чем один большой список опций. В HTML 4 все элементы OPTGROUP должны быть определены непосредственно в элементе SELECT (т.е. группы не могут быть вложенными).

17.6.1 Предустановленные опции

Ноль или более опций могут быть предустановлены для пользователя. ПА должны определять, какая опция является предустановленной, следующим образом:

    Если ни один элемент OPTION не имеет установленного атрибута selected , поведение ПА по определению предустановленной опции не определено.
    Примечание. Поскольку существующие программы обрабатывают эту ситуацию по-разному, данная спецификация отличается от RFC 1866 ([RFC1866] раздел 8.1.3):

Первоначально выбранной является опция 1, если только отсутствует атрибут SELECTED или любой из элементов .

Поскольку поведение ПА различно, авторы должны удостовериться, что каждое меню включает предустановленную опцию ( OPTION ) по умолчанию.

  • Если один из элементов OPTION имеет установленный атрибут selected , он должен быть предустановленным.
  • Если элемент SELECT имеет установленный атрибут multiple , и более чем один элемент OPTION имеет установленный атрибут selected , они все должны быть предустановлены.
  • Считается ошибкой, если более чем один элемент OPTION имеет установленный атрибут selected , и элемент SELECT не имеет установленного атрибута multiple . ПА могут по-разному обрабатывать такие ошибки, но не должны предустанавливать более чем одну опцию выбора.
  • Начальный тег: необходим, Конечный тег: необходим

    Определение атрибута элемента OPTGROUP

    Атрибуты, определённые в другом месте

    Примечание. Разработчики должны помнить, что следующие версии HTML могут расширить механизм группировки, чтобы разрешить вложенные группы (т.е., элементы OPTGROUP могут быть вложенными). Это позволит авторам определять возможность более сложного выбора.

    Начальный тег: необходим, Конечный тег: не обязателен

    Определения атрибутов элемента OPTION

    selected [CI] Если установлен, этот булев атрибут определяет, какая из опций предустановлена. value = cdata [CS] Определяет начальное значение ЭУ. Если не установлен, начальное значение установлено на содержимое элемента OPTION . label = text [CS] Позволяет авторам определить более короткий лэйбл по сравнению с содержимым элемента OPTION . Если определён, ПА должен использовать значение этого атрибута вместо содержимого элемента OPTION в качестве лэйбла опции.

    Атрибуты, определённые в другом месте

    При рассмотрении выбора опции меню ПА должен использовать значение атрибута label элемента OPTION в качестве выбора. Если этот атрибут не установлен, ПА должен использовать содержимое элемента OPTION .

    Атрибут label элемента OPTGROUP определяет лэйбл для группы выбора.

    В следующем примере создаётся меню, позволяющее пользователю выбрать, какой из 7 программных компонентов устанавливать. Первый и второй компоненты предустановлены, но могут быть отключены пользователем. Остальные компоненты не предустановлены. Атрибут size устанавливает, что видны только 4 ряда меню, хотя пользователь может выбирать из 7 опций. Другие опции могут стать доступными путём прокрутки.

    После SELECT идут кнопки submit и reset.

    Только выбранные опции будут действующими (используя имя ЭУ «component-select»). Если ни одна опция не выбрана, ЭУ является недействующим, и ни имя, ни какое-либо его значение не отсылаются серверу при отправке формы. Заметьте, что если атрибут value установлен, он определяет начальное значение ЭУ и является в то же время содержимым элемента.

    В этом примере использован элемент OPTGROUP для группирования опций. Следующая разметка:

    представляет такую группировку:

    Визуальные ПА могут позволять пользователям выбирать из группы опций иерархического меню или другим способом, отражающим структуру опций выбора.

    Графический ПА может представить это так:

    Этот рисунок показывает элемент SELECT как выпадающее меню. Верхний лэйбл меню показывает выбранное в данный момент значение (PortMaster 3, 3.7.1). Пользователь раскрыл два ниспадающих меню, но ещё не выбрал новое значение (PortMaster 2, 3.7). Заметьте, что каждое каскадное меню отображает лэйбл элемента OPTGROUP или OPTION .

    17.7 Элемент TEXTAREA

    Начальный тег: необходим, Конечный тег: необходим

    Атрибуты, определённые в другом месте

    Элемент TEXTAREA создаёт многострочный ЭУ для ввода текста. ПА должны использовать содержимое этого элемента как начальное значение элемента и отображать этот текст как начальный.

    В этом примере создаётся ЭУ TEXTAREA , в котором 20 рядов и 80 столбцов, содержащий 2 строки начального текста. За ЭУ TEXTAREA идут кнопки submit и reset.

    Установка атрибута readonly позволяет отображать в TEXTAREA неизменяемый текст.
    Это отличается от использования стандартного текста разметки в документе, поскольку значение TEXTAREA отсылается вместе с формой.


    17.8 Элемент ISINDEX

    ISINDEX не рекомендуется. Этот элемент создаёт однострочное окно для ввода текста. Авторы должны использовать элемент INPUT для создания элементов для ввода текста.

    prompt = text [CS] Не рекомендуется. Этот атрибут определяет строку промпта для текстового поля.

    Атрибуты, определённые в другом месте

    Элемент ISINDEX создаёт однострочный ЭУ для ввода текста, позволяющий вводить любое количество символов. ПА должны использовать значение атрибута prompt как название промпта.

    НЕ РЕКОМЕНДУЕТСЯ:
    Следующее объявление ISINDEX :

    можно переписать для INPUT так:

    Семантика ISINDEX. В настоящее время семантика элемента ISINDEX определяется хорошо, если только URI документа является HTTP URI. На практике строка ввода ограничивается набором символов Latin-1, так как отсутствует URI механизм определения другого набора символов.

    17.9 Лэйблы

    Некоторые ЭУ автоматически содержат лэйблы, ассоциированные с ними (кнопки), а другие — нет (поля ввода текста, переключатели, radio-кнопки и меню).

    Для ЭУ, имеющих встроенные лэйблы, ПА должны использовать значения атрибута value как строку лэйбла.

    Элемент LABEL используется для определения лэйблов в ЭУ, не имеющих встроенных лэйблов.

    17.9.1 Элемент LABEL

    Начальный тег: необходим, Конечный тег: необходим

    Атрибуты, определённые в другом месте

    Элемент LABEL может использоваться для присоединения информации к ЭУ. Каждый элемент LABEL ассоциирован только с одним ЭУ формы.

    Атрибут for явно ассоциирует лэйбл с другим ЭУ : значение атрибута for должно быть тем же, что и атрибута id ассоциированного ЭУ. Более, чем один LABEL может быть ассоциирован с элементом путём создания множественных ссылок атрибута for .

    В этом примере создаётся таблица, для выравнивания двух ЭУ text и ассоциированных с ними лэйблов. Каждый лэйбл ассоциируется только с одним ЭУ text:

    Этот пример дополняет предыдущий включением элементов LABEL :

    Чтобы ассоциировать лэйбл с другим ЭУ неявно, ЭУ должен находиться внутри содержимого элемента LABEL . В этом случае LABEL может содержать только один элемент управления. Лэйбл может находиться перед или после ассоциированного ЭУ.

    В этом примере мы неявно ассоциируем два лэйбла с двумя ЭУ text:

    Учтите. что эта техника не может использоваться, если для вывода используется таблица, и лэйбл находится в одной ячейке, а ассоциированный ЭУ — в другой ячейке.

    Если LABEL получает фокус/focus, он передаёт фокус ассоциированному ЭУ. См. ниже раздел о клавишах быстрого доступа/access keys.

    Лэйблы могут рассматриваться ПА различными способами (напр., визуально, речевым синтезатором и т.д.)

    17.10 Структурирование формы: элементы FIELDSET и LEGEND

    Начальный тег: необходим, Конечный тег: необходим

    Определение атрибута элемента LEGEND

    align = top|bottom|left|right [CI]Не рекомендуется. Этот атрибут определяет позицию «легенды» в том, что касается набора полей. Возможные значения:

    • top: «Легенда» находится сверху над набором полей. Это значение по умолчанию.
    • bottom: «Легенда» находится под набором полей..
    • left: «Легенда» находится слева от набора полей.
    • right: «Легенда» находится справа от набора полей.

    Атрибуты, определённые в другом месте

    Элемент FIELDSET позволяет тематически группировать ЭУ и лэйблы. Группирование ЭУ облегчает пользователю понимание их назначение, одновременно облегчая навигацию табуляцией для визуальных ПА и речевую навигацию для ПА, ориентированных на голосовое управление. Правильное использование этого элемента делает документы более доступными.

    Элемент LEGEND даёт возможность установить заглавие к FIELDSET . «Легенда» улучшает доступность, если FIELDSET просматривается невизуально.

    В этом примере мы создаём форму, которая может заполняться в мед. учреждении. Она состоит из трёх разделов: персональная информация, история болезни и текущее лечение. Каждый раздел содержит ЭУ для ввода соответствующей информации:

    Заметьте, что в этом примере мы улучшили визуальное представление формы выравниванием элементов в каждом FIELDSET (с помощью таблиц стилей), изменив цвета и шрифты (с помощью таблиц стилей), добавив скрипты (т.е., чтобы открыть только «Текущее лечение», если пользователь укажет, что он/она лечится в данный момент) и т.д.

    17.11 Передача фокуса элементу

    Элемент в документе HTML должен получить фокус от пользователя, чтобы активизироваться для выполнения своих задач. Например, пользователь должен активизировать гиперссылку, определённую элементом A , чтобы перейти по ней. Так же необходимо передать фокус элементу TEXTAREA для того, чтобы ввести текст.

    Существует несколько способов передачи фокуса элементу:

    • Указать на элемент указательным устройством.
    • Переходить от одного элемента к другому с помощью клавиатуры. Автор документа может установить порядок табуляции, определяющий последовательность получения элементами фокуса, если пользователь пользуется для навигации клавиатурой (см. навигация с помощью табуляции). После выбора элемент может быть активизирован какой-нибудь другой последовательностью клавиш.
    • Выбрать элемент клавишами доступа (называемыми иногда «быстрые клавиши» или «горячие клавиши»).

    17.11.1 Навигация с помощью табуляции

    tabindex = number [CN] Определяет позицию элемента в порядке табуляции в текущем документе. Это должно быть цифровое значение в диапазоне от 0 до 32767. ПА должны игнорировать ведущие нули.

    Порядок табуляции определяет последовательность, в которой элементы будут получать фокус при навигации с помощью клавиатуры. Порядок табуляции может включать вложенные элементы.

    Элементы, которые могут получать фокус, «перебираются» пользовательским элементом в соответствии со следующими правилами:

    1. Элементы, поддерживающие атрибут tabindex , и имеющие для него положительное значение, перебираются в первую очередь. Навигация проходит от элемента с наименьшим значением tabindex к элементу с наибольшим значением. Значения могут не быть непрерывной последовательностью или начинаться каким то определённым значением. Элементы, имеющие одинаковые значения tabindex , должны перебираться в том порядке, в котором они появляются в потоке символов.
    2. Элементы, не поддерживающие атрибут tabindex или поддерживающие его и устанавливающие значение «0», считаются текстом. Эти элементы перебираются в порядке, в котором они следуют в потоке символов.
    3. Недоступные элементы не перебираются при табуляции.

    Следующие элементы поддерживают атрибут tabindex : A , AREA , BUTTON , INPUT , OBJECT , SELECT и TEXTAREA .

    В этом примере порядок табуляции: BUTTON , элементы INPUT по порядку (заметьте, что «field1» и кнопка разделяют один индекс табуляции, но «field1» появляется позже в потоке символов), и наконец — гиперссылка, созданная элементом A .

    Клавиши табуляции. Реальная последовательность клавиш, вызывающая навигацию при помощи табуляции или активацию элементов, зависит от конфигурации ПА (напр., клавиша «tab» используется для навигации, а клавиша «enter» — для активации выбранного элемента).

    ПА должны также определять последовательность клавиш для навигации в обратную сторону. Если достигнут конец (или начало) ряда табуляции, ПА должен «зацикливаться» на начало (или конец).

    17.11.2 Клавиши быстрого доступа

    accesskey = символ/character [CN] Устанавливает клавишу быстрого доступа к элементу. Клавиша доступа — это одиночный символ из набора символов документа.
    Примечание. Автор должен учитывать при определении клавиш доступа метод ввода, применяемый предполагаемым пользователем.

    Нажатие клавиши доступа, назначенной элементу, передаёт фокус этому элементу. Действие после получения фокуса зависит от элемента. Например, если пользователь активизирует гиперссылку, определённую элементом A , ПА обычно переходит по ссылке. Если пользователь активизирует radio-кнопку, ПА изменяет значение radio-кнопки. Если пользователь активирует поле text, оно становится доступным для ввода и т.д.

    Следующие элементы поддерживают атрибут accesskey : A , AREA , BUTTON , INPUT , LABEL , LEGEND и TEXTAREA .

    В следующем примере клавиша «U» устанавливается для лэйбла, ассоциированного с ЭУ INPUT . Нажатие клавиши доступа передаёт фокус лэйблу, который, в свою очередь, передаёт его ассоциированному ЭУ. Пользователь может вводить текст в поле INPUT .

    В следующем примере мы устанавливаем клавишу доступа гиперссылке, определённой элементом A . Нажатие клавиши переводит пользователя к другому документу, в данном случае — к оглавлению.

    Вызов быстрых клавиш зависит от операционной системы. Например, на машинах с MS Windows обычно нужно нажимать «alt» одновременно с клавишей доступа. В системе Apple — «cmd» одновременно с клавишей доступа.

    Отображение клавиш доступа зависит от ПА. Мы рекомендуем, чтобы авторы включали клавиши доступа в лэйблы. ПА должны рассматривать значение клавиш доступа так, чтобы подчеркнуть их значение и выделить из окружающего текста (например, подчёркиванием).

    17.12 Недоступные ЭУ и ЭУ «только для чтения»

    В тех случаях, когда ввод данных пользователем не нужен или не желателен, важно иметь возможность делать ЭУ недоступными или «только для чтения». Например, кнопка submit может быть недоступной, пока пользователь не введёт нужные данные. Также автор может включить отрывок текста «только для чтения», который должен быть отправлен вместе с формой. Следующий раздел описывает Недоступные и «Только для чтения» ЭУ.

    17.12.1 Недоступные ЭУ

    disabled [CI] Если установлен для ЭУ формы, этот булев атрибут делает ЭУ недоступным для пользователя.

    Установленный атрибут disabled действует на ЭУ следующим образом:

    • Недоступный ЭУ не может получить фокус.
    • Недоступный ЭУ скрыт от навигации табуляцией.
    • Недоступный ЭУ не может быть «действующим».

    Следующие ЭУ поддерживают атрибут disabled : BUTTON , INPUT , OPTGROUP , OPTION , SELECT и TEXTAREA .

    Этот атрибут наследуется, но локальное объявление переопределяет наследуемое значение.

    То, как недоступные ЭУ отображаются, зависит от ПА. Например, некоторые ПА выделяют серым цветом недоступные элементы меню, лэйблы кнопок и т.п.

    В данном примере элемент INPUT недоступен. Таким образом, он не может принимать ввод пользователя, и его значение не будет отправлено вместе с формой.

    Примечание. Единственная возможность изменить значение атрибута disabled динамически — использование скриптов.

    17.12.2 ЭУ » только для чтения»

    readonly [CI] Если установлен, этот булев атрибут запрещает изменение ЭУ.

    Атрибут readonly определяет, может ли ЭУ быть модифицирован пользователем.

    Если установлен, атрибут readonly действует на элемент следующим образом:

    • ЭУ «только для чтения» может получить фокус, но не может быть модифицирован пользователем.
    • ЭУ «только для чтения» включён в навигацию табуляцией.
    • ЭУ «только для чтения» может быть «действующим».

    Следующие ЭУ поддерживают атрибут readonly : INPUT и TEXTAREA .

    То, как ЭУ «только для чтения» отображаются, зависит от ПА.

    Примечание. Единственная возможность изменить значение атрибута readonly динамически — использование скриптов.

    17.13 Отправка формы

    Этот раздел разъясняет, как ПА отправляет форму и как форма обрабатывается пользовательскими агентами.

    17.13.1 Метод отправки формы

    Атрибут method элемента FORM определяет метод HTTP, используемый для отправки формы программе-обработчику. Этот атрибут может иметь два значения:

    • get: методом «get» HTTP набор данных формы присоединяется к URI, определённому атрибутом action (со знаком «?» в качестве разделителя), и этот новый URI высылается программе-обработчику.
    • post: методом «post» HTTP набор данных формы включается в тело формы и высылается программе-обработчику.

    Метод «get» нужно использовать, если форма цельна (напр., не осуществляет побочных действий). Многие средства поиска в базах данных не имеют видимых побочных действий и являются идеальными приложениями для использования метода «get».

    Если сервис, ассоциированный с обработчиком формы, имеет побочный эффект (например, если форма модифицирует базу данных или подписку на сервис), должен использоваться метод «post».

    Примечание. Метод «get» ограничивает набор данных формы символами ASCII. Только метод «post» (с enctype =»multipart/form-data») специфицирован для использования с полным набором символов [ISO10646].

    17.13.2 «Действующие» ЭУ

    «годный» для отправки. Каждый действующий ЭУ имеет пару: имя ЭУ и текущее значение как часть отправляемого с формой набора данных формы. Действующий ЭУ должен быть определён внутри элемента форма/FORM и должен иметь имя ЭУ.

    • НедоступныеЭУ — те, которые не могут быть «действующими».
    • Если форма содержит больше одной кнопки submit, только активированная кнопка submit может быть действующей.
    • Все «on» переключатели могут быть действующими.
    • Из radio-кнопок, использующих одно значение атрибута name , только «on/включённая» radio-кнопка может быть действующей.
    • Для menuимя ЭУ предоставляется элементом SELECT , а значения предоставляются элементом OPTION . только выбранная опция может быть действующей. Если ни одна опция не выбрана, ЭУ является «недействующим», и ни имя, ни любое другое значение не пересылается серверы при отправке формы.
    • Текущее значениеfile select — это список из одного или более имён файлов. При отправке формы содержимое каждого файла отправляется вместе с данными формы. Содержимое файлов упаковывается в соответствии с типом содержимого формы.
    • Текущее значение объекта ЭУ определяется реализацией объекта.

    Если ЭУ не имеет текущего значения при отправке формы, ПА не должны обрабатывать его как «действующий» ЭУ.

    Также ПА не должны рассматривать следующие объекты как действующие:

    Скрытые ЭУ ЭУ, которые не отображаются из-за установок в таблицах стилей, могут быть действующими. Например:

    создаёт значение в паре с «invisible-password», которое отправляется вместе с формой.

    17.13.3 Обработка данных формы

    Если пользователь отправил форму (напр., активацией кнопки submit), ПА обрабатывает её следующим образом:

    Шаг 1: Идентификация «действующих» ЭУ

    Шаг 2: Создание набора данных формы

    Шаг 3: Кодирование набора данных формы

    Набор данных формы кодируется в соответствии с типом содержимого, определённым атрибутом enctype элемента FORM .

    Шаг 4: Отправка кодированного набора данных формы

    Наконец кодированные данные пересылаются обработчику, определённому в атрибуте action с использованием протокола, указанного в атрибуте method .

    Данная спецификация не определяет все соответствующие методы отправки или типы содержимого, которые могут быть использованы с формами. Однако, ПА HTML 4 должны поддерживать установленные соглашения в следующих случаях:

    • Если method — «get» и action — HTTP URI, ПА берёт значение action , добавляет `?’ к нему, затем присоединяет набор данных формы, кодированный с использованием типа содержимого «application/x-www-form-urlencoded». Затем ПА перенаправляет всё по гиперссылке на этот URI. В этом сценарии данные формы ограничены кодами ASCII.
    • Если method — «post» и action — HTTP URI, ПА проводит транзакцию HTTP «post», используя значение атрибута action и сообщение, созданное в соответствии с типом содержимого, определённым атрибутом enctype .

    Для любых других значений action или method поведение не определено.

    ПА должен уметь принять ответ от транзакций HTTP «get» и «post».

    17.13.4 Типы содержимого формы

    Атрибут enctype элемента FORM определяет тип содержимого, используемый при кодировке набора данных формы для отправки на сервер. ПА должен поддерживать типы содержимого, перечисленные ниже. Поведение для других типов содержимого не определено.

    application/x-www-form-urlencoded

    Это тип содержимого по умолчанию. Формы отправленные с содержимым этого типа, должны кодироваться так:

    1. Имена ЭУ и значения переводятся в escape-последовательности. Символы пробелов заменяются `+’ , и затем зарезервированные символы переводятся в escape-последовательности, как описано в [RFC1738], раздел 2.2:
      Неалфавитные символы заменяются `%HH’ , знаком процента и двумя 16-ричными цифрами, представляющими ASCII-код символа. Символы новой строки представляются парами «CR LF» (напр., `%0D%0A’ ).
    2. Пары имя/значение перечисляются в том порядке, в котором они появляются в документе. Имя отделено от значения знаком `=’ и пары имя/значение отделены друг от друга знаком `&’ .

    multipart/form-data

    Примечание. См. в [RFC2388] информацию о подгрузке файлов, включая проблемы обратной совместимости, взаимоотношения между «multipart/form-data» и другими типами содержимого, вопросы функционирования и т.д.

    Типа содержимого «application/x-www-form-urlencoded» недостаточно для пересылки данных большого объёма данных бинарного типа или текста, содержащего не-ASCII символы. Тип содержимого «multipart/form-data» должен использоваться для отправки форм, содержащих файлы, не-ASCII данные и бинарные данные.

    Содержимое «multipart/form-data» следует правилам всех составных MIME-данных, как описано в [RFC2045]. Определение «multipart/form-data» можно найти в регистре [IANA].

    Сообщение «multipart/form-data» содержит несколько частей, каждая из которых представляет «действующий» ЭУ. Эти части пересылаются обработчику в том же порядке, в каком соответствующие ЭУ появляются в потоке документа. Границы частей не должны появляться внутри каких-либо данных; то, как это достигается, находится за рамками данной спецификации.

    Как и все многочастные типы MIME, каждая часть может иметь заголовок «Content-Type», который по умолчанию содержит «text/plain». ПА должны предоставлять заголовок «Content-Type» вместе с параметром «charset».

    Каждая часть должна содержать:

    1. заголовок «Content-Disposition», значением которого является «form-data».
    2. атрибут имя, определяющий имя соответствующего ЭУ. Имена ЭУ, кодированные в оригинале в не-ASCII наборе символов, могут быть кодированы с использованием метода, описанного в [RFC2045].

    Таким образом, для ЭУ с именем «mycontrol», соответствующая часть будет определена:

    Как и в других передачах MIME, «CR LF» (т.е., `%0D%0A’ ) используется для разделения строк данных.


    Каждая часть может кодироваться, и заголовок «Content-Transfer-Encoding» предоставляется, если значение этой части не соответствует кодировке по умолчанию(7BIT) (см. [RFC2045], раздел 6)

    Если содержимое файла отправляется с формой, ввод файла должен идентифицироваться соответствующим типом содержимого (напр., «application/octet-stream»). Если несколько файлов возвращено как результат единого ввода формы, они должны быть возвращены как «multipart/mixed», внедрённые в «multipart/form-data».

    ПА должен попытаться предоставить имя для каждого пересылаемого файла. Имя файла может быть определено параметром «filename» в заголовке ‘Content-Disposition: form-data’ или, в случае с нескольким файлами, заголовком ‘Content-Disposition: file’ подраздела. Если имя файла клиентской операционной системы не-US-ASCII, имя файла может быть приближено или кодировано с использованием метода [RFC2045]. Это подходит для всех тех случаев, когда, например, подгруженные файлы могут содержать ссылку друг на друга (напр., TeX файл и его «.sty» — дополнительное описание стиля).

    Следующий пример иллюстрирует кодирование «multipart/form-data». Предположим, у нас есть такая форма:

    Если пользователь вводит «Larry» в окне ввода текста и выделяет текстовый файл «file1.txt», ПА должен выслать обратно следующие данные:

    Если пользователь выделит второй (image) файл «file2.gif», ПА может создать части так:

    Структура HTML-документа и элементы разметки заголовка документа

    HTML-документ — это один большой контейнер, который начинается с тега и заканчивается тегом :

    Контейнер HTML или гипертекстовый документ состоит из двух других вложенных контейнеров: заголовка документа (HEAD) и тела документа (BODY). Рассмотрим простейший пример классического документа.

    Пример простого документа

    2.3.1.1. Назначение заголовка. Основные контейнеры заголовка

    Заголовок HTML-документа является необязательным элементом разметки. Хотя современная практика HTML-разметки такова, что почти в каждом документе есть HTML-заголовок.

    Первоначально существование заголовка определялось необходимостью именования окна браузера. Это достигалось за счет элемента разметки TITLE:

    Основные контейнеры заголовка — это элементы HTML-разметки, которые наиболее часто встречаются в заголовке HTML-документа, т.е. внутри элемента разметки HEAD.

    Мы рассмотрим только восемь элементов разметки, включая сам элемент разметки HEAD:

    · HEAD (элемент разметки HEAD);

    · TITLE (заглавие документа);

    · ISINDEX (поисковый шаблон);

    · LINK (общие ссылки);

    · STYLE (описатели стилей);

    Чаще всего применяются элементы TITLE, SCRIPT, STYLE. Использование элемента META говорит об осведомленности автора о правилах индексирования документов в поисковых системах и возможности управления HTTP-обменом данными. BASE и ISINDEX в последнее время практически не применяются. LINK указывают только при использовании внешних относительно данного документа описателей стилей.

    Элемент разметки HEAD

    Элемент разметки HEAD содержит заголовок HTML-документа. Данный элемент разметки не является обязательным. Синтаксис контейнера HEAD в общем виде выглядит следующим образом:

    Это пример из документации по сайту Интернет-Университета Информационных Технологий

    Контейнер заголовка служит для размещения информации, относящейся ко всему документу в целом. Необязательный атрибут PROFILE указывает на внешний файл META-тегов. В качестве значения этого атрибута указывается URL данного файла.

    Элемент разметки TITLE

    Элемент разметки TITLE служит для именования документа в WWW. Более прозаическое его назначение — именование окна браузера, в котором просматривается документ. Состоит контейнер из тега начала, содержания и тега конца. Наличие тега конца обязательно. Тег начала элемента не имеет специфических атрибутов.

    При выборе текста для содержания контейнера TITLE следует учитывать, что отображается он системным фонтом, так как является заголовком окна браузера. В нелокализованных версиях операционных систем и графических оболочек русский текст содержания элемента TITLE будет отображаться абракадаброй.

    Синтаксис контейнера TITLE в общем виде выглядит следующим образом:

    Заголовок не является обязательным контейнером документа. Его можно опустить.

    Роботы многих поисковых систем используют содержание элемента TITLE для создания поискового образа документа. Слова из TITLE попадают в индекс поисковой системы. Из этих соображений элемент TITLE всегда рекомендуется использовать на страницах Web-узла.

    Элемент разметки BASE

    Элемент разметки BASE служит для определения базового URL для гипертекстовых ссылок документа, заданных в неполной (частичной) форме.

    Разметка гипертекстовых ссылок обычно выполняется как разметка в частично заданных (относительных) адресах, когда URL задается относительно текущего местоположения документа.

    В этом случае в качестве базы по умолчанию выбирается каталог, в котором размещен HTML-документ (./). Такой стиль разметки удобен тем, что при переносе всего дерева документов в другое место не потребуется менять систему гипертекстовых ссылок внутри документов.

    Контейнер BASE можно использовать вне документа, в заголовке или теле документа. При этом область действия базового адреса определяется от места размещения контейнера до следующего контейнера BASE.

    Применение BASE в современных документах ограничено в силу разных причин. В сложных случаях можно пользоваться указаниями URL в полной форме.

    Элемент разметки ISINDEX

    Элемент разметки ISINDEX используется для указания поискового шаблона и унаследован от ранних версий HTML. В HTML 4.0 этот контейнер не определен. Утрата данного контейнера объясняется широким применением форм и CGI-скриптов. Тем не менее все браузеры его поддерживают. Не будем рассматривать.

    Элемент разметки META

    Это наиболее популярный элемент разметки заголовка, более распространен только элемент TITLE. Такое положение дел объясняется назначением данного элемента разметки. META содержит управляющую информацию, которую браузер использует для правильного отображения и обработки содержания тела документа.

    Впервые контейнер META был задействован при принудительной перезагрузке документа браузером через заголовок HTTP-сообщения. В заголовке HTTP-сообщения можно указать оператор refresh. Время, заданное как параметр этого оператора, определяет интервал в секундах, после которого браузер загружает документ, определенный атрибутом URL данного оператора.

    В контейнере META подобный механизм реализуется следующим образом:

    В данном случае через одну секунду после загрузки документа браузер должен инициировать загрузку страницы refresh.htm.

    В Windows 95 и Windows NT 4.0 с поддержкой таблиц UNICODE появилась возможность указывать тип кодировки документа — CHARSET. Для перекодировки на стороне клиента (документ подготовлен в кодировке cp1251) в заголовок документа необходимо включить META-тег следующего вида:

    С появлением роботов поисковых машин на META-тег была возложена еще одна функция — описание поискового образа документа. Собственно, для описания документа используется два META-тега. Один определяет список ключевых слов, а второй – реферат (краткое содержание документа), который отображается в качестве пояснения к ссылке на документ в отчете поисковой машины о выполненном запросе. Контейнер TITLE здесь также используется в качестве названия документа.

    При индексировании такого документа содержимое контейнера TITLE и атрибутов CONTENT контейнеров META после фильтрации попадет в индекс поисковой машины и может быть использовано для составления запросов.

    Элемент разметки LINK

    LINK позволяет загружать внешние описатели стилей. В общем случае контейнер LINK может имеет следующий вид:

    В данном случае речь идет о загрузке стилей из файла css.htm. При этом стили задаются в нотации W3C, а не JavaScript, что определяется атрибутом TYPE. В сущности, атрибут REL определяет тип гипертекстовой связи, HREF (Нуреrtехt REFerence) указывает адрес документа, идентифицирующего связь, а атрибут TYPE определяет тип содержания этого документа.

    Элемент разметки STYLE

    Элемент разметки STYLE предназначен для размещения описателей стилей. При этом описание стиля из данного элемента разметки, если оно совпадает по имени класса и/или идентификатору подкласса со стилем, описанным во внешнем файле, заменяет описание стиля из внешнего файла. С точки зрения влияния на весь документ, описатели стилей задают правила отображения контейнеров HTML-документа для всей страницы.

    В настоящее время контейнер используется только с одним атрибутом TYPE, который задает тип описателя стиля. Это может быть либо text/css, либо text/javascript. Если элемент разметки открыт тегом начала, то он должен быть закрыт тегом конца. В общем виде запись элемента STYLE выглядит так:

    Применению стилей в HTML-разметке, а также проектированию Web-узлов с применением CSS посвящена отдельная глава «Применение каскадных таблиц и стилей».

    Элемент разметки SCRIPT

    Элемент разметки SCRIPT служит для размещения кода JavaScript, VBScript или JScript. Вообще говоря, SCRIPT можно использовать не только в заголовке документа, но и в его теле. В отличие от контейнера STYLE, ему не требуется дополнительный контейнер LINK для загрузки внешних файлов кодов. Это можно сделать непосредственно в самом контейнере SCRIPT:

    Существует несколько скриптовых языков: JavaScript, VBScript, JScript. По умолчанию подразумевается JavaScript.

    Дата добавления: 2015-10-01 ; просмотров: 426 . Нарушение авторских прав

    Языки гипертекстовой разметки SGML. XML. HTML. Технологии web

    Hyper Text Markup Language (HTML) — язык разметки гипертекста — предназначен для написания гипертекстовых документов, публикуемых в World Wide Web.

    Гипертекстовый документ — это текстовый файл, имеющий специальные метки, называемые тегами, которые впоследствии опознаются браузером и используются им для отображения содержимого файла па экране компьютера.

    С помощью этих меток можно выделять заголовки документа, изменять цвет, размер и начертание букв, вставлять графические изображения и таблицы. Но основным преимуществом гипертекста перед обычным текстом является возможность добавления к содержимому документа гиперссылок — специальных конструкций языка HTML, которые позволяют щелчком мыши перейти к просмотру другого документа.

    HTML-документ состоит из двух частей: собственно текста, т. е. данных, составляющих содержимое документа, и тегов — специальных конструкций языка HTML, используемых для разметки документа и управляющих его отображением. Теги языка HTML определяют, в каком виде будет представлен текст, какие его компоненты будут исполнять роль гипертекстовых ссылок, какие графические или мультимедийные объекты должны быть включены в документ.

    Графическая и звуковая информация, включаемая в HTML-документ, хранится в отдельных файлах. Программы просмотра HTML-документов (браузеры ) интерпретируют флаги разметки и располагают текст и графику на экране соответствующим образом. Для файлов, содержащих HTML-документы приняты расширения .htm или .html .

    В большинстве случаев теги используются парами. Пара состоит из открывающего и закрывающего тегов. Действие любого парного тега начинается с того места, где встретился открывающий тег, и заканчивается при встрече соответствующего закрывающего тега. Часто пару, состоящую из открывающего и закрывающего тегов, называют контейнером , а часть текста, окаймленную открывающим и закрывающим тегом, — элементом .

    Последовательность символов, составляющая текст может состоять из пробелов, табуляций, символов перехода на новую строку, символов возврата каретки, букв, знаков препинания, цифр, и специальных символов (например #, +, $, @), за исключением следующих четырех символов, имеющих в HTML специальный смысл: (больше), & (амперсанд) и » (двойная кавычка). Если необходимо включить в текст какой-либо из этих символов, то следует закодировать его особой последовательностью символов.

    Структура HTML-документа

    Самым главным из тегов HTML является одноименный тег . Он всегда открывает документ, так же, как тег должен непременно стоять в последней его строке. Эти теги обозначают, что находящиеся между ними строки представляют единый гипертекстовый документ. Без этих тегов браузер или другая программа просмотра не в состоянии идентифицировать формат документа и правильно его интерпретировать.

    HTML-документ состоит из двух частей: заголовок (head) и тела (body), расположенных в следующем порядке:

    Элемент разметки ISINDEX

    Элемент разметки BASE служит для определения базового URL для гипертекстовых ссылок документа, заданных в неполной (частичной) форме. Кроме того, BASE позволяет определить мишень (окно) загрузки документа по умолчанию при выборе гипертекстовой ссылки текущего документа.

    Разметка гипертекстовых ссылок обычно выполняется как разметка в частично заданных (относительных) адресах, когда URL задается относительно текущего местоположения документа.

    В этом случае в качестве базы по умолчанию выбирается каталог, в котором размещен HTML-документ (./). Такой стиль разметки удобен тем, что при переносе всего дерева документов в другое место не потребуется менять систему гипертекстовых ссылок внутри документов. Кроме того, распространению этого стиля способствует и сама архитектура World Wide Web. Наиболее тесные связи между документами задаются только в рамках одного Web-узла. Связей данного узла с остальными существенно меньше, и их можно прописать непосредственно в ссылках в полной форме.

    Контейнер BASE можно использовать вне документа, в заголовке или теле документа. При этом область действия базового адреса определяется от места размещения контейнера до следующего контейнера BASE.

    Наиболее часто BASE встречается на страницах узлов, которые имеют «зеркала». Часть документов основного сервера по разным причинам на «зеркальный» сервер не переносится. В этом случае документ с принудительно заданным базовым URL всегда будет ссылаться на основной сервер. Он оказывается «белой вороной» среди прочих документов Web-узла. При этом такая схема часто используется в совокупности с запретом на кэширование данного документа как клиентом (браузером), так и proxy-серверами.

    Существуют различия и при определении базового URL по умолчанию при обращении к страницам, которые различны по своей природе. Если для обычного файла базовым адресом по умолчанию является адрес каталога, где хранится данный файл, то для страниц, которые генерируются «на лету», возможны и другие базовые адреса по умолчанию. Например, для страниц, сгенерированных CGI-скриптом, адресом по умолчанию является URL данного скрипта. Если из такой страницы снова вызвать скрипт, как частично заданную ссылку, то имя скрипта будет передано в качестве параметра скрипту, который сгенерировал данную страницу.

    Базовый адрес: http://intuit.ru/cgi-bin/script/intuit.ru

    Если скрипт вызовет сам себя по частично заданной ссылке, то он себя не найдет.

    Возможность определения мишени загрузки позволяет не указывать атрибут TARGET в теге начала контейнера A (anchor):

    Потребность в этом возникает при организации постоянно отображаемых меню. Такое меню может быть реализовано либо во фрейме, либо в окне. При этом информационные страницы Web-узла, которые загружаются при активизации гипертекстовых ссылок, будут загружаться в другое окно или фрейм.

    Особенно полезен атрибут TARGET на страницах с вызовом скриптов, если результат работы скрипта нужно загрузить в определенное окно (фрейм).

    Тег начала контейнера содержит один обязательный атрибут, HREF, и может содержать один необязательный атрибут, TARGET. Синтаксис контейнера BASE в общем виде выглядит следующим образом:

    Применение BASE в современных документах ограничено в силу разных причин. В сложных случаях можно пользоваться указаниями URL в полной форме.

    Элемент разметки ISINDEX

    Элемент разметки ISINDEX используется для указания поискового шаблона и унаследован от ранних версий HTML. В HTML 4.0 этот контейнер не определен. Утрата данного контейнера объясняется широким применением форм и CGI-скриптов. Тем не менее все браузеры его поддерживают.

    Шаблон ввода ключевых слов при наличии данного контейнера в заголовке HTML-документа отображается в виде дополнительного поля ввода рабочей области браузера, что нарушает компоновку HTML-страниц, выполненных с применением современных средств разметки. Больше всего ISINDEX подходит для документов с компоновкой в стиле HTML 2.0.

    Применение элемента ISINDEX

    В классическом варианте при использовании ISINDEX список ключевых слов, которые вводятся в поисковом шаблоне и разделены символом «+», присоединяется к базовому адресу HTML-документа после символа «?».

    Очевидно, что сам HTML-документ не способен выполнить поиск. Это может сделать только поисковая программа.

    Присоединение запроса к документу унаследовано от первого сервера CERN (Conseil Europeen pour la Recherche Nucleaire, Европейская организация по ядерным исследованиям), в котором оно использовалось по аналогии с поисковыми серверами Gopher. Современный подход, основанный на HTML-формах, позволяет указывать URL поисковой программы, что дает большую свободу при разметке страниц.

    Современный синтаксис ISINDEX позволяет применить аналогичный формам подход. Для этой цели в теге начала контейнера ISINDEX можно указать атрибут ACTION.

    Однако и традиционная форма контейнера позволяет обращаться к внешним CGI-скриптам. Сделать это можно либо в совокупности с контейнером BASE, либо с использованием SSI.

    В первом случае для всего документа устанавливается базовый URL поисковой программы. Все URL гипертекстовых ссылок на другие страницы задаются в полной форме или базовый адрес переназначается после ISINDEX. Это вполне оправдано, если данная страница ничего, кроме поискового критерия и ссылки на домашнюю страницу Web-узла, не содержит.

    Во втором случае в документ встраивается обращение к CGI-скрипту, который реализует функции поисковой программы. Такое совмещение — свойство современного подхода к компоновке поисковых страниц. Как правило, и поисковый шаблон, и результаты поиска отображаются на одной странице, так как это позволяет корректировать запрос по мере получения результатов поиска. Встроенный в страницу скрипт анализирует переменные окружения сервера, и в случае отсутствия запроса может вообще никак не обнаруживать свое присутствие внутри документа.

    Тег начала элемента может содержать два необязательных атрибута: ACTION и PROMPT. Синтаксис элемента ISINDEX в общем виде выглядит следующим образом:

    Первый необязательный атрибут тега начала ISINDEX — PROMPT. Он позволяет вместо стандартного приглашения к вводу ключевых слов задать приглашение, которое, по мнению автора документа, лучше отражает суть поискового шаблона. Например, можно задать приглашение к вводу ключевых слов на русском языке.

    Применение атрибута PROMPT

    ISINDEX — отмирающий элемент разметки. Однако он определил формат обмена данными ISINDEX. Данные в этом формате передаются от браузера серверу в случае применения ISINDEX и в случае прямого указания дополнительных параметров после символа «?» в гипертекстовой ссылке.

    Спасибо за внимание, встретимся через неделю.

    Компьютерная графика и Web-дизайн — Курс лекций

    Чтобы скачать работу, Вы должны пройти проверку:

    Пример простого документа

    Компания Netscape Communication расширила классическую форму документа возможностью организации фреймов (кадров), позволяющих разделить рабочее окно программы просмотра на несколько независимых фреймов. В каждый фрейм можно загрузить свою страницу HTML. Приведем пример документа с фреймами.

    Документ с фреймами

    Заголовок HTML-документа является необязательным элементом разметки. В HTML 2.0 предлагалось вообще отказаться от элементов HEAD и BODY. В то время в HTML не было элементов, которые использовались одновременно и в заголовке, и в теле документа. Современная практика HTML-разметки такова, что почти в каждом документе есть HTML-заголовок.

    Первоначально существование заголовка определялось необходимостью именования окна браузера. Это достигалось за счет элемента разметки TITLE:

    Отображение содержания элемента TITLE

    Однако задумывался заголовок для несколько иных целей. Исходя из общих соображений, связанных с теорией и практикой разработки и эксплуатации гипертекстовых систем, все гипертекстовые связи информационных узлов принято разделять на контекстные и общие.

    Контекстные гипертекстовые связи соответствуют определенному месту документа — контексту. В HTML такие связи реализованы в виде гипертекстовых ссылок (элемент A (anchor)). Фактически до реализации таблиц описателей стилей в современных браузерах это был единственный вид связей, которыми мог управлять автор HTML-документа.

    Общие гипертекстовые связи определяются не частью документа (контекстом), а всем документом целиком. Например, быть предыдущим по отношению к другому документу или следующим — это общая гипертекстовая связь, которая позволяет организовать так называемый «линейный» просмотр информационных узлов гипертекстовой сети.

    Реализация такого сорта ссылок уже давно является частью проектов W3C (Arena, Amaya). В коммерческих браузерах такой механизм реализован только для описателей стилей (элемент разметки LINK).

    Важную роль заголовок HTML-документа играет в JAVASCRIPT. Существует принципиальная разница между заголовком и телом документа при использовании элемента разметки SCRIPT. Она заключается в определении зоны видимости функций и переменных. Переменные и функции, определенные в заголовке документа, относятся ко всему окну браузера. Это значит, что к ним можно обратиться из любого места документа и изменить их значения. Кроме того, к ним можно обратиться из другого окна или фрейма. Фактически, это глобальные переменные. При работе с многослойными документами переменные и функции тела относятся к слоям, что делает доступ к ним неудобным.

    Еще одной функцией заголовка HTML-документа является управление HTTP-обменом через элемент разметки META. При современной практике размещения Web-узлов компаний на серверах провайдеров администраторы этих узлов могут не иметь возможности управлять программой-сервером. В этом случае для управления обменом остается только одна возможность — через заголовок HTML-документа.

    В заключение нельзя не упомянуть еще об одном важном назначении заголовка HTML-документа — поисковом образе документа для индексирования роботами поисковых систем. Элемент META позволяет хранить списки ключевых слов и описания документа, которые будут использоваться для составления индекса поисковой системы и появляться в качестве описания документа в случае выдачи ссылки на него при поиске по ключевым словам.

    Основные контейнеры заголовка

    Основные контейнеры заголовка — это элементы HTML-разметки, которые наиболее часто встречаются в заголовке HTML-документа, т.е. внутри элемента разметки HEAD.

    Мы рассмотрим только восемь элементов разметки, включая сам элемент разметки HEAD: · HEAD (элемент разметки HEAD);

    · TITLE (заглавие документа);

    · ISINDEX (поисковый шаблон);

    · LINK (общие ссылки);

    · STYLE (описатели стилей);

    Чаще всего применяются элементы TITLE, SCRIPT, STYLE. Использование элемента META говорит об осведомленности автора о правилах индексирования документов в поисковых системах и возможности управления HTTP-обменом данными. BASE и ISINDEX в последнее время практически не применяются. LINK указывают только при использовании внешних относительно данного документа описателей стилей.

    Элемент разметки HEAD

    Элемент разметки HEAD содержит заголовок HTML-документа. Данный элемент разметки не является обязательным. При наличии тега начала элемента разметки желательно использовать и тег конца элемента разметки. По умолчанию элемент HEAD закрывается, если встречается либо тег начала контейнера BODY, либо тег начала контейнера FRAMESET. Атрибутов у тега начала контейнера нет, хотя в DTD HTML один необязательный атрибут прописан. Синтаксис контейнера HEAD в общем виде выглядит следующим образом: Это пример из документации по сайту Интернет-Университета Информационных Технологий

    Контейнер заголовка служит для размещения информации, относящейся ко всему документу в целом. Необязательный атрибут PROFILE указывает на внешний файл META-тегов. В качестве значения этого атрибута указывается URL данного файла.

    Элемент разметки TITLE


    Элемент разметки TITLE служит для именования документа в World Wide Web. Более прозаическое его назначение — именование окна браузера, в котором просматривается документ. Состоит контейнер из тега начала, содержания и тега конца. Наличие тега конца обязательно. Тег начала элемента не имеет специфических атрибутов.

    В различных браузерах алгоритм отображения элемента TITLE может отличаться. Так, в некоторых руководствах предлагается создать бегущую строку в заголовке документа, указав несколько последовательных контейнеров TITLE: И Ин

    Такой механизм на современных компьютерах не работает. При этом следует учитывать, что в отличие от реализации «бегущей» строки средствами JAVASCRIPT, лидирующие пробелы в заголовке игнорируются.

    При выборе текста для содержания контейнера TITLE следует учитывать, что отображается он системным фонтом, так как является заголовком окна браузера. В нелокализованных версиях операционных систем и графических оболочек русский текст содержания элемента TITLE будет отображаться абракадаброй.

    Синтаксис контейнера TITLE в общем виде выглядит следующим образом: название документа

    Заголовок не является обязательным контейнером документа. Его можно опустить. Роботы многих поисковых систем используют содержание элемента TITLE для создания поискового образа документа. Слова из TITLE попадают в индекс поисковой системы. Из этих соображений элемент TITLE всегда рекомендуется использовать на страницах Web-узла.

    Элемент разметки BASE

    Элемент разметки BASE служит для определения базового URL для гипертекстовых ссылок документа, заданных в неполной (частичной) форме. Кроме того, BASE позволяет определить мишень (окно) загрузки документа по умолчанию при выборе гипертекстовой ссылки текущего документа.

    Разметка гипертекстовых ссылок обычно выполняется как разметка в частично заданных (относительных) адресах, когда URL задается относительно текущего местоположения документа.

    В этом случае в качестве базы по умолчанию выбирается каталог, в котором размещен HTML-документ (./). Такой стиль разметки удобен тем, что при переносе всего дерева документов в другое место не потребуется менять систему гипертекстовых ссылок внутри документов. Кроме того, распространению этого стиля способствует и сама архитектура World Wide Web. Наиболее тесные связи между документами задаются только в рамках одного Web-узла. Связей данного узла с остальными существенно меньше, и их можно прописать непосредственно в ссылках в полной форме.

    Контейнер BASE можно использовать вне документа, в заголовке или теле документа. При этом область действия базового адреса определяется от места размещения контейнера до следующего контейнера BASE.

    Наиболее часто BASE встречается на страницах узлов, которые имеют «зеркала». Часть документов основного сервера по разным причинам на «зеркальный» сервер не переносится. В этом случае документ с принудительно заданным базовым URL всегда будет ссылаться на основной сервер. Он оказывается «белой вороной» среди прочих документов Web-узла. При этом такая схема часто используется в совокупности с запретом на кэширование данного документа как клиентом (браузером), так и proxy-серверами.

    Существуют различия и при определении базового URL по умолчанию при обращении к страницам, которые различны по своей природе. Если для обычного файла базовым адресом по умолчанию является адрес каталога, где хранится данный файл, то для страниц, которые генерируются «на лету», возможны и другие базовые адреса по умолчанию. Например, для страниц, сгенерированных CGI-скриптом, адресом по умолчанию является URL данного скрипта. Если из такой страницы снова вызвать скрипт, как частично заданную ссылку, то имя скрипта будет передано в качестве параметра скрипту, который сгенерировал данную страницу.

    Базовый адрес: http://intuit.ru/cgi-bin/script/intuit.ru

    Если скрипт вызовет сам себя по частично заданной ссылке, то он себя не найдет.

    Возможность определения мишени загрузки позволяет не указывать атрибут TARGET в теге начала контейнера A (anchor): intuit

    Потребность в этом возникает при организации постоянно отображаемых меню. Такое меню может быть реализовано либо во фрейме, либо в окне. При этом информационные страницы Web-узла, которые загружаются при активизации гипертекстовых ссылок, будут загружаться в другое окно или фрейм.

    Особенно полезен атрибут TARGET на страницах с вызовом скриптов, если результат работы скрипта нужно загрузить в определенное окно (фрейм).

    Тег начала контейнера содержит один обязательный атрибут, HREF, и может содержать один необязательный атрибут, TARGET. Синтаксис контейнера BASE в общем виде выглядит следующим образом:

    Применение BASE в современных документах ограничено в силу разных причин. В сложных случаях можно пользоваться указаниями URL в полной форме.

    Элемент разметки ISINDEX

    Элемент разметки ISINDEX используется для указания поискового шаблона и унаследован от ранних версий HTML. В HTML 4.0 этот контейнер не определен. Утрата данного контейнера объясняется широким применением форм и CGI-скриптов. Тем не менее все браузеры его поддерживают.

    Шаблон ввода ключевых слов при наличии данного контейнера в заголовке HTML-документа отображается в виде дополнительного поля ввода рабочей области браузера, что нарушает компоновку HTML-страниц, выполненных с применением современных средств разметки. Больше всего ISINDEX подходит для документов с компоновкой в стиле HTML 2.0.

    Применение элемента ISINDEX

    В классическом варианте при использовании ISINDEX список ключевых слов, которые вводятся в поисковом шаблоне и разделены символом » «, присоединяется к базовому адресу HTML-документа после символа «?». http://intuit.ru/isindex.html?keyword list

    Очевидно, что сам HTML-документ не способен выполнить поиск. Это может сделать только поисковая программа.

    Присоединение запроса к документу унаследовано от первого сервера CERN (Conseil Europeen pour la Recherche Nucleaire, Европейская организация по ядерным исследованиям), в котором оно использовалось по аналогии с поисковыми серверами Gopher. Современный подход, основанный на HTML-формах, позволяет указывать URL поисковой программы, что дает большую свободу при разметке страниц.

    Современный синтаксис ISINDEX позволяет применить аналогичный формам подход. Для этой цели в теге начала контейнера ISINDEX можно указать атрибут ACTION.

    Однако и традиционная форма контейнера позволяет обращаться к внешним CGI-скриптам. Сделать это можно либо в совокупности с контейнером BASE, либо с использованием SSI.

    В первом случае для всего документа устанавливается базовый URL поисковой программы. Все URL гипертекстовых ссылок на другие страницы задаются в полной форме или базовый адрес переназначается после ISINDEX. Это вполне оправдано, если данная страница ничего, кроме поискового критерия и ссылки на домашнюю страницу Web-узла, не содержит.

    Во втором случае в документ встраивается обращение к CGI-скрипту, который реализует функции поисковой программы. Такое совмещение — свойство современного подхода к компоновке поисковых страниц. Как правило, и поисковый шаблон, и результаты поиска отображаются на одной странице, так как это позволяет корректировать запрос по мере получения результатов поиска. Встроенный в страницу скрипт анализирует переменные окружения сервера, и в случае отсутствия запроса может вообще никак не обнаруживать свое присутствие внутри документа.

    Тег начала элемента может содержать два необязательных атрибута: ACTION и PROMPT. Синтаксис элемента ISINDEX в общем виде выглядит следующим образом: Первый необязательный атрибут тега начала ISINDEX — PROMPT. Он позволяет вместо стандартного приглашения к вводу ключевых слов задать приглашение, которое, по мнению автора документа, лучше отражает суть поискового шаблона. Например, можно задать приглашение к вводу ключевых слов на русском языке.

    Применение атрибута PROMPT

    ISINDEX — отмирающий элемент разметки. Однако он определил формат обмена данными ISINDEX. Данные в этом формате передаются от браузера серверу в случае применения ISINDEX и в случае прямого указания дополнительных параметров после символа «?» в гипертекстовой ссылке.

    Элемент разметки META

    Это наиболее популярный элемент разметки заголовка, более распространен только элемент TITLE. Такое положение дел объясняется назначением данного элемента разметки. META содержит управляющую информацию, которую браузер использует для правильного отображения и обработки содержания тела документа.

    Впервые контейнер META был задействован при принудительной перезагрузке документа браузером через заголовок HTTP-сообщения. В заголовке HTTP-сообщения можно указать оператор refresh. Время, заданное как параметр этого оператора, определяет интервал в секундах, после которого браузер загружает документ, определенный атрибутом URL данного оператора. Впервые этот механизм был реализован на сервере CERN, но наибольшую популярность приобрел при использовании сервера WN (Web-сервер, который был разработан для платформы Unix (Linux).

    В контейнере META подобный механизм реализуется следующим образом: В данном случае через одну секунду после загрузки документа браузер должен инициировать загрузку страницы refresh.htm.

    Используя этот механизм, можно построить автоматически перезагружаемую последовательность страниц. Для этого в заголовке каждой страницы из данной последовательности следует разместить соответствующий контейнер META.

    Заглавная буква «Х» в слове «REFRESHX.htm» — это цифра номера кадра. На странице нулевого кадра в этом месте следует указать на первый кадр (refresh1.htm), на странице первого кадра — на второй (refresh2.htm) и т.д.

    В Windows 95 и Windows NT 4.0 с поддержкой таблиц UNICODE появилась возможность указывать тип кодировки документа — CHARSET. К сожалению, на многих Unix-платформах этот механизм не работает, что часто приводит к ошибкам, например в IRIX версий 6.2-6.4. Скептическое отношение поклонников Unix к этой возможности ничем не подкреплено, так как основная масса пользователей российской части Internet просматривает документы World Wide Web в Windows. Для перекодировки на стороне клиента (документ подготовлен в кодировке cp1251) в заголовок документа необходимо включить META-тег следующего вида: Приведенный выше пример показывает, как используются операторы заголовка HTTP-сообщения. Однако здесь тоже следует быть осторожным. Большинство российских Web-узлов используют в качестве HTTP-сервера Russian Apache. Эта модификация сервера поддерживает перекодировку документов «на лету» для правильного отображения на стороне клиента. Russian Apache сам вставляет в HTTP-заголовок (не путать с HEAD) директиву Content-type. Если в документе будет META-элемент c указанием типа кодировки, а Apache перекодировал содержание, то возможно несоответствие между указанным в META типом кодировки и реальной кодировкой содержания документа.

    Кроме Content-type, можно указать и другие операторы. Например, запретить кэширование документа. Необходимость в этом возникает при частом обновлении документа или наличии в нем изменяющихся SSI-вставок. Для запрета кэширования достаточно вставить в заголовок META-тег вида: Pragma — это наследие HTTP 1.0. В новой версии протокола HTTP (HTTP 1.1) управление кэшированием осуществляется через оператор Cache-Control. Для получения такого же эффекта, как в случае с Pragma, в заголовке HTML-документа достаточно указать: Новый механизм управления кэшированием и хранением документа на стороне клиента гораздо более гибок, чем в HTTP 1.0. Например, можно запретить хранение документа после пересылки: Точно так же можно задать время последней модификации (Last-Modified) или дату истечения актуальности документа (Expire).

    С появлением роботов поисковых машин на META-тег была возложена еще одна функция — описание поискового образа документа. Наиболее последовательно это было впервые реализовано в Webcrawler. До этого в качестве поискового образа документа использовался либо весь список слов документа, либо слова первого абзаца.

    Собственно, для описания документа используется два META-тега. Один определяет список ключевых слов, а второй — реферат (краткое содержание документа), который отображается в качестве пояснения к ссылке на документ в отчете поисковой машины о выполненном запросе. Контейнер TITLE здесь также используется в качестве названия документа.

    При индексировании такого документа содержимое контейнера TITLE и атрибутов CONTENT контейнеров META после фильтрации попадет в индекс поисковой машины и может быть использовано для составления запросов. Процесс фильтрации отбракует так называемые stop-слова и общие слова. Они не попадут в индекс поисковой машины. В частности, будут отбракованы предлоги или, если речь идет о тематическом поисковом индексе, например по технологиям World Wide Web, то в него не попадут: web, Web-технология и т.п.

    META-тегом пользуются и программы подготовки документов. Они размещают в нем свой идентификатор. В общем случае контейнер META выглядит следующим образом: Практика показывает, что при индексировании можно указывать одновременно и атрибут NAME, и атрибут HTTP-EQUIV с одинаковыми значениями. Это связано с тем, что одни роботы индексирования анализируют содержание META-элемента по атрибуту NAME, а другие — по атрибуту HTTP-EQUIV.

    Элемент разметки LINK

    Элемент разметки LINK — это результат давно предпринятой попытки придать HTML академический вид. Согласно теории гипертекстовых систем, все гипертекстовые связи разделяют на два типа: контекстные и общие. Такое деление чисто условное и определяется тем, что контекстную связь можно привязать к определенному месту документа, а общую — отнести только ко всему документу целиком. Если взглянуть на проблему связи чуть шире, то очевидной становится аналогия с отношениями. Гипертекстовая связь задает отношение на множестве информационных узлов.

    Контекстная связь определяет отношение на паре узлов. При этом в модели World Wide Web один из узлов является источником, а второй — мишенью. Собственно, это и отражено в названии элемента разметки A (anchor), который определяет гипертекстовую ссылку (не путать с гипертекстовой связью). При этом в контекстной связи один и тот же термин может идентифицировать разные связи. Например, в контексте содержания конспекта данной темы слово «HEAD» определяет документ head.htm, который описывает контейнер HEAD и особенности его применения, а в контексте справочника по данной теме слово «HEAD» будет означать ссылку на описание синтаксиса этого контейнера.

    Общие ссылки нельзя привязать по контексту. Например, два информационных узла находятся в отношении следования, т.е. при «линейном» просмотре одна Web-страница является следующей для другой Web-страницы. В этом случае речь идет о страницах целиком, а не об отдельных их частях. Такой же общей связью является принадлежность к Web-узлу, который ассоциируется со своей домашней страницей.

    В информационно-поисковых системах поисковый термин определяет отношение «быть заиндексированным данным термином», которое также задает связь соответствующих документов.

    В настоящее время в браузерах не существует единого способа программирования или определения общих гипертекстовых связей. В течение последних пяти лет W3C строит уже второй браузер, который должен продемонстрировать возможность программирования икон меню браузера (вперед, назад и т.п.). Однако производители наиболее популярных браузеров такой поддержки через HTML-разметку в своих программах не предлагают.

    Существенный сдвиг в этом направлении произошел после реализации поддержки описателей стилей в Netscape Navigator и Internet Explorer четвертых версий. CSS (Cascade Style Sheets, каскадные таблицы стилей) позволяют определять для различных типов гипертекстовых связей вид гипертекстовых ссылок. При этом можно определять различные типы контекстных ссылок. Кроме того, впервые нашел осмысленное применение контейнер LINK. Он позволил загружать внешние описатели стилей: В данном случае речь идет о загрузке стилей из файла css.htm. При этом стили задаются в нотации W3C, а не JAVASCRIPT, что определяется атрибутом TYPE. В сущности, атрибут REL определяет тип гипертекстовой связи, HREF (Hypertext REFERENCE) указывает адрес документа, идентифицирующего связь, а атрибут TYPE определяет тип содержания этого документа.

    В общем случае контейнер LINK может имеет следующий вид: Для разных типов содержания действия по интерпретации элемента разметки будут различными. В настоящее время идет процесс разработки спецификаций описания метаданных, где возможно применение элемента разметки LINK.

    Элемент разметки STYLE

    Элемент разметки STYLE предназначен для размещения описателей стилей. При этом описание стиля из данного элемента разметки, если оно совпадает по имени класса и/или идентификатору подкласса со стилем, описанным во внешнем файле, заменяет описание стиля из внешнего файла. С точки зрения влияния на весь документ, описатели стилей задают правила отображения контейнеров HTML-документа для всей страницы.

    В настоящее время контейнер используется только с одним атрибутом TYPE, который задает тип описателя стиля. Это может быть либо text/css, либо text/javascript. Если элемент разметки открыт тегом начала, то он должен быть закрыт тегом конца. В общем виде запись элемента STYLE выглядит так: описание стиля/стилей

    Применению стилей в HTML-разметке, а также проектированию Web-узлов с применением CSS посвящена отдельная глава «Применение каскадных таблиц и стилей».

    Элемент разметки SCRIPT

    Элемент разметки SCRIPT служит для размещения кода JAVASCRIPT, VBSCRIPT или JSCRIPT. Вообще говоря, SCRIPT можно использовать не только в заголовке документа, но и в его теле. В отличие от контейнера STYLE, ему не требуется дополнительный контейнер LINK для загрузки внешних файлов кодов. Это можно сделать непосредственно в самом контейнере SCRIPT: Если открыт тег начала, то нужно обязательно использовать тег конца контейнера. В противном случае, браузер может отобразить только символ «]». Если код не помещен в HTML-комментарии, то старые версии браузеров (до Mozilla 2) отображают программу перед текстом страницы. В ряде случаев страница вообще может не отображаться.

    В общем виде запись контейнера выглядит следующим образом: JAVASCRIPT/VBSCRIPT-код

    Существует несколько скриптовых языков: JAVASCRIPT, VBSCRIPT, JSCRIPT. По умолчанию подразумевается JAVASCRIPT. Подробнее с JAVASCRIPT и контейнером SCRIPT можно ознакомиться в главе «Введение в JAVASCRIPT».

    Лекция #3: Контейнеры тела документа

    Теги тела документа

    Теги тела документа предназначены для управления отображением информации в программе интерфейса пользователя. Они описывают гипертекстовую структуру базы данных при помощи встроенных в текст контекстных гипертекстовых ссылок. Тело документа состоит из: · иерархических контейнеров и заставок;

    · заголовков (от Н1 до Н6);

    · блоков (параграфы, списки, формы, таблицы, картинки и т.п.);

    · горизонтальных отчеркиваний и адресов;

    · текста, разбитого на области действия стилей (подчеркивание, выделение, курсив);

    · математических описаний, графики и гипертекстовых ссылок.

    Тело документа — контейнер BODY

    Описание тегов тела документа следует начать с тега BODY. В отличие от тега HEAD, тег BODY имеет атрибуты.

    Атрибут BACKGROUND определяет фон, на котором отображается текст документа. Так, если источником для фона HTML- документа является графический файл image.gif, то в открывающем теге тела BODY появляется соответствующий атрибут: Как видно из этого примера, в качестве значения данного атрибута используется адрес в сокращенной форме URL. В данном случае это адрес локального файла. Следует заметить, что разные интерфейсы пользователя поддерживают различные дополнительные атрибуты для тега BODY.

    Таблица 1. Атрибуты

    VLINK =#FF0000Цвет пройденных гипертекстовых ссылок

    LINK =#00FF00Цвет гипертекстовой ссылки

    В данной таблице строка #ХХХХХХ определяет цвет в терминах RGB в шестнадцатеричной нотации. Также имеется возможность задавать цвета по названию. Далее в таблице приведены названия цветов, определенные в стандарте HTML 4 и соответствующие им RGB-коды. Отметим, что многие современные браузеры выходят за рамки стандартов и поддерживают гораздо больше названий цветов.

    Таблица 2. Цвета

    Так, значения атрибутов в таблице 1 определяют цвет текста как синий, фона — белый, пройденные ссылки красные, а новые ссылки зеленые. Если в качестве атрибутов тега BODY указать

    , то цвет фона будет белым, текст будет синим, ссылки — зелеными, а пройденные ссылки станут красными. Однако пользоваться этими атрибутами следует крайне осторожно, так как у пользователя может оказаться другой интерфейс, который эти параметры не интерпретирует.

    Microsoft Internet Explorer и Netscape Navigator допускают применение атрибутов LEFTMARGIN=n и TOPMARGIN=n в теге . Атрибут LEFTMARGIN= задает левое поле для всей страницы. TOPMARGIN= определяет верхнее поле. Число n показывает ширину поля в пикселах. Например, тег создаст на всей странице левое поле шириной 40 пикселов. При n, равном 0, левое поле отсутствует.

    Теги управления разметкой

    Заголовок обозначает начало раздела документа. В стандарте определено 6 уровней заголовков: от Н1 до Н6. Текст, окруженный тегами , получается большим — это основной заголовок. Если текст окружен тегами , то он выглядит несколько меньше (подзаголовок); текст внутри еще меньше и так далее до . Некоторые программы позволяют использовать большее число заголовков, однако реально более трех уровней встречается редко, а более 5 — крайне редко.

    Ниже на рисунке показан результат использования следующих заголовков: (открыть)

    Тег применяется для разделения текста на параграфы. В нем используются те же атрибуты, что и в заголовках.

    Атрибут ALIGN позволяет выровнять текст по левому или правому краю, по центру или ширине. По умолчанию текст выравнивается по левому краю. Данный атрибут применим также к графике и таблицам.

    Далее приведены возможные значения атрибута ALIGN: ALIGN=justify выравнивание по левому и правому краям. Реализовано не во всех программах интерпретации.

    ALIGN=left выравнивание по левому краю. По умолчанию текст HTML выравнивается по левому краю и не выравнивается по правому, то есть начало строк находится на одном уровне по вертикали, а концы — на разных. Чаще всего, получающийся при этом текст с равными промежутками между словами выглядит лучше. Поскольку выравнивание по левому краю задается автоматически, атрибут ALIGN=left можно опустить.

    ALIGN=right выравнивание по правому краю. Текст, выровненный по правому краю и не выровненный по левому — концы строк находятся на одном уровне, а начало на разных, — часто используется с целью создать оригинальный дизайн. Для этого задается атрибут ALIGN=right в обычных тегах, например в теге .

    ALIGN=center центрирование текста и графики. Есть несколько способов отцентрировать текст или графику. В спецификациях HTML 3.0 предлагается пользоваться тегом . Однако этот тег применим не ко всем объектам HTML-страницы, поэтому разработчики Netscape добавили тег , который центрирует любые объекты и поддерживается браузерами Netscape Navigator 3.0, Microsoft Explorer 3.0 и другими. К тегу нужно относиться с осторожностью. Какой-нибудь браузер может его вообще проигнорировать, и на странице окажется текст, выровненный по левому краю.

    Обтекание графики текстом. С помощью атрибута ALIGN можно заставить текст «обтекать» графический объект. Для этого следует поместить тег туда, где должен быть графический объект, и добавить атрибут ALIGN=left, ALIGN=right или ALIGN=center. Кроме того, с помощью атрибутов HSPACE и VSPACE (они описаны ниже) задается ширина горизонтальных и вертикальных полей, отделяющих изображение от текста. Можно также создать рамку вокруг картинки или обрамление таблицы текстом. Чтобы текст не «обтекал» графику, а прерывался, необходимо применить тег c атрибутом CLEAR.

    Принудительный перевод строки используется для того, чтобы нарушить стандартный порядок отображения текста. При обычном режиме интерпретации программа интерфейса пользователя отображает текст в рабочем окне, автоматически разбивая его на строки. В этом режиме концы строк текста игнорируются. Иногда для большей выразительности требуется начать печать с новой строки. Для этого и нужен тег BR. Атрибут CLEAR в теге используется для того, чтобы остановить в указанной точке обтекание объекта текстом и затем продолжить текст в пустой области за объектом. Продолжающийся за объектом текст выравнивается в соответствии со значениями LEFT, RIGHT или ALL атрибута CLEAR: Текст будет продолжен, начиная с ближайшего пустого левого поля.

    Текст будет продолжен, начиная с ближайшего пустого правого поля.

    Текст будет продолжен, как только и левое, и правое поля окажутся пустыми.

    Тег (No Break, без обрыва) дает браузеру команду отображать весь текст в одной строке, не обрывая ее. Если текст, заключенный в теги , не поместится на экране, браузер добавит в нижней части окна документа горизонтальную полосу прокрутки. Если вы хотите оборвать строку в определенном месте, поставьте там тег .

    Теги управления отображением символов

    Все эти теги можно разбить на два класса: теги, управляющие формой отображения (font style), и теги, характеризующие тип информации (information type). Часто внешне разные теги при отображении дают одинаковый результат. Это зависит главным образом от настроек интерпретирующей программы и вкусов пользователя.

    Теги, управляющие формой отображения

    Курсив, усиление, подчеркивание, верхний индекс, нижний индекс, шрифт большой, маленький, красный, синий, различные комбинации — все это делает страницы более интересными. Microsoft Internet Explorer и Netscape Navigator позволяют определить шрифт с помощью атрибута FONT. Теперь можно объединять на одной странице несколько видов шрифтов, вне зависимости от того, какой из них задан по умолчанию в браузере пользователя.

    Теги и — изменение размеров шрифта

    Текст, расположенный между тегами или , будет, соответственно, больше или меньше стандартного.

    Верхние и нижние индексы

    С помощью тегов и можно задавать верхние и нижние индексы, необходимые для записи торговых знаков, символов копирайта, ссылок и сносок. Рассматриваемые теги позволяют создать внутри текстовой области верхние или нижние индексы любого размера. Чтобы они казались меньше окружающего текста, можно использовать теги и с атрибутом FONT SIZE=-1, уменьшающим размер шрифта.

    Атрибут SIZE тега позволяет задавать размер текста в данной области. Если вы не пользуетесь тегом для задания определенного размера шрифта на всей странице, то по умолчанию принимается 3. Некоторые браузеры тег не поддерживают, поэтому желательно употреблять его только внутри текстовой области. В других случаях лучше использовать теги , , и т.д. Главное преимущество тега состоит в том, что после окончания действия он не разбивает строку, как теги . Поэтому тег бывает очень полезен для изменения размера шрифта в середине строки.

    Если вы хотите сделать свою страницу более красочной, можете воспользоваться атрибутом COLOR в теге FONT, и тогда единственным ограничением будет цветовая палитра на компьютере пользователя.

    Теги, управляющие формой отображения, приведены в таблице.

    Спецификация языка HTML

    Сентябрь 8, 1995 г.

    Реферат: Документ содержит русский перевод черновой версии спецификации языка гипертекстовой разметки HTML . Перевод выполнен по заказу корпорации » Университетские сети знаний » (УНИКОР) для проведения работ по проекту » Instauratio Magna » , в рамках программы Госкомвуза » Национальная академическая система баз данных и баз знаний высшей школы России «.

    Текст перевода и его отдельные части могут свободно распространяться и быть использованы организациями и отдельными лицами в целях создания и развития информационных систем и средств обработки информации. Не допускается коммерческое использование текста и его отдельных частей, а также распространение его в измененном виде.

    Перевод спецификации HTML производился в 1994 году и некоторая информация на момент публикации устарела. По этой причине в оригинальный текст включены примечания (замкнуты в скобках и помечены, как » прим. ред. «). Некоторые из них вынесены из текста и размещаются в конце данного документа в разделе » Изменения и дополнения «.

    Язык разметки гипертекста (HTML
    Проект Internet )
    Рабочая группа IIIR

    Tim Berners-Lee, CERN
    Daniel Connolly, Atrium
    июнь 1993

    Язык разметки гипертекста

    Представление текстовой и метаинформации
    для обработки и обмена

    • Статус данного документа
    • Аннотация
    • Терминология
    • Степень долженствования
    • Замечания
    • Классификация элементов в реализации языка HTML
    • HTML и MIME
    • Наборы символов
    • Введение
    • Структурированный текст
    • Метки
    • Имена
    • Атрибуты
    • Типы элементов
    • Пустые элементы
    • Текст
    • Заменяемый текст
    • Обращения к символам по числовому значению
    • Обращения к объектам
    • Модели данных в элементе
    • Смешанные данные
    • Комментарии и другая разметка
    • Разделители строк
    • Пробелы и табуляторы
    • Список инструментария для разметки
    • Элементы языка HTML
    • Общие свойства документа
    • Форматирование текста
    • Графика
    • Устаревшие элементы
    • Body
    • Анкер (элемент A)
    • Элемент Address
    • Элемент Base
    • Элемент выделения блока (Blockquote)
    • Заголовки (Headings)
    • Типовые методы обработки
    • Img: встроенные изображения
    • Isindex
    • Link
    • Формы списков в языке HTML
    • Списки
    • P: метка параграфа
    • Pre: предварительно отформатированный текст
    • Название документа
    • Выделение символов
    • Устаревшие элементы
    • Plaintext (незакодированный текст)
    • Xmp и Listing: поля примеров в документе
    • Выделение выражений HP1 и т.д.
    • Комментарии
    • Исторические заметки: Xmp и Listing
    • Объекты
    • Значения для взаимоотношений между документами или их частями
    • Взаимоотношения между документами
    • Взаимоотношения с тематикой документов
    • Авторское право
    • Ссылки
    • Адреса авторов
    • Изменения и дополнения

    Статус данного документа

    Данный документ является проектом Internet. Проекты Internet являются рабочими документами инженерного подразделения сети Internet (IETF), его региональных отделений и рабочих групп. Отметим, что и другие группы могут распространять рабочие документы в качестве проектов Internet.

    Проекты Internet являются рабочими документами, действительными не более шести месяцев. Проекты Internet могут быть отменены, обновлены или заменены другими документами в любой момент. Нежелательно делать ссылки на проекты Internet или упоминать их иначе как «рабочие проекты» или «проекты в процессе разработки».

    Нет ограничений на распространение этого документа. Данный документ является проектом стандарта для обмена информацией в сетях. Желательно посылать Ваши комментарии по адресу timbl@info.cern.ch или же на обсуждение в www-talk@info.cern.ch .

    Данный текст является версией 1.2 рассматриваемого проекта. Этот документ доступен в гипертекстовом виде в системе World-Wide Web http://info.cern.ch/hypertext/WWW/MarkUp/HTML.html (прим. ред. 1)

    Язык разметки гипертекста (HyperText Markup Language — HTML) можно использовать для представления:

    • гипертекстовых новостей, почты, сопровождающей информации и сопутствующей гиперсреды,
    • меню с опциями
    • результатов запросов к базам данных
    • простых структурированных документов со встроенной графикой
    • гипертекстовых обзоров имеющейся информации

    Программа World W > Описание языка HTML ссылается на спецификацию URL в документах RFC.

    Реализацию анализаторов и генераторов языка HTML можно найти на различных W3 серверах, в программах просмотра, среди общедоступного исходного кода программы W3. Они также могут быть созданы с использованием различных общедоступных анализаторов SGML, таких, как [SGMLS]. HTML относится к документам типа SGML с очень обобщенной семантикой, пригодной для кодирования информации, получаемой от большого набора прикладных программ. Этот язык является более общим, чем многие другие специфические реализации языка SGML, и вместе с тем он полностью сохраняет независимость от конкретных устройств.

    Данная спецификация языка использует нижеприведенные слова в заранее определенном значении.


    Representation — описание, представление, отображение информации.
    Кодирование информации для ее передачи. Например, язык HTML является представлением гипертекста в закодированном виде.
    Rendering — обработка. Форма предоставления информации человеку.
    «может быть» (may) Реализация языка не обязана во всех случаях следовать данному указанию
    «должно» (must, shall) Если данное указание не соблюдается, то реализация не удовлетворяет данной спецификации.
    «следовало бы» (should) Если данное указание не выполняется, то хотя данная реализация считается удовлетворяющей стандарту, однако на практике могут возникнуть нежелательные последствия.
    «обычно» (typical) Для многих элементов дано описание механизма обычной обработки. Он не является обязательной частью стандарта, однако приведен в качестве описания для разработчиков и для того, чтобы помочь пользователям уяснить, для чего предназначены те или иные элементы языка.

    Параграфы, этого документа, отмеченные как замечания, не являются обязательной частью спецификации HTML, а всего лишь пояснением к нему.

    Классификация элементов в реализации языка HTML

    основные Все программы-анализаторы должны распознавать указанные элементы. Все элементы являются главными, если не указано обратное.
    дополнительные стандартные элементы языка HTML, которые могут без опасности игнорироваться анализаторами. Правильное действие — игнорировать дополнительные элементы, а содержимое документа обрабатывать так, как если бы в нем не было этих меток (например, это может быть EM или любые неопределенные элементы).
    устаревшие Элементы, не являющиеся стандартом языка HTML. Анализаторам следует по возможности поддерживать данные элементы с тем, чтобы сохранить совместимость с предыдущими версиями данной спецификации. .

    Подтип языка HTML определяется как:

    имя типа в стандарте MIME текст.
    имя подтипа html.
    обязательные параметры отсутствуют.
    необязательные параметры набор символов.

    Базовый набор символов (SGML BASESET) для языка HTML — это ISO Latin-1. На данный набор могут ссылаться любые обращения к символам. Набор символов, реальный используемый при кодировке HTML документа, может быть ISO Latin 1, или же его 7-битная часть, являющаяся набором ASCII-кодов. HTML документу нет нужды включать какие-либо символы, чей десятичный код превышает 127. Возможно, что такой механизм пересылки, как электронная почта, наложит ограничения на количество битов в байтах кодировки документа, хотя протокол HTTP, используемый в программе W3, всегда позволяет передавать 8-битные данные.

    Если документ HTML кодируется с использованием 7-битных символов, то для кодировки символов из верхней половины набора ISO Latin-1 могут использоваться механизмы обращений по числовому значению и обращения к объектам. Таким образом, могут быть приготовлены документы, пригодные к пересылке по системам с 7-битными ограничениями.

    Язык разметки гипертекста (HyperText Makeup Language — HTML) формулируется в терминах языка стандартной обобщенной разметки (Standard Generalized Markup Language — SGML) []. Язык SGML представляет собой метод создания структурированных документов, а также языков для их разметки.

    В языке SGML каждый документ имеет три части:

      Декларации языка SGML, привязывающие к определенным значениям параметры обработки, а также имена синтаксиса. Например, декларация SGML в описании типа документа HTML объявляет, что строка, с которой начинается метка, — это И наоборот, для реализации анализатора языка HTML необходимо лишь воссоздать те части анализатора SGML, которые необходимы для разбора данных, появляющихся вслед за разбором деклараций HTML DTD.

    Данные в формате HTML похожи на текстовой файл, за исключением того, что некоторые из символов интерпретируются как разметка. Разметка придает документу некую структуру.

    Данные представляют собой иерархию элементов. Каждый элемент имеет имя, атрибуты и несет некую информацию. Большинство элементов представлены в документе в виде начальной метки, указывающей имя и атрибуты. Далее следует собственно содержание элемента. И наконец, заканчивает все это конечная метка. Например,

    Некоторые элементы языка (такие как P, LI) являются пустыми. Они не имеют поля данных, и ограничиваются лишь начальной меткой.

    В остальных элементах поле данных представляет собой набор символов и вложенных элементов. Заметим, что описание HTML DTD фактически накладывает некие ограничения на количество допустимых вложений — большинство элементов не могут быть вложены в другие элементы. Ни один из элементов не может быть вложенным сам в себя рекурсивным образом. Анкеры и выделенные символы могут быть помещены в другие конструкции.
    (прим.ред. 3)

    Каждый элемент начинается с метки, меткой же и заканчивается каждый непустой элемент. Начальные метки выделяются символами , а конечные — символами .

    Имя элемента следует в метке сразу за символом открытия Атрибуты

    Начальная метка позволяет вставить между именем и символом > пробелы и атрибуты. Атрибут состоит из имени, символа равенства и значения. Слева и справа от символа равенства можно оставлять пробелы.

    Значение атрибута указывается в виде строки, заключенной в одинарные или двойные кавычки.

    Чтобы определить значение атрибута, осуществляется анализ данной строки в формате RCDATA (см. ниже). Например, такой подход позволяет представлять символы кавычек в значении атрибута как обращения к символам по числовому значению. Длина строки со значением атрибута после такого анализа не должна превышать 1024 символов.

    Имя метки соотносится с типом элемента, объявленным в декларации HTML DTD. Объявление типа элемента ассоциирует его имя со

    • списком атрибутов, их типом и статусом
    • типом данных (EMPTY, CDATA, RCDATA, ELEMENT или MIXED), определяющим синтаксис элемента
    • моделью данных, задающей шаблон для вложенных элементов и данных

    Пустые элементы имеют в своей декларации ключевое слово EMPTY.
    Например:

    Это означает, что

    — допустимо
    текст — недопустимо

    Ключевое слово CDATA указывает на то, что элемент содержит текст. Текстом считается любая информация, расположенная до метки завершения. Например, декларация

    определяет, что нижеприведенный текст является приемлемым XMP элементом.

    Here’s an example. It looks Это пример. Хотя и
    like it has and кажется, что он содержит
    in it, but метки и комментарии, это
    it does not. Even this не так. Текстом является
    даже There is no way to represent tags in CDATA .

    Элементы, содержащие данные типа RCDATA, очень похожи на элементы с данными CDATA. Отличие состоит в том, что содержащийся в них текст может содержать обращения к объектам и обращения к символам по их числовому значению. Элементы, объявленные как
    могут содержать любой набор символов в своем тексте.

    Обращения к символам по числовому значению

    Если пользователь хочет использовать в своих документах какой-либо символ, уже зарезервированный в качестве элемента разметки, то ему следует воспользоваться обращением к нужному символу. Строка &#, за которой следует буква или цифра, указывает на применение условного обозначения вместо символа. За ограничителем следуют цифры десятичного числа и точка с запятой. Например,
    You can even represent tags in RCDATA

    Обращения к объектам

    (прим.ред. 4)
    В декларациях HTML DTD объявлены объекты для символов «менее, чем», «больше, чем» и «амперсанд», а также для каждого символа из набора ISO Latin 1. Так что Вам предоставляется возможность обращаться к символам не только по номеру, но и по имени.

    Если за строкой & следует буква или цифра, то это обозначает обращение к объекту. За разграничителем должны следовать имя объекта и точка с запятой. Например,
    Kurt Gödel was a famous logician and mathematician.

    Замечание.
    Убедитесь, что строки документа не содержит никаких неучтенных символов разметки. При написании документов на языке HTML следует замещать все встречающиеся символы и & на обращения к символам по числовому значению или обращения к объектам.

    Модели данных в элементе

    В некоторых элементах указывается ключевое слово, определяющее не тип, а модель данных. Это означает допустимость применения не только данных, но и вложенных элементов. Если модель данных в элементе не включает символа #PCDATA, то информация в поле данных относится к рассматриваемому элементу. Пробелы в поле данных такого элемента рассматриваются как разметка и игнорируются. Символы, не являющиеся разметкой, и следовательно, относящиеся к данными, недопустимы.

    Например, декларация

    объявляет элемент, который можно использовать следующим образом

    Head Example

    Однако следующие примеры содержат ошибки
    no data allowed!
    (данные в этом элементе недопустимы)
    Two isindex tags
    (дважды встречается метка isindex)

    Если в элементе модель данных содержит символ #PCDATA, то содержимое такого элемента рассматривается как смесь нескольких элементов. Например,

    Это означает, что элемент PRE состоит из одного или нескольких элементов или текстов A, B, I, U или P. Пример PRE элемента:

    Содержимое предыдущего элемента PRE рассматривается как
    A B element
    The string » cat — concatenate»
    An A element
    The string »\n»
    Another B element
    The string »\n cat Комментарии и другая разметка

    Если Вы хотите включить в HTML документ комментарий таким образом, чтобы он игнорировался анализатором, поставьте перед ним и после него ограничители соответственно. Весь текст, расположенный между начальным ограничителем и символами —, будет игнорироваться. Следовательно, комментарии не могут быть вложенными. В заключительном ограничителе между — и символом > можно вставлять пробелы (но в начальном ограничителе между
    HTML Guide: Recommended Usage

    В языке SGML есть несколько конструкций, которые в HTML будут нежелательны или воспринимаются как ошибка.

    Ограничитель

    Разделитель строки рассматривается как элемент разметки (и соотвественно игнорируется), если он помещен в элемент в начале или конце поля данных. Это позволяет Вам писать либо

    Оба примера будут обработаны одинаковым образом. Кроме того, если строка документа не является пустой, но все равно не содержит информацию для анализатора, она будет игнорироваться полностью. Например, элемент

    содержит лишь строки
    first line

    third line
    fourth line

    Пробелы и табуляторы

    Символы пробелов должны воспроизводиться как горизонтальные пробелы. В языке HTML несколько рядом стоящих символов пробела должны воспроизводиться как один пробел.

    Порядок воспроизведения символа горизонтальной табуляции (HT) не определен, и поэтому символ HT не должен использоваться в документах, за исключением тех случаев, когда он является частью элемента PRE (либо вышедших из употребления XMP, LISTING и PLAINTEXT).

    Ни пробелы, ни табуляторы нельзя использовать для того, чтобы сделать документ в формате SGML более красивым и легко читаемым.

    Список инструментария для разметки

    Следующие разделители могут, в зависимости от контекста, производить разметку

    .
    . Язык HTML не объявляет карту коротких ссылок. Поэтому такая конструкция будет ошибочной.
    Разделитель Его значение
    конец выделенной части документа (приводит к ошибке)
    Элементы языка HTML

    Здесь приведен список элементов, используемых в языке HTML. Документы должны (но не обязательно) содержать элемент HEAD, за которым следует элемент BODY.

    Документы старого типа могут содержать лишь данные обычных элементов HEAD и BODY, причем в любом порядке. Это осуждается, но тем не менее, анализаторы должны воспринимать такое построение документа. Обратите внимание также на статус элементов.

    Общие свойства документа

    Элемент HEAD содержит всю информацию о документе в целом. Однако он не содержит какого-либо текста. Последний является лишь частью документа и должен находиться в элементе BODY. В элементе заголовка HEAD можно использовать лишь строго заданный набор элементов.

    Нижеприведенные элементы определяют общие свойства документа. Они должны появляться в элементе HEAD. Порядок элементов значения не имеет.

    TITLE Название элемента.
    ISINDEX Элемент, посылаемый серверу вместе с документом, предназначенным для информации к поиску. .
    NEXTID Параметр, используемый текстовыми редакторами для создания , уникальных идентификаторов. , ( Устарел и не рекомендуется использовать. Прим.ред. ).
    LINK Элемент, определяющий связь этого документа с другими. В , документе может присутствовать несколько элементов LINK. , См. описание связей между документами и описание элемента , Анкер.
    BASE Запись, сделанная на языке URL при фиксировании данного , документа. .

    (прим.ред. 5)

    В элементе BODY документа встречаются элементы из приведенного ниже списка. Они выстроены в том порядке, в каком должны подаваться на устройство вывода.

    Заголовки
    (Headings)
    Язык поддерживает заголовки разделов различных уровней.
    Анкеры
    (Anchors)
    Части текста, которые формируют начало и/или конец связей в гипертексте, называются, анкерами и формируются меткой A.
    Метки параграфов
    (Paragraph marks)
    Элемент P указывает на границу между параграфами.
    Стиль адреса
    (Address style)
    Этот элемент указывает, в каком стиле предстает перед клиентом элемент ADDRESS.
    Выделенный блок текста.
    (Blockquote style)
    .
    Списки списки, словари и т.д.
    Преформатированный текст
    (Preformatted text)
    Части текста, предварительно отформатированные с использованием шрифта фиксированной ширины.
    Выделение символов
    (Character highlighting)
    Элементы форматирования, не вызывающие разбиения на параграфы.
    IMG Метка IMG может использоваться для включения в текст графических изображений.

    Элементы, не указанные выше, считаются устаревшими. Однако они должны распознаваться анализаторами в целях совместимости с предыдущими версиями языка.

    В противоположность элементу HEAD элемент BODY содержит всю ту информацию, из которой собственно и состоит рассматриваемый документ. Порядок следования элементов здесь именно тот, в каком они предстают перед читателем. См. далее список элементов, применимых в пределах элемента BODY.

    Анкер (элемент A)

    (прим.ред. 3)
    Анкер — это некий текст, который указывает на начало и/или конец связи в гипертексте. Текст между открывающей и закрывающей метками определяет начало связи или указываемое ею место (или и то, и другое вместе). Метка анкера может иметь следующие атрибуты:

    HREF Необязательный. ( Адрес гипертекстовой ссылки. Прим.ред. ) Если атрибут HREF установлен, то анкер является точно выверенный текстом — началом соединения. Если читатель выбрал этот текст, то ему (ей) будет представлен другой элемент, чей сетевой адрес определяется значением HREF атрибута. Формат сетевого адреса определяется в другом месте. Такой подход позволяет с помощью формы HREF=»#индикатор» ссылаться на другой анкер в том же самом документе. Если же анкер относится к другому документу, атрибут является относительным именем, именем относительно данного документа (либо он указывает базовый адрес, если таковой имеется).
    NAME Необязательный. Если этот атрибут указан, то он позволяет данному анкеру быть местом в документе, на которое ссылается какой-либо анкер. Значение атрибута является идентификатором анкера. Идентификатор анкера — это произвольная строка текста, которая тем не менее уникальна в пределах рассматриваемого HTML документа. Другие документы тоже могут создавать ссылки именно на этот анкер, помещая его идентификатор в поле адреса документа после символа #.
    REL Необязательный. Атрибут REL может дать взаимоотношение(ия) в описанной ранее связи гипертекста. Значение атрибута — это список значений для взаимоотношений, написанный через запятую. Значения атрибута и их семантика будут регистрироваться комитетом по языку HTML. Если ничего не указано, то по умолчанию предполагается, что взаимоотношениях не несут каких-либо значений. Атрибут REL нельзя применять, если нет атрибута HREF. См. значения для взаимоотношений, атрибут REV.
    REV Необязательный. Полностью аналогичен атрибуту REL за исключением того, что тип соединения имеет обратную семантику. Связь из анкера A в анкер B с атрибутом REL=»X» полностью аналогична связи из B в A с атрибутом REV=»X». Анкер может иметь оба атрибута REL и REV.
    URN Необязательный. Если этот атрибут указан, то это определяет универсальный номер ресурса для данного документа.
    TITLE Необязательный. Данный атрибут является чисто информационным. Если атрибут присутствует в анкере, его значение должно ( может прим.ред. ) совпадать со значением элемента TITLE в документе, чей адрес указан в атрибуте HREF. См. замечание 2.
    METHODS Необязательный. Значение этого атрибута — строка. Она должна представлять собой список через запятую методов HTTP, которые программа общего пользования в состоянии поддерживать. См. замечание 3.

    Все приведенные выше атрибуты являются необязательными, хотя для того, чтобы анкер действовал, нужны NAME и HREF. См. также описание LINK.

    Пример использования анкеров

    See CERN’s information for more details.

    A serious crime is one which is associated with imprisonment.

    The Organization may refuse employment to anyone convicted of a serious crime.

    Замечание 1. Универсальные номера для ресурсов (Universal resource numbers — URN) должны обеспечивать распознавание документа в случае обнаружения его дубликатов. Должно существовать программное обеспечение клиента, осуществляющее отсев копий для уже имеющейся информации.
    Формат номеров URN обсуждается различными рабочими группами из инженерного подразделения сети Internet (1993). ( На сегодняшний день спецификация URN не определена. Прим.ред. )

    Замечание 2. Атрибут названия для связей (TITLE).
    Соединение может содержать атрибут TITLE. Если этот атрибут имеется, он должен давать название документа, чей адрес определен в атрибуте HREF. Есть по крайней мере две причины для использования такого атрибута.

    • Программа просмотра может запросить показ названия документа в качестве предварительного условия для его выборки. Например, в виде метки с записью, или маленького ящика, возникающего, когда мышь попадает на анкер или же при вызове документа.
    • Некоторые документы не имеют названия, так что использование атрибута названия для связи является для них единственным способом получить название. В основном это документы, не являющиеся размеченным текстом, графикой, текстом и меню для программы Gopher. Именно так работает упомянутая программа Gopher. Очевидно, что это приводит к дублированию данных и было бы рискованно безоглядно надеяться на то, что атрибут названия у соединения будет корректным и уникальным для соответствующего документа.

    Замечание. 3 Атрибут метода для связи (METHODS).
    Анкеры и связи используют атрибут метода для указания действий, которые клиент может применять к объектам. Эти действия более точно формулируются в HTTP протоколе, если таковой применяется. Однако этот атрибут, как и атрибут TITLE, в силу некоторых причин может использоваться для повышения информативности соединения. Например, программа чтения может вызывать различные способы визуализации информации в зависимости от разрешенного в атрибуте метода (например, клиент, осуществляющий поиск, может пользоваться различными иконами).

    Данный элемент предназначен для указания адреса, подписей, авторства и т.д. Элемент появляется часто в начале или конце документа.

    Типовая обработка элемента. Обычно элемент адреса использует наклонный шрифт, а также его текст может быть выровнен по правой границе листа. Элемент адреса применяет символ конца параграфа. Разбивка элемента адреса на отдельные параграфы не приводит к появлению в самом тексте документа каких-либо пустых мест. Примеры использования
    A.N.Other

    JimquickPost News, Jumquick, CT 01234

    Tel (123) 456 7890

    Элемент BASE позволяет документу самому назначать URL в случаях, когда он может быть прочтен извне ( либо переназначить URL, если это необходимо. Прим.ред ). Метки URL в документе могут иметь сокращенную форму и указывать смещение относительно некого базового адреса.

    Где бы не был указан базовый адрес, для работы с сокращенными URL читатель будет применять главный URL, используемый для адресации документа в целом.

    Элемент BASE может иметь только один атрибут — HREF. ( Данный элемент применяется только в элементе HEAD. Прим.ред. )

    Элемент выделения блока (BLOCKQUOTE)

    Элемент BLOCKQUOTE допускает обработку специальным образом текста, выделенного в каком-либо источнике.

    Типовая обработка элемента. Типовая обработка может заключаться в дополнительном смещении текста влево или вправо и/или в использовании наклонного шрифта. Элемент BLOCKQUOTE приводит к разбиению текста на параграфы, а также обычно к появлению пустой строки или пробелов между выделенным блоком и предшествующим/ последующим текстом.

    Обработка с единым шрифтом может, к примеру, привести к появлению в начале строки символа «>», что соответствует стилю выделения в системе Internet почты.

    Пример:
    I think it ends

    Soft you now, the fair Ophelia, Nymph, in thy orisons,
    be all my sins remembered.

    Обрабатывается до шести уровней заголовков (Заметим, что узел в гипертексте, как правило, нуждается в меньшем количестве уровней, чем сочинение, чья структура целиком определяется применением заголовков). Элемент заголовка несет в себе все изменения шрифтов, разбиение на параграфы до и после, пробелы, необходимые, например, для обработки заголовка. Язык HTML не требует применения иных средств для выделения символов или разбивки текста на параграфы.

    Заголовок H1 относится к самому верхнему уровню и рекомендуется в качестве начального для узла в гипертексте. Предполагается, что текст первого заголовка будет соответствовать запросам клиента, уже производящего анализ связанной с этим узлом информации. Это отличает заголовок (heading) от названия (title), которое должно характеризовать данный узел в более широком плане.

    Было бы отклонением от правил при переходе от заголовка к заголовку пропускать какой-либо уровень, например, ставить после элемента H1 сразу элемент H3. Хотя такая практика и не запрещена, но нежелательна и может привести к странным результатам при написании других реализаций языка HTML.

    This is a heading

    Second level heading

    Замечание об анализаторах. Анализаторы не должны накладывать какие-либо ограничения на порядок элементов-заголовков, даже если при переходе с заголовка на заголовок допускается пропуск промежуточных уровней. (прим.ред. 7)

    Типовые методы обработки

    H1 Толстый, очень крупный шрифт, текст центрирован. Между заголовком и последующим текстом вставляется одна или две пустых строки. При выводе на принтер заголовок печатается на новой странице.
    H2 Толстый крупный шрифт. Без отступа. До и после заголовка помещаются одна или две пустых строки.
    H3 Наклонный большой шрифт. До и после заголовка помещаются одна или две пустые строки. С небольшим отступом.
    H4 Толстый нормальный шрифт. Отступ больше, чем в H3. До и после заголовка помещается пустая строка.
    H5 Наклонный нормальный шрифт. Отступ как у заголовка H4. Пустая строка ставится перед заголовком, но не после.
    H6 Толстый шрифт. Отступ такой же, как у обычного текста и больше, чем у H5. Перед заголовком ставится пустая строка.

    Эти типовые значения являются всего лишь указанием для анализатора в программе просмотра гипертекста. Клиент может получить опции для самостоятельной настройки стилей. Но при написании документов Вы должны исходить из того, что где бы ни появился элемент заголовка, он будет иметь именно тот эффект, как описано выше.

    Программа обработки гипертекста обязана автоматически вставлять пробел между элементами, так что необязательно и даже неправильно будет ставить после элемента заголовка символ конца параграфа.

    IMG: Встроенные изображения

    Элемент IMG позволяет вставлять информацию из другого документа. Последний обычно является иконкой, маленькой картинкой и т.д. Элемент IMG не предназначен для вставки дополнительного HTML текста.

    Те анализаторы гипертекста, которые не могут показывать встроенные изображения, элементы IMG игнорируют. Авторам документов следует взять на заметку, что некоторые анализаторы могут показывать (или печатать на принтере) связанные с данным документом изображения, но не встроенные. Если изображение имеет большое значение, может оказаться более разумным создать с ним связь, нежели делать это изображение встроенным в гипертекст. Если же изображение является в значительной степени декоративным, более удобным будет применение элемента IMG.

    Элемент IMG является пустым (не имеет заключительной метки) и имеет два атрибута:

    SRC Значением этого атрибута является URL документа, который должен быть вставлен в гипертекст. Синтаксис этого атрибута такой же, как и у атрибута HREF для метки A. Атрибут SRC является обязательным.
    ALIGN Это атрибут, принимая значения TOP, MIDDLE или BOTTOM, определяет, верхняя, средняя или нижняя часть изображения должна быть поставлена вровень с текстом.

    В тексте анкеров допускается применение элементов IMG.

    Элемент ISINDEX информирует читателя о том, что данный документ является индексным указателем. По его прочтении клиент может применять поиск по ключевому слову. К узлу гипертекста можно обратиться при поиске по ключевому слову, сопроводив адрес узла знаком вопроса и списком ключевых слов, разделенных символами плюса. См. формат сетевого адреса.

    Заметим, что эта метка обычно автоматически генерируется сервером. Если метка ISINDEX добавлена в документ HTML вручную, то сделавший это клиент предполагает, что данный сервер способен осуществлять поиск в этом документе. Ведь очевидно, что сервер должен обладать такой возможностью: простое добавление элементов в документ не способствует успешному выполнению запросов на поиск, если сервер не обладает требуемым для поиска инструментарием!

    Элемент LINK появляется в границах элемента HEAD документа HTML. Он используется для указания взаимоотношения между данным документом и каким-либо другим объектом. Документ может иметь любое количество элементов LINK. Элемент LINK является пустым (не содержит метки завершения), но имеет те же атрибуты, что и элемент анкер.

    Как правило, элемент используется для указания авторства, соответствующих индексных указателей, словарей, предыдущих и последующих версий документа и т.д. Связи могут формировать некую статичную ветвящуюся структуру, где рассматриваемый документ идентифицируется, например, ссылкой на «родительский», «последующий» и «предыдущий» документы. Серверы также могут не препятствовать установлению ссылок теми клиентами, которые не имеют прав на внесение изменений в сам текст документа.

    Формы списков в языке HTML

    Словарь (или список определений, DL) — это список в виде параграфов, каждый из которых имеет рядом с собой короткое название. За пределами словарей этот элемент используется для предоставления читателю набора названных элементов. В словаре допустимо применение следующих элементов:

    DT «Понятие, термин». Обычно помещается в текст словаря после большого отступа слева.
    DD «Определение», которое может занимать много строк.

    Эти элементы должны появляться в словаре парами. Появление элемента DT без сопровождающего DD недопустимо. Элемент DL может иметь только один вид атрибута

    COMPACT предписывает применение компактного алгоритма обработки, поскольку элементы списка по отдельности малы, либо весь список достаточно велик, либо имеет место и то и другое.

    Типовой метод обработки

    Пары элементов DT, DD в списке определений начинаются с одной и той же строки. В каждой паре элемент DT стоит слева и занимает примерно треть места на дисплее. Элемент DD стоит справа и занимает оставшиеся две трети. Термин DT обычно занимает достаточно мало места, чтобы уместиться в выделенной ему колонке. Если же термин длиннее, то он будет продолжен на этой строке далее. В этом случае текст элемента DD будет смещен на одну строку вниз, с тем, чтобы не пересечься с термином DT. Либо термин DT может быть разбит на несколько строк в левой колонке. Как правило, даже несмотря на присутствие атрибута COMPACT, между следующими друг за другом парами DT и DD остаются пробелы. Атрибут COMPACT применяется для списков, имеющих большой размер и/или использующих пары элементов DT, DD, которые занимают лишь одну-две строки. Конечно, программа обработки может самостоятельно фиксировать такие случаи и принимать соответствующие решения, что следует поощрять.

    Атрибут COMPACT может также уменьшать левую колонку (колонку терминов — DT).

    Пример использования

    Term the first definition paragraph is reasonably
    long but is still displayed clearly
    Term2 follows Definition of term2

    Term definition paragraph
    Term2 Definition of term2

    Список — это последовательность параграфов, каждому из которых может предшествовать специальная метка или очередной номер. Синтаксис списка:


    • list element
    • another list element .

    Открывающими метками для списка могут быть UL, OL, MENU или DIR. Сразу за открывающей меткой должен следовать первый элемент списка. Типовая обработка

    Здесь мы не определяем порядок воспроизведения списков, однако должны быть четко оговорены размеченный список для случая неупорядоченных списков и очередь нумерованных параграфов для упорядоченного списка. Среди других возможностей для интерактивного показа списков — встроенные панели скроллинга для ускоренного просмотра.

    Список элементов, имеющих типовые алгоритмы обработки:

    UL Список многострочных параграфов, обычно разделенных несколькими пробелами и/или размеченный кружками или крупными черными точками.
    OL Этот элемент похож на элемент UL, за исключением того, что параграфы нумеруются.
    MENU Список параграфов меньшего размера. Обычно на одну запись приходится лишь одна строка, а ее стиль более компактен, чем в случае элемента UL.
    DIR Список элементов, чей размер, как правило, не превышает 20 символов. Элементы могут размещаться в несколько колонок на странице, причем ширина такой колонки обычно 24 символа. Намного лучше, если программа обработки в состоянии оптимизировать ширину колонки в зависимости от ширины составляющих ее элементов.

    Пример использования


    1. When you get to the station, leave
      by the southern exit, on platform one.
    2. Turn left to face toward the mountain
    3. Walk for a mile or so until you reach the
      «Asquith Arms» then
    4. Wait and see .

  • The oranges should be pressed fresh
  • The nuts may come from a packet
  • The gin must be good quality


    P: Метка параграфа

    Пустой элемент P служит разделителем параграфов. Конкретная процедура обработки (отступы, инструкции и т.д.) здесь не оговаривается и может зависеть от наличия иных меток, стилей и т.д.

    ставится между двумя частями текста для их разделения.

    Нет нужды применять

    для создания пустого места вокруг заголовка, списка, адреса или выделенных элементов, которые уже сами по себе предполагают наличие разделителей параграфов. Создание пустых мест вокруг перечисленных элементов — обязанность программы обработки. Соседство метки разделителя параграфов и такого элемента, который сам автоматически создает разделители параграфов, может привести к непредсказуемым последствиям. Следует избегать того, чтобы метке разделителя параграфов предшествовал или следовал за ней такой элемент.

    создает небольшой вертикальный пропуск между параграфами (одна строка или полстроки). Этого не происходит (как правило) в тексте элементов ADDRESS и (даже) PRE. В некоторых версиях в обычном тексте метка

    может также создавать небольшой отступ слева в первой строке открываемого ею параграфа.

    What to do

    This is a second.

    This is a third.

    P>What not to do

    I found that on my XYZ browser it looked prettier to
    me if I put some paragraph marks

    Mome of the paragraph marks in this example should
    be there.

    PRE: предварительно отформатированный текст

    В языке HTML предварительно отформатированный текст отображается в виде текста, использующего шрифт фиксированной ширины.

    Необязательный атрибут этого элемента

    WIDTH Этот атрибут задает максимальное количество символов, которые может содержать строка текста. Эта информация позволяет системе обработки выбирать соответствующие данному случаю шрифты и отступ. В случаях, когда атрибут WIDTH не идентифицирован, рекомендуется выбирать ширину 80 символов. В случаях, когда атрибут WIDTH присутствует, рекомендуется иметь фиксированный набор размеров 40, 80 и 132 символа, остальные значения атрибута должны быть промежуточными.

    В пределах элемента PRE:

    • В тексте символы конца строки обрабатываются как информация к переходу на начало следующей строки. Это не относится к строке непосредственно предшествующей метке, или следующей за ней.
    • Не должна применяться метка

    . Если она все же обнаружена, то должна интерпретироваться как команда перехода на начало следующей строки.

  • Могут применяться анкеры и элементы выделения символов.
  • Не должны применяться элементы, определяющие форматирование параграфов (заголовки, адреса и т.д.).
  • ASCII символ горизонтальной табуляции (HT) должен интерпретироваться как наименьшее положительное количество пробелов, остающихся до позиции, чей номер кратен 8. Однако применение этого символа не рекомендуется.
  • Замечание: выделение текста

    В пределах предварительно отформатированного элемента горизонтальное смещение должно осуществляться на определенное количество позиций, чья ширина соответствует ширине символа. Это может препятствовать или даже блокировать специальные смещения выделенных элементов.

    Замечание: границы строки

    Вышеупомянутый термин «переход на начало следующей строки» не должен восприниматься как предположение о том, что программа обработки предварительно форматированного текста не может применять (фиксированный) левый отступ. Конечно, левый сдвиг ограничен затребованной шириной строки.

    Название документа задается элементом TITLE. В документе элемент TITLE должен быть частью элемента HEAD. Любой документ может иметь не более одного названия. Название должно характеризовать содержание элемента в более широком плане. Название не является всего лишь частью текста в документе. Оно относится ко всему документу в целом. Название не может содержать анкеры, разделители параграфов, выделение символов. Название документа может использоваться при идентификации узла в архивном списке, в качестве метки на окне, показывающем этот узел гипертекста. Название, как правило, не появляется в текстовом поле документа. Названия противопоставляются заголовкам. В идеале, размер названия документа не должен превышать 64 символов. Это необходимо, поскольку многие прикладные программы будут показывать названия документов в качестве названий окон, в качестве опций меню и в других полях ограниченного размера. Поскольку фактически нет ограничений на длину названия документа (а само название может формироваться в результате комбинирования некой дополнительной информации), то, выбирая название создаваемому документу, следует помнить, что оно может быть усечено другими программами, если окажется для них слишком длинным.

    Примеры приемлемых названий
    Rivest and Neuman. 1989(b)
    или
    A Recipe for Maple Syrup Flap-Jack
    или
    Introduction — AFS user’s Guide

    Примеры неприемлемых заголовков

    Заголовок, имеющий смысл лишь в случае привязки к конкретному контексту
    Introduction
    или слишком длинный заголовок
    Remarks on the Quantum-Gravity effects of «Bean
    Pone»diversification in Mononucleosis patients in Developing
    Countries under Economic Conditions Prevalent during
    the Second half of the Twentieth Century, and Related Papers:
    a Summary

    Элементы выделения позволяют форматировать отдельные части текста особым образом, производить выделение и т.д. Метки выделения не приводят к разбиению на параграфы и могут применяться к отдельным кускам текста внутри параграфов. Как и все метки, не поддерживаемые имеющимися версиями анализаторов языка HTML, эти метки будут игнорироваться, однако размеченный ими текст будет обрабатываться как и любой другой.

    Все метки выделения имеют соответствующие им завершающие метки, как в этом примере

    This is emphasized text.

    Практическая реализация одних стилей выделения более очевидна. Для других — менее. Логические стили можно применять в любом месте, если, к примеру, нет нужды ссылаться в тексте на процедуру форматирования (например, «обязательно использование наклонного шрифта для отдельных частей текста»).

    Анализаторы, не способные изобразить какой-либо стиль выделения символов, могут представить его с некоторой потерей качества изображения с применением альтернативного стиля или стиля по умолчанию. Некоторые версии анализаторов могут игнорировать все метки, так что поставщикам информации желательно не придавать меткам выделения большую смысловую нагрузку.

    Имена для этих элементов заимствованы у макросов TeXInfo.

    ( лучше использовать термин — типографические. Прим.ред. )

    TT Шрифт фиксированной ширины.
    B Толстый или еще каким-либо образом выделенный шрифт.
    I Наклонный шрифт (или искаженный каким-либо образом, если просто наклон невозможен).
    U Подчеркивание.
    EM Выделение символов (обычно наклон шрифта). ( смысловое усиление определенного слова или фразы. прим.ред. )
    STRONG Более четкое выделение (обычно применение более жирного шрифта). ( выделение, привлечение внимания. прим.ред. )
    CODE Пример кода. Обычно фиксированный шрифт (не путать с элементом PRE). ( формулы, выражения. прим.ред. )
    SAMP Последовательность символов. ( названия команд, примеры. прим.ред. )
    KBD Текст, набираемый пользователем. Этот стиль применяется в описаниях.
    VAR Имя переменной. ( имена переменных в примерах, формулах. прим.ред. )
    DFN Пример определения к какому-либо термину. Обычно жирный наклонный шрифт или просто жирный. ( Официально считается расширением в версии HTML 2.0. прим.ред. )
    CITE Цитата. Обычно наклонный шрифт. ( названия документов, выдержки из документов, цитируемые фразы и т.д. прим.ред. )

    Пример использования
    This text contains an emphasized word.
    Don’t assume that it will be italic!
    It was made using the EM element. A citation is
    typically italic and was no formal necessary structure:
    Moby Dick> is a book title.

    Следующие элементы являются устаревшими в языке HTML. Рекомендуется, чтобы программы обслуживания клиента могли все же обрабатывать эти устаревшие элементы с целью совместимости со старыми серверами.

    Plaintext (незакодированный текст)

    Пустая метка PLAINTEXT завершает документ на языке HTML. Позади этой метки уже не ставятся какие-либо записи на языке SGML. Вместо этого, по старому соглашению протокола HTTP, за меткой Plaintext следует ASCII текст (в стандарте MIME тип данных «text/plain»).

    Пример использования элемента

    0001 This is line one of a ling listing
    0002 file from which is sent

    Эта метка позволяет читать остаток файла более эффективно и без какого-либо дополнительного анализа. Элемент Plaintext применяется исключительно в целях оптимизации. Заключительная метка у данного элемента отсутствует. Остаток файла не содержит также каких-либо записей на языке SGML.

    XMP и LISTING: поля примеров в документе

    Данные элементы еще находят применение и должны распознаваться применяющимися в настоящее время анализаторами. С другой стороны, новые серверы должны использовать вместо этих элементов элемент

    Значения для взаимоотношений
    между документами или их частями

    Статус. Приведенный в этой главе список не является частью стандарта. Его назначение — иллюстрация примеров использования взаимоотношений, а также создание основы для дальнейшего совершенствования языка. Дополнение к этому списку будет осуществляться после регистрации в комитете по языку HTML. При проведении исследований к списку также можно добавлять новые значения, при условии, что их имя начинается с комбинации «X-«.

    Значения атрибута REL для связи в гипертексте имеют именно тот смысл, который мы определили в данном описании, и могут быть обработаны особым образом прикладными программами, использующими язык HTML.

    Описываемые здесь взаимоотношения определяют связи не просто между анкерами в документах. Они описывают связи между самими документами, как большими независимыми блоками информации, как между объектами. Если некое значение используется для описания взаимоотношения между анкерами, но не между документами, предполагается, что тем не менее указанная семантика применима к упомянутым документам.

    В последующем описании A — это документ, инициирующий связи, а B — это документ, на который ссылается атрибут HREF анкера.

    Если взаимоотношение между документами в гипертексте называется ациклическим, то это значит, что оно не содержит цепочек связей, которые, начавшись на каком-либо документе, могли бы вновь на него вернуться. Поэтому связи такого типа могут использоваться для формирования ветвящихся структур.

    Взаимоотношения между документами

    Взаимоотношения формируются между документами без какого-либо учета содержания последних.

    USEINDEX (использование в качестве индекса)

    В данной ситуации пользователь, читающий документ A, может вызвать функцию поиска. B — это документ, содержащий связную индексную информацию, используемую такой функцией. Документ A может содержать любое количество индексных связей, что позволяет осуществлять поиск на нескольких условиях индексации в зависимости от решения клиента.

    Документ B должен поддерживать работу поиска в соответствии с протоколом доступа.

    USEGLOSSARY (использование в качестве словаря)

    B — это документ, содержащий индексную информацию, которая должна использоваться для удовлетворения запросов о переводе, сделанных в основном документе (как правило, запрос делается при двойном щелчке над словом, которое не находится в пределах анкера).

    Документ может иметь любое количество связей со словарем.

    Информация в документе B является дополнением к документу A и носит вспомогательный характер. Например, аннотация используется клиентом для написания своего рода сносок или иных критических замечаний к документам других людей.

    Пример: взаимосвязь между блоком новостей и составляющими его статьями.

    Подобна аннотации, однако условия, чтобы документ B служил дополнением к документу A, не ставится. Документы A и B равноправны. Пример: связь между почтовым сообщением и ответом на него, между заметкой с новостями и откликом на нее.

    Если появилась связь такого типа, то информация с узла на ее конце вставляется в исходный документ при его просмотре.

    В упорядоченной структуре, сформированной авторами, документу A предшествует документ B, а за документом B всегда следует документ A.

    Документ может иметь не более одной связи для такого взаимоотношения и/или на него может быть сделана только одна такая ссылка.

    Замечание: Такое взаимоотношение может управлять вспомогательными средствами навигации, формировать материал для печати и т.д. Совместно с понятием «поддокумент» оно может использоваться для создания ветвящейся структуры, такой как книжка для печати, формирующая гипертекстовой документ. Такой документ может содержать только одну такую ветвящуюся структуру.

    Согласно иерархии, определенной автором, документ B является составной частью документа A. Ациклическое взаимоотношение.

    Если в системе присутствует документ A, то должен присутствовать и документ B. Это подразумевает, что если программа обнаружила документ A, то она должна обязательно найти и документ B.

    Когда обнаружена связь такого типа, а документ B в системе отсутствует, последний должен быть найден. Иными словами, когда программа клиента обнаруживает связь, клиенту немедленно предоставляется панель поиска, а на ней искомый текст. Затем осуществляется поиск без промежуточного восстановления и презентации узла B.

    Документ B является старой версией документа A. Ациклическое взаимоотношение.

    Документ B представляет собой список версий документа A. Навстречу этой связи из документа A должна существовать связь документа B с документом A и всеми известными его версиями.

    Взаимоотношения с тематикой документов

    Эти взаимоотношения выражают семантику не для самих документов, а для затронутых ими тем.

    INCLUDES (составная часть)

    Документ A включает документ B, документ B является составной частью документа A. Например, личность, чье описание дано в документе A, состоит в группе, описываемой документом B.

    Например, личность, чье описание дано в узле A, является автором документа B или отвечает за его содержание. Сведения такого типа могут применяться для целей защиты информации, для посылки сообщений авторам и т.д.

    Например, личность, чье описание дано в документе A, выражает заинтересованность в информации из узла B. Данная информация может применяться также для осведомления читателей о произведенных изменениях.

    Авторское право для протокола HTTP определяет списки названий для связей и элементов анкеров. Предлагается, что эту обязанность будет выполнять комитет по присвоению номеров Internet или его приемники. Допускается применение незарегистрированных значений в опытном порядке, при условии, что они начинаются с сочетания «X-«.

    SGML ISO 8879:1986, Текст с обработкой информации и обобщенный стандартный язык разметки (SGML) для служебных систем.
    sgmls анализатор SGML Джонса Кларка (James Clark) , созданный по материалам анализатора ARCSGML, написанным Чарльзом Голдфабом (Charles F. Goldfarb). Исходный текст программы доступен на FTP сервере ifi.uio.no в каталоге /pub/SGML/SGMLS.
    WWW Универсальный локатор ресурсов. RFCxxx. Доступен в настоящее время посредством FTP на компьютере info.cern.ch в каталоге /pub/ietf.

    Данный документ был подготовлен при участии и с помощью многих людей, пользующихся данной сетью. Дэн Коннолли (Dan Connolly) приготовил дескриптор DTD, а также часть языков HTML и SGML во время работы в корпорации Convex Computer по адресу 3000 Waterview Parkway Richardson, TX 75083. В настоящее время он работает в Atrium Technology Inc. и не является последним редактором документа.

    Tim Berners-Lee
    Address: CERN
    1211 Geneva 23
    Switzerland
    Telephone: +41(22)767 3755
    Fax: +41(22)767 7155
    email: timbl@info.cern.ch

    Daniel Connolly
    Address: Atrium Technologies, Inc.
    5000 Plaza on the Lake, Suite 275
    Austin, TX 78746
    USA
    email: connolly@atrium.com

    2. В литературе по языку SGML термин » TAG » часто переводится как » индикатор «. В данном переводе используется слово » метка «. Слово «метка» используется также и для именования открытия и закрытия элементов.

    3. В данном переводе для термина » anchor » выбрано слово » анкер «. Анкеры применяются в HTML в двух случаях:

    1. Когда нужно сослаться на какой-либо документ или место в текущем документе, т.е. являются » отправной » точкой в связи.
    2. Когда нужно указать, что на данное место (элемент) в документе можно сослаться. Другими словами — место назначения (для гипертекстовой связи).

    4. В данном переводе под словом » объект » подразумевается » entity » в языке SGML, а выражение » обращение к объекту «, соответствует — » Entity reference «. В языке HTML все объекты и их имена заранее определены и не существует средств для определения пользователем своих собственных объектов.

    5. В современной спецификации HTML, в элемент HEAD введен еще один элемент — META , который служит для указания какой-либо дополнительной информации ( meta information ) для документа в целом. Это могут быть: дата последней модификации документа, версия, автор и другая подобная информация. Спецификация HTML указывает на то, что содержимое элемента META может обрабатываться WWW сервером, например, быть выведено по запросу HEAD (протокол HTTP). Точное определение элемента META смотрите в текущей версии спецификации языка HTML.

    6. Под » узлом » в данном контексте подразумевается » документ «. Автор спецификации имел в виду, что каждому гипертекстовому узлу в системе WWW соответствует отдельный документ.

    HTML tag

    Описание

    В HTML тег используется для запроса документ при помощи текстового поля. Метки можно использовать где угодно но глава tag — предпочтительнее. Она является упрощенной версией tag и не должны использоваться.

    Общие атрибуты

    Этот тег поддерживает все глобальные атрибуты описано в — HTML-атрибут ссылки

    Специальные атрибуты

    В HTML tag также поддерживает следующие атрибуты:

    Атрибут Значение Описание
    Запрос Строка Наклейки для текстового поля
    действий URL-адрес Используется, когда запрос необходимо направить другой URL-адрес

    атрибутов события

    Этот тег поддерживает всех атрибутов события описаны в — HTML события ссылки

    Языки гипертекстовой разметки SGML. XML. HTML. Технологии web

    Hyper Text Markup Language (HTML) — язык разметки гипертекста — предназначен для написания гипертекстовых документов, публикуемых в World Wide Web.

    Гипертекстовый документ — это текстовый файл, имеющий специальные метки, называемые тегами, которые впоследствии опознаются браузером и используются им для отображения содержимого файла па экране компьютера.

    С помощью этих меток можно выделять заголовки документа, изменять цвет, размер и начертание букв, вставлять графические изображения и таблицы. Но основным преимуществом гипертекста перед обычным текстом является возможность добавления к содержимому документа гиперссылок — специальных конструкций языка HTML, которые позволяют щелчком мыши перейти к просмотру другого документа.

    HTML-документ состоит из двух частей: собственно текста, т. е. данных, составляющих содержимое документа, и тегов — специальных конструкций языка HTML, используемых для разметки документа и управляющих его отображением. Теги языка HTML определяют, в каком виде будет представлен текст, какие его компоненты будут исполнять роль гипертекстовых ссылок, какие графические или мультимедийные объекты должны быть включены в документ.

    Графическая и звуковая информация, включаемая в HTML-документ, хранится в отдельных файлах. Программы просмотра HTML-документов (браузеры ) интерпретируют флаги разметки и располагают текст и графику на экране соответствующим образом. Для файлов, содержащих HTML-документы приняты расширения .htm или .html .

    В большинстве случаев теги используются парами. Пара состоит из открывающего и закрывающего тегов. Действие любого парного тега начинается с того места, где встретился открывающий тег, и заканчивается при встрече соответствующего закрывающего тега. Часто пару, состоящую из открывающего и закрывающего тегов, называют контейнером , а часть текста, окаймленную открывающим и закрывающим тегом, — элементом .

    Последовательность символов, составляющая текст может состоять из пробелов, табуляций, символов перехода на новую строку, символов возврата каретки, букв, знаков препинания, цифр, и специальных символов (например #, +, $, @), за исключением следующих четырех символов, имеющих в HTML специальный смысл: (больше), & (амперсанд) и » (двойная кавычка). Если необходимо включить в текст какой-либо из этих символов, то следует закодировать его особой последовательностью символов.

    Структура HTML-документа

    Самым главным из тегов HTML является одноименный тег . Он всегда открывает документ, так же, как тег должен непременно стоять в последней его строке. Эти теги обозначают, что находящиеся между ними строки представляют единый гипертекстовый документ. Без этих тегов браузер или другая программа просмотра не в состоянии идентифицировать формат документа и правильно его интерпретировать.

    HTML-документ состоит из двух частей: заголовок (head) и тела (body), расположенных в следующем порядке:

    Применение элемента ISINDEX

    В классическом варианте при использовании ISINDEX список ключевых слов, которые вводятся в поисковом шаблоне и разделены символом «+», присоединяется к базовому адресу HTML-документа после символа «?».

    Очевидно, что сам HTML-документ не способен выполнить поиск. Это может сделать только поисковая программа.

    Присоединение запроса к документу унаследовано от первого сервера CERN (Conseil Europeen pour la Recherche Nucleaire, Европейская организация по ядерным исследованиям), в котором оно использовалось по аналогии с поисковыми серверами Gopher. Современный подход, основанный на HTML-формах, позволяет указывать URL поисковой программы, что дает большую свободу при разметке страниц.

    Современный синтаксис ISINDEX позволяет применить аналогичный формам подход. Для этой цели в теге начала контейнера ISINDEX можно указать атрибут ACTION.

    Однако и традиционная форма контейнера позволяет обращаться к внешним CGI-скриптам. Сделать это можно либо в совокупности с контейнером BASE, либо с использованием SSI.

    В первом случае для всего документа устанавливается базовый URL поисковой программы. Все URL гипертекстовых ссылок на другие страницы задаются в полной форме или базовый адрес переназначается после ISINDEX. Это вполне оправдано, если данная страница ничего, кроме поискового критерия и ссылки на домашнюю страницу Web-узла, не содержит.

    Во втором случае в документ встраивается обращение к CGI-скрипту, который реализует функции поисковой программы. Такое совмещение — свойство современного подхода к компоновке поисковых страниц. Как правило, и поисковый шаблон, и результаты поиска отображаются на одной странице, так как это позволяет корректировать запрос по мере получения результатов поиска. Встроенный в страницу скрипт анализирует переменные окружения сервера, и в случае отсутствия запроса может вообще никак не обнаруживать свое присутствие внутри документа.

    Тег начала элемента может содержать два необязательных атрибута: ACTION и PROMPT. Синтаксис элемента ISINDEX в общем виде выглядит следующим образом:

    Первый необязательный атрибут тега начала ISINDEX — PROMPT. Он позволяет вместо стандартного приглашения к вводу ключевых слов задать приглашение, которое, по мнению автора документа, лучше отражает суть поискового шаблона. Например, можно задать приглашение к вводу ключевых слов на русском языке.

    Введите ключевые слова:

    Дата добавления: 2015-10-02 ; просмотров: 49 | Нарушение авторских прав

    Илон Маск рекомендует:  Что такое код openssl_x509_read
    Понравилась статья? Поделиться с друзьями:
    Кодинг, CSS и SQL
    Читайте также:
    1. Амбулаторное применение какого препарата требует регулярного динамического контроля показателей свертывания крови?
    2. Архитектурных элементах здания
    3. Билет № 7, вопрос № 5.Способы предупреждения и ликвидации пожаров. Средства пожаротушения и их применение
    4. Билет № 8, вопрос № 2.Назначение компенсаторов износа, их виды и применение
    5. В. Оздоровление эротического элемента
    6. Ввод исходных данных с помощью элемента управления TextBox
    7. Вебинар №1. «Основы рационального питания и их применение в фитнес-тренинге».