Главная

Популярная публикация

Научная публикация

Случайная публикация

Обратная связь

ТОР 5 статей:

Методические подходы к анализу финансового состояния предприятия

Проблема периодизации русской литературы ХХ века. Краткая характеристика второй половины ХХ века

Ценовые и неценовые факторы

Характеристика шлифовальных кругов и ее маркировка

Служебные части речи. Предлог. Союз. Частицы

КАТЕГОРИИ:






Засоби подання текстової інформації




Поняття гіпертексту було уведено В.Бушем ще в 1945 році, однак сплеск активності навколо цієї технології відбувся лише тоді, коли з розвитком Інтернет виникла реальна необхідність у механізмі об'єднання великих обсягів інформаційних ресурсів, що подані у вигляді нелінійного тексту. З використанням гіпертекстової моделі документа спосіб подання різноманітних інформаційних ресурсів у мережі став більш упорядкований, а користувачі одержали зручний механізм пошуку і перегляду потрібної інформації.

Зараз серед інформаційних ресурсів, потенційно доступних користувачам Інтернет, як і раніше, переважає гіпертестова інформація, в основному, у форматі HTML і XML (хоча частка цієї інформації постійно зменшується).

Найпопулярніша на сьогоднішній день мова гіпертекстової розмітки HTML була створена спеціально для організації інформації, розподіленої в мережі Інтернет, і є однією з ключових складових технології WWW. З використанням гіпертекстової моделі документа спосіб подання різноманітних інформаційних ресурсів у мережі став більш упорядкований, а користувачі одержали зручний механізм пошуку і перегляду потрібної інформації.

HTML є спрощеною версією мови розмітки SGML (Standart Generalised Markup Language, ISO 8879), яка була прийнята Комітетом ISOу 1986 році як міжнародний стандарт для визначення незалежних від пристроїв вводу/виводу, обчислювального середовища методів подання текстів в електронній формі. SGML призначається для опису формальних специфікацій мов опису документів, структур документів і інших метаданих.

HTML припускає, що документ складається зі стандартних елементів розмітки, що відображаються стандартним образом. Набір цих елементів – це типізація компонентів звичайного документа: заголовок, автори, параграфи, таблиці, цитування тощо.

Інструкції HTML, у першу чергу, призначені для управління процесом виводу вмісту документа на екран програми-клієнта і визначають цим самим спосіб подання документа, але не його структуру. HTML-документ складається зі стандартних елементів розмітки, що відображаються стандартним образом.

Збільшення кількості інформації в гіпертекстових документах та ускладнення їхньої структури перетворило простоту технології HTML з переваги на недолік.

Мову XML (eXtensible Markup Language) розроблено Всесвітнім консорціумом W3C для забезпечення інтероперабельностіміж SGML і HTML. На відміну від HTML, що створювався для гіпертекстових документів з фіксованою структурою, XML призначений для розмітки документів довільної структури.

XML являє собою простий і в той же час потужний та гнучкий текстовий формат опису документів. У форматі XML можна зберігати дані практично будь-якого ступеня структуризації і будь-якого призначення. XML-документ за своєю структурою є деревом, яке можна інтерпретувати і як граф. Перехід на специфікації XML дозволяє описувати структуру даних без прив'язки до форми їх відображення, визначати форму подання даних незалежно від конкретного змісту, створювати метадані та керувати доступом до даних тощо.

Зараз існує кілька мов запитів до XML-джерел даних: XQL та XML QL. Пошук в XML-документі полягає у встановленні елементів, що відповідають умовам запиту, з наступним перетворенням знайдених елементів у структуру, задану в запиті.

Технології XML забезпечують стандартне подання даних для використання різними застосуваннями без спеціальної додаткової обробки інформації. Різні логічні схеми різних документів можуть використовувати ті самі імена елементів у різних значеннях. Для інтерпретації цих значень необхідно вказати простір імен – колекцію імен, які ідентифиікуються за посиланням URI ((URI – ідентифікатор ресурсів, що дозволяє описувати й ідентифікувати не тільки інформаційні ресурси Інтернет, але і предмети реального світу і загальні поняття предметної області), що використовуються документами XML як імена типів, елементів і атрибутів. Простір імен можна розглядати як ІР, з якого здобувають необхідні визначення.

Існують й інші формати для подання текстової інформації. Наприклад, PDF-файли звичайно розглядаються як частина «невидимої» Web-інформації, схованої в БД, що звичайно не індексуються пошуковими системами. Тим часом великий обсяг важливої інформації (у тому числі технічні статті і наукові звіти) зберігається тільки у форматі PDF. В Інтернет досить часто зустрічаються і матеріали у форматі MS Word чи у форматі rtf, у яких поряд з текстовою інформацією містяться малюнки, таблиці, графіки і формули.






Не нашли, что искали? Воспользуйтесь поиском:

vikidalka.ru - 2015-2024 год. Все права принадлежат их авторам! Нарушение авторских прав | Нарушение персональных данных