Контакти

Як використовувати xml файл. Навіщо потрібна мова XML? Перетворення XML даних

Extensible Markup Language (XML). Це дійсно просто текстові файли, які використовують призначені для користувача теги для опису структури та інших функцій документа.

Що таке XML

XML - це мова розмітки, створений консорціумом World Wide Web Consortium (W3C) для визначення синтаксису кодування документів, які можуть бути прочитані людьми і машинами. Він робить це за допомогою тегів, які визначають структуру документа, а також те, як документ повинен зберігатися і транспортуватися.

Найпростіше порівняти його з іншою мовою розмітки, з яким ви можете бути знайомі, - мова гіпертекстової розмітки (HTML), який використовується для кодування веб-сторінок. HTML використовує визначений набір символів розмітки (короткі коди), які описують формат вмісту на веб-сторінці.

Однак, відмінність XML в тому, що він є розширюваним. У XML немає визначеного мови розмітки, як у HTML. Замість цього, XML дозволяє користувачам створювати свої власні символи розмітки для опису контенту, формуючи необмежений і самовизначатися набір символів.

По суті, HTML - це мова, яка фокусується на поданні контенту, в той час як XML - це виділений мову опису даних, який використовується для зберігання даних.

XML часто використовується в якості основи для інших форматів документів, яких сотні. Ось кілька, які ви можете дізнатися:

  • RSS і ATOM описують, як додатки повинні обробляти веб-канали.
  • Microsoft .NET використовує XML для своїх файлів конфігурації.
  • Microsoft Office використовує XML в якості основи для структури документа.

Таким чином, якщо у вас є XML-файл, це не обов'язково говорить Вам, для якого додатка він призначений. Втім, Вам і не потрібно турбуватися про це, якщо тільки ви не розробляєте XML-файли.

Як відкрити XML-файл

Існує кілька способів відкрити XML-файл безпосередньо. Ви можете відкривати і редагувати їх за допомогою будь-якого текстового редактора, переглядати їх за допомогою будь-якого веб-браузера або використовувати веб-сайт, який дозволяє переглядати, редагувати і навіть конвертувати їх в інші формати.

Використовуйте текстовий редактор при регулярній роботі з XML

Оскільки XML-файли - це просто текстові файли, їх можна відкрити в будь-якому текстовому редакторі. Однак, багато текстові редактори, такі як Notepad, просто не призначені для відображення XML-файлів з їх правильною структурою. Це може бути корисно для швидко ознайомлення зі змістом XML-файла. Але, існують більш зручні інструменти для роботи з ними.


Використання веб-браузера для перегляду XML-файла

Якщо Вам не потрібно редагувати XML-файл, але просто потрібно переглянути вміст, з цим завданням впоратися ваш браузер. Більш того, ваш веб-браузер, швидше за все, вже налаштований як стандартна програма перегляду XML-файлів. Таким чином, подвійне клацання XML-файла повинен відкрити його в браузері.

Якщо ні, ви можете натиснути правою кнопкою миші файл, щоб знайти варіанти його відкриття з будь-яким іншим додатком. Просто виберіть ваш веб-браузер зі списку програм.

Коли файл відкриється, ви повинні побачити добре структуровані дані. Це не так красиво, як кольоровий вигляд, який ви отримуєте в Notepad ++, але набагато краще, ніж блокнот.

Використання онлайн-редактора для XML-файлів

Якщо ви хочете редагувати випадковий XML-файл і не хочете завантажувати новий текстовий редактор, або Вам потрібно конвертувати XML-файл в інший формат, Існує кілька гідних онлайн-редакторів XML, доступних безкоштовно.

TutorialsPoint.com, XMLGrid.net і CodeBeautify.org - дозволяють переглядати і редагувати XML-файли. Після завершення редагування можна завантажити змінений XML-файл або навіть перетворити його в інший формат.

Для прикладу використовуємо CodeBeautify.org. Сторінка розділена на три розділи. Зліва знаходиться XML-файл, з яким ви працюєте. В середині ви знайдете кілька функцій. Праворуч ви побачите результати деяких варіантів, які ви можете вибрати.

Наприклад, на малюнку нижче зліва знаходиться наш повний XML-файл, а на панелі результатів відображається подання до вигляді дерева, так як ми натиснули кнопку Tree View посередині.

Використовуйте кнопку Browse для завантаження XML-файла з вашого комп'ютера або кнопку Load URL для вилучення XML з інтернет-джерела

Кнопка Tree View відображає дані в добре відформатованої структурі дерева на панелі результатів, з усіма тегами, виділеними помаранчевим кольором, і атрибутами праворуч від тегів.

Beatify відображає ваші дані в акуратному, легко читається.

Кнопка Minify відображає ваші дані, використовуючи найменшу кількість прогалин. Ця функція буде розмістити кожен кожен шматок даних на одному рядку. Це стане в нагоді при спробі зробити файл менше, що заощадить деякий простір.

І, нарешті, Ви можете використовувати кнопку XML to JSON для перетворення XML в формат JSON, і кнопку Export to CSV для збереження даних у вигляді файлу значень, розділених комами, або кнопку Download для завантаження будь-яких змін, які ви зробили в новому XML-файлі .

Досить часто багато користувачів сучасних комп'ютерних систем і програмних продуктів різного типу стикаються з файлами, що мають расшіреніе.xml. Багато хто просто не уявляють собі, що це за документ, як його відкрити. Зараз буде розглянуто, Заодно з'ясуємо, що ж він собою являє і для чого потрібен.

Що являє собою файл XML

Почнемо, мабуть, з того, що, з точки зору сучасних комп'ютерних технологій і програм, які використовуються для створення документів такого типу, являє собою текстовий файл, в якому прописані команди універсального розширюваного мови (Extensible Markup Language), який досить сильно нагадує відомий засіб розмітки HTML.

Як правило, файл XML містить загальну інформацію про який-небудь об'єкт, яка виражена описовими засобами (про це трохи пізніше). Що ж стосується даних, що зберігаються в таких контейнерах, це можуть бути бази даних, часто використовувані для каталогів відео і аудіо в Інтернеті, збережені призначені для користувача настройки програм і додатків, а також веб-сторінки цілком.

Як приклад можна взяти, скажімо, аудіо-альбом якогось виконавця. Файл XML включає в себе інформацію про рік випуску, жанрі, кількості і назвах треків, популярності і т. Д. Правда, при відвідуванні ресурсів у Всесвітній павутині серферу не потрібно замислюватися про фізичну відкритті такого інформаційного файлу, оскільки навіть при відтворенні пісні онлайн в програвачі будуть відображатися всі дані на кшталт тих, які містяться в стандартних MP3-файлах у вигляді ID3-тегів. Інформація як би подгружается до воспроизводимому треку.

Вид XML-файла

Якщо подивитися на вигляд файлу, можна відразу помітити, що в ньому властивості будь-якого об'єкта описані за допомогою тегів і атрибутів, які задаються вручну.

Про основні командах самого мови мова зараз не йде, оскільки пересічному користувачеві такі відомості і не потрібні. Єдине, що можна відзначити, так це тільки те, що певної кількості використовуваних для опису об'єкта елементів в даному форматі не існує: скільки потрібно, стільки і задається.

Чим відкрити стандартний XML-формат

Тепер подивимося, як відкрити файл XML. Як вже, напевно, багато хто зрозумів, це файл текстовий, а значить, найпростіше використовувати для його перегляду або редагування будь-якої, нехай навіть найпримітивніший редактор. Та хоч той же «Блокнот» з стандартного набору Windows.

Однак тут не все так просто. Справа в тому, що по подвійному кліку файл без завдання відповідної асоціації з якою-небудь програмою не відкриється. У кращому випадку система запропонує список найбільш підходящих додатків. Можна вибрати програму на свій розсуд, а заодно поставити галочку напроти пункту постійного використання вибрану програму для всіх файлів такого типу.

Можна вчинити інакше, використовуючи правий клік на файлі з подальшим вибором команди «Відкрити за допомогою ...», після чого, знову ж таки, вибрати потрібну програму або зі списку, або вказати місце розташування основного виконуваного компонента (найчастіше це файл EXE).

Третій спосіб, що дозволяє відкрити файл XML, полягає в початковому запуску програми, а потім у використанні меню відкриття файлу (в більшості випадків це поєднання Ctrl + O). При цьому зовсім необов'язково використовувати «Блокнот». Будь ласка, файл відкривається без всяких проблем в тому ж додатку Word і йому подібних. Навіть «майкрософтовського» Excel здатний відкривати дані такого формату.

Втім, якщо виникає необхідність редагування XML-формату, тоді краще застосовувати професійні утиліти з підтримкою мовного синтаксису, наприклад, Oxygen XML Editor, XML Marker або EditiX Lite Version. Природно, це далеко не всі утиліти, здатні працювати з мовою файлу на вищому рівні. Сьогодні таких програм можна знайти дуже багато.

Тепер кілька слів про те, чому іноді з'являється помилка XML-файла при відкритті. Найчастіше це пов'язано з порушенням цілісності самого файлу, а також з некоректним введенням описових атрибутів або тегів. Крім того, в Excel існує обмеження щодо ліміту відображаються рядків, так що в цьому випадку дані при відкритті можуть бути неповними.

Можливі помилки при відкритті XML-файла у вигляді вкладення електронної пошти

Іноді помилки можуть з'являтися, коли проводиться спроба відкриття файлу, що є вкладенням електронного повідомлення. Гущавину за все це відноситься до стандартних поштових клієнтів зразок Outlook Express.

Справа в тому, що спочатку вкладення зберігається у вигляді тимчасових даних (дуже часто з додаванням до основного розширенню дополнітельного.tmp), і звернення виробляється саме до нього.

Щоб уникнути такої ситуації, досить просто спочатку зберегти вкладення в оригінальному форматі в будь-який зручний місце на диску або на знімному носії, після чого використовувати описані вище стандартні методи.

замість підсумку

Як бачимо, нічого складного в розумінні структури і способів відкриття файлів такого формату немає. Тут, правда, принципово не розглядалося питання створення XML-даних, оскільки для повного розуміння процесу потрібно знати хоча б ази самої мови. В іншому ж, думається, складнощів з файлами такого формату у користувачів не виникне.

Мова XML привернув до себе вже досить багато уваги з боку розробників і користувачів Інтернет. Сьогодні кількість прихильників цієї нової технології зростає також стрімко, як і число повідомлень про чергові взятих нею перепони на шляху до загального визнання. Незважаючи на те, що XML дуже молодий (міжнародна організація W3C затвердила специфікацію "Extensible Markup Language (XML) 1.0" трохи менше року тому - на початку лютого 1998 р) і окремі компоненти цієї мови знаходяться ще в стадії доробки, уже сьогодні з'являються нові мови , створені на основі XML, виникають численні Web-сервера, що використовують цю технологію для організації, яка на них інформації. Світ Інтернет навколо нас в черговий раз перетворюється, і ми можемо стати учасниками цього процесу вже сьогодні

Метою даної статті є спроба на конкретних прикладах показати деякі з можливостей XML, відповісти на ряд часто виникають при знайомстві з новою мовою питань. Що ж таке XML? В чому полягають його переваги перед звичним вже нам мовою HTML? Чи можна використовувати XML на своїх Web-сторінках вже сьогодні? А якщо можна, то як?

В кінці статті наведені посилання на інші ресурси Інтернет, за допомогою яких Ви зможете також отримати більш повну інформацію по конкретним додатковими питаннями, пов'язаними із застосуванням XML і незачеплених нами в цій статті. Повні специфікації XML і пов'язаних з ним мов доступні на офіційній сторінці W3C -

Для чого потрібен новий мову розмітки?

Набагато більш простий і зручний, ніж SGML, мова HTML дозволяє визначати оформлення елементів документа і має якийсь обмежений набір інструкцій - тегів, за допомогою яких здійснюється процес розмітки. Інструкції HTML, в першу чергу, призначені для управління процесом виведення вмісту документа на екрані програми-клієнта і визначають цим самим спосіб представлення документа, але не його структуру. В якості елемента гіпертекстової бази даних, описуваної HTML, використовується текстовий файл, який може легко передаватися по мережі з використанням протоколу HTTP. Ця особливість, а також те, що HTML є відкритим стандартом і величезна кількість користувачів має можливість застосовувати можливості цієї мови для оформлення своїх документів, безумовно, вплинули на зростання популярності HTML і зробили його сьогодні головним механізмом подання інформації в Web

Однак сучасні програми потребують не тільки в мові представлення даних на екрані клієнта, але і в механізмі, що дозволяє визначати структуру документа, описувати що містяться в ньому елементи. HTML володіє нескладним набором команд і цілком успішно справляється із завданням опису текстової інформації і відображенням її на екрані програми перегляду-броузера. Однак самі відображаються дані ніяк не пов'язані з тими тегами, які використовуються для форматування, тому у програм-аналізаторів немає можливості використовувати теги HTML для пошуку потрібних нам фрагментів документа. Тобто зустрівши, наприклад, такий опис

rose,

програма перегляду буде знати, яким кольором відобразити текст, що міститься всередині тегів і, ймовірно, відобразить його правильно, але їй абсолютно байдуже, в якому місці документа зустрівся цей тег, в які інші теги укладений поточний фрагмент, чи існують вкладені в нього фрагменти, чи правильно побудовані відносини між об'єктами. Таке "байдужість" до структури документа призводить до того, що пошук або аналіз інформації усередині нього нічим не буде відрізнятися від роботи із суцільним, що не розбитим на елементи текстовим файлом. А це, як відомо, не найефективніший спосіб роботи з інформацією.

Іншим істотним недоліком HTML можна назвати обмеженість набору його тегів. DTD- правила для HTML визначають фіксований набір дескрипторів і тому в розробника немає можливості вводити власні, спеціальні теги. Хоча час від часу з'являються нові розширення мови (на сьогоднішній день останньою версією HTML є HTML 4.0), але довгий шлях їх стандартизації, що супроводжується постійними розбіжностями між основними виробниками браузерів роблять практично неможливою швидку адаптацію мови, його використання для відображення спеціалізованої інформації (наприклад, мультимедійної , математичних, хімічних формул і т.д.).

Підводячи підсумок всьому сказаному, можна стверджувати, що HTML вже сьогодні не задовольняє повною мірою вимогам, що пред'являються сучасними розробниками до мов подібного роду. І йому на зміну був запропонований новий мову гіпертекстової розмітки, потужний, гнучкий, і, одночасно з цим, зручний мова XML. У чому ж полягає його гідності?

XML ( Extensible Markup Language) - це мова розмітки, що описує цілий клас об'єктів даних, званих XML- документами. Ця мова використовується в якості засобу для опису граматики інших мов і контролю за правильністю складання документів. Тобто сам по собі XML не містить ніяких тегів, призначених для розмітки, він просто визначає порядок їх створення. Таким чином, якщо, наприклад, ми вважаємо, що для позначення елемента roseв документі необхідно використовувати тег ;, То XML дозволяє вільно використовувати обумовлений нами тег і ми можемо включати в документ фрагменти, подібні до наступного:

rose

Набір тегів може бути легко розширений. Якщо, припустимо, ми хочемо також вказати, що опис квітки має за змістом йти усередині опису оранжереї, в якій він цвіте, то просто задаємо нові теги і вибираємо порядок їх слідування:

rose

Якщо ми хочемо посадити туди ще кілька квіточок, то повинні внести наступні зміни:

rose tulip cactus

Як видно, сам процес створення XML документа дуже простий і вимагає від нас лише базових знань HTML і розуміння тих завдань, які ми хочемо виконати, використовуючи XML в якості мови розмітки. Таким чином, у розробників з'являється унікальна можливість визначати власні команди, що дозволяють їм найбільш ефективно визначати дані, що містяться в документі. Автор документа створює його структуру, будує необхідні зв'язки між елементами, використовуючи ті команди, які задовольняють його вимогам і домагається такого типу розмітки, яке необхідно йому для виконання операцій перегляду, пошуку, аналізу документа.

Ще одним з очевидних переваг XML є можливість використання його в якості універсальної мови запитів до сховищ інформації. Сьогодні в глибинах W3C знаходиться на розгляді робочий варіант стандарту XML-QL (або XQL), який, можливо, в майбутньому складе серйозну конкуренцію SQL. Крім того, XML-документи можуть виступати в якості унікального способу зберігання даних, який включає в себе одночасно засоби для розбору інформації й представлення її на стороні клієнта. У цій області одним із перспективних напрямків є інтеграція Java і XML - технологій, що дозволяє використовувати міць обох технологій при побудові машинно-незалежних додатків, що використовують, крім того, універсальний формат даних при обміні інформацією.

XML дозволяє також здійснювати контроль за коректністю даних, що зберігаються в документах, робити перевірки ієрархічних співвідношень усередині документа і встановлювати єдиний стандарт на структуру документів, умістом яких можуть бути самі різні дані. Це означає, що його можна використовувати при побудові складних інформаційних систем, В яких дуже важливим є питання обміну інформацією між різними додатками, що працюють в одній системі. Створюючи структуру механізму обміну інформації на самому початку роботи над проектом, менеджер може позбавити себе в майбутньому від багатьох проблем, пов'язаних з несумісністю використовуваних різними компонентами системи форматів даних.

Також одним з достоїнств XML є те, що програми-обробники XML- документів не складні і вже сьогодні з'явилися і вільно поширюються всілякі програмні продукти, призначені для роботи з XML-документами. XML підтримується сьогодні в Microsoft Internet Explorer 4/0 і в бета-версіях IE5. Було заявлено про його підтримку в наступних версіях Netscape Communicator, СУБД Oracle, DB-2, в додатках MS-Office. Все це дає підстави припускати, що, швидше за все, в найближчому майбутньому XML стане основною мовою обміну інформацією для інформаційних систем, замінивши собою, тим самим, HTML. На основі XML уже сьогодні створені такі відомі спеціалізовані мови розмітки, як SMIL, CDF, MathML, XSL, і список робочих проектів нових мов, що знаходяться на розгляді W3C, постійно поповнюється.

Як виглядає XML-документ?

перший другий підпункт 1 третій Останній

Правила створення XML- документа

RussiaNovosibirsk</country>

конструкції мови

елементи даних

rose Novosibirsk rose Новосибірськ Siberia Новосибірський Державний Технічний Університет
дуже хороший інститут Новосибірський Державний Університет
теж не поганий Навіщо він потрібен, цей XML?

[Останнім часом, у зв'язку з появою цих сторінок, найчастішим
питанням до мене виявився такий: "Розкажи, а навіщо він взагалі потрібен, XML?
Хіба нам мало HTML? "Не маючи багато чого часу (або розуму;) на виготовлення власних публікацій, а також глибоко шануючи класиків, я вважав за краще краще побіжно перевести відмінну статтю по названої subj
- можливо, це перший епізод серіалу "в допомогу"]

Jon Bosak, Tim Bray
XML and the Second-Generation Web
з журналу "Scientific American", травень 1999

Дайте людям пару наведень, інше вони збагнуть самі. Подивившись на сторінку, де більші блоки тексту діляться на більш дрібні, все швидко розуміють, що перед ними початок статті. Подивившись на список бакалійних товарів, можна швидко здогадатися, що це "інструкція" на відвідування магазину. Побачивши колонки цифр - зрозуміти, що це банківський рахунок. Комп'ютери поки ще не такі розумні - до них все це доводиться доносити точно - з чим конкретно вони повинні мати справу і що для цього від них вимагається.

Саме для цього - зробити інформацію само-описаної - і був придуманий новий мову розмітки документів - Extensible Markup Language (XML). Ці легко вимовляються зміни ( "само-описаний" документ, зміна правил спілкування з комп'ютерами) несуть в собі величезний потенціал - роль Internet від середовища доставки інформації починає розширюватися на інші види людської діяльності. І дійсно, з моменту затвердження її W3C в 1998р, XML-специфікація зі швидкістю лісової пожежі стала проникати всюди - в промисловість і науку, в виробництво товарів і медицину.

Ентузіасти сподівалися, що XML дасть можливість вирішити ряд глобальних проблем Web. Проблеми ці відомі: по-перше, Internet - супершвидкісна мережу, часто поводиться гірше черепахи; а по-друге, хоча в мережі присутній чи не вся інформація, знайти в ній щось необхідне нерідко буває до сказу важко.

Обидві ці проблеми обумовлені, головним чином, природою основного мови Мережі - HTML. І хоча успіх HTML в порівнянні з іншими будь-коли запропонованими мовами електронних публікацій очевидний, HTML занадто мізерний: по суті, він лише говорить браузеру, як того розмістити на сторінці текст, картинки і кнопки. HTML упирає на подання інформації, і тому досить простий у вивченні, проте за це доводиться розплачуватися.

Це відбивається на складності розробки web-сайтів, якщо тільки ці сайти не повинні походити на факси, що розсилають сторінки всім бажаючим, хто попросить. Більше половини людей і компаній в усьому світі вважали за краще б web-сайти, які вміють приймати від користувачів замовлення, пересилати діагнози хвороб і навіть запускати тонкі інструментальні операції в заводських цехах і наукових лабораторіях. Подібні завдання _НІКОГДА_ не стояли перед HTML !.

Наприклад, якщо навіть у вашого лікаря і виходить "витягувати" в свій переглядач аналізи, взяті з вашої мед.карточкі, то навряд чи у нього вже виходить послати їх по мережі іншого фахівця, щоб отриману відповідь вставити назад в свою БД. Його комп'ютер не знає, що робити з інформацією, яка йому настільки ж ясна, як

бе бе бе

або бе бе.
Легендарний Керниган одного разу зауважив, що вся хитрість принципу WYSIWYG (що бачу, то і отримую) полягає в тому, що коли нічого не видно, то зазвичай і отримати вдається рівно стільки ж.

Ті слова вище, що укладені в кутові дужки, називаються тегами. В HTML немає ніякого тега для аналізів, і звідси інший його недолік: негнучкість. Додавання в мову нового тега - це така бюрократична тяганина, така тривала, що ніхто з цим і зв'язуватися не буде. А адже свої власні теги не завадили б кожній програмі, а не тільки такий, як у наведеному прикладі з лікарем.

Це багато в чому пояснює сьогоднішні повільні темпи створення онлайнових магазинів, каталогів поштою та інших інтерактивних сайтів. Змінивши кількість одиниць замовлення і спосіб доставки, і побачивши жменьку поміняти в поле "сума" цифр, вам все одно доведеться запитувати віддалений (і без того перевантажений роботою) сервер надіслати вам назад повну знову сформовану сторінку з графікою і всім іншим. Тоді як ваш власний потужний комп'ютер буде бездіяльно простоювати, тому що тільки що дізнався щось типу

і , Але не ціни з варіантами доставки.

Додайте до цього і незадовільна якість можливостей пошуку в Web. Оскільки не існує способу якось особливо помітити інформацію про ціни, рішуче неможливо здійснювати в web пошук сторінок за ознакою "ціна".


Щось старе, щось нове

В принципі, рішення елементарно: в тегах потрібно вказувати, що це за інформація, а не те, як вона повинна виглядати. Наприклад, розмічати компоненти замовлення на сорочку тегами "ціна, розмір, кількість, колір", а не "bold, paragraph, row, column", як це пропонується в HTML. Тоді програмі простіше ідентифікувати документ як замовлення і виконати решту роботи: показати це замовлення в тому чи іншому вигляді, провести через бухгалтерську систему, або зробити все так, щоб назавтра нова сорочка була б доставлена \u200b\u200bдо вашого порогу.

Ми, робоча група W3C, ще в 1996 р приступили до розробки такого проекту. Ідея була сильна, хоча і не зовсім оригінальна. Протягом поколінь редактори і друкарі маркували рукописні тексти позначками для складачів. Подібний "мова розмітки" розвивався самостийно до 1986р., Поки, в результаті десятирічної роботи, Міжнародна Організація по Стандартизації (ISO) не запровадила систему створення нових мов розмітки.

Отримавши ім'я SGML (Standard Generalized Markup Language), ця мова опису мов - метамова - довів свою корисність на прикладі багатьох великих систем підготовки публікацій. І навіть HTML отримав своє визначення через SGML. Єдина складність з SGML полягала в його всеїдності - там маса хитромудрих речей для мінімізації натискань на клавіші, так як в ту пору кожен байт був на рахунку. Ось чому сьогодні web-браузери з ним не в ладах.

Створюючи XML, наша робоча група очистила SGML від всієї лушпиння і запропонувала строго-цільовий і більш-менш прийнятний метамова. Базою XML є набір правил, керуючись якими, кожен може створити власну мову розмітки. Ці правила обрані так, щоб одна єдина невелика програма (її ще називають парсером або синтаксичним аналізатором) могла впоратися з розпізнаванням будь-якого нового мови. Звернемося знову до прикладу з доктором, який хотів би передати аналізи фахівця. Якби лікарі-професіонали збудували з XML свою мову розмітки для кодування лікарських записів (ряд груп вже давно працюють над проблемою), то в повідомленні доктора своєму колезі могло б бути щось на зразок


<имя пациента> blah blah
<аллергия на лекарство> blah blah blah

У такій постановці вже не складно написати програму для довільно взятого комп'ютера так, щоб вона могла розпізнати ці стандартизовані лікарські записи і вміла заносити цю в прямому сенсі життєво важливу інформацію в свою базу даних.

Точно так же, як HTML створювався, щоб будь-який користувач міг читати Internet-документи, XML дає нам те есперанто, на якому будь-хто може читати і писати, незважаючи на Вавилон несумісних платформ. Так навіть з точки зору пересічної людини в мові XML більше смислового навантаження (на відміну від інших форматів даних), бо в ньому немає чогось такого, що виглядало б нечитабельним текстом.

Міць універсальності XML обумовлена \u200b\u200bмінімальним набором правильно обраних правил. По-перше - теги завжди складають пару, оточуючи своєрідними дужками текст, до якого вони застосовуються. По-друге - спарені теги можуть вкладатися один в одного на зразок лапок, дозволяючи будувати складні багаторівневі структури.

Правило вкладання автоматично обумовлює простоту будь-якого XML-документа, виробляючи структуру, відому в інформатиці як дерево. Аналогічно генеалогічного дерева, будь-який графічний або текстовий елемент документа є батько, син чи брат (parent, child, sibling) якогось іншого елемента, і це ставлення спорідненості завжди однозначно. Звичайно, дерева не описують все різноманіття структур даних, однак покривають більшу частину типових випадків застосування комп'ютерів. Крім того, дерева надзвичайно зручні для програмістів. Немає проблем написати невеликий шматочок коду для переупорядочивания транзакцій або виведення на екран цілком зрозумілого чека, коли цей чек представлений у вигляді дерева.

Друге джерело універсальної сили XML - це опора на новий стандарт Unicode - систему кодування, яка допускає взаімосмешеніе текстів на всіх основних мовах світу. Навпаки, в HTML, як і в масі текстових процесорів, документ, як правило, може бути тільки на одному конкретному мовою, не має значення якому - англійською, японською або арабською.
А якщо програма не знає кодування якоїсь мови, про документ (в HTML) можна забути. Буває й гірше: наприклад, через неузгодженість кодувань програми, написані на Тайвані, часто не вміють читати тексти, орієнтовані на материковий Китай. У випадку з XML, якщо програма вміє правильно з ним працювати, вона впорається з будь-якою комбінацією кодувань. Таким чином, XML дозволяє обмінюватися даними не тільки між різними комп'ютерними платформами, а й дає можливість долати національні та культурні бар'єри.


Кінець всесвітньому очікуванню (World Wide Wait)

З поширенням XML Мережа повинна стати набагато "чуйними". Сьогодні все, що вміють робити комп'ютерні пристрої в мережі, не має значення, потужні це десктопи або кишенькові органайзери, це не більше, ніж отримати форму по "GET", заповнити її, потім ганяти на web-сервер туди-сюди, поки робота з формою не буде завершено процес. XML дає нам можливість передати в форму структуру і семантику даних, і, отже, всі ці пристрої зможуть робити основний обробіток в потрібному місці і негайно. Це не тільки зменшить навантаження на сервера, але і має привести до істотного скорочення мережевого трафіку.

Для ілюстрації уявіть собі, як в онлайновому бюро подорожей вам потрібно підібрати рейс з Лондона в Нью-Йорк на 4 липня. Швидше за все, ви побачите список в кілька разів довше, ніж може поміститися на екрані. Цей список можна скоротити, задавши більш точні параметри типу часу вильоту, ціни або авіакомпанії, але в цьому випадку ви просто "навантажуєте" сервер бюро подорожей своїм запитом і змушені чекати відповіді. Однак якби цей довгий список рейсів вам надали в XML, то бюро могло б супроводити його невеликим Java-аплетів, за допомогою якого моментально і легко впорядкувати і відсіяти непотрібне, не вдаючись до будь-якого взаємодії з сервером. Помножте це на мільйони користувачів Web, і загальний ефект виявиться вражаючим.

Чим більше мережевої інформації буде розмічено "галузевими" XML-тегами, тим легше буде знайти те, що ви шукаєте. Сьогодні пошук в Internet за запитом "робота для біржового брокера" накриє вас лавиною рекламних оголошень, але ймовірно, про роботу їх там буде всього кілька штук - в основному робота ховається на безкоштовних дошках оголошень газетних сайтів, з якими не люблять працювати пошукові роботи. І зараз Асоціація Газет Америки (Newspaper Association of America) створює на XML свою мову розмітки оголошень, який обіцяє зробити процес пошуку набагато ефективніше.

Неважливо, нехай це просто проміжний крок. Бібліотекарі давно знають способи знайти щось швидко - Відеофайли можуть не документи, а їх компактні ключові опису, лише вказують на самі джерела. А саме, це каталоги з зразком у вигляді бібліотечних карток. Подібну інформацію про інформацію і називають "метадані".

Тому з самого початку важлива роль в XML-проект відводилася створенню супутнього стандарту метаданих. Ту ж саму роль, як каталожні картки для бібліотечних книг, для інформації в Web повинна зіграти лютнева Специфікація Описаний Ресурсів (Resource Description Framework, RDF). Поширюючись по Мережі, метадані RDF зроблять пошук набагато швидшим і релевантним, ніж зараз. У Мережі немає бібліотекарів, але кожен веб-майстер, до всього іншого, прагне до легкої "Що знаходяться" його сайту, тому ми очікуємо, що RDF, як тільки людям відкриється його міць, матиме неабиякий вплив на розвиток Internet.

Зрозуміло, інформацію можна отримувати і без пошуку. Зрештою, Мережа це гіпертекст - мільярди сторінок, пронизаних гіперпосиланнями - тими підкресленими словами, за якими досить клацнути, щоб помчати на якусь іншу сторінку. У XML механізм гіперпосилань так само багаторазово посилений. Специфікація посилань в XML, звана XLink і яку W3C готує до кінця року, дасть можливість користувачеві вибирати з декількох адрес призначення. Ще один різновид гіперпосилань дозволить отримувати текст або зображення прямо за місцем натискання, даючи можливість відвідувачеві не залишати сторінку.

Ймовірно, найбільш корисними в XLink виявиться та частина специфікації, яка дозволяє авторам вдаватися до опосередкованим посиланнях, що відсилає замість самих сторінок в якусь зведену БД. Так, якщо автор змінив адресу сторінки, простим авторським редагуванням запису в такій базі даних легко оновити всі посилання, що ведуть на його сторінку. Це дозволить позбутися від стають звичними повідомлень "404 File Not Found", що сигналізують про "поламаної" засланні.

Поєднання більш ефективної обробки, більш точного пошуку і більш гнучкого зв'язування революціонізує структуру Мережі і відкриває абсолютно нові методи доступу до інформації. Для користувачів ця нова Мережа стане істотно швидше, могутніше і корисніше, ніж Мережа сьогоднішня.


Необхідна співпраця

Зрозуміло, не все так просто. XML дозволяє будь-якому сконструювати нову мову на свій лад, проте створити хороший мова - завдання, складність якої не слід недооцінювати. Придумати мову - лише самий початок: наївно очікувати, що значення ваших тегів будуть очевидні іншим людям, поки ви не забезпечили мову керівництвом, і будуть зрозумілі комп'ютерів, поки ви не написали програми, що працюють з тегами мови.

Неважко пояснити, чому це так. Якби все необхідне для того, щоб навчити комп'ютер обробляти замовлення, зводилося до розмітки тегами, тоді і XML не знадобився б. Не потрібні були б навіть програмісти - раз комп'ютери досить розумні, щоб вміти все робити самостійно.

Те, навіщо нам потрібен XML, це не магія, а результативність. XML встановлює базові правила, на один пласт спрощують деталі програмування - щоб люди зі схожими інтересами могли сконцентруватися на іншому твердому горішку - угодах про те, як саме вони хотіли б оформляти дані, якими їм хочуть обмінюватися. Це дуже непроста проблема, хоча і не нова.

І такі угоди будуть, оскільки множаться несумісність комп'ютерних платформ дає нам в результаті затримки термінів, фінансові втрати і веде до плутанини майже у всіх сферах діяльності. Люди хочуть обмінюватися ідеями і робити справу, незалежно від того, що у всіх різні комп'ютери - і щоб це стало реальністю, взаіморазвітія приватних (для різних сфер діяльності) мов чекає ще довгий шлях. Однак шквал нових абревіатур з закінченням "ML" свідчить про безсумнівно прогресивної (inventiveness) струмені, яку XML вніс в науку, бізнес і освіту.

Створюючи нову мову розмітки на XML, його творці повинні домовитися про три речі: які там будуть теги, як вони можуть вкладатися один в одного, і як вони повинні оброблятися. Перші два пункти - словник мови і структура - кодуються зараз за допомогою DTD (Document Type Definition). Стандарт XML не зобов'язує розробників мови вдаватися до DTD, але у більшості нових мов DTD-описи, мабуть, будуть - програмістам так простіше писати програми, які розуміють цю розмітку і извлекающие з неї щось путнє. Потрібні будуть також комплекти посібників, де на людській мові описані значення всіх тегів. Наприклад, HTML має DTD-опис, але по HTML є і сотні сторінок звичних посібників, з якими звіряються програмісти, розробляючи браузери та інші програми для Web.


Есе про стилі

Для користувачів головне - це що вміє робити програма, а не те, що написано в її описі. Як правило, люди вважають за краще, щоб програми дозволяли їм бачити закодовану на мові XML інформацію в читабельному вигляді. Але в тегах самого XML немає ніякої спеціальної розмітки, що вказує. як дані повинні бути представлені на екрані або друкованому аркуші.

Для публікаторів, які прагнуть написати один раз, а потім постійно видавати ( "write once and publish everywhere"), найголовніше - "народити" публікацію, а потім "розливати" її в міріади видів видань, як друкованих, так і електронних. XML допомагає їм так: контент розмічається описовими тегами, незалежними від середовища візуалізації. Далі публікатор може оформити правила подання у вигляді т. Зв. stylesheets (листів стилів), автоматично "стилізує" його твір під різні пристрої і середовища. Стандарт такого XML-мови, що розробляється для цих цілей, носить назву Extensible Stylesheet Language (XSL).

Останні версії браузера вміють читати XML-документи, вибирати відповідні файли стилю, і застосовувати їх для сортування і форматування інформації на екрані. Читач може навіть і не здогадатися, що має справу з XML, а не HTML, якщо тільки не зверне уваги, що сайти з XML спритніше і простіше у використанні.

Люди з вадами зору також отримують безкоштовний виграш від XSL-принципів публікації документів, так як XSL дає їм можливість читати XML в системі Брейлі або з голосу. Ці переваги стосуються і інших: наприклад, комівояжеру, яка бажає займатися мережевим серфінгом, не виходячи з автомобіля, напевно здалося б досить зручним слухати сторінки в звуковому супроводі.

Хоча спочатку ядро \u200b\u200bМережі складали наукові та освітні програми, сьогоднішня Мережа - це вже комерція (ну, або можна сказати, комерційні очікування), запасаються паливо для швидкого старту. Всі пам'ятають недавній резонанс, викликаний сплеском онлайнових продажів, а чи варто говорити про те, як стрімко взаємодіють бізнесмени в мережі між собою. Потоки товарів великих виробників так і напрошуються на автоматизацію в мережі. Але в сьогоднішніх бізнес-схемах використовуються складні взаємодії program-to-program, і на практиці це працює з рук геть погано, бо для успіху необхідно однаковість процесів обробки, до якого поки що далеко.

Протягом століть люди успішно займалися бізнесом, обмінюючись типовими документами: замовленнями, рахунками, деклараціями, квитанціями і т.д. і т.д. Документи працювали на бізнес, і ніхто не вимагав, щоб одна бере участь сторона знала внутрішню кухню інший. Будь-який документ показувався рівно настільки, наскільки одержувачу інформації слід було його показати, і не більше. Мабуть, обмін документами і є найправильніший спосіб займатися бізнесом і в Web теж. Але це зовсім не було тієї завданням, під яку створювався HTML.

І навпаки, XML задуманий саме з метою обміну документами і очевидно, що основа електронної комерції буде спиратися на угоди, виражені мільйонами курсують по Internet XML-документів.

Таким чином, Мережа, посилена XML, повинна стати для своїх користувачів швидким, дружнім і кращим місцем для бізнесу. Ще більше XML необхідний web-майстрам і web-дизайнерам. "На повну котушку" буде потрібно знання нових XML-мов арміям програмістів. І хоча дні самообразованних хакерів [автори мали на увазі кращий сенс цього слова] ще тривають, над їх популяцією вже нависла загроза.

Завтрашній web-дизайнер зобов'язаний бути обізнаний не тільки у виготовленні тексту і графіки, а й в будівництві багаторівневих, взаємозалежних систем на основі DTD, дерев даних, гіперссилочних структурах, метаданих і стильових компонентах - сильної і передової інфраструктурі Web другого покоління.

В операційній системі Windows більшість програм зберігає свої настройки в реєстрі. Однак для зберігання параметрів додатка також часто використовують і спеціальні файли, розташовані зазвичай безпосередньо в каталогах з виконуваними файлами або у вкладених папках. Файли можуть мати різні формати, в тому числі, і формат XML, якому і присвячена ця невелика стаття.

Що це за формат XML, для чого потрібен і де використовується

По правді кажучи, цілі, з якими створювався формат XML (з'явився він в 1996 році), були, можна так сказати, глобальними. XML або eXtensible Markup Language, що перекладається як «розширювана мова розмітки», був розроблений як засіб забезпечення сумісності передачі структурованих даних між різними програмними системами, особливо тими з них, які використовуються в інтернеті. Мова цей настільки універсальний, що файли XML розуміють навіть несумісні додатки різних операційних систем, що, звичайно ж, істотно спрощує програмістам завдання з обміну інформацією між програмними платформами.

Крім того, XML активно застосовується при конструюванні сайтів. Іноді його позиціонують як більш досконалий і універсальний аналог мови гіпертекстової розмітки HTML, але ці мови в дійсності служать різним цілям. HTML відповідає головним чином за відображення даних, XML же був спроектований для передачі і зберігання цих даних. Використовується XML також і при створенні нових інтернет-мов. До речі, знайомий багатьом RSS, використовуваний в розсилці через новинні канали, заснований саме на XML.

Програми для відкриття і перегляду файлів у форматі XML

Що це за формат XML розібралися, тепер подивимося, як з ним працювати. По правді кажучи, з необхідністю редагування XML-файлів зазвичай стикаються розробники і системні адміністратори, але давайте все ж припустимо, що така ж необхідність виникла і у вас. Чим відкрити файл XML? Взагалі, переглянути його можна будь-яким текстовим редактором, навіть Блокнотом, але набагато зручніше використовувати для цих цілей спеціальні програми.

Notepad ++

Якщо шукаєте, ніж відкрити XML, спробуйте Notepad ++ - універсальний текстовий редактор, призначений для створення і редагування коду. Легкий, швидкий і простий, він ідеально підходить для роботи зі всілякими типами конфігураційних файлів. Редактором підтримується підсвічування синтаксису, зміна кодування, є потужний вбудований пошук за різними параметрами, одним словом, все, що потрібно програмісту і не тільки йому.

XMLPad

На відміну від Notepad ++, XMLPad є вузькоспеціалізованим редактором. Якраз те, чим можна і потрібно відкривати формат XML, оскільки створювався він саме для роботи з файлами цього типу. Крім перегляду і редагування документів XML редактор XMLPad підтримує їх валідацію і інспектування, конвертація в DTD, імпортування даних з HTML і багато іншого. Як і належить, в додатку є підтримка синтаксису, є засіб пошуку і заміни. З особливостей програми можна виділити наявність вбудованого міні-браузера для відкриття URL-посилань.

Тим, хто налаштований на вивчення веб-мов більш серйозно, можна запропонувати - просунутий і в той же час простий і зручний редактор XML на платформі Java. Програмою підтримується створення і редагування файлів XML, XSL, XSD і DTD, також є вбудований конвертер в скрипти, відладчик XSLT і XQuery, засоби для роботи з візуальними діаграмами XML і безліч інших компонентів. Недоліки - програма платна, і в ній відсутня підтримка російської мови.

XML Marker

Непоганий спосіб відкрити файл XML - скористатися простим редактором XML Marker. Він не такий наворочений, як Oxygen XML Editor, але при цьому цілком справляється з більшістю завдань, які виникають перед користувачем при роботі з файлами XML. В наявності подання деревовидної структури документа з можливістю швидкого переходу до обраних рядках за тегами, зручна навігація, повний набір засобів для роботи з текстовими даними. Мінус програми - немає російської мови.

браузери

Є ще один найпростіший спосіб, як прочитати файл XML, правда, мова тут йде тільки про читання. Відкрийте в Google Chrome або будь-якому іншому браузері нову вкладку і перетягніть XML-файл на вікно оглядача. Документ буде представлений в структурованому вигляді, з підсвічуванням синтаксису, все, як і належить.

Перегляд XML-файлів онлайн

Працювати з XML-документами можна не тільки за допомогою десктопних програм, також не складає труднощів відкрити XML онлайн. Ось вам на замітку два простих онлайн-редактора.

XmlGrid

Простий на вигляд, але досить функціональний онлайновий редактор файлів XML, доступний за адресою xmlgrid.net. Сервісом підтримується створення, зміна, валідація та конвертування документів XML, додатково є функція проектування карт сайтів. Код редагованого файлу можна вставити в веб-форму з буфера обміну, по URL-адресою або завантаживши на сервер сам документ. Вміст файлу відображається у вигляді таблиці з даними, в якій кожне поле являє собою окрему осередок.

XML EDITOR

Відкрити файл XML онлайн дозволяє також інтернет-редактор XML EDITOR, що входить в набір додатків TutorialsPoint - одного з найбільших навчальних ресурсів. Щоб скористатися сервісом, перейдіть за адресою www.tutorialspoint.com, у верхній частині сторінки натисніть посилання «Tools», знайдіть у списку веб-додатків XML EDITOR і відкрийте його. Ви побачите вікно простого текстового редактора з двома колонками. У лівій пишеться і редагується код, в правій відображається деревоподібна структура документа. Завантажити файл в редактор можна як з комп'ютера, так і з будь-якого веб-сайту, вказавши URL.



Сподобалася стаття? поділіться їй