HTML



HTML
(HyperText Markup Language)
Fájlkiterjesztés .html, .htm
MIME-típus text/html
Fejlesztő World Wide Web Consortium & WHATWG
Formátum típusa Jelölőnyelv
Kiterjesztése ennek SGML
Kiterjesztése ez XHTML
Mac OS típuskód TEXT
Uniform public.html
Standard

ISO/IEC 15445
W3C HTML 4.01

W3C HTML5 (draft)

A HTML (angolul: HyperText Markup Language=hiperszöveges jelölőnyelv) egy leíró nyelv, melyet weboldalak készítéséhez fejlesztettek ki, és mára már internetes szabvánnyá vált a W3C (World Wide Web Consortium) támogatásával. Az aktuális változata az 5, mely az SGML általános jelölőnyelv egy konkrét alkalmazása (azaz minden 5-ös HTML dokumentum egyben az SGML dokumentumszabványnak is meg kell hogy feleljen). Ezt tervek szerint lassan kiszorította volna az XHTML, amely a szintén SGML alapú XML leíró nyelven alapul.

Tartalomjegyzék

Használata


HTML általában szöveges állományokban található meg olyan számítógépeken, melyek az internethez kapcsolódnak. Ezek az állományok tartalmazzák azokat a szimbólumokat, amelyek a megjelenítő programnak leírják, hogyan is kell megjeleníteni illetve feldolgozni az adott állomány tartalmát. Megjelenítő program lehet egy webböngésző (angolul: web browser), aural böngésző (olyan, amelyik a felhasználónak felolvassa a megjelenítendő szöveget), braille olvasó, amely konvertálja a szöveget braille "formátumba", levelező program (mint például: Mozilla Thunderbird, Microsoft Outlook, Eudora stb.), valamint egyéb eszközök, például mobiltelefon.

Szimbólumok, tartalom


Négyfajta szimbólum (leíró elem) található meg a HTML-ben:

Felépítés


Egy HTML állomány három fő részre bontható:

  1. A Dokumentum Típus Definíció az állomány legelején, pl:
    <!DOCTYPE html>
  2. a HTML fejléc <head></head>, ami technikai és dokumentációs adatokat tartalmaz, amelyeket az internet böngésző nem jelenít meg, tehát átlag felhasználó ezeket nem látja és
  3. a HTML törzs <body></body>, amely a megjelenítendő információkat tartalmazza.

Tehát egy internetes oldal alapszerkezete a következőképpen nézhet ki:

  <!DOCTYPE html>
  <html>
    <head>
      <title>Az oldal címe</title>
      <!--esetleges további fejléc-információk-->
    </head>
    <body>
      <p>első bekezdés</p>
      <p>második bekezdés</p>
    </body>
  </html>

Karakterkódolás

Egy HTML dokumentum alapértelmezésként ISO-8859-1, azaz nyugat-európai kódolást használ.[1] Gyakran előforduló hiba szokott lenni, hogy nincs beállítva a charset paraméter a fejléc content attribútumában, annak ellenére, hogy a dokumentum nem nyugat-európai kódolású szöveget tartalmaz. Magyar nyelvű oldalak esetén ilyenkor gyakran az „ő” és „ű” betűk helyett „õ” és „û” karaktereket látunk (ekkor valószínűleg "ISO-8859-2" vagy "windows-1250" volna a helyes charset érték), de az is lehet, hogy minden ékezetes betű teljesen olvashatatlanná válik, betűszemetet eredményezve (ha például a megjelenítendő szöveg UTF-8 kódolású). A charset paraméter értékeként több száz kódolás és érvényes alternatív név (alias) megadható.[2]

Numerikus karakter referenciák

Akármilyen kódolást használ is egy HTML dokumentum, bármilyen Unicode karakter megjeleníthető a szövegben annak UCS kódjával „&#” és „;” jelek között. Például a magyar kis „ő” betű UCS kódja a decimális 337 (vagy hexadecimális 151), ezért függetlenül a használt kódolástól, a HTML dokumentumban elhelyezett &#337; vagy &#x151; mindig az „ő” betűt fogja megjeleníteni.

Karakter egyedhivatkozások

Az SGML számos Unicode karakterhez definiál egyedi megnevezéseket,[3][4] azonban a HTML a lehetséges SGML egyedeknek csak egy részét használja[5] (a használt egyedeket a dokumentum DTD-jében kell megadni, és a HTML 4.01-es verziójáig ez nem tartalmazza a közép-európai karaktereket). Emiatt a magyar ékezetes karakterek közül is csak azokra lehetséges SGML egyedhivatkozást megadni, amelyek a nyugat-európai kódkészletben is megtalálhatók. Vagyis hiába definiálja az SGML például „ő” betűhöz az „odblac” nevet, hivatalosan azt egy böngészőnek nem kell tudnia megjeleníteni egy 4.01-es HTML dokumentum esetén.

Az egyedek neveire az „&” és „;” jelek között hivatkozhatunk, így például az &eacute; a kis „é” betűt jeleníti meg.

XHTML


Az XHTML a HTML megfogalmazása XML-ben (a HTML SGML-ben van definiálva). Gyakorlatilag nincs jelentős eltérés a két nyelv között, csak a formai követelmények lettek szigorúbbak:

HTML5


A HTML5 a következő, jelentősen átdolgozott változata a HTML-nek (Hypertext Markup Language), a web fő jelölőnyelvének. Egyik fő tervezési célja, hogy a webes alkalmazásokhoz ne legyen szükség pluginek (pl. Adobe Flash, Microsoft Silverlight, Sun JavaFX) telepítésére. A specifikáció a HTML4 és az XHTML1 új verzióját jelenti, a hozzájuk tartozó DOM2 HTML API-val együtt. A HTML5 specifikációban leírt formátumba történő migráció HTML4-ről, vagy XHTML1-ről a legtöbb esetben egyszerű, mivel a visszamenőleges kompatibilitás biztosított. A specifikáció a közeljövőben támogatni fogja a Web Forms 2.0 specifikációt is. HTML5-ben lehetőség van audio és videofájlok beillesztésére, erre a célra külön tagek vannak (<audio>, <video>). Továbbá létezik egy úgynevezett <canvas> tag, mely egy vászon. Erre Javascript segítségével lehet rajzolni, vagy képet beilleszteni. Fontos megemlíteni, hogy a HTML5-ből kivették az elrendezés megadó tulajdonságokat. Ezeket CSS-ben kell megadni.

Jegyzetek


  1. Specifying the character encoding in HTML
  2. HTML-ben érvényes karakterkódolások
  3. SGML karakter egyedek . [2008. október 18-i dátummal az eredetiből archiválva]. (Hozzáférés: 2008. október 21.)
  4. SGML-Unicode kódtáblázat . [2015. december 14-i dátummal az eredetiből archiválva]. (Hozzáférés: 2008. október 21.)
  5. A HTML 4-ben használható karakter egyedek

További információk


Kapcsolódó szócikkek


  • Informatikai portál • összefoglaló, színes tartalomajánló lap



Kategóriák: Jelölőnyelvek | Webfejlesztés | World Wide Web Consortium sztenderdek | HTML


Dátum: 27.03.2021 07:13:37 CET

Eredet: Wikipedia (Szerzői [Laptörténet])    Lizenz: CC-BY-SA-3.0

Változtatások: Az összes képet és a hozzájuk kapcsolódó legtöbb látványelemet eltávolítottuk. Néhány ikont a FontAwesome-Icons váltotta fel. Néhány sablont eltávolítottak (például „a cikk kibővítéséhez szükséges”) vagy hozzárendelte (mint például „hatjegyek”). A CSS osztályokat vagy eltávolították, vagy harmonizálták.
A Wikipedia-tól olyan linkeket, amelyek nem vezetnek cikkhez vagy kategóriához (mint például a „Redlinks”, „a szerkesztési oldalra mutató linkek”, „a portálok linkjei”), eltávolították. Minden külső linkhez tartozik egy további FontAwesome-Icon. Néhány apró változtatás mellett a médiatartályt, a térképeket, a navigációs dobozokat, a beszélt verziókat és a geomikroformátumokat eltávolítottuk.

Felhívjuk figyelmét: Mivel az adott tartalmat az adott időpontban automatikusan a Wikipedia veszi, a kézi ellenőrzés volt és nem lehetséges. Ezért a nowiki.org nem garantálja a megszerzett tartalom pontosságát és aktualitását. Ha van olyan információ, amely pillanatnyilag hibás, vagy pontatlan a képernyő, akkor nyugodtan lépjen kapcsolatba velünk: email.
Lásd még: Jogi nyilatkozat & Adatvédelmi irányelvek.