Search…

Lược Sử HTML

24/10/202014 min read
Quá trình hình thành và phát triển của HTML.

HTML là chữ viết tắt của Hypertext Markup Language, là ngôn ngữ đánh dấu tiêu chuẩn được thiết kế để hiển thị trong trình duyệt Web, có thể được hỗ trở bởi những công nghệ như Cascading Style Sheets (CSS) và ngôn ngữ JavaScript (JS).

Trình duyệt web nhận tài liệu HTML từ máy chủ web hoặc từ máy tính và hiển thị thành các trang web với nhiều tiện ích. HTML mô tả cấu trúc của 1 trang web bằng các tag có ngữ nghĩa (semantic tags).

Các phần tử HTML (tags, elements) là các thành phần xây dựng nên trang HTML. Với cấu trúc HTML hình ảnh và các đối tượng khác như form, HTML cung cấp các phần tử để tạo tài liệu có cấu trúc bằng các tags hỗ trợ văn bản như tiêu đề <title>, danh sách <ul>, liên kết <a>, ...

Các phần tử HTML được phân định bằng các tag đóng mở, ví dụ như tag <img />, <input />. Các thẻ khác như đoạn văn <p>. Các trình duyệt không hiển thị các tag HTML, nhưng sử dụng chúng để diễn giải nội dung của trang.

HTML có thể sử dụng cùng với JavaScript, giúp tăng tính tương tác và các hành động trên web. Có thể kết hợp với CSS xử lý bố cục web, điều chỉnh giao diện theo tiêu chuẩn của World Wide Web Consortium (W3C) từ năm 1997.

Tóm lược lịch sử

Quá trình phát triển

Năm 1980, nhà vật lý học Tim Berners-Lee - 1 nhà thầu tại CERN đã đề xuất và tạo bản mẫu ENQUIRE, 1 hệ thống cho các nhà nghiên cứu tại CERN sử dụng để chia sẻ tài liệu. Năm 1989, Berners-Lee viết đề xuất 1 hệ thống siêu văn bản trên nền Internet. Berners-Lee chỉ định sử dụng HTML, tiến hành viết phần mềm trình duyệt và máy chủ vào cuối năm 1990. Năm đó, Berners-Lee và kỹ sư hệ thống dữ liệu CERN Robert Cailliau đã hợp tác và yêu cầu được tài trợ, nhưng dự án không được CERN chính thức thông qua. Trong ghi chú cá nhân của mình từ năm 1990, ông đã liệt kê "1 vài lĩnh vực mà siêu văn bản được sử dụng".

Bản mô tả đầu tiên của HTML là 1 tài liệu được gọi là các thẻ HTML "HTML Tags", được Tim Berners-Lee đề cập lần đầu trên Internet vào cuối năm 1991. Nó mô tả 18 phần tử, bao gồm thiết kế ban đầu tương đối đơn giản của HTML. Ngoại trừ thẻ "siêu liên kết", chúng bị ảnh hưởng mạnh bởi SGMLguid, dạng tài liệu dựa trên ngôn ngữ đánh dấu tổng quát tiêu chuẩn nội bộ (SGML) tại CERN. 11 trong số các phần tử này vẫn tồn tại trong HTML4.

HTML là 1 "markup language" mà trình duyệt web sử dụng để thông dịch và soạn văn bản, hình ảnh và các tài liệu khác thành các trang web trực quan. Các đặc tính mặc định cho các thẻ HTML được xác định trong trình duyệt và có thể thay đổi bằng cách sử dụng CSS của các nhà thiết kế web. Nhiều phần tử văn bản được tìm thấy trong báo cáo kỹ thuật TR 9537 của ISO năm 1988 có tên là Techniques for using SGML, bản báo cáo đề cập đến các tính năng của các ngôn ngữ định dạng văn bản ban đầu được sử dụng bởi RUNOFF command được phát triển vào đầu những năm 1960 cho CTSS (Compatible Time-Sharing System - Hệ thống chia sẻ thời gian tương thích): các lệnh định dạng này bắt nguồn từ các lệnh được dùng trong các máy đánh chữ để định dạng tài liệu thủ công. Tuy nhiên, khái niệm "SGML" của việc đánh dấu tổng quan được dựa trên các phần tử (các phạm vi lồng nhau với các thuộc tính) chứ không chỉ in ra văn bản với các hiệu ứng đặc biệt, với sự tách biệt của cấu trúc và đánh dấu; HTML dần theo định hướng này cùng với CSS.

Berners-Lee coi HTML là 1 ứng dụng của "SGML". Được chính thức định nghĩa bởi IETF với bài xuất bản giữa năm 1993 về đề xuất đầu tiên cho 1 "đặc tả HTML", Bản thảo Internet "Ngôn ngữ Đánh dấu Siêu văn bản (HTML)" của Berners-Lee và Dan Connolly, bao gồm cả một bản định nghĩa kiểu Tài liệu SGML để xác định ngữ pháp. Bản nháp hết hạn sau 6 tháng, nhưng đáng chú ý là sự công nhận thẻ tùy chỉnh của trình duyệt "NCSA Mosaic" để nhúng hình ảnh nội dòng, phản ánh triết lý của IETF về việc dựa trên các tiêu chuẩn của các nguyên mẫu thành công. Tương tự, bản Internet-Draft cạnh tranh của Dave Raggett, "HTML+ (Định dạng đánh dấu siêu văn bản)" từ cuối năm 1993 đề xuất tiêu chuẩn hóa các tính năng đã được triển khai như bảng và biểu mẫu.

Sau khi các bản nháp HTML và HTML+ hết hạn vào đầu năm 1994, IETF đã thành lập "Nhóm Công Tác HTML", Nhóm này vào năm 1995 đã hoàn thành "HTML 2.0", đặc tả HTML đầu tiên được dự định là tiêu chuẩn cho việc triển khai trong tương lai.

Sự phát triển mạnh mẽ dưới sự bảo trợ của IETF bị đình trệ bởi các lợi ích cạnh tranh. Kể từ năm 1996, các đặc tả HTML được duy trì với đầu tư từ các nhà cung cấp phần mềm thương mại bởi World Wide Web Consortium (W3C). Tuy nhiên, vào năm 2000, HTML trở thành tiêu chuẩn quốc tế (ISO/IEC 15445:2000). HTML 4.01 được xuất bản vào cuối năm 1999, với các bản tiếp theo được xuất bản đến năm 2001. Năm 2004, sự phát triển của HTML5 trong Nhóm Công Tác về Công nghệ Ứng dụng Siêu văn bản Web (WHATWG), Nhóm này đã trở thành 1 phần có thể phân phối chung với W3C vào năm 2008, được hoàn thiện và chuẩn hóa 28 tháng 10 năm 2014. 

Dòng thời gian của các phiên bản HTML

HTML 2

 24 tháng 11 năm 1995

HTML 2.0 được xuất bản dưới dạng RFC 1866. Các khả năng bổ sung của RFC:

  • Ngày 25 tháng 11 năm 1995: RFC 1867 (tải lên tệp dựa trên biểu mẫu).
  • Tháng 5 năm 1996: RFC 1942 (bảng).
  • Tháng 8 năm 1996: RFC 1980 (ánh xạ hình ảnh phía máy khách).
  • Tháng 1 năm 1997: RFC 2070 (quốc tế hóa).

HTML 3

 4 tháng 1 năm 1997

 HTML 3.2 được phát hành dưới dạng Khuyến nghị W3C. Đây là phiên bản đầu tiên được phát triển và tiêu chuẩn hóa độc quyền bởi W3C, vì IETF đã giải tán Nhóm Công Tác HTML vào 12/09/1996. 

Ban đầu có tên mã là "Wilbur", HTML 3.2 loại bỏ hoàn toàn các công thức toán học, điều hòa sự chồng chéo giữa nhiều phần mở rộng độc quyền và bám theo hầu hết các thẻ đánh dấu trực quan của Netscape. Phần tử nhấp nháy của Netscape và khoanh vùng của Microsoft bị bỏ qua do thỏa thuận chung giữa hai công ty. Đánh dấu cho các công thức toán học tương tự như trong HTML không được chuẩn hóa cho đến 14 tháng sau trong MathML.

HTML 4

18 tháng 12 năm 1997

HTML 4.0 đã được xuất bản dưới dạng Khuyến nghị W3C. Nó cung cấp ba biến thể:

  • Ràng buộc, trong đó các phần tử đã bỏ bị cấm.
  • Chuyển tiếp, trong đó các phần tử đã bỏ được dùng.
  • Khung, trong đó chủ yếu chỉ cho phép các phần tử liên quan đến khung.

Ban đầu có tên mã là "Cougar", HTML 4.0 sử dụng nhiều phần tử và thuộc tính dành riêng cho trình duyệt nhưng cũng đồng thời tìm cách loại bỏ dần các tính năng đánh dấu trực quan của Netscape bằng cách đánh dấu chúng là đã bỏ để thay thế cho các định kiểu (style sheet). HTML 4 là 1 ứng dụng SGML tuân theo ISO 8879 - SGML. 

24 tháng 4 năm 1998

HTML 4.0 đã được phát hành lại với các chỉnh sửa nhỏ mà không tăng số phiên bản.

24 tháng 12 năm 1999

HTML 4.01 đã được xuất bản dưới dạng Khuyến nghị W3C. Cung cấp ba biến thể giống như HTML 4.0 và phiên bản cuối cùng của nó được xuất bản vào 12/05/2001.

Tháng 5 năm 2000

ISO/IEC 15445: 2000 ("ISO HTML", dựa trên bản HTML 4.01 ràng buộc) được xuất bản như 1 tiêu chuẩn quốc tế ISO/IEC. Trong ISO, tiêu chuẩn này thuộc phạm vi của ISO/IEC JTC1/SC34 (Ủy ban kỹ thuật chung ISO / IEC 1, Tiểu ban 34 - Mô tả tài liệu và ngôn ngữ xử lý). 

Sau HTML 4.01, không có phiên bản HTML mới nào trong nhiều năm vì sự phát triển của ngôn ngữ dựa trên XML là XHTML khiến Nhóm Công Tác HTML của W3C bận rộn từ đầu và giữa những năm 2000.

HTML 5

 Ngày 28 tháng 10 năm 2014

HTML5 được xuất bản dưới dạng Khuyến nghị W3C. 

Ngày 1 tháng 11 năm 2016

HTML 5.1 được xuất bản dưới dạng Khuyến nghị W3C. 

Ngày 14 tháng 12 năm 2017

HTML 5.2 được xuất bản dưới dạng Khuyến nghị W3C. 

Tiến trình phiên bản nháp HTML

Tháng 10 năm 1991

Thẻ HTML, 1 tài liệu không chính thức của CERN liệt kê 18 thẻ HTML, lần đầu tiên được đề cập trước công chúng.

Tháng 6 năm 1992

Bản nháp không chính thức đầu tiên của HTML DTD, với bảy lần sửa đổi tiếp theo (15 tháng 7, 6 tháng 8, 18 tháng 8, 17 tháng 11, 19 tháng 11, 20 tháng 11, 22 tháng 11).

Tháng 11 năm 1992

HTML DTD 1.1 (bản đầu tiên có số phiên bản, dựa trên các bản sửa đổi RCS, bắt đầu bằng 1.1 thay vì 1.0), 1 bản nháp không chính thức.

Tháng 6 năm 1993

Ngôn ngữ đánh dấu siêu văn bản được Nhóm Công Tác IETF IIIR phát hành dưới dạng Bản nháp Internet (đề xuất sơ bộ cho 1 tiêu chuẩn). Được thay thế bằng phiên bản thứ hai 1 tháng sau đó.

Tháng 11 năm 1993

HTML+ đã được IETF xuất bản dưới dạng Bản nháp Internet và là 1 đề xuất cạnh tranh với bản nháp Ngôn ngữ đánh dấu siêu văn bản. Hết hạn vào tháng 7 năm 1994. 

Tháng 11 năm 1994

Bản thảo đầu tiên (bản sửa đổi 00) của HTML 2.0 do chính IETF xuất bản (được gọi là "HTML 2.0" từ bản sửa đổi 02), dẫn đến việc xuất bản RFC 1866 vào tháng 11 năm 1995. 

Tháng 4 năm 1995 (tác giả tháng 3 năm 1995)

HTML 3.0 được đề xuất làm tiêu chuẩn cho IETF, nhưng đề xuất này hết hạn sau 5 tháng (28/09/1995) mà không có thêm hành động nào. Đề xuất này bao gồm nhiều tính năng xuất hiện trong đề xuất HTML+ của Raggett, như hỗ trợ bảng, luồng văn bản xung quanh các số liệu và hiển thị các công thức toán học phức tạp. W3C bắt đầu phát triển trình duyệt Arena của riêng mình để làm nền tảng thử nghiệm cho HTML3 và CSS, nhưng HTML 3.0 không thành công vì 1 số lý do. Bản nháp HTML3 này được xem là một đề xuất lớn với hơn 150 trang và lúc ấy tốc độ phát triển của trình duyệt web đã vượt xa các nguồn lực của IETF. Các nhà cung cấp trình duyệt, bao gồm Microsoft và Netscape vào thời điểm đó chọn triển khai các phần nhỏ khác nhau của bản nháp HTML3 và giới thiệu các phần mở rộng của riêng họ. Những phần mở rộng này mục đích là để kiểm soát phong cách của văn bản, trái với "niềm tin của cộng đồng kỹ sư lúc ấy rằng những thứ như màu chữ, kết cấu nền, kích thước phông chữ và mặt phông chữ lạc khỏi phạm vi của mục đích duy nhất rằng là đặc tả cách sắp xếp của văn bản. Dave Raggett - một W3C Fellow thâm niên nhận xét rằng "Ở 1 khía cạnh, Microsoft đã gây dựng hoạt động kinh doanh trên Web bằng cách mở rộng các tính năng HTML." 

Tháng 1 năm 2008

HTML5 được W3C xuất bản dưới dạng Bản nháp.

Mặc dù cú pháp gần giống với SGML, HTML5 từ bỏ việc trở thành 1 ứng dụng SGML và nhấn mạnh định nghĩa cho việc tuần tự hóa HTML, bổ sung vào việc tuần tự hóa XHTML5 dựa trên XML thay thế. 

2011 HTML5 - Cơ hội cuối

Vào 14/02/2011, W3C mở rộng quy định của Nhóm Công Tác HTML với các cột mốc cho HTML5. Vào 05/2011, Nhóm Công Tác nâng cấp HTML5 thành "Cơ hội cuối", 1 lời mời đến các cộng đồng trong và ngoài W3C để xác nhận tính hợp lý về mặt kỹ thuật của bản đặc tả. W3C phát triển 1 bộ thử nghiệm toàn diện để đạt được khả năng tương tác rộng rãi cho đặc điểm kỹ thuật đầy đủ vào năm 2014 cũng đồng thời là ngày cho việc đề xuất. Vào 01/2011, WHATWG đổi tên HTML5 thành HTML. Tuy nhiên, W3C vẫn tiếp tục dự án phát hành HTML5. 

2012 HTML5 - Ứng viên khuyến nghị

Vào 07/2012, WHATWG và W3C quyết định về mức độ tách biệt. W3C sẽ tiếp tục đặc tả HTML5 để tập trung vào 1 chuẩn định nghĩa duy nhất, WHATWG xem điều này như một nước đi vội vàng. WHATWG thì tiếp tục công việc với HTML5 và xem nó như là một "Mức sống". Khái niệm về 1 "Mức sống" là sẽ không bao giờ hoàn thiện, luôn được cập nhật và cải thiện. Các tính năng mới có thể được thêm vào nhưng chức năng sẽ không bị xóa. 

Vào tháng 12 năm 2012, W3C đã chỉ định HTML5 là "Đề xuất khuyến nghị". Tiêu chí để tiến tới Khuyến nghị W3C là "hai cách triển khai hoàn toàn 100% và có thể tương tác hoàn toàn". 

2014 HTML5 - Đề xuất khuyến nghị và Khuyến nghị

Vào tháng 9 năm 2014, W3C chuyển HTML5 sang "Đề xuất khuyến nghị". 

Vào ngày 28 tháng 10 năm 2014, HTML5 đã được phát hành dưới dạng Khuyến nghị W3C ổn định, bản đặc tả kỹ thuật đã hoàn thành.

Các phiên bản XHTML

XHTML là 1 ngôn ngữ riêng biệt bắt đầu như 1 bản định dạng lại của HTML 4.01 với XML 1.0 nhưng không còn được phát triển như 1 chuẩn riêng biệt.

XHTML 1.0 được xuất bản dưới dạng Khuyến nghị W3C vào ngày 26/01/2000 và được sửa đổi và tái phát hành vào ngày 01/08/2002. XHTML 1.0 cung cấp ba biến thể giống như HTML 4.0 và 4.01 và được định dạng lại bằng XML với một số hạn chế.

XHTML 1.1 được xuất bản dưới dạng Khuyến nghị W3C vào ngày 31 tháng 5 năm 2001. Nó dựa trên XHTML 1.0 Nghiêm ngặt, nhưng bao gồm các thay đổi nhỏ, có thể được tùy chỉnh và được định dạng lại bằng cách sử dụng các mô-đun trong khuyến nghị W3C "Mô-đun hóa XHTML", được xuất bản vào ngày 10 tháng 4 năm 2001. 

XHTML 2.0 là 1 bản nháp đang hoạt động, công việc trên nó đã bị bỏ dở vào năm 2009 để chuyển sang phần HTML5 và XHTML5. XHTML 2.0 không tương thích với XHTML 1.x và do đó, sẽ được mô tả chính xác hơn là 1 ngôn ngữ mới lấy cảm hứng từ XHTML hơn là 1 bản cập nhật cho XHTML 1.x.

Cú pháp XHTML, được gọi là "XHTML5.1", đang được định nghĩa cùng với HTML5 trong bản nháp HTML5. 

Sự chuyển đổi của HTML Publication sang WHATWG

Vào ngày 28 tháng 5 năm 2019, W3C cho biết rằng WHATWG là nhà phát hành duy nhất cho các chuẩn HTML và DOM. W3C và WHATWG đã luôn cạnh tranh với nhau về các chuẩn từ năm 2012. Tuy rằng các chuẩn của W3C giống hệt với WHATWG vào năm 2007 nhưng sau này đã dần khác nhau do các quyết định thiết kế khác nhau. Chuẩn của WHATWG đã có một thời gian là tiêu chuẩn ngầm trong thực tế.

Dịch từ

https://en.wikipedia.org/wiki/HTML.

IO Stream

IO Stream Co., Ltd

30 Trinh Dinh Thao, Hoa Thanh ward, Tan Phu district, Ho Chi Minh city, Vietnam
+84 28 22 00 11 12
developer@iostream.co

383/1 Quang Trung, ward 10, Go Vap district, Ho Chi Minh city
Business license number: 0311563559 issued by the Department of Planning and Investment of Ho Chi Minh City on February 23, 2012

©IO Stream, 2013 - 2024