Mã hóa và Giải mã Thực thể HTML

Chuyển đổi ký tự đặc biệt thành thực thể HTML và ngược lại

Thử các ví dụ sau:

Giới thiệu về HTML Entities

HTML entities là các ký tự đặc biệt được sử dụng trong HTML để đại diện cho các ký tự có thể bị hiểu nhầm là mã HTML. Chúng cho phép bạn hiển thị các ký tự dành riêng, vốn có thể bị hiểu nhầm là mã HTML, và các ký tự vô hình như khoảng trắng không ngắt dòng.

Các ứng dụng phổ biến của HTML Entities

  • Hiển thị các ký tự dành riêng như <, >, &
  • Thêm các ký tự đặc biệt như bản quyền (©) hoặc thương hiệu (™)
  • Bao gồm các ký tự từ các ngôn ngữ hoặc hệ thống chữ viết khác nhau
  • Thêm các ký hiệu toán học hoặc ký hiệu kỹ thuật
  • Đảm bảo hiển thị nhất quán trên các trình duyệt và nền tảng khác nhau

Cách HTML Entities hoạt động

HTML entities có thể được tham chiếu theo hai cách:

  • Các entity có tên: Bắt đầu bằng dấu & và kết thúc bằng dấu chấm phẩy (ví dụ, &lt; cho <)
  • Các entity số: Sử dụng giá trị thập phân hoặc thập lục phân (ví dụ, &#60; or &#x3C; cho <)
  • HTML5 hỗ trợ nhiều entity có tên cho các ký tự phổ biến
  • Tất cả các ký tự Unicode có thể được đại diện bằng các entity số
  • Các bộ mã hóa và giải mã giúp chuyển đổi giữa văn bản thuần và định dạng HTML entity

Các HTML Entities phổ biến

Một số HTML entities được sử dụng phổ biến bao gồm:

  • &lt; = < (bé hơn)
  • &gt; = > (lớn hơn)
  • &amp; = & (dấu và)
  • &quot; = " (dấu ngoặc kép)
  • &apos; = ' (dấu nháy đơn)
  • &nbsp; = khoảng trắng không ngắt dòng
  • &copy; = © (bản quyền)
  • &reg; = ® (thương hiệu đã đăng ký)

Các lưu ý về bảo mật

Việc sử dụng đúng HTML entities rất quan trọng đối với bảo mật web. Bằng cách mã hóa các ký tự đặc biệt, bạn có thể ngăn chặn một số loại tấn công cross-site scripting (XSS). Luôn mã hóa nội dung động có thể bao gồm dữ liệu do người dùng cung cấp để đảm bảo nó được hiển thị an toàn trong HTML.

Examples

Văn bản thuầnHTML Entities
<div>&lt;div&gt;
Smith & CoSmith &amp; Co
8 > 38 &gt; 3