URL là gì?

Chắc hẳn các bạn, ai cũng đã từng nghe nói đến URL nhưng không hiểu một cách tường tận về nó. Do vậy, nhiều bạn thắc mắc rằng URL là gì? Cấu trúc và thành phần của chúng ra sao? Từ đó, bài viết sau đây sẽ giúp các bạn có cái nhìn tổng quan về URL và cấu trúc của nó.

URL là gì?

URL là tên viết tắt tiếng anh của Uniform Resource Locator , là đường dẫn hay địa chỉ được sử dụng để tham chiếu đến các tài nguyên trên mạng Internet. URl có khả năng tạo nên siêu liên kết cho các website. Mọi tài nguyên được lưu trữ trên Internet được gán bằng một địa chỉ chính xác, địa chỉ đó chính là URL. 

[irp]

Cấu trúc của một URL

Cấu trúc URL
Cấu trúc một URL gồm nhiều thành phần

Cấu trúc đơn giản của một URL mà bạn có thể thấy là:

  • Giao thức: http, https, ftp,…
  • World wide web: www (hoặc có thể không có thường được gọi là non-www)
  • Tên miền : ví dụ như là matbao.net
  • Cổng giao tiếp (port): 80, 443, 2222, 2082,…
  • Ví dụ đầy đủ về một đường dẫn URL: https//www.matbao.net/ten-mien/dang-ky-ten-mien.html

Một URL đơn giản gồm 2 thành phần chính: Scheme (giao thức kết nối) và Authority (nhà cung cấp). Cụ thể 2 thành phần này mời bạn đọc xem tiếp trong các phần tiếp theo nhé.

Scheme trong URL 

Schema trong URL
Schema là phần mở đầu trong một URL

Scheme là phần mở đầu của URL kết thúc trước dấu “:”, đại diện cho phương thức mà trình duyệt web của bạn dùng để giao tiếp với server. Thông thường, người dùng sẽ ít chú ý đến phần này của đường dẫn URL. Tuy nhiên, Scheme sẽ được quy định phương thức truyền tải dữ liệu giữa trình duyệt và server. Sau đây là các loại Scheme thường gặp là:

  • Http: là tên viết tắt tiếng anh của HyperText Transfer Protocol, được dịch theo nghĩa tiếng việt là giao thức truyền tải siêu văn bản. Đây chính là giao thức truyền tải cơ bản nhất của website và server. Giao thức này dùng để xác định mọi hành động của máy chủ đối với thao tác của người dùng trên trình duyệt web bằng các lệnh nhất định. Thông thường, Http sẽ sử dụng Port 80 để giao tiếp.
  • Https: là tên viết tắt tiếng anh của HyperText Transfer Protocol Secure. Cũng giống như Http, nhưng Https có thêm chức năng đó là mã hoá dữ liệu trong quá trình truyền tải. Quá trình này được sử dụng SSL (Secure Socket Layer) nhằm mục đích đảm bảo cho quá trình truyền dữ liệu an toàn giữa web server và trình duyệt website. Thông thường, Https sẽ sử dụng port 433 để truyền dữ liệu.
  • FPT: là tên viết tắt tiếng anh của File Transfer Protocol. Giao thức này thường dùng để chuyển đổi giữa các File qua lại giữa trình duyệt và web server.

Tuy nhiên, bạn không nhất thiết phải gõ Scheme trước tất cả URL. Lưu ý, khi bạn gõ URL còn lại bất kỳ thì trình duyệt sẽ tự động chọn phương thức phù hợp. Ngoài ra, đối với một số URL, bạn sẽ phải tự mình gõ Scheme để chúng ta chọn phương thức kết nối.

[irp]

Authority trong URL

Authority trong URL
Path là một trong 3 thành phần của Authority

Phần Authority chính là phần còn lại của URL. Phần còn lại này sẽ được chia thành nhiều phần khác nhau. Chúng ta lấy ví dụ “www.example.com“, đây chính là hostname đại diện cho địa chỉ IP. Nếu như bạn thuộc địa chỉ IP bạn có thể gõ vào phần URL thay vì hostname. Tuy nhiên, chúng ta có thể thấy địa chỉ IP sẽ khó nhớ hơn rất nhiều so với hostname. Do vậy, người ta sẽ thường có xu hướng nhớ hostname hơn là địa chỉ IP.

Sau đây là một số thành phần của nó:

  • Tên miền cấp cao nhất (Top-Level Domain)
  • Tên miền phụ (Subdomain)

Các thành phần bổ sung cho một URL

Thành phần bổ sung khác dành cho Authority của URL gồm 3 thành phần: Path (Đường dẫn), Query (Truy vấn) và Fragment (Phân mảnh).

  • Path (Đường dẫn)
Thành phần của URL
Path (Đường dẫn) trong 1 URL (Phần được bôi vàng)

Nếu như Authority của URL sẽ dẫn bạn đến đúng máy chủ trên mạng, đường dẫn sẽ đưa bạn đến đúng thư mục hoặc file trên máy chủ đó. Đường dẫn sẽ được bắt đầu bằng dấu gạch chéo. Những dấu gạch chéo này sẽ tiếp tục thể hiện sự phân chia giữa các thư mục và thư mục con (subfolder). Ta có thể lấy ví dụ như sau:

www.example.com/folder/subfolder/filename.html

Phần cuối cùng chính là tên file sẽ được mở khi chúng ta truy cập vào trang web. Có thể bạn sẽ không thấy đường dẫn này trên thanh địa chỉ. Nhưng điều đó không đồng nghĩa là không có. Có một vài ngôn ngữ được sử dụng để tạo trang web ẩn tên và phần mở rộng của file để cho người dùng dễ nhớ và gõ URL hơn.

Query (Truy vấn) 

Truy vấn của URL thường được sử dụng nhằm mục đích xác định những thứ không phải là thành phần cấu trúc của đường dẫn cố định. Theo như thường lệ, bạn sẽ thấy chúng được sử dụng để thực hiện tìm kiếm. Hoặc có thể khi trang web phân phối dữ liệu thông qua biểu mẫu cũng sử dụng Query. Phần truy vấn này thường được bắt đầu bằng dấu chấm hỏi và theo sau đường dẫn ( hoặc có thể sau tên máy chủ nếu không có đường dẫn).

Sau đây là ví dụ của URL khi thực hiện tìm kiếm “shopee” trên trang google

Query khi gõ từ khóa tìm kiếm là Shopee

Theo như bạn đã thấy, sau phần chấm hỏi là 2 phần của truy vấn:

URL cho tìm kiếm: “ search?q=” và từ khoá đã được mã hoá “shopee&oq=shopee&aqs”

[irp]

Fragment (Phân mảnh)

Phân mảnh thường được bắt đầu bằng một dấu thăng (#) và được sử dụng nhằm mục đích xác định vị trí cụ thể của trang web. Đây chính là thành phần cuối cùng của URL. Một khi tạo website, các nhà thiết kế có thể thêm liên kết neo ( anchor text). Liên kết neo và URL cùng với phân mảnh thường được sử dụng để tạo mục lục trang web giúp điều hướng trang web một cách dễ dàng hơn.

Friendly URL là gì?

URL thân thiện
Friendly URL là một yếu tố vô cùng quan trọng trong SEO

URL thân thiện với SEO là gì? URL thân thiện hay friendly URL mô tả một cách chính xác trang bằng các từ khoá giúp cho người dùng và các công cụ tìm kiếm dễ nhận biết. Sau đây là một ví dụ về URL thân thiện với SEO:

  • https://www.example.com/tu-khoa-can-seo-abc.html

Sau đây là ví dụ về URL không thân thiện với SEO:

  • https://www.example.com/subfolder/subfolder-2/AxJSjdS.html

Đây chính là các bước tối ưu hoá đầu tiên mà các bạn có thể thực hiện cho URL của bạn thân thiện với công cụ tìm kiếm. URL thân thiện với người dùng có nghĩa là sử dụng các từ khoá có liên quan đến nội dung website.

Top-Level Domain là gì? 

Top-Level Domain
Các thành phần chính trong một Domain

Top-Level Domain được dịch sang tiếng việt có nghĩa là tên miền cấp cao nhất. Trong ví dụ ở trên, “com” là tên miền cấp cao nhất. Đây chính là mức cao nhất trong hệ thống tên miền phân cấp được sử dụng nhằm mục đích dịch địa chỉ IP thành địa chỉ ngôn ngữ đơn giản nhất, dễ nhớ. Những tên miền cấp cao này đã được tập đoàn Internet cấp số và tên miền (ICANN) tạo và quản lý. Có 3 tên miền cấp cao phổ biến nhất đó là .com, .net, .gov.

Đa số, các quốc gia đều có trên miền cấp cao nhất gồm có hai chữ cái, bạn thường sẽ thấy tên miền như .vn (Việt Nam), .us (Mỹ), .ca (Canada),… Có một số tên miền cấp cao nhất bổ sung ( như .museum) đã được các tổ chức cá nhân tài trợ và quản lý. Ngoài ra, cũng có một số tên miền cấp cao nhất dùng chung như là .club, .news, .life.

Subdomain là gì?

Subdomain là gì
Subdomain được dịch sang tiếng việt có nghĩa là tên miền phụ. 

Subdomain được dịch sang tiếng việt có nghĩa là tên miền phụ. Chúng ta hãy xem  DNS như là một hệ thống phân cấp, cả hai phần “www” và “example”  của URL ví dụ như trên được xem là tên miền phụ. Phần “www” là tên miền phụ của tên miền cấp cao nhất “com” và phần “www” là tên miền phụ của tên miền “example” . Đó chính là lý do tại sao các bạn nhìn thấy công ty có đăng ký tên như “google.com” được chia thành các tên miền phụ như là

  • “news.google.com”,
  • www.google.com”,
  • “mail.google.com”,… 

URL ảnh hưởng đến SEO như thế nào?

URL trong SEO
Trong SEO, URL là một yếu tố vô cùng quan trọng ảnh hưởng đến kết quả

Nếu như các bạn vẫn còn đang thắc mắc rằng không biết URL có quan trọng đối với SEO hay không, các bạn hãy thử hình dung là khi bạn gõ một từ khoá trên thanh công cụ tìm kiếm của Google, sẽ cho bạn hàng trăm hàng nghìn kết quả dưới dạng là các đường link để bạn click vào và truy cứu thông tin. Và từ những kết quả hiện về đầu tiên hiển thị cho trang web chuẩn SEO được tối ưu một cách tốt nhất, trong đó đường link cũng nằm trong mục tiêu đánh giá của Google về một bài viết thật chất lượng hay một website.

Nếu như các bạn sử dụng công cụ hỗ trợ SEO hay có thể check SEO theo một cách chuyên nghiệp cho website, bạn cũng sẽ dễ dàng nhận thấy điều này trong phần “Slug”. Phần này các bạn có thể hiểu đơn giản là cách các đường dẫn hiện thị trên các công cụ tìm kiếm hay đại diện cho một nội dung nào đó trong website của bạn. Và sau đây là các tiêu chuẩn SEO thường dùng để đánh giá các URL:

URL không được quá dài

Độ dài phù hợp của URL
Độ dài URL cần phải ngắn và thể hiện được nội dung của bài viết

Bắt đầu từ năm 2011 trở đi, Google đã thay đổi thuật toán tìm kiếm và dường như các từ khoá quá dài đã không còn được phổ biến như trước nữa. Và chiều dài URL đối với các bài viết như sau:

  • Chiều dài trung bình URL cho blog của Google là 76 ký tự.
  • Chiều dài trung bình URL cho Gmail là 59 ký tự.
  • Chiều dài trung bình URL cho Webmaster Tools là 90 ký tự.

URL không nên viết có dấu hay quá nhiều ký tự đặc biệt

URL không nên quá phức tạp bởi ký tự và chữ có dấu

Hầu hết, các URL của các trang web cho dù viết dưới dạng tiếng việt thì đều được để dưới dạng không dấu và được nối với nhau bằng những dấu gạch nối “dang-ky-web-chuyen-nghiep-o-dau”. Ngoài những yếu tố về độ dài thì đây được xem như là yêu cầu thứ hai chuẩn SEO cho một URL. Đồng thời, hãy hạn chế tối đa việc thể hiện các ký tự đặc biệt trong đường dẫn như *@#$^&… Những ký tự này được xem là quá khó hiểu và ảnh hưởng đến khả năng xếp thứ hạng của website bạn.

URL chứa từ khoá SEO

Nếu như bạn đang SEO từ khoá quan trọng nào, bạn hãy đảm bảo rằng từ khoá của mình muốn SEO có hiển thị trong đường dẫn URL đó. Đây chính là điều mà các SEO thường xuyên phải nhắc nhở bạn trước khi update hay cho đăng tải về bài viết nào đó.

URL hạn chế dẫn về thư mục con

Đó chính là các ký tự sau kí tự “/” mà đã được đề cập ở trên với các bạn. Đường dẫn cần SEO của bạn không nên chứa quá nhiều thư mục con hay phải đi qua quá nhiều trang chính để đến với nội dung cần SEO. Như vậy, Google sẽ không đánh giá cao về đường link này của bạn.

Thay vì như vậy, bạn muốn có được đường link tốt chỉ dẫn đúng bài viết chính và không phải phân chia quá nhiều thư mục, trong khi thiết kế của bạn có thể yêu cầu với bộ phận kỹ thuật hay các lập trình viên để điều chỉnh và cài đặt phần này cho bạn. Từ đó, bạn sẽ sở hữu một website chuyên nghiệp, chuẩn SEO nhất.

Tối ưu thẻ URL như thế nào cho chuẩn?

Tối ưu URL
URL thể hiện sự chuyên nghiệp của bài viết

Đối với xã hội ngày nay, do nhu cầu cung cấp và sử dụng các dịch vụ trên Internet rất lớn và ngày càng phát triển không ngừng. Từ đó, các đơn vị kinh doanh dịch vụ đã phát triển rất nhiều tài nguyên tham chiếu của mình, chính vì việc này cũng khiến cho người sử dụng không thể tìm kiếm được một địa chỉ URL nhất định trong các tìm kiếm của mình. Đó chính là lý do các bạn cần phải tối ưu địa chỉ URL tốt nhất.

Tối ưu nội dung URL

  • Về từ khoá: đường dẫn URL nên chứa từ khoá và các từ khoá đó đặt ngay đầu URL.
  • Về nội dung: phải đảm bảo ngắn gọn và mang tính mô tả. Để khi người sử dụng nhìn vào mà có thể hiểu được nội dung của trang web là gì.
  • Về giới hạn ký tự trong URL: URL của bạn chỉ nên gồm 10 từ hoặc 96 ký tự.
  • Về stop words: các bạn nên hạn chế sử dụng những chữ dạng stop words trong một URL. Những từ như thế sẽ làm cho công cụ tìm kiếm tránh quét chúng.

Tối ưu cấu trúc URL

  • Không nên chứa những ký tự kỳ lạ: các bạn nên sử dụng URL ở dạng tĩnh, sử dụng dấu gạch nối (-) để ngăn các từ. Và không nên sử dụng dấu gạch dưới (_) hay bất kỳ ký tự là nào. Ví dụ như “@”, “^”, “#”, “&”, “$”,… bởi vì như vậy Google sẽ không nhận diện được liên kết của bạn. 
  • Giữ nguyên cấu trúc của đường dẫn URL: các bạn không nên thay đổi cấu trúc của đường dẫn URL trong khi Google đã index liên kết đó. Trong những trường hợp buộc phải thay đổi thì các bạn nên sử dụng redirect 301 chuyển URL cũ sang mới. Làm như vậy sẽ giúp cho website của bạn không bị ảnh hưởng nhiều.
  • Đường dẫn của URL nên hạn chế dẫn về thư mục con: URL của bạn không nên chứa quá nhiều thư mục con hay phải đi qua quá nhiều trang chính để đến với nội dung cần SEO. Chính vì như vậy, bạn sẽ không được Google đánh giá cao. Một đường link tối ưu phải nên dẫn về đúng với bài viết và không nên phân chia quá nhiều thư mục con.
  • URL friendly = URL tĩnh và chứa từ khoá: nếu như URL chứa từ khoá sẽ làm tăng giá trị của bài viết. Mặc khác, Google thích trang web tĩnh (.html) hơn là một trang web động (?id=).

Bài viết trên một phần nào cũng giúp các bạn hiểu được URL là gì? Cấu trúc và các thành phần của chúng như thế nào? Và các bạn cần phải làm gì để có thể tối ưu được URL một cách hiệu quả nhất.  URL là thành phần vô cùng quan trọng trong 1 website cũng như SEO. Do đó, bạn cần phải đặc biệt lưu ý thuộc tính này khi làm SEO, ngoài ra nó còn ảnh hưởng đến tính thẩm mỹ của website.

Tham khảo

1. https://www.thebalanceeveryday.com/what-does-url-mean-897078

2. https://sitechecker.pro/what-is-url/

3. https://www.definitions.net/definition/URL

4. https://www.collinsdictionary.com/dictionary/english/url

5. https://www.techopedia.com/definition/1352/uniform-resource-locator-url

Hãy bình luận đầu tiên

Để lại một phản hồi

Thư điện tử của bạn sẽ không được hiện thị công khai.