Hiểu về Htaccess, tối ưu SEO website đơn giản hơn rất nhiều

Tác giả : hoanganh   Kiểm tra bởi Anh Nguyễn

Trên đường đua khốc liệt cho vị trí top đầu của các công cụ tìm kiếm, tối ưu hóa SEO là việc không thể bỏ qua. Và đi theo nó sẽ là các công cụ bổ trợ và những giải pháp đặc thù, một mảng rất rộng những thuật ngữ mà mọi Marketer buộc phải nằm lòng. Htaccess hay file .htaccess là một trong số đó. Bài viết này sẽ đề cập đến mọi khía cạnh của .htaccess để bạn có thể tùy chỉnh và đạt được những kết quả tốt nhất trong việc tối ưu hóa công cụ tìm kiếm. Không mất thời gian thêm nữa, bắt đầu nào.

Những điều cần biết về .htaccess trong SEO

Htaccess là gì?

Về mặt kỹ thuật, htaccess là một tập tin được sử dụng để cấu hình thư mục trong các website apache. Bạn có thể dễ dàng tạo một tệp mới và ghi đè các tham số từ tệp htaccess của mình nếu các web hosting không cho phép bạn chỉnh sửa. Ngoài ra, nếu bạn tạo một file htaccess trên thư mục gốc của web server, nó sẽ được áp dụng cho toàn bộ trang web của bạn.

Kiểm soát htaccess tốt hơn với Directives

Directives cho phép bạn kiểm soát htaccess chặt chẽ hơn trong việc định cấu hình bằng cách sử dụng các dẫn xuất ngắn. Với các dẫn xuất này, bạn có thể bảo vệ tệp bằng mật khẩu, kiểm soát thu thập thông tin, cho phép hoặc cấm các địa chỉ IP,…

Kiểm soát htaccess tốt hơn với Directives

Tại sao cần tối ưu hóa SEO trong các tệp .htaccess?

Dưới đây là những lợi ích mà htaccess đem lại cho SEO:

Trình thu thập thông tin của công cụ tìm kiếm sẽ tiếp cận cách .htaccess xử lý chức năng trang web. Nếu htaccess được vận hành đúng, điều này sẽ giúp cải thiện xếp hạng website.

Với .htaccess, bạn có thể tạo ra URL mà công cụ tìm kiếm yêu thích.

Htaccess cũng có thể giải quyết lỗi 404 HTTPS và xử lý điều hướng 301.

Nó cũng được dùng để chặn người dùng sử dụng địa chỉ IP hoặc domain khỏi các spy solution của công cụ tìm kiếm.

htaccess có thể giải quyết lỗi 404

Backup trước khi chỉnh sửa .htaccess 

Chỉnh sửa .htaccess là một đề xuất rất phức tạp. Mặc dù nó có thể giúp cải thiện website, tuy nhiên cũng sẽ dẫn đến việc gặp lỗi máy chủ nội bộ 500 và khiến trang web không hoạt động nếu làm sai.

Để tránh điều này, sao lưu hay Backup file .htaccess là giải pháp tốt nhất trước khi thực hiện bất kỳ thay đổi nào

Tìm file .htaccess ở đâu?

Vị trí của tệp .htaccess tùy thuộc vào nền tảng bạn đang sử dụng. Thường thì nó sẽ ở thư mục gốc. Ví dụ: nếu bạn đang sử dụng WordPress, bạn sẽ tìm thấy nó trong WordPress installation directory. Đối với các nền tảng sử dụng cPanel, bạn có thể truy cập File Manager và đi đến thư mục gốc. Sau đó bật “Show Hidden Files” để truy cập tệp .htaccess.

Friendly URLs trong SEO 

URL đóng một vai trò rất quan trọng trong SEO. Theo Matt Cutts, các từ khóa xuất hiện trong URL cũng sẽ giúp tăng khả năng xếp hạng cao hơn. Đối với các chủ Blog, ông cũng đề xuất lưu ý về độ dài URL, nó phải ngắn gọn và clean, điều này sẽ giúp gợi ý cho các công cụ tìm kiếm rằng bạn đang quan tâm đến người đọc của mình.

Friendly URLs trong SEO 

Tối ưu hóa URL cho trang web

Bạn có thể tối ưu hóa tệp .htaccess để giải quyết vấn đề này bằng cách ghi đè các URL hiện tại bằng file extension và đảm bảo chúng được xử lý đúng cách. Để làm được điều đó, hãy sử dụng đoạn code sau trong tệp .htaccess của mình.

RewriteEngine On

Rewrite Rule ^topicname/ (a[a-zA-Z0-9]+)$ index.php?topic=$1

Nó sẽ chuyển đổi tất cả URL trang web của bạn thành như sau

www.yoursite.com/therulesyouchoosed/article.

Tối ưu CMS URLs

Nếu bạn đang sử dụng WordPress, Joomla hoặc bất kỳ CMS nào, việc tùy chỉnh các URL sẽ theo nhiều cách khác nhau. Bạn có thể thực hiện bằng cách thêm đoạn code sau vào tệp .htaccess.

RewriteEngine On

Rewrite Rule (.*)/$load_page.php?&page_id=$1

Sau khi file được cập nhật, các URL của bạn đã sẵn sàng để tối ưu hóa SEO một cách hiệu quả hơn.

Xóa .php và .html

Trên thực tế, các extension như .html và .php không có giá trị gì đối với người đọc, và nó cũng khiến họ khó ghi nhớ, do vậy bạn có thể cân nhắc việc xóa chúng đi.

Để xóa các extension, tất cả những gì bạn cần làm là sao chép đoạn mã dưới đây và đưa vào tệp .htaccess.

RewriteCond% {REQUEST_FILENAME}! -D

RewriteCond% {REQUEST_FILENAME} .php -f

RewriteCond% {REQUEST_FILENAME} .html -f

Viết lại Quy tắc ^ (. *) $ $ 1.html

Canonical robots.txt

Các file robot.txt nằm ở thư mục gốc, tuy nhiên các robot xấu hay những đoạn mã độc hại có thể quét toàn bộ trang web để tìm một tệp robot.txt và ăn hết tài nguyên trên website của bạn. Chắc chắn bạn sẽ không muốn nó xảy ra và điều này có thể được cải thiện với sự trợ giúp của canonical. 

Giải pháp canonical

Bạn có thể hướng dẫn người dùng tìm tệp robot.txt. bằng cách sử dụng .htaccess để giải quyết vấn đề liên tục yêu cầu truy cập. Bằng cách này, bạn cũng đang cải thiện SEO website của mình bằng cách cung cấp cho người dùng những gì họ muốn, đồng thời giảm tải lên server. Đoạn mã bạn cần dùng như sau:

RewriteBase /

RewriteCond %{REQUEST_URI} !^/robots.txt$ [NC]

RewriteCond %{REQUEST_URI} robots\.txt [NC]

RewriteRule .* http://yourmotocmswebsite.com/robots.txt [R=301,L]

Trong đoạn mã trên, tất cả những gì bạn cần làm là thay đổi “yourwebsite.com” thành URL trang web của bạn. URL phải là thư mục gốc website và bất kỳ ai cũng có thể truy cập được. Đoạn mã trên đã sử dụng rewrite module của Apache. Tuy nhiên, nếu bạn đang tìm kiếm một giải pháp thay thế gọn gàng hơn, có thể sử dụng mod_alias.

RedirectMatch 301 ^/(.*)/robots\.txt http://yourmotocmswebsite.com/robots.txt

Non-www redirect

Một trong những vấn đề cơ bản nhất mà hầu hết trang web gặp phải là chuyển hướng không có www. Nếu bạn đang kiểm tra trang web của mình, bạn cũng nên quan tâm đến vấn đề non-www redirect. Tin tốt là Canonical tag có thể sửa chữa điều này và bên cạnh đó, nó cũng giúp khắc phục sự cố trùng lặp URL trên trang web của bạn và cải thiện cấu trúc URL tổng thể của website

sử dụng .htaccess redirect non-www sang www bằng một trong hai đoạn mã sau

RewriteEngine onRewriteCond %{HTTP_HOST}!^www\.yourwebsite\.comRewriteRule(.*) http://www.yourmotocmswebsite.com/$1 [R=301,L]
RewriteEngine onRewriteCond %{HTTP_HOST} ^yourwebsite\.com [NC]RewriteRule(.*) http://www.yourmotocmswebsite.com/$1 [R=301,L]

Thay thế thuật ngữ “yourmotocmswebsite” bằng tên miền của mình.

Sử dụng canonical tags cho header tags và tệp PDF

Rel = ”canonical” cũng có thể được sử dụng để báo hiệu các canonical URLs và các tệp trong header tags cũng như PDFs hiệu quả hơn. Ví dụ: bạn có thể sử dụng canonical tags để trỏ các liên kết PDF sang HTML một cách đơn giản. Bằng cách này, người dùng không phải tải tệp xuống để kiểm tra. Tuy nhiên, để điều này xảy ra, bạn cần phải bật cả hai tùy chọn. Để kích hoạt, hãy sử dụng đoạn code bên dưới. 

Header and Link “; rel=”canonical””

Redirect bằng cách sử dụng .htaccess cho SEO

Trong phần này, chúng ta sẽ xem xét các chuyển hướng bằng cách chỉnh sửa file .htaccess để tránh lỗi 301 và 404. Điều này sẽ giúp đảm bảo người dùng không truy cập vào một liên kết hỏng và tạo điều kiện để trang web có thể đáp ứng các tiêu chuẩn do thuật toán Google đặt ra.

Với tư cách là chủ website, bạn có thể tùy chỉnh 404 bad request hoặc chuyển hướng đến trang chủ. Điều này cho phép người dùng có thể tìm lại trang chứa nội dung mà họ cần. Nếu thao tác chính xác, htaccess sẽ giúp giảm tỷ lệ thoát và cải thiện hiệu suất SEO cho website của bạn.

Thực hiện chuyển hướng cho tất cả các lỗi bao gồm:

400: yêu cầu không hợp lệ403: nội dung bị cấm
401: yêu cầu ủy quyền500: lỗi máy chủ

Tất cả những gì bạn cần làm chỉ đơn giản là thay đổi mã lỗi và thay đổi trang chuyển hướng được liên kết với nó thông qua đoạn code sau

ErrorDocument 402 /temp/page-unavailable-temporarily402

Chặn bots xấu

Không phải tất cả các bot đều tốt. Chúng có thể muốn thu thập dữ liệu từ trang web của bạn mà không cung cấp bất kỳ giá trị nào. Đó là lý do tại sao bạn cần chặn những bots xấu này. Htaccess cho phép bạn viết các dẫn xuất có thể ngăn chặn bot bằng cách sử dụng đoạn mã sau.

RewriteCond%{HTTP_USER_AGENT} ^BOTNAME [OR]

RewriteCond%{HTTP_USER_AGENT} ^BOTNAME1 [OR]

RewriteCond%{HTTP_USER_AGENT} ^BOTNAME3

RewriteRule ^.*-[F,L]

Sửa lỗi 301 redirects and 404 errors

“404 not found” sẽ xảy ra ngay cả khi bạn bảo trì trang web của mình hàng ngày. Trong khi đó redirect 301 sẽ giúp loại bỏ lỗi 404 bằng cách chuyển hướng trang cũ sang trang mới. Điều này vô hình chung sẽ giải quyết hai vấn đề:

1. Chuyển hướng thành công các trang web liên kết với trang cũ của bạn.

2. Chuyển hướng 301 hoạt động cho tất cả các công cụ tìm kiếm bao gồm cả Google.

Để làm được điều này, bạn cần viết mã code sau vào htaccess của mình

Redirect 301/information/old-article

http://www.yourmotocmssite.com/articles/new-article

Chuyển hướng sang trang web mới nhất

Các công cụ tìm kiếm sẽ thu thập dữ liệu ở rất nhiều địa chỉ khác nhau trên trang chủ của bạn, việc index này được thực hiện hầu như mọi lúc. Tất nhiên bạn sẽ không bao giờ muốn khách hàng truy cập vào phiên bản cũ của trang web. Đó là lý do tại sao bạn cần đảm bảo thực hiện chuyển hướng đến trang web mới nhất. Và tất cả những gì bạn cần làm là sử dụng mã sau trong tệp .htaccess của mình.

RewriteCond %{HTTP_Host} ^yoursite.com$ [NC]

RewriteCond ^(.*)$ http://www.yourmotocmssite.com/$1[R+301,L]

RewriteCond %{THE_REQUEST} ^.*/index

Rewriter ^(.*)index$ http://www.site.com/$1 [R=301, L]

Lưu ý: Đừng quên thay thế “yourmotocmssite” thành tên miền của bạn.

Chuyển hướng Sitemaps

Sitemaps cũng sẽ không thể tránh khỏi các bot xấu và bạn cần phải đảm bảo rằng máy chủ của bạn có thể giúp crawler tìm thấy chúng. Điều này sẽ giúp bạn giải phóng tài nguyên hệ thống và cũng đảm bảo tiết kiệm băng thông. Để giải quyết vấn đề này, hãy thêm mã sau vào tệp .htaccess của mình.

RedirectMatch 301 /sitemap\.xml$ http://yourmotocmssite.com/sitemap.xml

RedirectMatch 301 /sitemap\.xml\.gz$ http://yourmotocmssite.com/sitemap.xml.gz

Để sử dụng đoạn mã trên, bạn cần chỉnh sửa nó theo tên miền trang web và file paths bạn đang sử dụng. Dòng đầu tiên của mã được dùng để chuyển hướng yêu cầu đến một sitemaps thông thường không được nén. Và dòng mã thứ 2 sẽ chuyển hướng đến phiên bản nén của sitemaps.

Cải thiện .htaccess cho SEO với Site Speed Caching

Ai cũng yêu tốc độ, kể cả người dùng hay các công cụ tìm kiếm. Do đó, nếu như bạn muốn được xếp hạng cao hơn, website của bạn phải có tốc độ tải nhanh. Và sử dụng caching sẽ giúp cải thiện điều đó. 

Caching là một phương pháp mà tài nguyên trang web được lưu trữ trong trình duyệt và nó sẽ không cần phải tải xuống khi người dùng yêu cầu. Bằng cách kích hoạt bộ nhớ đệm, bạn không chỉ có thể tăng tốc cho trang web của mình mà còn tiết kiệm thời gian xử lý của máy chủ.

Để kích hoạt bộ nhớ đệm, chúng ta sẽ sử dụng mod_headers và mod_expires. 

ExpiresActive In

ExpiresDefault A259200

Đoạn mã trên sẽ giúp bạn đặt thời gian hết hạn cho nội dung và nó tính bằng giây.

Robot Directives

Trang web của bạn có thể chứa các trang hoặc bài đăng mà bạn không muốn chia sẻ với người dùng hay thậm chí với công cụ tìm kiếm. Trong trường hợp này, bạn có thể muốn hạn chế quyền truy cập vào các tệp đó. Bạn có thể làm điều đó thông qua chỉnh sửa .htaccess. 

Header (“X-Robots-Tag: no index”, true);

Đoạn mã trên chỉ đơn giản là ẩn các tệp PHP do bạn tạo. Bạn cũng có thể định cấu hình máy chủ web bằng cách sử dụng mã sau:

Header set X-Robots-Tag “no index”

Bạn cũng có thể đặt các trang thành “no follow” nếu bạn muốn các trang đó không bị các công cụ tìm kiếm theo dõi.

Header (“X-Robots-Tag: no index, no follow”, true);

Chuyển hướng nguồn cấp dữ liệu sang FeedBurner

Chuyển hướng nguồn cấp dữ liệu đến Feedburner có thể giúp bạn tăng cường SEO trang web của mình. Bạn có thể tự động hóa toàn bộ quá trình nhờ vào .htaccess. 

# Feedburner redirection

 RewriteCond %{REQUEST_URI} ^/feed/ [NC]

 RewriteCond %{HTTP_USER_AGENT} !(FeedBurner|FeedValidator) [NC]

 RewriteRule .* http://feeds.feedburner.com/mainContentFeed [L,R=302]

 RewriteCond %{REQUEST_URI} ^/comments/feed/ [NC]

 RewriteCond %{HTTP_USER_AGENT} !(FeedBurner|FeedValidator) [NC]

 RewriteRule .* http://feeds.feedburner.com/allCommentsFeed [L,R=302]

Đối với các mã trên, bạn cần phải thay thế allCommentsFeed mainContentFeed với giá trị FeedBurner của mình

Cải thiện Crawl Mobile Content bằng Vary Header

Mobile serving có thể được cải thiện bằng cách sử dụng Vary Header. Nó chỉ đơn giản là nói với Google rằng bạn có một trang khác để phục vụ người dùng di động. Từ đó, Google sẽ xác định các trang một cách chính xác và thu thập dữ liệu phù hợp hơn. Điều này sẽ cải thiện trải nghiệm người dùng, tác động đến thứ hạng SEO của trang web.

Để kích hoạt tính năng này, tất cả những gì bạn cần làm là sao chép đoạn mã sau vào trong file .htaccess của mình.

Header append Vary User-Agent

Ngăn việc ăn cấp hình ảnh

Bạn cũng có thể định cấu hình .htaccess để ngăn các trang lấy hình ảnh từ website của bạn. Điều này sẽ giúp bạn cải thiện việc sử dụng băng thông máy chủ và nâng cao hiệu suất của nó. Để làm được như vậy, bạn cần sử dụng mã được đề cập bên dưới.

OnRewriteCond% {HTTP_REFERER}! ^ Http: //www.yourmotocmssite.com [NC]

RewriteCond% {HTTP_REFERER}! ^ Http: //yourmotocmssite.com [NC]

RewriteRule [^ /] +. (Gifljpg) – [F]

Htaccess có thể giúp bạn cải thiện SEO trang web của bạn theo nhiều cách. Trong bài viết hôm nay, chúng ta đã xem xét rất nhiều phương pháp như chuyển hướng, bộ nhớ đệm, canonical và SEO-friendly URLs. Htaccess có thể giải quyết lỗi hình ảnh, redirection, lỗi HTTP,…tất cả những vấn đề này đều ảnh hưởng đến trải nghiệm người dùng và liên quan trực tiếp đến SEO. Do đó, bạn nên thiết lập .htaccess của mình càng sớm càng tốt.

Kết luận

Chúng ta đã đi qua rất nhiều nội dung về Htaccess từ khái niệm, công dụng và quan trọng hơn hết là những giải pháp nó mang lại để hỗ trợ cho các ý định SEO. Rất hy vọng những thông tin này đem đến cho bạn những bài học bổ ích. Bạn có thể ghé thăm trang web chính thức của Top On Seek để đón đọc thêm nhiều bài viết hay về Digital Marketing hoặc đăng ký tư vấn và trải nghiệm dịch vụ SEO chuyên nghiệp từ chúng tôi để có những giải pháp tối ưu trong việc phát triển website và thu về lượng truy cập vượt trội.

Nguồn: https://www.motocms.com/blog/en/htacess-for-seo/

Thông tin tác giả

Một người yêu thích viết lách theo đuổi con đường SEO Content đa nhiệm - đa năng - đa sắc màu. Không ngừng học hỏi, nâng cao kỹ năng. Mong muốn mang đến không chỉ là một bài viết chuẩn SEO, mà còn là một trải nghiệm thăng hoa cùng con chữ.

Bài viết liên quan

Miễn phí kiểm tra lỗi SEO













Nhận báo giá SEO

Cần dịch vụ SEO?

 Tư vấn chiến lược SEO

Liên hệ

 Viết Content SEO

 Viết Content SEO

Liên hệ

KIẾN THỨC SEO NỔI BẬT

(GMB) Google My Business là gì: Cách tạo và tối ưu cho doanh nghiệp

Những năm gần đây, Google My Business (GMB) – Doanh nghiệp của tôi – không chỉ là một yếu tố ...

25/10/2020

TopOnSeek

Ahrefs là gì? Cách dùng Ahrefs để tối ưu SEO

Ahrefs là công cụ xây dựng liên kết SEO được phổ biến trên trang web hiện nay. Vậy Ahrefs là ...

09/09/2020

Thảo Phạm

SEMrush: Hướng dẫn sử dụng SEMrush từ A-Z

SEMrush là gì? SEMrush là gì? SEMrush là một công cụ phân tích các chỉ số của website và SEO ...

19/11/2019

Hiền Trần

KIẾN THỨC SEO MỚI NHẤT

Xu hướng marketing 2021: Những con số thống kê mới nhất

Thị trường marketing luôn chuyển động – công nghệ và các xu hướng marketing không ngừng thay đổi. Đó là ...

18/08/2021

Hiền Trần

Link Spam Update: Google cập nhật chuẩn Backlinks mới nhất

Google bắt đầu tung ra “link spam update”, giúp các thuật toán xác định và vô hiệu hóa spam liên ...

27/07/2021

Trương Ánh

Youtube algorithm – 20 sự thật đã được xác nhận về thuật toán Youtube

Youtube algorithm – thuật toán Youtube đã thay đổi rất nhiều trong vài năm qua để dần trở nên phù ...

26/07/2021

hoanganh