Công việc đang tuyển dụng Xem thêm

Hiểu về Htaccess, tối ưu SEO website đơn giản hơn rất nhiều

Tác giả : Hiền Trần   Kiểm tra bởi HieuND
1.2/5 - (4 bình chọn)
Ngày đăng: 26/07/2021

Trên đường đua khốc liệt cho vị trí top đầu của các công cụ tìm kiếm, tối ưu hóa SEO là việc không thể bỏ qua. Và đi theo nó sẽ là các công cụ bổ trợ và những giải pháp đặc thù, một mảng rất rộng những thuật ngữ mà mọi Marketer buộc phải nằm lòng. Htaccess hay file .htaccess là một trong số đó. Bài viết này sẽ đề cập đến mọi khía cạnh của .htaccess để bạn có thể tùy chỉnh và đạt được những kết quả tốt nhất trong việc tối ưu hóa công cụ tìm kiếm. Không mất thời gian thêm nữa, bắt đầu nào.

>>>Xem thêm: Wikipedia SEO và những điều bạn có thể chưa biết?

Những điều cần biết về .htaccess trong SEO

Htaccess là gì?

Về mặt kỹ thuật, htaccess là một tập tin được sử dụng để cấu hình thư mục trong các website apache. Bạn có thể dễ dàng tạo một tệp mới và ghi đè các tham số từ tệp htaccess của mình nếu các web hosting không cho phép bạn chỉnh sửa. Ngoài ra, nếu bạn tạo một file htaccess trên thư mục gốc của web server, nó sẽ được áp dụng cho toàn bộ trang web của bạn.

Kiểm soát htaccess tốt hơn với Directives

Directives cho phép bạn kiểm soát htaccess chặt chẽ hơn trong việc định cấu hình bằng cách sử dụng các dẫn xuất ngắn. Với các dẫn xuất này, bạn có thể bảo vệ tệp bằng mật khẩu, kiểm soát thu thập thông tin, cho phép hoặc cấm các địa chỉ IP,…

Kiểm soát htaccess tốt hơn với Directives

Tại sao cần tối ưu hóa SEO trong các tệp .htaccess?

Dưới đây là những lợi ích mà htaccess đem lại cho SEO:

Trình thu thập thông tin của công cụ tìm kiếm sẽ tiếp cận cách .htaccess xử lý chức năng trang web. Nếu htaccess được vận hành đúng, điều này sẽ giúp cải thiện xếp hạng website.

Với .htaccess, bạn có thể tạo ra URL mà công cụ tìm kiếm yêu thích.

Htaccess cũng có thể giải quyết lỗi 404 HTTPS và xử lý điều hướng 301.

Nó cũng được dùng để chặn người dùng sử dụng địa chỉ IP hoặc domain khỏi các spy solution của công cụ tìm kiếm.

htaccess có thể giải quyết lỗi 404

Backup trước khi chỉnh sửa .htaccess 

Chỉnh sửa .htaccess là một đề xuất rất phức tạp. Mặc dù nó có thể giúp cải thiện website, tuy nhiên cũng sẽ dẫn đến việc gặp lỗi máy chủ nội bộ 500 và khiến trang web không hoạt động nếu làm sai.

Để tránh điều này, sao lưu hay Backup file .htaccess là giải pháp tốt nhất trước khi thực hiện bất kỳ thay đổi nào

Tìm file .htaccess ở đâu?

Vị trí của tệp .htaccess tùy thuộc vào nền tảng bạn đang sử dụng. Thường thì nó sẽ ở thư mục gốc. Ví dụ: nếu bạn đang sử dụng WordPress, bạn sẽ tìm thấy nó trong WordPress installation directory. Đối với các nền tảng sử dụng cPanel, bạn có thể truy cập File Manager và đi đến thư mục gốc. Sau đó bật “Show Hidden Files” để truy cập tệp .htaccess.

Friendly URLs trong SEO 

URL đóng một vai trò rất quan trọng trong SEO. Theo Matt Cutts, các từ khóa xuất hiện trong URL cũng sẽ giúp tăng khả năng xếp hạng cao hơn. Đối với các chủ Blog, ông cũng đề xuất lưu ý về độ dài URL, nó phải ngắn gọn và clean, điều này sẽ giúp gợi ý cho các công cụ tìm kiếm rằng bạn đang quan tâm đến người đọc của mình.

Friendly URLs trong SEO 

Tối ưu hóa URL cho trang web

Bạn có thể tối ưu hóa tệp .htaccess để giải quyết vấn đề này bằng cách ghi đè các URL hiện tại bằng file extension và đảm bảo chúng được xử lý đúng cách. Để làm được điều đó, hãy sử dụng đoạn code sau trong tệp .htaccess của mình.

RewriteEngine On

Rewrite Rule ^topicname/ (a[a-zA-Z0-9]+)$ index.php?topic=$1

Nó sẽ chuyển đổi tất cả URL trang web của bạn thành như sau

www.yoursite.com/therulesyouchoosed/article.

Tối ưu CMS URLs

Nếu bạn đang sử dụng WordPress, Joomla hoặc bất kỳ CMS nào, việc tùy chỉnh các URL sẽ theo nhiều cách khác nhau. Bạn có thể thực hiện bằng cách thêm đoạn code sau vào tệp .htaccess.

RewriteEngine On

Rewrite Rule (.*)/$load_page.php?&page_id=$1

Sau khi file được cập nhật, các URL của bạn đã sẵn sàng để tối ưu hóa SEO một cách hiệu quả hơn.

Xóa .php và .html

Trên thực tế, các extension như .html và .php không có giá trị gì đối với người đọc, và nó cũng khiến họ khó ghi nhớ, do vậy bạn có thể cân nhắc việc xóa chúng đi.

Để xóa các extension, tất cả những gì bạn cần làm là sao chép đoạn mã dưới đây và đưa vào tệp .htaccess.

RewriteCond% {REQUEST_FILENAME}! -D

RewriteCond% {REQUEST_FILENAME} .php -f

RewriteCond% {REQUEST_FILENAME} .html -f

Viết lại Quy tắc ^ (. *) $ $ 1.html

Canonical robots.txt

Các file robot.txt nằm ở thư mục gốc, tuy nhiên các robot xấu hay những đoạn mã độc hại có thể quét toàn bộ trang web để tìm một tệp robot.txt và ăn hết tài nguyên trên website của bạn. Chắc chắn bạn sẽ không muốn nó xảy ra và điều này có thể được cải thiện với sự trợ giúp của canonical. 

Giải pháp canonical

Bạn có thể hướng dẫn người dùng tìm tệp robot.txt. bằng cách sử dụng .htaccess để giải quyết vấn đề liên tục yêu cầu truy cập. Bằng cách này, bạn cũng đang cải thiện SEO website của mình bằng cách cung cấp cho người dùng những gì họ muốn, đồng thời giảm tải lên server. Đoạn mã bạn cần dùng như sau:

RewriteBase /

RewriteCond %{REQUEST_URI} !^/robots.txt$ [NC]

RewriteCond %{REQUEST_URI} robots\.txt [NC]

RewriteRule .* http://yourmotocmswebsite.com/robots.txt [R=301,L]

Trong đoạn mã trên, tất cả những gì bạn cần làm là thay đổi “yourwebsite.com” thành URL trang web của bạn. URL phải là thư mục gốc website và bất kỳ ai cũng có thể truy cập được. Đoạn mã trên đã sử dụng rewrite module của Apache. Tuy nhiên, nếu bạn đang tìm kiếm một giải pháp thay thế gọn gàng hơn, có thể sử dụng mod_alias.

RedirectMatch 301 ^/(.*)/robots\.txt http://yourmotocmswebsite.com/robots.txt

Non-www redirect

Một trong những vấn đề cơ bản nhất mà hầu hết trang web gặp phải là chuyển hướng không có www. Nếu bạn đang kiểm tra trang web của mình, bạn cũng nên quan tâm đến vấn đề non-www redirect. Tin tốt là Canonical tag có thể sửa chữa điều này và bên cạnh đó, nó cũng giúp khắc phục sự cố trùng lặp URL trên trang web của bạn và cải thiện cấu trúc URL tổng thể của website

sử dụng .htaccess redirect non-www sang www bằng một trong hai đoạn mã sau

RewriteEngine onRewriteCond %{HTTP_HOST}!^www\.yourwebsite\.comRewriteRule(.*) http://www.yourmotocmswebsite.com/$1 [R=301,L]
RewriteEngine onRewriteCond %{HTTP_HOST} ^yourwebsite\.com [NC]RewriteRule(.*) http://www.yourmotocmswebsite.com/$1 [R=301,L]

Thay thế thuật ngữ “yourmotocmswebsite” bằng tên miền của mình.

Sử dụng canonical tags cho header tags và tệp PDF

Rel = ”canonical” cũng có thể được sử dụng để báo hiệu các canonical URLs và các tệp trong header tags cũng như PDFs hiệu quả hơn. Ví dụ: bạn có thể sử dụng canonical tags để trỏ các liên kết PDF sang HTML một cách đơn giản. Bằng cách này, người dùng không phải tải tệp xuống để kiểm tra. Tuy nhiên, để điều này xảy ra, bạn cần phải bật cả hai tùy chọn. Để kích hoạt, hãy sử dụng đoạn code bên dưới. 

Header and Link “; rel=”canonical””

Redirect bằng cách sử dụng .htaccess cho SEO

Trong phần này, chúng ta sẽ xem xét các chuyển hướng bằng cách chỉnh sửa file .htaccess để tránh lỗi 301 và 404. Điều này sẽ giúp đảm bảo người dùng không truy cập vào một liên kết hỏng và tạo điều kiện để trang web có thể đáp ứng các tiêu chuẩn do thuật toán Google đặt ra.

Với tư cách là chủ website, bạn có thể tùy chỉnh 404 bad request hoặc chuyển hướng đến trang chủ. Điều này cho phép người dùng có thể tìm lại trang chứa nội dung mà họ cần. Nếu thao tác chính xác, htaccess sẽ giúp giảm tỷ lệ thoát và cải thiện hiệu suất SEO cho website của bạn.

Thực hiện chuyển hướng cho tất cả các lỗi bao gồm:

400: yêu cầu không hợp lệ403: nội dung bị cấm
401: yêu cầu ủy quyền500: lỗi máy chủ

Tất cả những gì bạn cần làm chỉ đơn giản là thay đổi mã lỗi và thay đổi trang chuyển hướng được liên kết với nó thông qua đoạn code sau

ErrorDocument 402 /temp/page-unavailable-temporarily402

Chặn bots xấu

Không phải tất cả các bot đều tốt. Chúng có thể muốn thu thập dữ liệu từ trang web của bạn mà không cung cấp bất kỳ giá trị nào. Đó là lý do tại sao bạn cần chặn những bots xấu này. Htaccess cho phép bạn viết các dẫn xuất có thể ngăn chặn bot bằng cách sử dụng đoạn mã sau.

RewriteCond%{HTTP_USER_AGENT} ^BOTNAME [OR]

RewriteCond%{HTTP_USER_AGENT} ^BOTNAME1 [OR]

RewriteCond%{HTTP_USER_AGENT} ^BOTNAME3

RewriteRule ^.*-[F,L]

Sửa lỗi 301 redirects and 404 errors

“404 not found” sẽ xảy ra ngay cả khi bạn bảo trì trang web của mình hàng ngày. Trong khi đó redirect 301 sẽ giúp loại bỏ lỗi 404 bằng cách chuyển hướng trang cũ sang trang mới. Điều này vô hình chung sẽ giải quyết hai vấn đề:

1. Chuyển hướng thành công các trang web liên kết với trang cũ của bạn.

2. Chuyển hướng 301 hoạt động cho tất cả các công cụ tìm kiếm bao gồm cả Google.

Để làm được điều này, bạn cần viết mã code sau vào htaccess của mình

Redirect 301/information/old-article

http://www.yourmotocmssite.com/articles/new-article

Chuyển hướng sang trang web mới nhất

Các công cụ tìm kiếm sẽ thu thập dữ liệu ở rất nhiều địa chỉ khác nhau trên trang chủ của bạn, việc index này được thực hiện hầu như mọi lúc. Tất nhiên bạn sẽ không bao giờ muốn khách hàng truy cập vào phiên bản cũ của trang web. Đó là lý do tại sao bạn cần đảm bảo thực hiện chuyển hướng đến trang web mới nhất. Và tất cả những gì bạn cần làm là sử dụng mã sau trong tệp .htaccess của mình.

RewriteCond %{HTTP_Host} ^yoursite.com$ [NC]

RewriteCond ^(.*)$ http://www.yourmotocmssite.com/$1[R+301,L]

RewriteCond %{THE_REQUEST} ^.*/index

Rewriter ^(.*)index$ http://www.site.com/$1 [R=301, L]

Lưu ý: Đừng quên thay thế “yourmotocmssite” thành tên miền của bạn.

Chuyển hướng Sitemaps

Sitemaps cũng sẽ không thể tránh khỏi các bot xấu và bạn cần phải đảm bảo rằng máy chủ của bạn có thể giúp crawler tìm thấy chúng. Điều này sẽ giúp bạn giải phóng tài nguyên hệ thống và cũng đảm bảo tiết kiệm băng thông. Để giải quyết vấn đề này, hãy thêm mã sau vào tệp .htaccess của mình.

RedirectMatch 301 /sitemap\.xml$ http://yourmotocmssite.com/sitemap.xml

RedirectMatch 301 /sitemap\.xml\.gz$ http://yourmotocmssite.com/sitemap.xml.gz

Để sử dụng đoạn mã trên, bạn cần chỉnh sửa nó theo tên miền trang web và file paths bạn đang sử dụng. Dòng đầu tiên của mã được dùng để chuyển hướng yêu cầu đến một sitemap thông thường không được nén. Và dòng mã thứ 2 sẽ chuyển hướng đến phiên bản nén của sitemaps.

Cải thiện .htaccess cho SEO với Site Speed Caching

Ai cũng yêu tốc độ, kể cả người dùng hay các công cụ tìm kiếm. Do đó, nếu như bạn muốn được xếp hạng cao hơn, website của bạn phải có tốc độ tải nhanh. Và sử dụng caching sẽ giúp cải thiện điều đó. 

Caching là một phương pháp mà tài nguyên trang web được lưu trữ trong trình duyệt và nó sẽ không cần phải tải xuống khi người dùng yêu cầu. Bằng cách kích hoạt bộ nhớ đệm, bạn không chỉ có thể tăng tốc cho trang web của mình mà còn tiết kiệm thời gian xử lý của máy chủ.

Để kích hoạt bộ nhớ đệm, chúng ta sẽ sử dụng mod_headers và mod_expires. 

ExpiresActive In

ExpiresDefault A259200

Đoạn mã trên sẽ giúp bạn đặt thời gian hết hạn cho nội dung và nó tính bằng giây.

Robot Directives

Trang web của bạn có thể chứa các trang hoặc bài đăng mà bạn không muốn chia sẻ với người dùng hay thậm chí với công cụ tìm kiếm. Trong trường hợp này, bạn có thể muốn hạn chế quyền truy cập vào các tệp đó. Bạn có thể làm điều đó thông qua chỉnh sửa .htaccess. 

Header (“X-Robots-Tag: no index”, true);

Đoạn mã trên chỉ đơn giản là ẩn các tệp PHP do bạn tạo. Bạn cũng có thể định cấu hình máy chủ web bằng cách sử dụng mã sau:

Header set X-Robots-Tag “no index”

Bạn cũng có thể đặt các trang thành “no follow” nếu bạn muốn các trang đó không bị các công cụ tìm kiếm theo dõi.

Header (“X-Robots-Tag: no index, no follow”, true);

Chuyển hướng nguồn cấp dữ liệu sang FeedBurner

Chuyển hướng nguồn cấp dữ liệu đến Feedburner có thể giúp bạn tăng cường SEO trang web của mình. Bạn có thể tự động hóa toàn bộ quá trình nhờ vào .htaccess. 

# Feedburner redirection

 RewriteCond %{REQUEST_URI} ^/feed/ [NC]

 RewriteCond %{HTTP_USER_AGENT} !(FeedBurner|FeedValidator) [NC]

 RewriteRule .* http://feeds.feedburner.com/mainContentFeed [L,R=302]

 RewriteCond %{REQUEST_URI} ^/comments/feed/ [NC]

 RewriteCond %{HTTP_USER_AGENT} !(FeedBurner|FeedValidator) [NC]

 RewriteRule .* http://feeds.feedburner.com/allCommentsFeed [L,R=302]

Đối với các mã trên, bạn cần phải thay thế allCommentsFeed mainContentFeed với giá trị FeedBurner của mình

Cải thiện Crawl Mobile Content bằng Vary Header

Mobile serving có thể được cải thiện bằng cách sử dụng Vary Header. Nó chỉ đơn giản là nói với Google rằng bạn có một trang khác để phục vụ người dùng di động. Từ đó, Google sẽ xác định các trang một cách chính xác và thu thập dữ liệu phù hợp hơn. Điều này sẽ cải thiện trải nghiệm người dùng, tác động đến thứ hạng SEO của trang web.

Để kích hoạt tính năng này, tất cả những gì bạn cần làm là sao chép đoạn mã sau vào trong file .htaccess của mình.

Header append Vary User-Agent

Ngăn việc ăn cấp hình ảnh

Bạn cũng có thể định cấu hình .htaccess để ngăn các trang lấy hình ảnh từ website của bạn. Điều này sẽ giúp bạn cải thiện việc sử dụng băng thông máy chủ và nâng cao hiệu suất của nó. Để làm được như vậy, bạn cần sử dụng mã được đề cập bên dưới.

OnRewriteCond% {HTTP_REFERER}! ^ Http: //www.yourmotocmssite.com [NC]

RewriteCond% {HTTP_REFERER}! ^ Http: //yourmotocmssite.com [NC]

RewriteRule [^ /] +. (Gifljpg) – [F]

Htaccess có thể giúp bạn cải thiện SEO trang web của bạn theo nhiều cách. Trong bài viết hôm nay, chúng ta đã xem xét rất nhiều phương pháp như chuyển hướng, bộ nhớ đệm, canonical và SEO-friendly URLs. Htaccess có thể giải quyết lỗi hình ảnh, redirection, lỗi HTTP,…tất cả những vấn đề này đều ảnh hưởng đến trải nghiệm người dùng và liên quan trực tiếp đến SEO. Do đó, bạn nên thiết lập .htaccess của mình càng sớm càng tốt.

Kết luận

Chúng ta đã đi qua rất nhiều nội dung về Htaccess từ khái niệm, công dụng và quan trọng hơn hết là những giải pháp nó mang lại để hỗ trợ cho các ý định SEO. Rất hy vọng những thông tin này đem đến cho bạn những bài học bổ ích. Bạn có thể ghé thăm trang web chính thức của Top On Seek để đón đọc thêm nhiều bài viết hay về Digital Marketing hoặc đăng ký tư vấn và trải nghiệm dịch vụ SEO chuyên nghiệp từ chúng tôi để có những giải pháp tối ưu trong việc phát triển website và thu về lượng truy cập vượt trội.

Nguồn: https://www.motocms.com/blog/en/htacess-for-seo/

Thông tin tác giả

SEO content - công việc tôi khá yêu thích. Content là yếu tố không thể thiếu trong SEO. Nếu xem website của bạn là một ngôi nhà thì content chính là nội thất bên trong ngôi nhà đó. Content hay, hấp dẫn sẽ "giữ chân" khách hàng ở lại website để tìm hiểu và mua sản phẩm của bạn. Vì vậy, tôi đã không ngừng cố gắng để làm sao có được content chất lượng nhất cho website tôi thực hiện.

Bài viết liên quan

Miễn phí kiểm tra lỗi SEO













Nhận báo giá SEO

Cần dịch vụ SEO?

 Tư vấn chiến lược SEO

Liên hệ

 Viết Content SEO

 Viết Content SEO

Liên hệ

KIẾN THỨC SEO NỔI BẬT

Celeb là gì? Nghệ thuật sử dụng Celeb trong truyền thông – Marketing

Đối với các chiến lược gia trong doanh nghiệp, việc lên kế hoạch để quảng bá sản phẩm luôn là ...

30/05/2023

Lê Thị Kim Thoa
Key visual là gì? “Bí kíp” tạo key visual thu hút khách hàng

Trong bất cứ chiến dịch Marketing nào thì doanh nghiệp cũng mong muốn những hình ảnh quảng cáo sản phẩm ...

24/05/2023

Thảo Phạm
Mức lương của nhân viên QA hiện nay và cơ hội nghề nghiệp

Bạn đã xem qua bài viết tháng 12 cung gì và biết được sự phù hợp trong tính cách của ...

03/02/2023

Thảo Phạm

KIẾN THỨC SEO MỚI NHẤT

Disavow Link là gì? Cách Disavow Link gỡ phạt thuật toán Google

Disavow Link là gì? Disavow Link (nghĩa là: từ chối liên kết) là một công cụ của Google Search Console, ...

25/04/2024

Hải Yến
Thuê SEO Website: Nên Thuê hay Tự Làm? Bảng Giá Chi Tiết

Để website phát huy hiệu quả tối đa, thu hút khách hàng tiềm năng và gia tăng doanh thu, doanh ...

22/04/2024

Ngọc Hiền
Navigation là gì? 8 Mẹo xây dựng Web Navigation đơn giản nhất

Navigation là một khía cạnh rất quan trọng đối với cả người dùng và các nhà phát triển website. Khi ...

19/04/2024

Lan Anh