Bài 1: Tổng quan về các bộ máy tìm kiếm

Trong bài này, chúng ta sẽ tìm hiểu về

  • · World Wide Web là gì?
  • · Lịch sử và vai trò của công cụ tìm kiếm
  • · Sơ lược về dò quét, tạo chỉ mục và xây dựng thứ hạng
  • · Những tiến bộ gần đây của các công cụ tìm kiếm

World Wide Web là gì?

Về cơ bản, thế giới web là tập hợp các trang web và các file (thuộc rất nhiều định dạng khác nhau) được liên kết với nhau bởi hệ thống phức tạp của các liên kết hay links. 

Các file trên thế giới web này có thể thuộc những định dạng sau:

      • Hình ảnh
      • Videos
      •  File pdf
      • Video Flash
      • File Javascript

Với nhiều định dạng file khác nhau, nội dung trang web trở nên hấp dẫn hơn, thay vì thuần túy là văn bản. Việc này gây khó khăn cho máy tìm kiếm, đặc biệt vào thời điểm nó mới ra đời. Một phần vì kỹ thuật dò quét chưa thực sự phát triển.

Cho đến ngày nay, máy tìm kiếm vẫn gặp khó khăn với một vài định dạng file.

Là một người làm SEO, bạn cần biết những định dạng file nào mà máy tìm kiếm gặp khó khăn để không đưa những nội dung quan trọng vào các file này.

Lịch sử và vai trò của các máy tìm kiếm

Thế giới web mới ra đời trong hơn 20 năm.

Ngày đó, máy tìm kiếm vẫn chưa ra đời – các website được biết đến chỉ nhờ truyền miệng, hoặc nhờ một trang web danh bạ chứa địa chỉ của tất cả các trang web khác (web hub). Khi thế giới Internet vẫn còn nhỏ, việc này ko vấn đề gì. Nhưng khi thế giới này mở rộng mạnh mẽ vào những năm tiếp theo, một giải pháp mới là điều bắt buộc.

Trong suốt 1993/1994, những máy tìm kiếm đầu tiên đã ra đời bao gồm Excite, AltaVista và Yahoo!. Số lượng các trang web và người dùng tăng lên mạnh mẽ đến mức mà những trang web hub trở nên quá tải và không còn hiệu quả.

Năm 1996, Google ra đời. Đây là máy tìm kiếm đầu tiên nhận ra sức mạnh và vai trò của liên kết và sử dụng chúng để đánh giá độ uy tín của trang web. Đây chính là bước đột phá giúp tăng chất lượng bảng kết quả tìm kiếm.

Ba công việc chính của máy tìm kiếm: Dò quét, Xây dựng cơ sở dữ liệu và Xếp hạng

Về cơ bản:

Dò quét: Là quá trình máy tìm kiếm đi tìm những nội dung mới. Họ sử dụng những phần mềm có thể tự động ghé thăm các website và lần theo liên kết trên các trang web để tìm ra những nội dung khác.

Xây dựng cơ sở dữ liệu: Các máy tìm kiếm copy nội dung của các trang web mà chúng đã ghé thăm. Dữ liệu này được lưu trữ trên rất nhiều máy tính trong các trung tâm dữ liệu (data center) ở khắp nơi trên thế giới. Điều này giúp cho việc tìm kiếm trở nên nhanh chóng, dễ dàng hơn giúp bạn nhận được kết quả chỉ trong 1/2s hoặc ít hơn.

Xếp hạng: Đây là công việc mà các SEO quan tâm nhất. Khi một người tìm kiếm online, các cỗ máy này cần một thuật toán để đánh giá trang web nhằm xác định trang web nào liên quan nhất, và từ đó tính ra thứ hạng của trang web đó trên bảng kết quả

Những tiến bộ gần đây của công cụ tìm kiếm

Bên cạnh đó, kết quả tìm kiếm không phân biệt theo khu vực. Bất kỳ ai trong một đất nước tìm kiếm một sản phẩm hay dịch vụ đều nhận được một bảng kết quả như nhau.

Tuy nhiên, trong những năm gần đây, đã có một số thay đổi:

Mạng xã hội: Các trang mạng xã hội như Facebook và Twitter giúp máy tìm kiếm biết chính xác trang web nào đang được quan tâm. Máy tìm kiếm đã nhanh chóng cập nhật tín hiệu này vào thuật toán, giúp bảng kết quả trở nên chính xác hơn, cập nhật hơn.

Cá nhân hóa kết quả tìm kiếm: Tương tự, máy tìm kiếm thu thập lịch sử lướt web của người dùng. Lịch sử đó bao gồm: những cụm từ nào được họ tìm kiếm nhiều, những trang web nào họ hay ghé thăm và ở lại lâu. Từ đó, máy tìm kiếm có thể biết mức độ yêu thích của người dùng đối với các trang web. Kết quả là với cùng một cụm từ, bảng kết quả tìm kiếm của người này sẽ có khác biệt với bảng kết quả của người khác.

Ví dụ trang web vnexpress.net và 24h.com.vn. Tôi thích trang web này, bạn thích trang web khác. Chúng ta ai cũng có quan điểm của riêng mình.

Máy tìm kiếm đã tiến hóa rất nhiều trong những năm gần đây và từ đó thay đổi cách thức tìm kiếm của mọi người, đặc biệt là Google. Cỗ máy này đã trở nên thông minh hơn rất nhiều nhờ cơ chế tự học cũng như khả năng thu thập dữ liệu vượt trội giúp nó có thể cung cấp kết quả phù hợp nhất với mong muốn người dùng. Sự vượt trội này của Google thể hiện qua 2 tính năng dưới đây:

Google Suggets: Ra đời từ 8/2008. Khi bạn bắt đầu gõ, Google sẽ đề xuất từ khóa cho bạn, giúp bạn không mất nhiều thời gian mà vẫn biết được từ khóa nào phù hợp nhất cho mình.

Google Instant: Ra đời 9/2010, Google Instant thay đổi đáng kể cách tìm kiếm bằng cách ngay lập tức cung cấp kết quả dựa trên những ký tự mà người dùng gõ vào. Bạn sẽ thu được kết quả ngay khi gõ mà không cần nhấn Enter.

Là một chuyên gia SEO, bạn không chỉ cần biết những điều này, bạn còn phải nhận thức ảnh hưởng của nó đến công việc. Cụ thể, bạn cần phải biết cách tìm kiếm sẽ thay đổi như thế nào, cụm từ tìm kiếm sẽ thay đổi như thế khi những tính năng này ra đời.

Tags: