Chương I: SE hoạt động như thế nào?
SE có 4 chức năng chính đó là khảo sát thông tin - crawl, lưu trữ - index, phân tích – canculating relevancy and rankings và trả kết quả - serving results.

1.Khảo sát và lưu trữ
Hãy tưởng tượng World Wide Web như một mạng lưới các điểm dừng trong hệ thống tàu điện ngầm của một thành phố lớn. Mỗi điểm dừng là một kho tài liệu của nó (thường là một trang web, nhưng đôi khi là một file JPG, PDF hoặc khác). Các SE cần thu thập thông tin trong toàn bộ thành phố và đảm bảo phải tìm trong tất cả các điểm dừng trên đường đi, vì vậy chúng sử dụng cách hữu hiệu nhất – thành lập các liên kết.
"Cấu trúc liên kết của website được dùng để kết nối tất cả các trang lại với nhau"
(Hoặc, ít nhất là những gì mà công cụ tìm kiếm có thể truy cập.) Thông qua liên kết, các bọ tìm kiếm, hay còn gọi là "bọ thu thập", hoặc "con nhện" có thể tìm tới hàng tỷ trang web đã được liên kết với nhau.
Một khi công cụ tìm kiếm đã tìm đến được các trang này, công việc tiếp theo của nó là phân tích các đoạn mã và lưu trữ một cách có chọn lọc các tài liệu vào trong các ổ đĩa vô cùng lớn, và sau đó sẽ được đưa ra khi có một yêu cầu truy vấn. Để hoàn thành nhiệm vụ liên kết hàng tỷ trang trong một phần nhỏ của một giây, các công cụ tìm kiếm đã xây dựng trung tâm dữ liệu lớn tại các thành phố trên toàn thế giới.
(Hoặc, ít nhất là những gì mà công cụ tìm kiếm có thể truy cập.) Thông qua liên kết, các bọ tìm kiếm, hay còn gọi là "bọ thu thập", hoặc "con nhện" có thể tìm tới hàng tỷ trang web đã được liên kết với nhau.
Một khi công cụ tìm kiếm đã tìm đến được các trang này, công việc tiếp theo của nó là phân tích các đoạn mã và lưu trữ một cách có chọn lọc các tài liệu vào trong các ổ đĩa vô cùng lớn, và sau đó sẽ được đưa ra khi có một yêu cầu truy vấn. Để hoàn thành nhiệm vụ liên kết hàng tỷ trang trong một phần nhỏ của một giây, các công cụ tìm kiếm đã xây dựng trung tâm dữ liệu lớn tại các thành phố trên toàn thế giới.
Các cơ sở lưu trữ này nắm giữ hàng ngàn loại máy để có thể làm việc với lượng thông tin khổng lồ. Nhưng đối với khách hàng, họ yêu cầu phải có được kết quả ngay sau khi gõ câu truy vấn và nếu bắt họ phải chờ chỉ trong khoảng 3-4 giây, nhất định họ sẽ cảm thấy không hài lòng. Chính vì vậy các SE luôn phải làm việc hết sức mình để đáp ứng nhu cấu khách hang càng nhanh càng tốt

2.Phân tích và trả kết quả
Khi có yêu cầu truy vấn, các công cụ tìm kiếm sẽ lọc trong ngân hàng dữ liệu các thông tin có liên quan và trả kết quả theo 2 bước, bước thứ nhất chỉ trả những kết quả có liên quan nhất, thứ hai là sắp xếp thông tin theo mức độ liên quan (hay tầm quan trọng). Cả 2 yếu tố “ liên quan” và “ quan trọng” đều có ảnh hưởng đến quá trình tối ưu hóa của công cụ tìm kiếm.
Đối với các công cụ tìm kiếm, sự liên quan có nghĩa hơn việc chỉ hiển thị một trang web chứa thông tin mà người dùng cần. Trước đây các công cụ tìm kiếm chưa đi xa hơn bước này và do vậy kết quả có được thường không làm người tìm kiếm hài lòng. Chình vì sự lặp đi lặp lại này mà các kỹ sư chuyên nghiệp của các SE đã nghĩ ra cách tốt hơn để mang lại kết quả tốt nhất khiến khách hàng không những hài lòng mà cón đánh giá rất cao. Trong cuốn sách này chúng ta sẽ bàn luận đến những phương thức đó.
Tầm quan trọng cũng được đánh giá ngang bằng với việc định lượng, tuy nhiên các công cụ tìm kiếm phải làm tốt cả hai điều này.
Hiện nay, các SE đánh giá cao tầm quan trọng của tính phổ biến. Một trang web hoặc tài liệu càng phổ biến, thông tin chứa trong đó càng có giá trị. Giả thuyết này đã chứng minh một thực tế là các SE đang ngày càng được đánh giá cao cũng như có được sự hài lòng của người sử dụng bằng cách sử dụng các số liệu có tính phổ biến cao.
Thật may là tầm quan trọng và tính phổ biến không được đánh giá bằng phương pháp thủ công nếu không thế giới sẽ phải cần đến hàng tỷ người để làm công việc này.Thay vì phải tự mình đánh giá chất lượng, bác nông dân đã có những cỗ máy được lập trình sẵn các công thức để cẩn thận phân loại và sau đó xếp hạng lúa mì. Các công thức này thường bao gồm hàng trăm yếu tố mà trong lĩnh vực tiếp thị và tìm kiếm, chúng ta thường gọi là "yếu tố để đánh giá xếp hạng" Đối với những người đặc biệt quan tâm, SEOmoz có những tài liệu chuyên biệt về chủ đề này -
Các Yếu tố Xếp hạng Công cụ Tìm kiếm.

Bạn có thể thấy rằng công cụ tìm kiếm hiển thị kết quả bang Ohio là trang có liên quan và phổ biến nhất
cho truy vấn "Các trường Đại học" trong khi truy vấn “Đại học Harvard” thì ít phổ biến hơn.
Làm sao để bạn cũng như những người học và nghiên cứu SEO có được thành công?

Các thuật toán phức tạp của SE luôn khiến người ta nhức đầu, và bản thân các SE cũng ít khi tiết lộ bí quyết làm sao để đạt được kết quả tốt hoặc traffic nhiều hơn . Dưới đây là một vài thông tin về tối ưu hóa và cách thực hiện mà các SE cung cấp:
Thông tin từ YAHOO! Hướng dẫn của Webmaster.

Có rất nhiều yếu tố ảnh hưởng việc một trang web có được xuất hiện trong kết quả tìm kiếm web hay không và khi nào hay ở đâu nó sẽ bị tụt hạng. Những yếu tố đó có thể bao gồm:
• Số lượng các trang web khác liên kết đến nó
• Nội dung của các trang
• Các cập nhật được index
• Những thay đổi của trang khi thử nghiệm các phiên bản mới
• Việc SE phát hiện ra các trang web mới
• Thay đổi thuật toán tìm kiếm và một vài yếu tố khác
• Số lượng các trang web khác liên kết đến nó
• Nội dung của các trang
• Các cập nhật được index
• Những thay đổi của trang khi thử nghiệm các phiên bản mới
• Việc SE phát hiện ra các trang web mới
• Thay đổi thuật toán tìm kiếm và một vài yếu tố khác
Thông tin từ BING. Hướng dẫn củaWebmaster.

Kỹ sư của Bing (Microsoft) cho biết một vài cách để có được thứ hạng tốt hơn trong SE của họ:
• Trong bài viết, chọn một vài từ khóa phổ biến mà khách hàng có thể dùng như thuật ngữ truy vấn và sẽ giúp dẫn độc giả về trang web của bạn.
• Thiết kế các trang với kích thước phù hợp. Mỗi trang chỉ nên có một chủ đề. Chúng tôi khuyến nghị chỉ nên có một chủ đề cho mỗi trang. Một trang HTML không có hình ảnh chỉ nên có dung lượng dưới 150 kb.
• Hãy chắc chắn rằng mỗi trang có thể truy cập bởi ít nhất một liên kết văn bản tĩnh.
• Không đặt các văn bản mà bạn muốn index bên trong hình ảnh. Ví dụ, nếu bạn muốn tên công ty của bạn hoặc địa chỉ được index, phải đảm bảo nó không được hiển thị bên trong logo của công ty.
• Thiết kế các trang với kích thước phù hợp. Mỗi trang chỉ nên có một chủ đề. Chúng tôi khuyến nghị chỉ nên có một chủ đề cho mỗi trang. Một trang HTML không có hình ảnh chỉ nên có dung lượng dưới 150 kb.
• Hãy chắc chắn rằng mỗi trang có thể truy cập bởi ít nhất một liên kết văn bản tĩnh.
• Không đặt các văn bản mà bạn muốn index bên trong hình ảnh. Ví dụ, nếu bạn muốn tên công ty của bạn hoặc địa chỉ được index, phải đảm bảo nó không được hiển thị bên trong logo của công ty.
Lời khuyên của Google để có được thứ hạng tốt hơn:

• Thiết kế trang chủ cho người sử dụng, không phải cho công cụ tìm kiếm.

• Thiết kế trang chủ cho người sử dụng, không phải cho công cụ tìm kiếm.
• Thiết kế trang web với một hệ thống phân cấp rõ ràng và liên kết văn bản. Mỗi trang nên được truy cập từ ít nhất một liên kết văn bản tĩnh.
• Tạo một trang web với thông tin phong phú, hữu ích, và trình bày các trang rõ ràng và mô tả chính xác nội dung sản phẩm, dịch vụ của bạn. Hãy chắc chắn rằng các yếu tố và thuộc tính ALT được mô tả chính xác.
• Các liên kết trên một trang nên ở mức độ hợp lý (ít hơn 100).
• Tạo một trang web với thông tin phong phú, hữu ích, và trình bày các trang rõ ràng và mô tả chính xác nội dung sản phẩm, dịch vụ của bạn. Hãy chắc chắn rằng các yếu tố và thuộc tính ALT được mô tả chính xác.
• Các liên kết trên một trang nên ở mức độ hợp lý (ít hơn 100).
Các SEM đã làm gì?
SE đã ra đời và tồn tại trong hơn 12 năm, các SEM cũng đã tìm hiểu và biết đuợc thông tin về cách xếp hạng website và sử dụng các phương pháp đó để cải thiện web của mình đồng thời cũng giúp khách hàng đạt được vị trí tốt hơn.
Thật ra các SE cũng hỗ trợ ít nhiều mặc dù tần suất của việc giúp đỡ này không nhiều. Các hội nghị về tiếp thị tìm kiếm như Hội chợ triển lãm Search Marketing, WebMasterWorld, chiến lược Công cụ Tìm kiếm, Hội thảo Đào tạo SEO của SEOmoz thu hút nhiều kỹ sư và đại diện từ các SE chính. Đại diện tìm kiếm cũng hỗ trợ quản trị web bằng cách thỉnh thoảng tham dự các buổi giao lưu trực tuyến trong blog, diễn đàn và các nhóm.
Thật ra các SE cũng hỗ trợ ít nhiều mặc dù tần suất của việc giúp đỡ này không nhiều. Các hội nghị về tiếp thị tìm kiếm như Hội chợ triển lãm Search Marketing, WebMasterWorld, chiến lược Công cụ Tìm kiếm, Hội thảo Đào tạo SEO của SEOmoz thu hút nhiều kỹ sư và đại diện từ các SE chính. Đại diện tìm kiếm cũng hỗ trợ quản trị web bằng cách thỉnh thoảng tham dự các buổi giao lưu trực tuyến trong blog, diễn đàn và các nhóm.
Thử nghiệm
Có lẽ không có công cụ nào tốt hơn cho các quản trị web nghiên cứu hoạt động của SE bằng việc tự do sử dụng chính các SE để thực hiện thí nghiệm, kiểm tra lý thuyết và thăm dò ý kiến. Và nếu siêng năng thì thông qua hình thức này các quản trị web sẽ có đuợc một luợng kiến thức không hề nhỏ.
• Đăng ký một trang web mới với các từ khóa vô nghĩa (ví dụ như ishkabibbell.com)
• Trong trang, tạo nhiều trang phụ và tất cả đều chứa một thuật ngữ mơ hồ (ví dụ như yoogewgally)
• Kiểm tra các chức năng, định dạng, từ khóa, cấu trúc liên kết của trang và làm cho các trang phụ thống nhất lại với nhau.
• Điểm các liên kết được lập chỉ mục và các trang đã được index trên các domain khác.
• Ghi lại hoạt động của công cụ tìm kiếm và bảng xếp hạng của trang.
• Tạo một số thay đổi nhỏ cho các trang có nội dung gần giống nhau để xác định những yếu tố có thể ảnh hưởng đến thứ hạng
• Ghi lại tất cả các kết quả khả quan và thử nghiệm lại trên các domain khác - nếu các thử nghiệm liên tục trả lại kết quả tương tự, có nghĩa là bạn đã phát hiện ra một mô hình được sử dụng bởi các công cụ tìm kiếm.
Một thử nghiệm nhanh
Bắt đầu với giả thuyết rằng một link được đặt ở vị trí cao (đầu trang chẳng hạn) sẽ có giá trị hơn. Chúng tôi thử nghiệm điều này bằng cách tạo ra một tên miền liên kết đến ba trang, tất cả đều chứa cùng một từ khóa bất kỳ. Sau khi được index, chúng tôi nhận thấy các trang có link ở vị trí cao trên trang chủ được xếp hạng trước và sau đó tiếp tục lặp đi lặp lại thử nghiệm cũng đều cho thấy kết quả tương tự.
Đây chỉ là một trong nhiều thử nghiệm để các SEM có thể tham khảo .
thông tin về những thủ thuật mà SE sử dụng và cách thức sắp xếp kết quả được thực hiện bởi các SE đã được Văn phòng Bằng sáng chế Hoa Kỳ cấp bằng . Có lẽ nổi tiếng nhất trong số này là hệ thống đã sinh ra nguồn gốc của Google cuối những năm 1990 - PageRank - được cấp bằng sáng chế # 6285999 – đây là phương pháp xếp hạng chính cho một cơ sở dữ liệu liên kết. Một số tài liệu về chủ đề này ví dụ như Công cụ phân tích một trang web có siêu liên kết trên quy mô lớn cũng đang được nghiên cứu và làm rõ. Một số SEM chuyên nghiệp cũng gặp không ít khó khăn trong việc hiểu rõ cá thuật toán đó, và thật ra tối ưu hóa công cụ tìm kiếm không nhất thiết phải khắc phục tất cả các hệ quả của những thuật toàn này.
Thông qua các phương pháp như phân tích bằng sáng chế, thí nghiệm và điều chỉnh trực tiếp, cộng đồng SEM đã nắm được những hoạt động cơ bản của công cụ tìm kiếm và các yếu tố quan trọng để tạo ra trang web có thứ hạng cao cũng như traffic tốt.


Phần sau của hướng dẫn này sẽ dành để giải thích các bước thực hành một cách rõ ràng và chính xác. Hãy tìm hiểu!
theo: dichvumarketing.net
0 nhận xét:
Post a Comment