Chủ nhật, 01 Tháng 8 2010

Meta Search Engine - Máy tìm kiếm liên hợp

Thứ sáu, 02 Tháng 1 2009 17:29   

Số lượng máy tìm kiếm có thể cạnh tranh vá»›i Google chỉ có thể đếm trên đầu ngón tay. Khi không thể cạnh tranh theo kiểu “trá»±c diệnâ€, meta search engine - tạm dịch là máy tìm kiếm liên hợp - là má»™t giải pháp mà nhiá»u ngưá»i muốn nhắm đến.

Má»™t máy tìm kiếm (search engine) thưá»ng có 3 thành phần chính:

  • Thứ nhất là web crawling, thành phần chuyên thu thập các trang web có trên Internet;
  • Thứ hai là indexing, thành phần rút trích các đặc trưng cá»§a các trang web (ví dụ tiêu Ä‘á», từ khóa tiêu biểu) và lưu trữ vào cÆ¡ sở dữ liệu để phục vụ cho nhu cầu tìm kiếm sau này;
  • Thứ ba là searching, thành phần tìm các trang web phù hợp/liên quan đến nhu cầu cá»§a ngưá»i dùng (thông qua việc gõ vào các từ khóa trong ô tìm kiếm).
Äá»c thêm...
 

Tìm Hiểu VỠSearch Engine ( Chương II )

Thứ sáu, 02 Tháng 1 2009 17:27   

Chương 2 tiêp theo chương một “Tổng quan vỠhệ thống Search Engine†của loạt bài viết vỠmáy tìm kiếm “Tìm hiểu vỠSearch Engine và xây dựng ứng dụng minh hoạ cho Search Engine tiếng Việt“.

Ứng dụng của Robot

Robot thưá»ng được sá»­ dụng cho những mục đích sau :

Phân tích, thống kê – Statistical Analysis

Robot đầu tiên được dùng để đếm số lượng web server, số tài liệu trung bình của một server, tỉ lệ các dạng file khác nhau, kích thước trung bình của một trang web, độ kết dính, …

Äá»c thêm...
 

Tìm Hiểu VỠSearch Engine ( Chương I )

Thứ sáu, 02 Tháng 1 2009 17:21   

Chương 1 trong luận văn “Tìm hiểu vá» Search Engine và xây dá»±ng ứng dụng minh hoạ cho Search Engine tiếng Việtâ€

Các bộ phận cấu thành hệ thống máy tìm kiếm search engine

Bộ thu thập thông tin – Robot

Robot là một chương trình tự động duyệt qua các cấu trúc siêu liên kết để thu thập tài liệu & một cách đệ quy nó nhận vỠtất cả tài liệu có liên kết với tài liệu này.

Äá»c thêm...
 


JPAGE_CURRENT_OF_TOTAL