|
|
| Thứ sáu, 02 Tháng 1 2009 17:29 |
|
| Số lượng máy tìm kiếm có thể cạnh tranh vá»›i Google chỉ có thể đếm trên đầu ngón tay. Khi không thể cạnh tranh theo kiểu “trá»±c diệnâ€, meta search engine - tạm dịch là máy tìm kiếm liên hợp - là má»™t giải pháp mà nhiá»u ngưá»i muốn nhắm đến. Má»™t máy tìm kiếm (search engine) thưá»ng có 3 thà nh phần chÃnh: - Thứ nhất là web crawling, thà nh phần chuyên thu tháºp các trang web có trên Internet;
- Thứ hai là indexing, thà nh phần rút trÃch các đặc trưng cá»§a các trang web (và dụ tiêu Ä‘á», từ khóa tiêu biểu) và lưu trữ và o cÆ¡ sở dữ liệu để phục vụ cho nhu cầu tìm kiếm sau nà y;
- Thứ ba là searching, thà nh phần tìm các trang web phù hợp/liên quan đến nhu cầu cá»§a ngưá»i dùng (thông qua việc gõ và o các từ khóa trong ô tìm kiếm).
|
|
|
|
|
| Thứ sáu, 02 Tháng 1 2009 17:27 |
|
| Chương 2 tiêp theo chương má»™t “Tổng quan vá» hệ thống Search Engine†cá»§a loạt bà i viết vá» máy tìm kiếm “Tìm hiểu vá» Search Engine và xây dá»±ng ứng dụng minh hoạ cho Search Engine tiếng Việt“. Ứng dụng cá»§a Robot Robot thưá»ng được sá» dụng cho những mục Ä‘Ãch sau : Phân tÃch, thống kê – Statistical Analysis Robot đầu tiên được dùng để đếm số lượng web server, số tà i liệu trung bình cá»§a má»™t server, tỉ lệ các dạng file khác nhau, kÃch thước trung bình cá»§a má»™t trang web, độ kết dÃnh, … |
|
|
|
|
| Thứ sáu, 02 Tháng 1 2009 17:21 |
|
| Chương 1 trong luáºn văn “Tìm hiểu vá» Search Engine và xây dá»±ng ứng dụng minh hoạ cho Search Engine tiếng Việt†Các bá»™ pháºn cấu thà nh hệ thống máy tìm kiếm search engine Bá»™ thu tháºp thông tin – Robot Robot là má»™t chương trình tá»± động duyệt qua các cấu trúc siêu liên kết để thu tháºp tà i liệu & má»™t cách đệ quy nó nháºn vá» tất cả tà i liệu có liên kết vá»›i tà i liệu nà y. |
|
|
|
Các bà i viết khác...
|
|
|
JPAGE_CURRENT_OF_TOTAL |