Trang chủ arrow Tản mạn arrow PANVIETNAM - CÔNG CỤ TRA CỨU ĐOẠT GIẢI THƯỞNG KHOA HỌC KỸ THUẬT
PANVIETNAM - CÔNG CỤ TRA CỨU ĐOẠT GIẢI THƯỞNG KHOA HỌC KỸ THUẬT
15/02/2008

PanVietnam là một hệ thống máy truy tìm dữ liệu toàn văn có hỗ trợ tiếng Việt, tương tự các hệ thống google.com, altavista.com...

Mục tiêu chính của hệ thống nhằm cung cấp máy truy tìm dữ liệu thông tin toàn văn có hỗ trợ tiếng Việt cho các hệ thống thông tin điện tử chuyên sâu như thư viện điện tử, thông tin trên đĩa CD-ROM, trong cơ sở dữ liệu hoặc một số hệ thống thông tin điện tử như báo điện tử...

Hệ thống được phát triển bởi Nguyễn Thế Vinh.

Tại http://www.panvietnam.com/, người sử dụng chỉ cần nhập từ hoặc cụm từ tìm kiếm, PanVietNam sẽ tìm trong 2.000 website để cung cấp một danh sách kết quả. Danh sách này có thể lên tới 15 triệu trang tài liệu dưới dạng HTML, và trang nào liên quan nhiều nhất với thông tin cần tìm kiếm sẽ được xuất hiện đầu tiên.

Được Công ty Netnam giới thiệu vào đầu tháng 11, hệ thống này hỗ trợ tiếng Việt với ba bộ mã chính: Unicode, TCVN và VNI. Nó cũng được trang bị những công nghệ mới nhất trong tìm kiếm thông tin gồm các giải thuật lập chỉ mục cơ sở dữ liệu, xử lý song song, lọc bỏ tạp nhiễu và trùng lặp, cơ chế trả lời kết quả thông minh. Số lượng tài liệu được tìm kiếm không hạn chế.

Hệ thống được chia thành ba tầng chính, gồm tầng: thu thập thông tin, nhận dạng và chuyển đổi thông tin thành dạng text, lập cơ sở dữ liệu cho các thông tin text. Mỗi tầng được chia thành nhiều đơn vị độc lập, hoạt động theo kiểu chia sẻ tính toán hoặc dự trữ (redundant). Vì vậy, nó cũng thực hiện cung cấp dịch vụ tìm kiếm cho từng website tùy theo yêu cầu cụ thể.

Nhóm Tứ Hải


Tin liên quan

Các bài mới:

Các bài đã đăng:

 
< Trước   Tiếp >