Xem trước tài liệu

Đang tải tài liệu...

Thông tin chi tiết tài liệu

Định dạng: PDF
Số trang: 25 trang
Dung lượng: 315 KB

Giới thiệu nội dung

Ứng dụng kỹ thuật thu thập thông tin trên web để xây dựng hệ thống tổng hợp thông tin kinh tế xã hội

Tác giả: NGUYỄN HỒ HIẾU

Lĩnh vực: KHOA HỌC MÁY TÍNH

Nội dung tài liệu:
Luận văn tập trung vào việc xây dựng hệ thống tự động tổng hợp thông tin trực tuyến từ các website, nhằm hỗ trợ công tác theo dõi, quản lý và chỉ đạo của lãnh đạo. Hệ thống sử dụng kỹ thuật khai phá dữ liệu web để tự động trích xuất tin tức theo các chủ đề được chọn, cho phép quản lý chuyên mục tin, kênh tin tức và thông tin lưu trữ, đồng thời hỗ trợ tìm kiếm thông tin đã lưu trữ. Đề tài nghiên cứu về khai phá dữ liệu web, các thuật toán phân cụm tài liệu và ứng dụng trong truy xuất thông tin tự động, từ đó xây dựng hệ thống tổng hợp thông tin kinh tế – chính trị – xã hội.

Mục lục chi tiết:

  • MỞ ĐẦU
  • CHƯƠNG 1. TỔNG QUAN
    • 1.1. TỔNG QUAN VỀ KHAI PHÁ DỮ LIỆU
      • 1.1.1. Giới thiệu
      • 1.1.2. Các dạng dữ liệu
      • 1.1.3. Các bài toán thông dụng trong khai phá dữ liệu
        • 1.1.3.1. Phân lớp (Classification).
        • 1.1.3.2. Dự đoán (Prediction).
        • 1.1.3.3. Tìm luật liên kết (Association Rule)
        • 1.1.3.4. Phân cụm (Clustering)
      • 1.1.4. Ứng dụng của khai phá dữ liệu
    • 1.2. PHÂN CỤM TÀI LIỆU
      • 1.2.1. Phân cụm tài liệu
      • 1.2.2. Biểu diễn tài liệu trong mô hình không gian vector
        • 1.2.2.1. Khái niệm
        • 1.2.2.2. Hàm tương tự giữa hai vector tài liệu trong không gian
      • 1.2.3. Các thuật toán ứng dụng trong phân cụm tài liệu
        • 1.2.3.1. Phân cụm dữ liệu không gian và các tiếp cận
        • 1.2.3.2. Phân cụm dữ liệu dựa vào thuật toán K-means
    • 1.3. THU THẬP THÔNG TIN TRÊN WEB
      • 1.3.1. Giới thiệu tổng quan về thu thập thông tin trên web
      • 1.3.2. Quá trình thu thập thông tin trên web
      • 1.3.3. Các kỹ thuật crawling và indexing
    • 1.4. KHẢO SÁT MỘT SỐ PHẦN MỀM TỔNG HỢP TIN
      • 1.4.1. Google Reader
      • 1.4.2. iGoogle
      • 1.4.3. Yahoo
  • CHƯƠNG 2. THIẾT KẾ GIẢI PHÁP XÂY DỰNG HỆ THỐNG THU THẬP THÔNG TIN KINH TẾ XÃ HỘI
    • 2.1. PHÂN TÍCH VÀ XÁC ĐỊNH YÊU CẦU
      • 2.1.1. Đặt vấn đề
      • 2.1.2. Xác định yêu cầu của Hệ thống