Xem trước tài liệu

Đang tải tài liệu...

Thông tin chi tiết tài liệu

Định dạng: PDF

Số trang: 17 trang

Dung lượng: Đang cập nhật

Giới thiệu nội dung

Tiếp cận khai phá dữ liệu văn bản và ứng dụng phương pháp Naive Bayes trong bộ lọc thư rác tự động

Tác giả: Nguyễn Thị Thanh Tâm

Lĩnh vực: Truyền dữ liệu và mạng máy tính

Nội dung tài liệu:

Luận văn này tập trung vào việc khai phá dữ liệu văn bản, một lĩnh vực khoa học liên ngành mới nổi nhằm giải quyết vấn đề “ngập lụt thông tin” do sự phát triển mạnh mẽ của công nghệ thông tin và Internet. Nghiên cứu đi sâu vào việc ứng dụng phương pháp Naive Bayes để xây dựng bộ lọc thư rác tự động, giải quyết vấn đề thư rác (spam) ngày càng gia tăng trên thư điện tử.

Luận văn đã trình bày các kiến thức cơ bản về khai phá dữ liệu văn bản, các bài toán liên quan như phân loại văn bản, tìm kiếm văn bản. Đặc biệt, nghiên cứu tập trung vào thuật toán Naive Bayes, bao gồm cơ sở lý thuyết, cách thức hoạt động và các bước xây dựng bộ lọc thư rác sử dụng thuật toán này.

Ngoài ra, luận văn còn giới thiệu một số công nghệ lọc thư rác hiện nay và tiến hành thử nghiệm ứng dụng Naive Bayes trên kho dữ liệu PU, cũng như giới thiệu phần mềm lọc thư rác Spam Reader 3.0. Các kết quả thử nghiệm đã cho thấy hiệu quả của phương pháp Naive Bayes trong việc phân loại thư rác.

Luận văn cũng đề cập đến hướng phát triển tiếp theo, bao gồm việc xây dựng Email Client có khả năng lọc thư rác tự động và nghiên cứu các phương pháp xử lý dữ liệu lớn trong khai phá dữ liệu văn bản.

Mục lục chi tiết:

Chương 1: Tổng quan về khai phá dữ liệu văn bản
Chương 2: Một số cơ sở lý thuyết và phương pháp phân loại văn bản
Chương 3: Ứng dụng phương pháp Naive Bayes trong bộ lọc thư rác tự động
Kết luận và hướng phát triển

Kinh tế - Quản trị - Quản lý

Tài chính - Ngân hàng - Kế toán

Kỹ thuật - Công nghệ

Giáo dục - Sư phạm

Y học - Dược học

Khoa học Xã hội - Nhân văn

Nông - Lâm - Ngư nghiệp

Khoa học Tự nhiên

Luật - Hành chính

Công nghệ thông tin

Kiến trúc - Xây dựng

Môi trường - Tài nguyên

Khác

Ngôn ngữ - Văn học

Điều dưỡng - Y tế công cộng

Kinh tế - Quản trị - Quản lý

Tài chính - Ngân hàng - Kế toán

Kỹ thuật - Công nghệ

Giáo dục - Sư phạm

Y học - Dược học

Khoa học Xã hội - Nhân văn

Nông - Lâm - Ngư nghiệp

Khoa học Tự nhiên

Luật - Hành chính

Công nghệ thông tin

Kiến trúc - Xây dựng

Môi trường - Tài nguyên

Khác

Ngôn ngữ - Văn học

Điều dưỡng - Y tế công cộng

Xem trước tài liệu

Thông tin chi tiết tài liệu

Giới thiệu nội dung

Tiếp cận khai phá dữ liệu văn bản và ứng dụng phương pháp Naive Bayes trong bộ lọc thư rác tự động

Tài liệu liên quan

Khóa luận tốt nghiệp: Ứng dụng công nghệ thông tin trong công tác văn thư tại Văn phòng Bộ Khoa học và công nghệ

Luận văn Thạc sĩ Khoa học máy tính: Nghiên cứu một số thuật toán phân cụm dữ liệu nửa giám sát và ứng dụng phân đoạn ảnh X-quang

Luận án Tiến sĩ Kế toán: Ảnh hưởng của Hệ thống thông tin kế toán đến hiệu quả hoạt động của các doanh nghiệp nhỏ và vừa Việt Nam

Luận văn: Một số phương pháp tiếp cận bài toán xử lý trùng lặp, phân loại tin tức, xác định từ khóa quan trọng và chọn câu tóm tắt

Luận án Tiến sĩ Quản lý kinh tế: Quản lý nhà nước của chính quyền cấp tỉnh về ứng dụng công nghệ thông tin trong các cơ quan hành chính nhà nước

Tóm tắt Đồ án tốt nghiệp Công nghệ thông tin: Xây dựng phần mềm quản lý quán café bằng ngôn ngữ lập trình C#

Luận án Thạc sĩ Công nghệ thông tin: Xây dựng ứng dụng kiểm thử phần mềm tự động sử dụng selenium và webdriver

Chuyên đề Tiến sĩ: Các phương pháp số giải phương trình vi phân đạo hàm riêng và ứng dụng và bài toán tĩnh và động của tấm sandwich

Luận án: Một Số Thuật Toán Metaheuristic Giải Bài Toán Bao Phủ Diện Tích Và Đối Tượng Trong Mạng Cảm Biến Không Dây

Luận văn: Nghiên cứu các phương pháp trích rút từ khoá từ trang web và ứng dụng

Trình bày báo cáo tốt nghiệp

Nghiên cứu một số biến thể của bài toán hôn nhân ổn định theo tiếp cận heuristic

Tài liệu xem nhiều

Luận án Tiến sĩ: Nghiên cứu thành phần hóa học và hoạt tính sinh học của loài gai kim (Barleria prionitis L.) thuộc họ Ô rô (Acanthaceae) ở Lào

Báo cáo bài tập lớn Vật lý A1: Vẽ quỹ đạo chuyển động ném xiên trong trọng trường bỏ qua lực cản và xác định một vài thông số liên quan

Luận án Tiến sĩ: Ảnh hưởng của tín ngưỡng thờ Đức Thánh Trần ở đền Kiếp Bạc đến đời sống tinh thần người dân tỉnh Hải Dương hiện nay

Luận văn Thạc sĩ Khoa học giáo dục: Quản lý đổi mới phương pháp dạy học các môn KHTN ở trường THCS huyện Lâm Thao, tỉnh Phú Thọ

BƢỚC ĐẦU TẠO CÂY TIÊU (Piper nigrum) IN VITRO KHÁNG NẤM Phytophthora sp