Xem trước tài liệu

Đang tải tài liệu...

Thông tin chi tiết tài liệu

Định dạng: PDF

Số trang: 63 trang

Dung lượng: 715 KB

Giới thiệu nội dung

Xác định Tỷ Lệ Tin Xấu Trên Báo Điện Tử Tiếng Việt Bằng Phương Pháp Học Sâu

Tác giả: Đặng Đình Quân

Lĩnh vực: Khoa học Máy tính

Nội dung tài liệu:

Luận văn này tập trung nghiên cứu một phương pháp hiệu quả để tự động đánh giá tỷ lệ thông tin tiêu cực (tin xấu) trên báo điện tử tiếng Việt. Với sự phổ biến của Internet và khối lượng thông tin khổng lồ được đăng tải hàng ngày, việc xác định tỷ lệ tin xấu trở nên cấp thiết để phản ánh đúng thực trạng xã hội và duy trì niềm tin của người đọc. Luận văn đề xuất sử dụng các phương pháp học sâu, một kỹ thuật học máy mạnh mẽ, có khả năng tự động học đặc trưng của dữ liệu văn bản, để giải quyết bài toán phân loại văn bản này. Nghiên cứu bao gồm việc giới thiệu sơ lược về học máy, học sâu, bài toán xác định tỷ lệ tin xấu, các phương pháp phân loại văn bản bằng học sâu, và đánh giá hiệu quả của các phương pháp đã đề xuất thông qua thực nghiệm.

Mục lục chi tiết:

Lời cam đoan
Lời cảm ơn
Danh mục các thuật ngữ, chữ viết tắt
Danh mục các hình vẽ và bảng
Mở đầu
Chương 1 – Sơ lược về học máy, học sâu và bài toán xác định tỷ lệ tin xấu

1.1. Giới thiệu bài toán xác định tỷ lệ tin xấu

1.1.1. Định nghĩa về tin xấu
1.1.2. Phân loại văn bản
1.1.3. Phân tích cảm xúc

1.2. Sơ lược về học máy

1.2.1. Học máy có giám sát
1.2.2. Học máy không giám sát
1.2.3. Học máy bán giám sát
1.2.4. Hàm mục tiêu, hàm tổn thất, hàm chi phí
1.2.5. Overfitting

1.3. Sơ lược về học sâu

1.3.1. Mạng nơ-ron

1.3.1.1. Perceptron
1.3.1.2. Mạng nơ-ron truyền thẳng nhiều lớp

1.3.2. Hàm kích hoạt

1.3.2.1. Softmax
1.3.2.2. Sigmoid
1.3.2.3. Hàm tanh

1.3.3. Huấn luyện mạng nơ-ron

1.3.3.1. SGD
1.3.3.2. Backpropagation
1.3.3.3. Hàm kích hoạt ReLU
1.3.3.4. Adam

1.3.4. Một số hàm chi phí

1.3.4.1. MSE
1.3.4.2. Categorical Cross Entropy

Chương 2 – Phương pháp xác định tỷ lệ bài viết nói về cái xấu trên báo điện tử tiếng Việt

2.1. Biểu diễn thuộc tính

2.1.1. Character-level, word-level
2.1.2. One-hot encoding
2.1.3. Word Embedding
2.1.4. Word2Vec

2.2. Các cấu trúc mạng nơ-ron sâu

2.2.1. CNN

2.2.1.1. Lớp tích chập
2.2.1.2. Pooling

2.2.2. RNN
2.2.3. Dropout

2.3. Một số phương pháp phân loại văn bản bằng học sâu
2.4. Phương pháp MLP
2.5. Phương pháp LSTM
2.6. Phương pháp Bi-LSTM-CNN

Chương 3 – Đánh giá phương pháp xác định tỷ lệ tin xấu trên báo điện tử tiếng Việt

3.1. Tập dữ liệu

3.1.1. Phạm vi dữ liệu thử nghiệm
3.1.2. Thu thập dữ liệu
3.1.3. Xử lý & gán nhãn dữ liệu

3.2. Thiết kế thí nghiệm

3.2.1. Thí nghiệm 1
3.2.2. Thí nghiệm 2
3.2.3. Các độ đo để đánh giá kết quả
3.2.4. Kiểm chứng chéo

3.3. Kết quả thí nghiệm

3.3.1. Thí nghiệm 1
3.3.2. Thí nghiệm 2

Kết luận
Danh mục tài liệu tham khảo

Kinh tế - Quản trị - Quản lý

Tài chính - Ngân hàng - Kế toán

Kỹ thuật - Công nghệ

Giáo dục - Sư phạm

Y học - Dược học

Khoa học Xã hội - Nhân văn

Nông - Lâm - Ngư nghiệp

Khoa học Tự nhiên

Luật - Hành chính

Công nghệ thông tin

Kiến trúc - Xây dựng

Môi trường - Tài nguyên

Khác

Ngôn ngữ - Văn học

Điều dưỡng - Y tế công cộng

Kinh tế - Quản trị - Quản lý

Tài chính - Ngân hàng - Kế toán

Kỹ thuật - Công nghệ

Giáo dục - Sư phạm

Y học - Dược học

Khoa học Xã hội - Nhân văn

Nông - Lâm - Ngư nghiệp

Khoa học Tự nhiên

Luật - Hành chính

Công nghệ thông tin

Kiến trúc - Xây dựng

Môi trường - Tài nguyên

Khác

Ngôn ngữ - Văn học

Điều dưỡng - Y tế công cộng

Xem trước tài liệu

Thông tin chi tiết tài liệu

Giới thiệu nội dung

Xác định Tỷ Lệ Tin Xấu Trên Báo Điện Tử Tiếng Việt Bằng Phương Pháp Học Sâu

Tài liệu liên quan

KẾT QUẢ THỬ NGHIỆM HỆ THỐNG PHUN NƯỚC, QUẠT GIÓ MỚI NHẰM GIẢM STRESS NHIỆT CHO BÒ SỮA TẠI CÔNG TY SỮA VÀ GIỐNG BÒ SỮA PHÙ ĐỔNG – HÀ NỘI

Đồ án tốt nghiệp Công nghệ kỹ thuật điện tử: Bảng điện tử hiển thị thông tin thời tiết

Tóm tắt Đồ án tốt nghiệp Công nghệ kỹ thuật điện tử và truyền thông: Thiết kế mô hình cân điện tử

Luận văn: Cấu trúc máy tính và bảo trì thiết bị

Luận văn đề tài “Nghiên cứu các phương pháp điều khiển Robot công nghiệp”

Nghiên Cứu Hệ Điều Khiển Chuyển Động Tuyến Tính Sử Dụng Động Cơ Polysolenoid

Đề tài: Công nghệ sản xuất Amoniac, Acid nitric, đạm

Repeated Index Modulation For OFDM Systems

Tóm tắt Luận văn Thạc sĩ Kỹ thuật: Nghiên cứu đánh giá độ êm dịu của ô tô khách 29 chỗ ngồi sản xuất tại Việt Nam

Thực tập sản xuất rượu vang tại công ty Dalat Beco

Nghiên cứu chế tạo axit rắn ZrO2 biến tính bằng Zn và S làm xúc tác cho quá trình chế tạo diesel sinh học từ dầu thực vật phi thực phẩm

Tiểu luận môn học Thay đổi và phát triển tổ chức: Cải tiến phong cách giao dịch tại Agribank chi nhánh huyện Châu Thành

Tài liệu xem nhiều

Luận án Tiến sĩ: Nghiên cứu thành phần hóa học và hoạt tính sinh học của loài gai kim (Barleria prionitis L.) thuộc họ Ô rô (Acanthaceae) ở Lào

Báo cáo bài tập lớn Vật lý A1: Vẽ quỹ đạo chuyển động ném xiên trong trọng trường bỏ qua lực cản và xác định một vài thông số liên quan

Luận án Tiến sĩ: Ảnh hưởng của tín ngưỡng thờ Đức Thánh Trần ở đền Kiếp Bạc đến đời sống tinh thần người dân tỉnh Hải Dương hiện nay

Luận văn Thạc sĩ Khoa học giáo dục: Quản lý đổi mới phương pháp dạy học các môn KHTN ở trường THCS huyện Lâm Thao, tỉnh Phú Thọ

BƢỚC ĐẦU TẠO CÂY TIÊU (Piper nigrum) IN VITRO KHÁNG NẤM Phytophthora sp