Xem trước tài liệu

Đang tải tài liệu...

Thông tin chi tiết tài liệu

Định dạng: PDF

Số trang: 79 trang

Dung lượng: 743 KB

Giới thiệu nội dung

Sử Dụng Mô Hình Ngôn Ngữ Bloom Filter Trong Cải Tiến Dịch Máy Thống Kê

Tác giả: Trần Tiến Thành

Lĩnh vực: Khoa học máy tính

Nội dung tài liệu:

Luận văn này tập trung nghiên cứu về mô hình ngôn ngữ (Language Model – LM) và ứng dụng của nó trong lĩnh vực xử lý ngôn ngữ tự nhiên, đặc biệt là trong dịch máy thống kê. Nghiên cứu đề cập đến các phương pháp xây dựng mô hình ngôn ngữ truyền thống như N-gram, cũng như các thuật toán làm mịn và các thước đo đánh giá hiệu quả của mô hình. Điểm nhấn của luận văn là việc nghiên cứu sâu về cấu trúc dữ liệu Bloom Filter và cách nó có thể được sử dụng để xây dựng mô hình ngôn ngữ hiệu quả hơn, đặc biệt là trong việc tiết kiệm không gian lưu trữ so với các mô hình truyền thống. Luận văn cũng trình bày về hệ thống dịch máy thống kê mã nguồn mở Moses và cách tích hợp mô hình ngôn ngữ Bloom Filter vào hệ thống này, cùng với các thử nghiệm và đánh giá kết quả.

Mục lục chi tiết:

MỞ ĐẦU

1. Đặt vấn đề
2. Đối tượng và phạm vi nghiên cứu
3. Nhiệm vụ nghiên cứu
4. Những nội dung nghiên cứu chính

NỘI DUNG

CHƯƠNG I: TỔNG QUAN VỀ DỊCH MÁY THỐNG KÊ DỰA VÀO CỤM TỪ VÀ MÔ HÌNH NGÔN NGỮ

1.1 Dịch máy thống kê dựa trên cụm từ

1.1.1 Dịch máy và dịch máy thống kê
1.1.2 Dịch máy thống kê dựa trên cụm

1.2 Mô hình ngôn ngữ

1.2.1 N-gram
1.2.2 Mô hình ngôn ngữ
1.2.3 Huấn luyện mô hình ngôn ngữ

1.2.3.1 Ước lượng cực đại hóa khả năng (Maximium Likelihood Estimation – MLE)
1.2.3.2 Các phương pháp làm mịn
1.2.3.2.1 Kneser-Ney
1.2.3.2.2 Kneser-Ney cải tiến (Modified Kneser-Ney – MKN)
1.2.3.2.3 Stupid Backoff

1.3 Đánh giá mô hình ngôn ngữ

1.3.1 Entropy – Độ đo thông tin
1.3.2 Độ hỗn loạn thông tin (Perplexity)
1.3.3 Tỉ lệ lỗi (Error rate)

1.4 Đánh giá chất lượng dịch tự động dựa trên điểm BLEU

CHƯƠNG 2: MÔ HÌNH NGÔN NGỮ BLOOM FILTER

2.1 Các cấu trúc dữ liệu xác suất (PDS)
2.2 Hàm băm (Hash function)
2.3 Bloom Filter cơ bản
2.4 Mô hình ngôn ngữ Bloom Filter

2.4.1 Bloom Filter tần số log (Log-frequency Bloom Filter)
2.4.2 Bộ lọc dựa vào chuỗi con (sub-sequence filtering)

CHƯƠNG 3: ỨNG DỤNG BLOOM FILTER CHO HỆ DỊCH MÁY THỐNG KÊ DỰA VÀO CỤM TỪ

3.1 Hệ dịch máy thống kê mã nguồn mở Moses
3.2 Tích hợp Mô hình ngôn ngữ Bloom Filter vào hệ thống Moses

3.2.1 Xây dựng LM với RandLM và SRILM

3.2.1.1 Ngữ liệu
3.2.1.2 Thuật toán làm mịn
3.2.1.3. Xây dựng LM với SRILM và RandLM

3.3 Thử nghiệm và đánh giá

KẾT LUẬN
TÀI LIỆU THAM KHẢO

Kinh tế - Quản trị - Quản lý

Tài chính - Ngân hàng - Kế toán

Kỹ thuật - Công nghệ

Giáo dục - Sư phạm

Y học - Dược học

Khoa học Xã hội - Nhân văn

Nông - Lâm - Ngư nghiệp

Khoa học Tự nhiên

Luật - Hành chính

Công nghệ thông tin

Kiến trúc - Xây dựng

Môi trường - Tài nguyên

Khác

Ngôn ngữ - Văn học

Điều dưỡng - Y tế công cộng

Kinh tế - Quản trị - Quản lý

Tài chính - Ngân hàng - Kế toán

Kỹ thuật - Công nghệ

Giáo dục - Sư phạm

Y học - Dược học

Khoa học Xã hội - Nhân văn

Nông - Lâm - Ngư nghiệp

Khoa học Tự nhiên

Luật - Hành chính

Công nghệ thông tin

Kiến trúc - Xây dựng

Môi trường - Tài nguyên

Khác

Ngôn ngữ - Văn học

Điều dưỡng - Y tế công cộng

Xem trước tài liệu

Thông tin chi tiết tài liệu

Giới thiệu nội dung

Sử Dụng Mô Hình Ngôn Ngữ Bloom Filter Trong Cải Tiến Dịch Máy Thống Kê

Tài liệu liên quan

Tóm tắt Luận án Tiến sĩ Khoa học máy tính: Xây dựng khung thức quản lý thỏa thuận cấp độ dịch vụ dựa trên công nghệ chuỗi khối để áp dụng cho giám sát và thực thi các luật đền bù trong việc cung cấp dịch vụ

Báo cáo đề tài: Viết phần mềm giao tiếp chuẩn USB kết nối chương trình PLC, màn hình giám sát HMI với máy tính

Nghiên Cứu Đề Xuất Hệ Học Chuyển Giao Mờ Phức Dựa Trên Kỹ Thuật Lấy Mẫu Không Gian Con Và Cấu Trúc Đồ Thị Có Hướng

Nghiên cứu thực trạng ứng dụng công nghệ thông tin tại trung tâm thông tin thư viện trường đại học vinh

Khóa luận tốt nghiệp: Điều chế cellulose nano tinh thể và ứng dụng

Báo cáo khoa học: Recent applications of NMR spectroscopy in plant metabolomics

Luận văn: Các Đề Xuất Cải Tiến Giao Thức AODV Nhằm Đảm Bảo Hỗ Trợ QOS

Luận văn Thạc sĩ Khoa học: Hồi quy bội tuyến tính hồi quy phi tuyến và ứng dụng

Tiểu luận: Thuật toán di truyền cùng với logic mờ

Báo cáo hệ thống thông tin quản lý: Công nghệ RFID

Luận văn: Xây Dựng Hệ Thống Giám Sát Và Cảnh Báo Sự Thay Đổi Nội Dung Trang Web

Towards an Agent Oriented approach to Software Engineering

Tài liệu xem nhiều

Luận án Tiến sĩ: Nghiên cứu thành phần hóa học và hoạt tính sinh học của loài gai kim (Barleria prionitis L.) thuộc họ Ô rô (Acanthaceae) ở Lào

Báo cáo bài tập lớn Vật lý A1: Vẽ quỹ đạo chuyển động ném xiên trong trọng trường bỏ qua lực cản và xác định một vài thông số liên quan

Luận án Tiến sĩ: Ảnh hưởng của tín ngưỡng thờ Đức Thánh Trần ở đền Kiếp Bạc đến đời sống tinh thần người dân tỉnh Hải Dương hiện nay

Luận văn Thạc sĩ Khoa học giáo dục: Quản lý đổi mới phương pháp dạy học các môn KHTN ở trường THCS huyện Lâm Thao, tỉnh Phú Thọ

BƢỚC ĐẦU TẠO CÂY TIÊU (Piper nigrum) IN VITRO KHÁNG NẤM Phytophthora sp