Xem trước tài liệu

Đang tải tài liệu...

Thông tin chi tiết tài liệu

Định dạng: PDF

Số trang: 51 trang

Dung lượng: Đang cập nhật

Giới thiệu nội dung

XÂY DỰNG MÔ HÌNH NGÔN NGỮ CHO TIẾNG VIỆT

Tác giả:

Cao Văn Việt

Lĩnh vực:

Khoa học máy tính

Nội dung tài liệu:

Luận văn này tập trung nghiên cứu và xây dựng mô hình ngôn ngữ cho tiếng Việt, một lĩnh vực còn mới mẻ và đối mặt nhiều khó khăn tại Việt Nam. Mô hình ngôn ngữ, một bộ phận thiết yếu của xử lý ngôn ngữ tự nhiên, được ứng dụng trong nhiều lĩnh vực như kiểm lỗi chính tả, dịch máy và phân đoạn từ. Luận văn đề cập đến các khó khăn tồn tại, các phương pháp khắc phục, đặc biệt là các phương pháp làm mịn. Nghiên cứu sử dụng bộ công cụ mã nguồn mở SRILIM để xây dựng mô hình ngôn ngữ tiếng Việt, sau đó áp dụng để tính toán độ hỗn loạn thông tin và dịch máy thống kê, nhằm xác định phương pháp làm mịn tối ưu.

Mục lục chi tiết:

Chương 1: Giới thiệu vấn đề
1.1 Đặt vấn đề
1.2 Mục tiêu
1.3 Cấu trúc của luận văn
Chương 2: Mô hình ngôn ngữ Ngram
2.1 Khái quát
2.2 Công thức tính “xác suất thô”
2.3 Khó khăn khi xây dựng mô hình ngôn ngữ N-gram
2.3.1 Phân bố không đều
2.3.2 Kích thước bộ nhớ của mô hình ngôn ngữ
2.4 Các phương pháp làm mịn
2.4.1 Các thuật toán chiết khấu (discounting)
2.4.2 Phương pháp truy hồi
2.4.3 Phương pháp nội suy
2.4.4 Phương pháp làm mịn Kneser – Ney
2.4.5 Phương pháp làm mịn Kneser – Ney cải tiến bởi Chen – GoodMan
2.5 Kỹ thuật làm giảm kích thước dữ liệu
2.5.1 Loại bỏ (pruning)
2.5.2 Đồng hóa (Quantization)
2.5.3 Nén (Compression)
2.6 Độ đo
2.6.1 Entropy – Độ đo thông tin
2.6.2 Perplexity – Độ hỗn loạn thông tin
2.6.3 Error rate – Tỉ lệ lỗi
Chương 3: Ứng dụng của mô hình ngôn ngữ trong mô hình dịch máy thống kê
3.1 Dịch máy
3.2 Dịch máy thống kê
3.3 Các phương pháp đánh giá bản dịch
Chương 4: Thực nghiệm
4.1 Công cụ
4.2 Dữ liệu huấn luyện
4.3 Kết quả
Chương 5: Kết luận
Tài liệu tham khảo

Kinh tế - Quản trị - Quản lý

Tài chính - Ngân hàng - Kế toán

Kỹ thuật - Công nghệ

Giáo dục - Sư phạm

Y học - Dược học

Khoa học Xã hội - Nhân văn

Nông - Lâm - Ngư nghiệp

Khoa học Tự nhiên

Luật - Hành chính

Công nghệ thông tin

Kiến trúc - Xây dựng

Môi trường - Tài nguyên

Khác

Ngôn ngữ - Văn học

Điều dưỡng - Y tế công cộng

Kinh tế - Quản trị - Quản lý

Tài chính - Ngân hàng - Kế toán

Kỹ thuật - Công nghệ

Giáo dục - Sư phạm

Y học - Dược học

Khoa học Xã hội - Nhân văn

Nông - Lâm - Ngư nghiệp

Khoa học Tự nhiên

Luật - Hành chính

Công nghệ thông tin

Kiến trúc - Xây dựng

Môi trường - Tài nguyên

Khác

Ngôn ngữ - Văn học

Điều dưỡng - Y tế công cộng

Xem trước tài liệu

Thông tin chi tiết tài liệu

Giới thiệu nội dung

XÂY DỰNG MÔ HÌNH NGÔN NGỮ CHO TIẾNG VIỆT

Tác giả:

Lĩnh vực:

Nội dung tài liệu:

Mục lục chi tiết:

Tài liệu liên quan

Tóm tắt Đồ án tốt nghiệp Công nghệ thông tin: Xây dựng website tin tức cho thành phố Đà Nẵng

Báo cáo khoa học: Effect of oxidative stress and involvement of poly(ADP-ribose) polymerase (PARP) in Dictyostelium discoideum development

Luận văn thạc sĩ: Ứng dụng luật kết hợp và thuật toán di truyền vào bài toán tối ưu sắp xếp container hàng hóa trên tàu

Luận văn Thạc sĩ Khoa học máy tính: Cách tiếp cận đại số gia tử xây dựng hệ hỗ trợ ra quyết định trong chẩn đoán bệnh viêm gan B

Tóm tắt Luận án Tiến sĩ Toán học: Cải tiến phương pháp học máy trong chuỗi thời gian và ứng dụng

ĐỀ TÀI: THỰC TRẠNG VÀ GIẢI PHÁP ỨNG DỤNG HỆ THỐNG THÔNG TIN TẠI CÁC DOANH NGHIỆP VIỆT NAM HIỆN NAY

Tóm tắt Luận án Tiến sĩ: Nghiên cứu nâng cao hiệu quả truyền dẫn thông tin di động nhờ học máy

Luận văn: Phân tích và thiết kế hệ thống thông tin quản lý cán bộ tại Công Ty Cổ Phần Hạ Long

NGHIÊN CỨU CÔNG NGHỆ J2ME VÀ THỬ NGHIỆM LẬP TRÌNH ỨNG DỤNG TRÊN THIẾT BỊ DI ĐỘNG

Luận án Tiến sĩ Dược học: Nghiên cứu bào chế phytosome quercetin ứng dụng vào viên nang cứng

Luận án Tiến sĩ Khoa học máy tính: Một số kỹ thuật phát hiện cấu trúc cộng đồng trên đồ thị mạng xã hội

Luận văn: Nâng Cấp Hệ Thống Pac Thêm Chức Năng Tự Động Xác Định Đối Tượng Tấn Công

Tài liệu xem nhiều

Luận án Tiến sĩ: Nghiên cứu thành phần hóa học và hoạt tính sinh học của loài gai kim (Barleria prionitis L.) thuộc họ Ô rô (Acanthaceae) ở Lào

Báo cáo bài tập lớn Vật lý A1: Vẽ quỹ đạo chuyển động ném xiên trong trọng trường bỏ qua lực cản và xác định một vài thông số liên quan

Luận án Tiến sĩ: Ảnh hưởng của tín ngưỡng thờ Đức Thánh Trần ở đền Kiếp Bạc đến đời sống tinh thần người dân tỉnh Hải Dương hiện nay

Luận văn Thạc sĩ Khoa học giáo dục: Quản lý đổi mới phương pháp dạy học các môn KHTN ở trường THCS huyện Lâm Thao, tỉnh Phú Thọ

BƢỚC ĐẦU TẠO CÂY TIÊU (Piper nigrum) IN VITRO KHÁNG NẤM Phytophthora sp