Xem trước tài liệu

Đang tải tài liệu...

Thông tin chi tiết tài liệu

Định dạng: PDF
Số trang: 55 trang
Dung lượng: 1 MB

Giới thiệu nội dung

Ứng Dụng Cảm Biến 3D Kinect Trong Nhận Diện Ngôn Ngữ Cử Chỉ Tiếng Việt Hỗ Trợ Việc Giao Tiếp Với Người Khuyết Tật Khiếm Thính

Tác giả: Quách Công Hoàng

Lĩnh vực: Công nghệ Điện tử – Viễn thông

Nội dung tài liệu:

Luận văn này tập trung vào việc ứng dụng cảm biến 3D Kinect để nhận dạng ngôn ngữ cử chỉ tiếng Việt, nhằm hỗ trợ giao tiếp cho người khuyết tật khiếm thính. Nghiên cứu đề xuất phương pháp mô hình để giải quyết bài toán nhận dạng tư thế bàn tay, cụ thể là trạng thái các khớp nối của bàn tay trong các tư thế tay của ngôn ngữ ký hiệu tiếng Việt. Bài toán nhận dạng được xây dựng như một bài toán tối ưu hóa, với mục tiêu là giảm thiểu sự khác biệt giữa ảnh mô hình của các tư thế tay giả định và ảnh quan sát thu được từ cảm biến Kinect. Giải thuật bầy đàn cải tiến được áp dụng để giải quyết bài toán tối ưu này. Bên cạnh đó, các tác vụ đòi hỏi tính toán lớn được xử lý song song trên khối xử lý đồ họa GPU của máy tính thông qua nền tảng tính toán song song OpenCL, nhằm tăng cường tốc độ xử lý.

Mục lục chi tiết:

  • Lời cam đoan
  • Lời cảm ơn
  • Mục lục
  • Danh mục kí hiệu và chữ viết tắt
  • Danh mục hình vẽ và đồ thị
  • Mở đầu
  • Chương 1: Tổng quan
    • 1.1 Mục tiêu và đối tượng nghiên cứu
      • 1.1.1 Nhận dạng ngôn ngữ kí hiệu Tiếng Việt
      • 1.1.2 Nhận dạng tư thế bàn tay
    • 1.2 Các nghiên cứu liên quan
    • 1.3 Nội dung nghiên cứu
  • Chương 2: Mô hình bàn tay
    • 2.1 Mô hình động học của bàn tay
    • 2.2 Xây dựng mô hình giả định bằng đồ họa máy tính
      • 2.2.1 Các khối hình học cơ bản
      • 2.2.2 Phương pháp xây dựng mô hình trên các thư viện phần mềm đồ họa
    • 2.3 Xác định mô hình quan sát bàn tay trên cảm biến
      • 2.3.1 Tóm lược về cảm biến Kinect
      • 2.3.2 Xác định mô hình bàn tay từ cảm biến Kinect
  • Chương 3: Giải thuật nhận dạng
    • 3.1 Xây dựng hàm mục tiêu
    • 3.2 Nhận dạng sử dụng phương pháp tối ưu bầy đàn
      • 3.2.1 Giới thiệu về giải thuật tối ưu bầy đàn PSO
      • 3.2.2 Ứng dụng giải thuật tối ưu bầy đàn vào nhận dạng
  • Chương 4: Tăng tốc thuật toán sử dụng khối xử lý đồ họa GPU
    • 4.1 Xử lý song song trên máy tính và tiêu chuẩn OpenCL
    • 4.2 Tăng tốc thuật toán trên GPU
  • Chương 5: Mô phỏng và thực nghiệm
    • 5.1 Mô phỏng
    • 5.2 Thực nghiệm
  • Chương 6: Kết luận
    • 6.1 Tổng kết
    • 6.2 Hạn chế và hướng phát triển
  • Tài liệu tham khảo