09. Nhận dạng nhạc số dựa trên chuỗi đặc trưng âm thanh - Bảo vệ 11/2010
Phạm Cẩm Ngọc. Xây dựng hệ thống tìm kiếm nhạc dựa trên tín hiệu âm thanh. Bảo vệ ngày 16/11/2010.
Sự phát triển của máy tính và mạng Internet như hiện nay dẫn đến nhu cầu tìm kiếm trên Internet là rất lớn. Nếu như trước đây người ta chỉ quan tâm đến tìm kiếm thông tin, văn bản thì hiện nay nhu cầu tìm kiếm dữ liệu đa phương tiện (multimedia) cho mục đích giải trí không ngừng tăng lên. Việc tìm kiếm các bản nhạc theo phương pháp truyền thống chỉ được thực hiện đơn giản bằng cách nhập vào máy tìm kiếm các thông tin về tiêu đề bài hát, tên tác giả, ca sĩ thể hiện … để nhận được bài hát tương ứng. Tuy nhiên, phương pháp tìm kiếm này không đáp ứng được nhu cầu tìm kiếm bản nhạc trong thực tế khi người sử dụng đơn giản lắng nghe một bài hát và muốn biết tên của bài hát đó. Xây dựng một hệ thống nhận dạng âm nhạc như vậy đã thu hút được sự quan tâm của các nhà nghiên cứu và các tổ chức lớn. Đã có nhiều bài báo và công trình khoa học có liên quan được công bố, nhưng chỉ có các phương pháp dựa trên tính toán và so sánh các đặc trưng (còn gọi là fingerprint hay local descriptor) trên các bản nhạc là mang lại hiệu quả hơn cả.
Mục đích chính của việc tính toán này là đưa ra một cơ chế hiệu quả để ước lượng sự tương tự giữa hai đối tượng multimedia: thay vì so sánh trực tiếp bản thân hai đối tượng (thường rất lớn), đơn giản hơn người ta so sánh các fingerprint giữa chúng. Trong hầu hết các hệ thống sử dụng công nghệ fingerprint, fingerprint của các đối tượng multimedia cùng với các meta-data liên quan (tên tác giả hay tiêu đề của album) được lưu trữ trong cùng một cơ sở dữ liệu. Các fingerprint này đóng vai trò như chỉ mục cho các meta-data. Meta-data của các đối tượng multimedia chưa biết có thể nhận được bằng cách tính toán fingerprint của các đối tượng này và sử dụng chúng như một truy vấn trong cơ sở dữ liệu fingerprint/meta-data. Có 3 ưu điểm chính của việc sử dụng fingerprint thay cho đối tượng multimedia gốc:
· Giảm thiểu được các nhu cầu về bộ nhớ/lưu trữ vì kích thước các fingerprint tương đối nhỏ;
· Việc so sánh đơn giản hơn do các thông tin dư thừa đã được loại bỏ khỏi fingerprint;
· Tìm kiếm hiệu quả hơn khi mà tập dữ liệu tìm kiếm là nhỏ.
Một hệ thống fingerprint thông thường bao gồm hai thành phần chính: phương pháp để tính toán fingerprint và phương pháp tìm kiếm fingerprint có hiệu quả trong một cơ sở dữ liệu fingerprint.
Mục tiêu của một hệ thống nhận dạng nhạc số dựa trên chuỗi đặc trưng âm thanh (audio fingerprint) là từ một bản thu âm ngắn đã bị nhiễu, hệ thống cho phép tìm kiếm chính xác bài hát gốc của bản thu âm đó. Trong thực tế có thể gặp tình huống sau, người sử dụng nào đó lắng nghe một ca khúc qua radio trên xe hơi của mình hay tại một bữa tiệc. Đây là bài hát nối tiếng mà đã lâu rồi anh ta không được nghe nên đã quên mất lời bài hát và tên tác giả bài hát này. Người này có thể gửi một đoạn ngắn của bản nhạc đã được thu âm qua điện thoại di động tới một server tìm kiếm nhạc số để nhận lại một tin nhắn chứa các thông tin liên quan như tên bài hát, lời bài hát hay tác giả của bài hát. Công việc này đặt ra những thách thức vì những lý do sau đây:
· Bản thu âm bị sai khác so với bản nhạc gốc do ảnh hưởng nhiễu tín hiệu của các thiết bị thu âm thông dụng (thường là điện thoại di động) hay do ảnh hưởng của tiếng ồn và các tạp âm xung quanh trong quá trình thu âm.
· Bản thu âm chỉ là một đoạn nhạc nào đó thuộc bài hát gốc nên các phương pháp tính toán đặc trưng truyền thống trên bản nhạc thu âm thường cho kết quả là một chuỗi đặc trưng khác với chuỗi đặc trưng được tính toán trên toàn bộ bài hát gốc.
· Hệ thống nhận dạng nhạc số cần phải đáp ứng được nhu cầu tìm kiếm trong thực tế là cho kết quả nhanh và chính xác trên một cơ sở dữ liệu gồm hàng trăm nghìn bài hát.
Trên cơ sở các nghiên cứu gần đây của Haitsma và Kaller [10, 11] và Y. Ke [5, 6] chúng tôi tiến hành xây dựng một hệ thống nhận dạng nhạc số dựa trên chuỗi đặt trưng âm thanh có tính ứng dụng trong thực tế sử dụng phương pháp trính rút đặc trưng cửa sổ gối kết hợp học máy. Bên cạnh đó, luận văn tiến tới xây dựng một bộ dữ liệu huấn luyện cho kết quả tìm kiếm với độ chính xác cao và một cơ sở dữ liệu meta-dada/fingerprint dựa trên hệ quản trị cơ sở dữ liệu PostgreSQL, đồng thời luận văn kết hợp xây dựng các hàm mở rộng bằng ngôn ngữ C trong PostgreSQL để có thể tìm kiếm bài hát bằng các truy vấn SQL đơn giản.
Luận văn này gồm ba chương, nội dung được mô tả như dưới đây:
Chương 1. Chuỗi đặc trưng âm thanh và ứng dụng trong tìm kiếm nhạc số giới thiệu về chuỗi đặc trưng âm thành và các ứng dụng của nó, hệ thống nhận dạng âm thanh của Haitsma [10, 11] và Y. Ke [5, 6].
Chương 2. Hệ quản trị cơ sở dữ liệu PostgreSQL trình bày về hệ quản trị cơ sở dữ liệu PostgreSQL và cách viết hàm mở rộng bằng ngôn ngữ C trong PostgreSQL.
Chương 3. Xây dựng và thử nghiệm hệ thống tìm kiếm nhạc số mô tả việc xây dựng, thử nghiệm hệ thống và các kết quả đạt được.
Phần kết luận tổng kết và tóm tắt nội dung chính của luận văn.
lam on cho em xin mot ban em
lam on cho em xin mot ban em nghien cuu nao? Hap dan lam day!
Bac oi em xin lau roi sao
Bac oi em xin lau roi sao bac khong relay lai cho em mot ban vay. Lam on cho em xin mot ban em cung dang tim hieu ve phan nay day. Cam on bac nhieu. Mail cua em: duongdinhsith@ymail.com
Sorry tôi bị ốm nên
Sorry tôi bị ốm nên không thấy comment của bạn. Đã gửi email cho bạn rồi!
làm ơn cho em xin một
làm ơn cho em xin một bản.e cũng đang nghiên cứu về vấn đề này.mail của em: hoangminhngoc87@gmail.com.thanks!