View Single Post
  #1  
Cũ 25-10-2012, 11:17
Nina Nina is offline
Kvas Nga - Квас
 
Tham gia: Nov 2007
Đến từ: TPHCM
Bài viết: 6,416
Cảm ơn: 5,003
Được cảm ơn 8,268 lần trong 3,723 bài đăng
Default Các định dạng nhạc số và định dạng lossless,

Thật ra đây là một vấn đề mình đã từng gặp, và theo cảm nhận trên diễn đàn này thì có lẽ nhiều người cũng gặp.

Nói một cách đơn giản, nén dữ liệu dạng Lossless là các định dạng nén dữ liệu theo thuật toán cho phép các dữ liệu có thể được tái tạo mà không bị mất thông tin. Nina hoàn toàn không phải chuyên gia trong lĩnh vực này, cũng không có ý định múa rìu qua mắt thợ. Qua kinh nghiệm cá nhân, Nina thấy bài viết sau đây của bạn tdev ở box Jazz diễn đàn Trái tim Việt Nam Online là rất bổ ích và dễ hiểu cho người mới bắt đầu, nên xin dẫn lại ở đây (cám ơn bạn WAL của diễn đàn Nhaccodien.info đã giới thiệu).


Âm Thanh số là gì ?

Âm thanh được ghi trên đĩa CD và định dạng file âm thanh WAV được sử dụng chuẩn định dạng
pulse-code modulation (PCM) (tạm dịch là điều biến nhịp, nghĩa là trong analog ta thấy 1 tần số sine diễn tả âm thanh, nhưng trong kĩ thuật số ta không thể có sóng sine mà người ta sử dụng những "nhịp đập" cao thấp khác nhau 1 cách liên tục để diễn tả cần đúng nhất hình dạng sóng sine") . Đây là những tín hiệu âm thanh gốc và hoàn toàn không được nén.

Theo chuẩn PCM, mỗi giây âm thanh được lấy mẫu với tần số lấy mẫu 44.1KHz, và mỗi mẫu được diễn tả bởi 16 bit dữ liệu. Có nghĩa là trong 1 phút nhạc/âm thanh ta có:

44100 đợt lấy mẫu
X 2 kênh trái phải
X 2 bytes (16 bit = 2 bytes)
X 60 giây
=
10.584.000 bytes
= 10.1 Mb

Như ta đã biết, 1 CD thường có dung lượng là 750Mb, hoặc lưu được 74 phút nhạc, vì thế nếu bạn nhân con số 10Mb của mỗi phút nhạc cho 74 bạn sẽ thấy rõ tại sao CD nó lại như vậy

Như vậy tóm lại, 1 giây của âm thanh gốc sẽ có bitrate là 1411kbps <- xin bạn chú ý số này


MP3,WMA,... - lossy compression (nén mất dự liệu)- Angel or Devil?

Với sự phát triển của PC và internet, nhu cầu chia sẻ thông tin và nhạc càng ngày càng đc đòi hỏi cao. Nhưng người ta không thể nào gửi cả album nhạc đến 700Mb qua internet với tốc độ èo uột 56kps thời đấy đuoc. Do đó các nhóm nghiên cứu, các tổ chức, và nhiều công ty khác nhau đã cố gắng tìm ra những định dạng âm thanh mới sử dụng những thuật toán riêng để nhằm giảm bớit dung lượng dữ liệu cần đề diễn tả âm thanh gốc cùng lúc đó cố gắng giữ cho âm thanh gần với âm thanh gốc nhất.

Có rất nhiều định dạng khác nhau đã ra đời như mp3, wma, aac, ogg, mpc, atrac, ... Chúng hoạt động gần giống nhau nhưng mỗi định dạng có 1 thuật toán khác nhau để xác định xem giữ lại mẫu âm thanh nào, bỏ mẫu âm thanh nào , hoặc điều chỉnh mẫu âm thanh thế nào. Thế thì tại sao lại có thể bỏ, hoặc giữ ? Vì theo lí thuyết tai con người sẽ rất khó nhận ra sự hiện diện của 1 tần số âm thanh nhất định nào đó (có thể là quá 20Khz). Việc bỏ đi 1 phần dữ liệu âm thanh này giúp cho các định dạng âm thanh mất dự liệu như Mp3 có thể giảm dữ liệu cần thiết để diễn tả 1 lần lấy mẫu (sẽ ít hơn rất nhiều so với 16bit cho 44100 lần 1 giây như của âm thanh gốc).

Ngoài ra các định dạng âm thanh này còn tạo ra những âm thanh giả nhằm đắp vào những phần nó đã loại bỏ, điều này là thực sự không thể chấp nhận đc, nó tạo ra những âm thanh ta hay gọi là "éo éo" hoặc vang hoặc méo hẳn so với âm chuẩn, đ/v những file đc nén với bitrate càng thấp thì hiện tượng này xảy ra càng nhiều (ví dụ điển hình nhất: bạn hãy nghe thử 1 đoạn khán giả vỗ tay của 1 file mp3 và 1 track trong CD gốc hoặc 1 file nén không mất dữ liệu (lossless) sẽ ngay lập tức nhận ra. Vì sao tiếng vỗ tay lại gây ra nhiều vấn đề như vậy ? Bởi vì tiếng vỗ tay là 1 âm thanh hỗn hợp ngẫu nhiên, nếu trong âm thanh chuẩn gốc nó sẽ đc diễn ta đầy đủ, thế nhưng với âm thanh nén, định dạng nén buộc phải "ép" bitrate của mình vào khoảng cho phép do đó nó tạo ra những âm thanh vỗ tay đều đều nhau rất ít sự khác biệt hoặc bị hiệu ứng vang).

Chúng ta thường thấy rằng Mp3 hay được nén với bitrate là 128, hoặc 192, hoac 320 kilobit 1 giây (kbps) . Bạn có thể nhận thấy rằng nó chỉ bằng 1/10 so với biterate của WAV (1411kbps) đó là lí do tại sao 1 phút nhạc mp3 128kbps chỉ tốn khoảng 1Mb.

Đúng là trong 1 số trường hợp nhất định, hoặc 1 dạng âm thanh/nhạc nào đó, sẽ rất khó phân biệt sự khác nhau giữa âm thanh gốc và mp3. Bên cạnh đó các thuật toán nén của các định nhạc mất dữ liệu đã được cải thiện rất nhiều. Thế nhưng không có gì hoàn hảo, và chắc chắn cái gì đã mất đi thì sẽ làm cho nó hỏng đi. Đặc biệt là âm thanh. Đối với những album nhạc như vocal, nhạc cụ , hay đặc biệt là cổ điển thì đây là 1 tai họa, vì với những album nhạc này, thường những nhạc cụ được sử dụng hoặc giọng hát có tần số âm thanh rất cao hay rất trầm do đó rất nhiều dự liệu đã bị loại bỏ hoặc điều chỉnh khác đi so với thực tế.

Mp3, âm thanh nén, nhiều người cho rằng chỉ thích hợp với nhạc pop hoặc các dạng nhạc bình thường khác.

Chúng ta cùng xem 2 tấm hình sau, nó thể hiện quang phổ âm thanh của cùng 1 bài nhạc nhưng cái đầu được nén mp3, cái thứ 2 là nén lossless FLAC. Ta có thể nhận thấy rõ sự khác biệt .... heheh chấp nhận đc hay ko thì tùy bạn ... nhưng tdev thì ko.

Bấm vào ảnh để xem kích cỡ đầy đủ.

Bấm vào ảnh để xem kích cỡ đầy đủ.

Lossless Compression (Nén không mất dữ liệu) - Thiên đường?

Trong công việc hàng ngày với máy tính, hẳn không ít lần bạn đã nén 1 file tài liệu gửi cho đồng nghiệp. Có thể bạn đã sử dụng Zip hoặc Rar làm định dạng nén.

File tài liệu đc bạn nén sau khi qua Zip hoac Rar sẽ trở nên nhỏ hơn rất nhiều nhưng khi người nhận nhận đc file, họ sẽ giải nén và có được file tài liệu gốc mà bạn đã tạo. Vậy Zip va Rar đã làm gì ? Nói đơn giản, đó là những thuật toán nhằm tìm ra những quy luật lặp của dữ liệu từ đó tìm 1 cách hiển thị khác tối ưu hơn, tốn ít dữ liệu hơn. (ví dụ ta có chuỗi: aaaaa bbbbbbb aaa 11111 , bạn thấy rằng cách diễn giải tốt hơn nhiều mà tốn ít chữ hơn là ax5 bx7 ax3 1x5). Đấy là 1 ví dụ rất đơn giản để bạn hiểu, còn thì nó phức tạp hơn rất nhiều . Như vậy khi người nhận nhận file và giải nén , Zip và Rar đóng nhiệm vụ sử dụng những chuỗi dữ liệu nén đấy tập hợp và tạo lại file gốc ban đầu.

Đó cũng là mục đích của định dạng âm thanh nén không mất dữ liệu (lossess). Với cấu trúc trên của zip hoặc rar thì bạn có thể thấy rõ rằng đ/v lossless audio, nó lấy đầu vào là âm thanh gốc của CD, cố gắng tìm ra những quy luật âm thanh và nén nó lại. Việc nén lại này là không cao vì dữ liệu âm thanh rất đa dạng và sử dụng nhiều dữ liệu. Hiện tại mức độ nén cao nhất có thể của kĩ thuật nén không mất dữ liệu là bằng khoảng 1/3 dung lượng gốc của âm thanh gốc. Do đó mỗi album lossless sẽ có dung lượng khoảng 200 đến 300 Mb.

Khi giải nén hoặc khi nghe lossless điều chắc chắn ta đạt được đó chính là tín hiệu gốc của âm thanh CD (44.1Khz, 16bit, 1411Kbps) . Điều này là cứu nhân cho mọi người yêu âm nhạc luôn đòi hỏi âm thanh trung thực nhưng không có điều kiện có CD gốc hoặc muốn sử dụng máy tính làm nơi lưu trữ albums.

Việc nén, nghe và ghi album với định dạng âm thanh không mất dữ liệu tdev đã đề cập nhiều trong topic này, mong bạn tìm đọc thêm.


Ghi chú: Vì bài viết là của bạn tdev, nên Nina giữ nguyên định dạng và ngôn từ của bài. Nếu các bạn quan tâm thì Nina sẽ đưa tiếp các bài viết của tdev và các bạn khác về nén, nghe và ghi album với định dạng âm thanh không mất dữ liệu.
Trả lời kèm theo trích dẫn
Có 5 thành viên gửi lời cảm ơn Nina cho bài viết trên:
ak47 (12-11-2013), chaika (01-11-2012), hungmgmi (25-10-2012), Lhs_LEN (25-10-2012), ndkcz (01-11-2012)