Câu hỏi Bạn có thể đo lường sự khác biệt về chất lượng giữa hai phần âm thanh không?


Có cách nào để đo lường khách quan sự khác biệt về chất lượng giữa hai tệp âm thanh - thông qua đo lường "khoa học" và không sử dụng tai hoặc ý kiến ​​của một người không?

Tôi có hai tệp - một tệp được mã hóa ở 768kb / s và tệp còn lại ở mức 1536kb / s. Tôi tự hỏi nếu có một cách để xác định chất lượng cao hơn bao nhiêu. Có lẽ nó có thể mở chúng trong một loại chương trình phân tích âm thanh và kiểm tra để cắt, giải quyết, vv?


2
2018-03-31 18:19


gốc


Dựa trên hai câu trả lời dưới đây, tôi nghĩ về cơ bản chúng tôi có 1) Chất lượng "kỹ thuật" tuyệt vời nhất và chất lượng tốt nhất ... với câu trả lời @slhck, tôi nghĩ chúng tôi có thể xác nhận không có cách nào để biết chắc chắn người ta sẽ thích hơn ... Nhưng tôi nghĩ chúng ta có thể nói cái nào nên có chất lượng kỹ thuật cao hơn dựa trên câu trả lời của tôi ... Tôi nghĩ rằng cả hai đều đúng cho các giải thích khác nhau về câu hỏi của bạn, vì vậy có thể một số hướng dẫn từ bạn bây giờ là tốt. - Austin T French
"Tôi có hai tệp - một tệp được mã hóa ở 768kb / giây và một tệp khác ở mức 1536kb / giây ..." - Đó chỉ là tốc độ dữ liệu. Chúng có thể dành cho các bản thu âm hoàn toàn khác nhau, tức là các bài hát khác nhau. Các codec có thể khác nhau. Tốc độ lấy mẫu có thể khác nhau. Kích thước mẫu (còn gọi là chiều sâu bit) có thể khác nhau. Nhưng nếu tất cả các thông số đó đều giống nhau, thì sự khác biệt về tốc độ dữ liệu có thể cho thấy các mức khác nhau (aka Q) nén mất dữ liệu. - sawdust
Bạn có thể chạy âm thanh thông qua một FFT và phân tích phổ tần số kết quả cho những thứ khác nhau. Cắt tần số thấp, chắc chắn, và có thể cắt. Từ "nghiêng" của quang phổ bạn gần như có thể đoán nếu âm thanh là "lầy lội". Thực sự là một câu hỏi cho Trang web xử lý tín hiệu SO, Tuy nhiên. - Daniel R Hicks


Các câu trả lời:


Bạn có thể khách quan nói với chất lượng?

Nói chung, không, không có cách chính xác để đo lường chất lượng âm thanh một cách khách quan với độ chính xác đủ. Đơn giản chỉ cần nói: Nếu không hỏi một nhóm người để xếp hạng cụ thể của họ, bạn không bao giờ có thể định lượng "chất lượng cao hơn một phần" trong một phần âm thanh, so với một phần khác. Bản thân chất lượng là không bao giờ tuyệt đối — nó rất chủ quan.

Những gì các nhà nghiên cứu thường làm để giảm bớt vấn đề đó là như sau: Họ xác định quy mô theo đó họ cho phép một nhóm người đánh giá chất lượng, chẳng hạn như năm điểm một (Xấu, Nghèo nàn, Hội chợ, Tốt, Xuất sắc). Hoặc bạn có thể chỉ cần so sánh các codec nhất định (nhưng điều đó sẽ không cung cấp cho bạn dữ liệu rất có ý nghĩa). Sau đó, các nhà nghiên cứu sử dụng các xếp hạng này để lập mô hình một số liệu máy tính cố gắng dự đoán phản ứng của con người.

Chỉ số chất lượng khách quan

Chỉ số chất lượng âm thanh mục tiêu khá cũ nhưng phổ biến là Đánh giá cảm nhận về chất lượng âm thanh (PEAQ), diễn tả cái ITU-R BS.1387 (1998). Về cơ bản, nó cố gắng mô phỏng tai người và tạo ra điểm số ý kiến ​​từ 1–5, giống như một người lắng nghe con người sẽ làm. PEMO-Q từ năm 2006 là một số liệu gần đây cho rằng PEAQ hoạt động tốt hơn.

Các chỉ số này thường được thử nghiệm trên các âm thanh hoặc lời nói đơn lẻ và không nhất thiết về âm nhạc vì khó ước tính chất lượng cảm nhận từ các âm thanh phức tạp, nơi các hiệu ứng tạo mặt nạ phổ biến hơn nhiều. Số liệu này từ năm 2008 được nhắm mục tiêu nhiều hơn đối với âm nhạc.

Dường như với tôi rằng nghiên cứu về chỉ số chất lượng âm thanh không hoạt động như đối với các chỉ số chất lượng video (chủ đề tôi đang làm việc). Bạn sẽ gặp khó khăn khi tìm một công cụ độc lập mà bạn có thể sử dụng trên Windows nơi bạn có thể chỉ cần cắm vào hai nguồn âm thanh và nhận kết quả. Hầu hết các số liệu được phát triển nội bộ tại các viện nghiên cứu và hiếm khi thấy ánh sáng của công chúng. Hoặc chúng công cụ thương mại cho các đài truyền hình và nhà cung cấp viễn thông.

Đây là một MATLAB thực hiện PEAQ, nhưng đó là tất cả những gì tôi biết từ đầu của tôi.

Bạn là gì có thể làm khi so sánh tệp

Nhìn vào vấn đề từ góc độ kỹ thuật, điều quan trọng cần đề cập là bạn có thể - theo lý thuyết - đoán tập tin nào mang lại chất lượng tốt hơn bằng cách chỉ nhìn vào tốc độ dữ liệu. Tuy nhiên, điều này chỉ hoạt động đáng tin cậy khi các tệp có cùng nội dung nguồn và chúng được mã hóa bằng cùng một bộ mã hóa.

Đó là toàn bộ ý tưởng đằng sau các bài kiểm tra nghe codec: Bạn lấy cùng một nguồn, mã hóa nó với các tốc độ dữ liệu khác nhau (hoặc mức chất lượng) với các bộ mã hóa khác nhau, và sau đó có người dùng so sánh chúng. Với dữ liệu "chân lý" này, bạn có thể nói rằng một tệp MP3 được mã hóa với LAME ở 128 kBit / s có âm thanh tốt như một tệp AAC được mã hóa với FAAC ở 64 kBit / s (các số này được tạo thành số, nhưng bạn nhận được Ý tưởng).

Nó thậm chí còn dễ dàng hơn nếu bạn biết rằng cùng một bộ mã hóa đã được sử dụng cho cả hai tệp, vì sau đó rất có thể tốc độ dữ liệu (kích thước tệp) đủ để thực hiện một phỏng đoán về chất lượng kết quả.

Nhưng sau đó một lần nữa, điều này chỉ hoạt động khi các nguồn là như nhau. Một số codec hoạt động tốt hơn cho các loại nhạc hoặc lời nói khác nhau. Một số hoạt động tốt hơn ở tốc độ bit thấp hơn và không nhất thiết phải cung cấp bất kỳ chất lượng nào tốt hơn ở mức giá cao hơn. Chỉ có quá nhiều yếu tố để xem xét.


9
2018-03-31 18:46





Các biện pháp tốt nhất là định dạng và tỷ lệ mẫu. Mặc dù kích thước tệp có thể cung cấp cho bạn một số ý tưởng.

Trong thực tế, chúng ta cần phải nhận ra rằng sự khác biệt về chất lượng của bản ghi có thể không có nghĩa là nó sẽ tốt nhất cho tai, nó sẽ đơn giản là một độ trung thực tốt hơn cho bản ghi gốc.

Định dạng - MP3 sẽ không có chất lượng như định dạng lossless như FLAC, và tùy thuộc vào các yếu tố khác trong codec hai định dạng lossy có thể có kết quả khác nhau dựa trên nén và cách nén được thực hiện

Tỷ lệ mẫu sẽ xác định tần suất thông tin được lấy từ bản ghi và sau đó phát lại mỗi giây, rõ ràng 1Hz sẽ là chất lượng khủng khiếp, khi 24kHz sẽ phát ra âm thanh tốt. Cao hơn thì tốt hơn.

Độ sâu bit Điều này tương tự như một bộ xử lý, trong đó đối với mỗi mẫu, bạn có thể ghi lại x bit trên mỗi mẫu. Nhiều bit hơn nghĩa là nhiều thông tin hơn có nghĩa là bản ghi chất lượng tốt hơn.

Kích thước tập tin IS là kết quả của chất lượng ghi âm. Trường hợp tỷ lệ mẫu, độ sâu bit, kênh và nén là các thành phần cho kích thước tệp. Bạn có thể tính toán ví dụ chính mình để xem nó.

Tuyên bố từ chối trách nhiệm của tôi ở đây, là điều này có thể không quan trọng đối với một số bản ghi âm. Nếu bạn đang nghe một bản ghi âm từ những năm 40, nó sẽ trở thành một bản thu âm nghèo nàn cho dù thế nào đi chăng nữa. Bạn không thể thêm thông tin định dạng gốc không chứa bản ghi mới bằng cách tăng bất kỳ thông tin nào ở trên.


1
2018-03-31 18:45



"Bạn không thể thêm thông tin vào bản ghi bằng cách tăng bất kỳ thông tin nào ở trên." - Đó là một tuyên bố gây hiểu lầm và kém lời kể từ khi không ai thiết lập bản ghi tham khảo là gì. Nếu bạn bắt đầu với tỷ lệ mẫu 8K / giây có độ nén cao và mẫu 8 bit (ví dụ: giọng nói của doanh nghiệp), thì xác nhận của bạn sẽ giảm đi. - sawdust
Tôi nghĩ rằng bạn biết những gì tôi có nghĩa là từ bối cảnh, nhưng tôi đã cố gắng để xóa nó lên quá. Cảm ơn - Austin T French


Bạn có thể mở chúng trong một chương trình chỉnh sửa âm thanh và thu nhỏ xuống từng con sóng (kỹ thuật số) và so sánh chéo các pixel so với một số bản gốc. enter image description here

Sử dụng chương trình này tôi thường thấy cầu thang, và cắt dễ dàng, thường là từ một tỷ lệ rất nghèo hoặc chất lượng rất kém của mã hóa, hoặc cả hai.

Để có được bất kỳ sâu sắc hơn khi bạn nói tỷ lệ rất cao, nó sẽ phải được so sánh một phần của nó, trực quan.  Có âm thanh được cho là tương tự, có các phương pháp khác nhau, để xóa một clip âm thanh với một đoạn âm thanh khác, những gì còn lại là những thay đổi giữa chúng.  Trong đó một trong những bộ lọc nhiễu có thể làm điều đó một cách dễ dàng, có những phương pháp khác tôi chắc chắn, giống như pha trộn âm, nơi một bản sao hoàn hảo của âm thanh sẽ không ra khỏi đường trực quan.

Tôi nghĩ rằng đảo ngược "giai đoạn" và làm một hỗn hợp phụ gia hoàn thành đó cũng có. Kết quả cuối cùng của một bản sao hoàn hảo ngược lại với bản gốc, phải là một đường thẳng hoàn toàn, và không có đầu ra âm thanh khi phát.  Nó rất dễ dàng để kiểm tra lý thuyết, và làm việc ra một kế hoạch, sử dụng chính xác cùng một clip âm thanh đầu tiên, sau đó thử cùng một điều với clip nén thay vào đó.

Hãy suy nghĩ về nó như thế này, trong một chương trình hình ảnh bạn có thể tải trong một phiên bản nén Jpeg của chính xác cùng một hình ảnh bạn đang làm việc trên, làm một lớp phủ differencing. Căn chỉnh clip với bản gốc, và tất cả các tạo tác và khối và thay đổi màu sắc hiển thị tức thời như màu sắc và mức độ màu sắc, mọi thứ bằng 100% giống như màu gốc là màu đen thuần túy. Với trình chỉnh sửa âm thanh, bạn có thể thực hiện điều tương tự cho âm thanh.


0
2018-04-01 09:49





Nếu bạn không có bản gốc không bị mất mát dưới bất kỳ hình thức nào, bạn có thể so sánh chất lượng của hai bản nhạc bị mất mã hóa bởi đôi tai của bạn.


-1
2018-04-01 10:07



OP nói rõ ràng rằng họ không muốn sử dụng tai của họ. - slhck