หากพูดถึงรูปแบบของเสียงความละเอียดสูงแล้ว นอกจากการเข้ารหัสเสียงแบบ Linear PCM ที่ใช้งานกันแพร่หลาย และเป็นพื้นฐานให้กับการเข้ารหัสเสียงในรูปแบบอื่น ๆ ก็ยังมีการเข้ารหัสเสียงอีกรูปแบบที่มีหลักการทำงานที่แตกต่างกัน ซึ่งก็คือ Direct Stream Digital หรือ DSD นั่นเอง
วันนี้ RE.V-> จะมาเล่าถึงประวัติและอธิบายรูปแบบสัญญาณเสียงแบบ DSD ให้รู้จักกันมากขึ้นครับ
ผังการทำงานของ Bitstream ADC และ DAC
จุดเริ่มต้นของ DSD นั้นมาจากเทคนิคการแปลงสัญญาณแบบ Bitstream conversion ที่ทาง Philips ได้ทำการวิจัย และนำมาใช้งานกับชิป ADC (Analog to Digital Converter) และ DAC (Digital to Analog Converter) ในช่วงปลายปี 1988 และด้วยความที่ชิป Bitstream conversion ผลิตได้ง่าย ราคาถูก และไม่ต้องการใช้วงจรจ่ายไฟที่มีขนาดใหญ่และซับซ้อน เทคนิคนี้จึงกลายเป็นหนึ่งในเทคนิคพื้นฐานที่ใช้ในการออกแบบชิป ADC และ DAC อื่น ๆ จนถึงปัจจุบัน
การทำงานของ Bitstream conversion นั้นจะไม่ได้ทำการประมวลสัญญาณเสียงแอนะล็อกและสัญญาณ PCM โดยตรง เหมือนกับเทคนิคการแปลงสัญญาณอื่น ๆ แต่จะแปลงสัญญาณดังกล่าวให้อยู่ในรูป Pulse-Density Modultation (PDM) หรือที่รู้จักในอีกชื่อว่า Sigma-Delta Modulation ก่อน แล้วจึงค่อยแปลงสัญญาณดังกล่าวให้เป็น PCM หรือสัญญาณแอนะล็อกอีกครั้ง รวมทั้งการใช้เทคนิค Oversampling เพิ่มอัตราสุ่มสัญญาณให้มากขึ้นกว่าที่ต้องการ เพื่อให้ digital filter สามารถกำจัด quantization noise ได้ดีขึ้น และช่วยลดความซับซ้อนในการออกแบบ analog low pass filter ที่ภาคสัญญาณขาออก
ในยุคเริ่มแรก สัญญาณ PDM ที่ใช้นั้น มีความละเอียด 1-bit ที่อัตราสุ่มสัญญาณ 2.8224 MHz ซึ่งมากกว่าอัตราสุ่มสัญญาณของมาตรฐาน Audio CD ที่ 44.1 kHz ถึง 64 เท่า
ผังการทำงานของ DSD
ส่วนการนำสัญญาณ PDM มาใช้เป็นสื่อบันทึกเสียงนั้น เริ่มต้นจากการที่ Sony Music ต้องการรูปแบบการจัดเก็บไฟล์ดิจิทัลเพื่อทำสำเนาต้นฉบับเพลงภายในเทปแม่เหล็ก ที่รองรับการแปลงให้อยู่ในสื่อรูปแบบต่าง ๆ ในอนาคตได้ ซึ่งปัจจัยที่ทาง Sony Music ให้ความสำคัญคืออัตราสุ่มสัญญาณที่จะเลือกใช้งานและการปรับค่าภายใน digital filter ใน ADC และ DAC
สุดท้ายแล้ว ในปี 1995 ทาง Sony Music ก็ได้ข้อสรุปว่า แทนที่จะมานั่งปวดหัวเลือกอัตราสุ่มสัญญาณและการปรับค่า digital filter ให้เหมาะสม ก็ไปดึงสัญญาณ PDM ความละเอียด 1-bit ที่อัตราสุ่มสัญญาณ 2.8224 MHz ที่ไม่ผ่าน decimator filter จาก ADC โดยตรง มาจัดเก็บเอาไว้ เมื่อต้องการจะเล่นกลับสัญญาณดังกล่าว ก็สามารถนำสัญญาณไปผ่านวงจร low-pass filter แบบแอนะล็อก แล้วได้สัญญาณแอนะล็อกเลย โดยไม่ต้องผ่าน interpolation filter
ผังการนำสัญญาณ DSD ไปแปลงเป็นสัญญาณ PCM ที่ sample rate ต่าง ๆ
นอกจากนี้ ค่า sample rate ของสัญญาณ 1-bit ที่ 2.8224 MHz ซึ่งสามารถนำไปแปลงให้อยู่ในรูปแบบสัญญาณ PCM ที่มี sample rate ต่ำกว่าได้ง่าย เพียงแค่ทำการหารด้วย Decimation Filter ก็จะได้อัตราสุ่มสัญญาณที่ 44.1 kHz, 88.2 kHz และ 176.4 kHz หรือนำไปคูณ 5 ด้วย Interpolation Filter แล้วเอาไปหารด้วย Decimation Filter ก็จะได้อัตราสุ่มสัญญาณที่ 48 kHz, 96 kHz และ 192 kHz
ขณะเดียวกันทาง Sony Consumer Electronics กำลังหาไอเดียสำหรับการสร้างมาตรฐานสื่อตัวใหม่ที่จะมาแทน Audio CD อยู่พอดี ทาง Sony เลยได้นำแนวความคิดดังกล่าวไปคุยกับ Philips เพื่อร่วมกันพัฒนาจนได้มาตรฐาน Super Audio CD (SA-CD) ที่ใช้ DSD เป็นรูปแบบสัญญาณสำหรับจัดเก็บเพลงบนแผ่น ซึ่งสัญญาณ DSD นั้นมีค่า Signal to Noise Ratio สูงถึง 120 dB และสามารถตอบสนองต่อความถี่ได้สูงถึง 100,000 Hz
สัญญาณ PDM ถูกถมสีไว้เพื่อให้สามารถสังเกตได้ง่าย
รูปแบบสัญญาณ PDM ที่ถูกใช้งานใน DSD นั้น จะใช้ค่า 0 และ 1 ในการแทนค่าของสัญญาณที่สุ่มมา โดย 0 จะแทนค่าแอมพลิจูดที่น้อย (ติดลบ) 1 จะแทนค่าแอมพลิจูดที่มาก (เป็นบวก) ส่วนตำแหน่งที่แอมพลิจูดเป็น 0 ก็จะแทนด้วยค่า 1 และ 0 สลับกัน ซึ่งการแทนค่าดังกล่าวจะแตกต่างจากสัญญาณ LPCM ที่แทนค่าแอมพลิจูดของ sample ตามความละเอียด bit ที่ทำการแบ่งนับ (quantize) ไว้
เนื่องจากสัญญาณแบบ 1-bit นั้น จะมีค่า Signal to Noise ratio (SNR) อยู่ที่ประมาณ 6 dB ซึ่งยังถือว่าห่างไกลจากมาตรฐาน Audio CD ที่มี SNR อยู่ประมาณ 96 dB มาก จึงได้มีการนำนำเทคนิค Noise Shaping ซึ่งจะทำการย้าย quantization noise ที่อยู่ในช่วงความถี่ที่มีข้อมูลเสียง (audio band) อยู่ (ประมาณ 20 kHz) ไปยังช่วงความถี่ที่สูงกว่าการได้ยินของมนุษย์มาใช้งาน ทำให้ความถี่ช่วง audio band นั้น มีค่า SNR สูงถึง 120 dB เลยทีเดียว
กราฟแสดงสัญญาณรบกวนของ DSD (สีแดง) เทียบกับ LPCM (สีน้ำเงิน)
อย่างไรก็ตามสัญญาณรบกวนที่ถูกย้ายไป จะเริ่มมีพลังงานมากขึ้นในช่วงประมาณ 25 kHz จนมีพลังงานสูงสุดที่ความถี่ครึ่งหนึ่งของอัตราสุ่มสัญญาณของ DSD สัญญาณรบกวนดังกล่าวสามารถที่จะทำอันตรายต่อวงจรขยายและลำโพงที่ไม่ได้ออกแบบมาเพื่อรองรับสัญญาณดังกล่าวได้ จึงจำเป็นจะต้องมี low-pass filter เพื่อกรองสัญญาณรบกวนดังกล่าวออกไป ทำให้ในมาตรฐานของ SA-CD ได้กำหนดให้มี low-pass filter ตัดสัญญาณเสียงความถี่ที่ 50 kHz ขึ้นไปในภาคสัญญาณขาออกของอุปกรณ์
นอกจากนี้การแปลงสัญญาณ DSD เป็น Linear PCM นั้น ก็ยังมีความจำเป็นต้องใช้ low-pass filter ดังกล่าวด้วยเช่นกัน เพราะภาคสัญญาณขาออกของ DAC แบบ PCM อาจจะไม่มีตัวกรองสัญญาณรบกวนดังกล่าวเหมือนกับอุปกรณ์ที่รองรับการแปลงสัญญาณ DSD ได้ ซึ่งส่วนมากก็จะใช้ low-pass filter ในรูปแบบดิจิทัลเข้ามาประมวลผลสัญญาณ แทนการใช้ตัวกรองสัญญาณแบบแอนะล็อกเหมือนในเครื่องเล่น SA-CD
Merging Horus – Audio Interface ที่รองรับการบันทึกและเล่นกลับ Quad-rate DSD
เพื่อให้ noise shaping มีพื้นที่ช่วงความถี่สูงสำหรับการย้ายสัญญาณรบกวนให้ไกลจาก audio band มากขึ้น จึงได้มีการเพิ่มอัตราสุ่มสัญญาณให้มากขึ้นกว่าที่ใช้อยู่เดิมเป็น 2 เท่า (5.6448 MHz) เลยเป็นที่มาของ Double-rate DSD หรือ DSD128 นอกจากนี้ในปัจจุบันยังได้มีการใช้อัตราสุ่มสัญญาณที่มากกว่าเดิม 4 เท่า (Quad-rate DSD, 11.2896 MHz) และ 8 เท่า (Octuple-rate DSD, 24.576 MHz) ซึ่งมักจะพบในอุปกรณ์ระดับมืออาชีพหรือเครื่องเสียงระดับ Hi-End อีกด้วย
อย่างไรก็ตาม DSD ความละเอียด 1-bit นั้น ก็ไม่เหมาะแก่การประมวลผลสัญญาณเสียง เพราะมีความละเอียดไม่พอในการประมวลผล รวมทั้งเครื่องมือในการประมวลผลส่วนมากออกแบบมาเพื่อใช้กับ LPCM จึงได้มีการคิดรูปแบบสัญญาณใหม่ เพื่อนำมาใช้ในงานตัดต่อและผสมเสียงแบบดิจิทัล เช่น DSD-wide ซึ่งมีความละเอียด 8-bit, 2.8224 MHz และ Digital Extreme Definition (DXD) ซึ่งเป็นสัญญาณ PCM ความละเอียด 32-bit, 384 kHz สำหรับใช้งานใน Pyramix ซอฟต์แวร์ DAW ของ Merging
ซิงเกิ้ล DSD 11.2 MHz ของ Suara ที่ขายในรูปแบบ DSF สำหรับดาวน์โหลด
สำหรับรูปแบบของไฟล์ที่ใช้ในการจัดเก็บสัญญาณ DSD นั้น ในปัจจุบันมีทั้งหมด 3 รูปแบบด้วยกันดังต่อไปนี้
- Direct Stream Digital Interchange File Format (DSDIFF หรือ DFF) เป็นรูปแบบไฟล์ที่กำหนดโดย Phillips สำหรับใช้ในขั้นตอนของการผลิตแผ่น Super Audio CD
- DSD Stream File (DSF) เป็นรูปแบบไฟล์ที่กำหนดโดย Sony สำหรับใช้งานบน DSD Disc ซึ่งเป็นรูปแบบแผ่น DSD ที่ผู้ใช้สามารถทำได้เองบนคอมพิวเตอร์ ตัวไฟล์รองรับการใส่รายละเอียดเพลงและรูปหน้าปก ต่อมารูปแบบไฟล์ดังกล่าวก็ได้กลายเป็นรูปแบบมาตรฐานสำหรับไฟล์ DSD ที่ขายบนเว็บดาวน์โหลดเพลงต่าง ๆ
- Wideband Single-bit Data (WSD) เป็นรูปแบบไฟล์ของ 1bit Audio Consortium ซึ่งเป็นการรวมตัวกันของผู้ผลิตอุปกรณ์และเครื่องเสียงในญี่ปุ่น
นี่ก็เป็นอีกหนึ่งบทความที่ค่อนข้างยาวและซับซ้อน ซึ่งผมเองก็ได้เรียบเรียงให้อยู่ในรูปแบบที่สามารถอ่านแล้วเข้าใจได้ง่าย ก็หวังว่าเพื่อน ๆ จะได้รู้จักกับ DSD กันมากขึ้นครับ ส่วนใครที่มีคำถามเพิ่มเติม ก็สามารถเขียนคำถามไว้ตรง comment ข้างล่างหรือที่ Facebook Page ของบล็อกได้ครับ
Sources
Key Chip for Next Generation of Audio – Sony
Super Audio CD. A Technical Overview.
Pingback: พาชมเครื่องเสียงพกพา Signature Series และหูฟังรุ่นใหม่ ๆ ของ Sony ประจำปี 2016 | RE.V –>