มาทำความรู้จัก DSEE เทคโนโลยีปรับปรุงคุณภาพเสียงจาก Sony กันเถอะ ตอนที่ 3

Sony DSEE

ในตอนที่แล้ว เราได้รู้จักรายละเอียดและความเป็นมาของ DSEE ในแต่ละรุ่นกันไปแล้ว ในบทความตอนที่ 3 นี้ เราจะมาลงลึกถึงรายละเอียดหลักการทำงานที่อยู่เบื้องหลังของเทคโนโลยีปรับปรุงคุณภาพเสียงนี้กันครับ

ด้วยความที่ทาง Sony ไม่ได้เปิดเผยรายละเอียดของเทคโนโลยีแบบลงลึกมากนักเหมือนตอนสมัยที่โปรโมทวงจรขยาย S-Master ที่มีเอกสาร white paper ออกมา เราจึงอาศัยข้อมูลจากสิทธิบัตรที่เกี่ยวข้องแทน ซึ่งสิทธิบัตรแต่ละชิ้นอาจจะมีเนื้อหาของสิ่งประดิษฐ์ทั้งชิ้นหรืออาจจะเป็นเพียงส่วนหนึ่งของสิ่งประดิษฐ์ที่ใหญ่กว่าก็ได้

จากเนื้อหาภายในสิทธิบัตร เราพอที่จะแบ่งสิทธิบัตรออกมาเป็น 3 กลุ่มใหญ่ ๆ ได้แก่

  1. สิทธิบัตรที่เกี่ยวข้องกับการปรับปรุงคุณภาพเสียง
  2. สิทธิบัตรที่เกี่ยวข้องกับเทคโนโลยี DSEE
  3. สิทธิบัตรที่เกี่ยวข้องกับเทคโนโลยี DSEE HX, DSEE Extreme และ DSEE Ultimate

ด้วยความที่เนื้อหาส่วนนี้ค่อนข้างเยอะ ผมจึงเขียนสรุปข้อมูลจากสิทธิบัตรในกลุ่มข้อ 1 และ ข้อ 2 ให้อ่านกันก่อน และขอยกสิทธิบัตรในกลุ่มที่ 3 ไปเขียนเป็นบทความตอนถัดไป

สิทธิบัตรที่เกี่ยวข้องกับการปรับปรุงคุณภาพเสียง

อย่างที่เคยเกริ่นไปในบทความตอนแรกว่าการปรับปรุงคุณภาพเสียงนั้นเป็นหัวข้อที่หลายบริษัทให้ความสนใจในการค้นคว้าและพัฒนา ทั้งการปรับปรุงคุณภาพเสียงสนทนาในการสื่อสารและคุณภาพเสียงที่ถูกลดทอนไปจากการแจกจ่ายผ่านสื่อรูปแบบต่าง ๆ ซึ่ง Sony เองก็เป็นหนึ่งในบริษัทเหล่านั้นเช่นกัน

ตัวอย่างของสิทธิบัตรที่เกี่ยวข้องกับการปรับปรุงคุณภาพเสียงเพลงที่น่าสนใจของ Sony คือสิทธิบัตร H07-236193A ของคุณ Yoritate Masataka ที่ยื่นจดทะเบียนในปี 1994 และตีพิมพ์ออกมาในปี 1995 ที่ประเทศญี่ปุ่น ซึ่งจากรายละเอียดภายในสิทธิบัตร ผมคิดว่าสิทธิบัตรนี้น่าจะเป็นแนวความคิดริเริ่มการปรับปรุงคุณภาพเสียงเพลงของ Sony ก่อนที่ลงมือสร้างเทคโนโลยี DSEE ในภายหลัง

sony-jph07236193a

ผังแสดงการทำงานของอุปกรณ์สิทธิบัตรญี่ปุ่น H07-236193A

สิทธิบัตร H07-236193A เป็นสิทธิบัตรของอุปกรณ์สร้างเสียงความถี่สูงเพื่อสร้างเสียงฮาร์โมนิกที่หายไปจากการส่งสัญญาณเสียงในรูปแบบต่าง ๆ เช่น Audio CD และการถ่ายทอดวิทยุโทรทัศน์ในระบบต่าง ๆ

การทำงานของอุปกรณ์นี้คือ เมื่อมีสัญญาณเสียงที่บันทึกในแผ่นซีดีถูกอ่าน (1) และถอดรหัสจนได้สัญญาณเสียงแล้ว (2) สัญญาณเสียงจะถูก Oversampling (11) เพื่อป้องกัน Aliasing และส่งไปยังตัวประมวลผลเพื่อสร้างเสียงความถี่สูง (13) และใช้ High Pass Filter (13) กรองเอาเฉพาะเสียงย่านความถี่สูงที่ถูกสร้างมาใหม่ (มากกว่า 20 kHz ขึ้นไปสำหรับ Audio CD, มากกว่า 15 kHz สำหรับวิทยุ FM) แล้วนำไปรวม (15) กับสัญญาณต้นฉบับที่ถูกหน่วงเวลาไว้ (14) เพื่อรอการประมวลผลสร้างเสียงความถี่สูง ก่อนที่จะนำสัญญาณที่รวมกับเรียบร้อยแล้วไปยัง DAC (3) ออกไปยังวงจรขยายและลำโพงต่อไป

จากสิทธิบัตรนี้ ทำให้เราได้ทราบเบื้องต้นว่าการปรับปรุงคุณภาพเสียงนี้ไม่สามารถทำได้ในเวลาจริง เพราะต้องมีการหน่วงสัญญาณต้นฉบับเพื่อรอการสังเคราะห์เสียงย่านความถี่สูงที่หายไปขึ้นมาก่อน แต่ในสิทธิบัตรไม่ได้ระบุว่าเวลาที่หน่วงนั้น ต้องหน่วงไว้นานเท่าไร ซึ่งในสิทธิบัตรที่ถูกจดภายหลังก็ใช้เทคนิคเดียวกันนี้ด้วย

สิทธิบัตรที่เกี่ยวข้องกับเทคโนโลยี DSEE

ทาง Sony ได้เริ่มจดสิทธิบัตรตัวหนึ่งที่เกี่ยวข้องกับการขยายสัญญาณเสียงย่านความถี่สูงกับสำนักงานทรัพย์สินทางปัญญาในประเทศต่าง ๆ ในช่วงปี 2006 – 2007 ซึ่งสิทธิบัตรเหล่านี้มีเนื้อหาของสิ่งที่ประดิษฐ์ใกล้เคียงกันมาก และเมื่อดูจากเนื้อหาต่าง ๆ แล้ว ผมคิดว่าสิทธิบัตรเหล่านี้น่าจะเกี่ยวข้องกับเทคโนโลยี DSEE ที่เราตามหาอยู่

สิทธิบัตรที่ว่ามานั้นคือสิทธิบัตรเลขที่ JP2008139844A (US8295507B2) ซึ่งเป็นสิทธิบัตรของอุปกรณ์เครื่องเล่นสัญญาณขาเข้าหลังจากที่ได้ขยายย่านความถี่ของสัญญาณขาเข้าแล้ว เพื่อแก้ไขปัญหาเสียงย่านความถี่สูงซึ่งหายไปจากการเข้ารหัสเสียงด้วยบิตเรทที่ต่ำ จนทำให้เสียงขาดความสมจริงและฟังดูทื่อ โดยอาศัยหลักการขยายย่านความถี่ของการเข้ารหัส HE-AAC ซึ่งก็คือเทคนิค SBC ที่เขียนไปในบทความตอนแรก และต่อยอดจากอุปกรณ์ประมาณค่า (Interpolation) ในช่วงความถี่ซึ่งเป็นสิทธิบัตรของบริษัท KENWOOD

sony-us8295507b2

ผังแสดงการทำงานของอุปกรณ์สิทธิบัตร US8295507B2

การทำงานของอุปกรณ์นี้เริ่มต้นจาก Band Dividing Section (12) จะนำสัญญาณที่เข้ามาแบ่งเป็นกลุ่มสัญญาณย่อย (Sub-band) จากนั้นก็จะส่งสัญญาณ Sub-band ที่อยู่ในช่วงความถี่ต่ำกว่าจุดเริ่มต้นขยายย่านความถี่ที่ถูกกำหนดโดย Extension Control Section (11) ไปยัง Time Classifying Section (13), High Frequency Band Generating Section (16) และ Band Combining Section (18)

sony-us8295507b2-lf-pw-spt-

ตัวอย่างกราฟแสดง Power Spectrum ของสัญญาณขาเข้าและเส้นขอบของย่านความถี่สูงที่ถูกประมาณขึ้นมา

Time Classifying Section จะตรวจจับทรานเซียนท์ (Transient) ของสัญญาณ Sub-band ที่รับมาเพื่อคำนวณค่ากำลังเฉลี่ยของกลุ่มสัญญาณ Sub-band แต่ละกลุ่มให้กับ Envelope Estimation Section (14) เพื่อไปประมาณค่าเส้นขอบของสัญญาณ Sub-band ในช่วงความถี่ที่เท่ากับหรือสูงกว่าจุดเริ่มขยายย่านความถี่ ก่อนที่จะส่งค่าเส้นขอบให้ Band Interpolation Section (15) คำนวณค่ากำลังขยาย (Gain) เพื่อปรับให้สัญญาณ Sub-band ย่านความถี่ต่ำสามารถเชื่อมกับสัญญาณ Sub-band ย่านความถี่สูงได้อย่างเรียบเนียนที่สุด

จากนั้น High Frequency Band Generating Section จะทำการสร้างสัญญาณ Sub-band ย่านความถี่สูงจากสัญญาณ Sub-band ย่านความถี่ต่ำด้วยข้อมูล Gain ที่ได้มาจาก Band Interpolation Section แล้วส่งให้ Phase Adjusting Section (17) ทำการปรับเฟสของสัญญาณที่สร้างขึ้นมา ก่อนที่จะนำไปรวมกับสัญญาณ Sub-band ย่านความถี่ต่ำที่ Band Combining Section จนได้สัญญาณเสียงที่ถูกขยายช่วงย่านความถี่สูงเสร็จเรียบร้อย

sony-us8295507b2-side-information

ตารางตัวอย่างการกำหนดจุดเริ่มต้นขยายย่านความถี่จากข้อมูลของสัญญาณขาเข้า

จุดที่น่าสนใจของสิทธิบัตรนี้ นอกจากการปรับปรุงเทคนิคการขยายความถี่ที่ดีและมีประสิทธิภาพเหนือกว่าเทคนิคที่จดสิทธิบัตรไปก่อนหน้าแล้ว ยังแก้ปัญหาการเลือกจุดเริ่มต้นที่จะให้อุปกรณ์ทำการขยายย่านความถี่ที่เหมาะสม โดยการเพิ่ม Extension Control Section ซึ่งจะรับข้อมูลประกอบอื่น ๆ ของสัญญาณค่าเข้าเช่น ระบบที่ใช้เข้ารหัส, อัตราสุ่มสัญญาณ, บิตเรท, รูปแบบระบบเสียงสเตอริโอ เพื่อใช้ในการกำหนดย่านความถี่จะเป็นจุดเริ่มต้นการขยายย่านความถี่ที่เหมาะสม เพื่อให้ Band Dividing Section แบ่งสัญญาณที่เข้ามาเป็น Sub-band ฝั่งย่านความถี่ต่ำได้

ตอนหน้า เราจะมาดูรายละเอียดของสิทธิบัตรที่เกี่ยวข้องกับเทคโนโลยี DSEE HX, DSEE Extreme และ DSEE Ultimate กันต่อครับ

Source

Leave a Reply