มาทำความรู้จัก DSEE เทคโนโลยีปรับปรุงคุณภาพเสียงจาก Sony กันเถอะ ตอนที่ 4

sony-dsee-hx-logo

สวัสดีปีใหม่ครับ จากบทความ DSEE ตอนที่ 3 เราได้ทราบรายละเอียดการทำงานของเทคโนโลยีนี้จากสิทธิบัตรที่น่าจะเกี่ยวข้องกันไปแล้ว ในบทความตอนนี้เราจะมาดูรายละเอียดการทำงานของ DSEE รุ่นใหม่อย่าง DSEE HX, DSEE Extreme และ DSEE Ultimate กันครับ

สิทธิบัตรที่เกี่ยวข้องกับเทคโนโลยี DSEE HX

ในช่วงปี 2009 ทาง Sony ได้เริ่มยื่นคำขอสิทธิบัตรต่าง ๆ ที่เกี่ยวข้องกับเทคโนโลยีขยายย่านความถี่สูง ทั้งส่วนตัวอุปกรณ์ขยายย่านความถี่เองที่ตีพิมพ์ออกมาเป็นสิทธิบัตรเลขที่ US9691410B2 และส่วนประกอบของอุปกรณ์ เช่น ตัวเข้ารหัสและตัวถอดรหัส นอกจากนี้ยังมีสิทธิบัตรวิธีการที่ใช้ในการคำนวณและกำหนดข้อมูลที่จะใช้ในการขยายเสียงย่านความถี่สูงขึ้นมาด้วย

sony-us9691410b2-attack-type-pw-spt

ตัวอย่างกราฟแสดง Power Spectrum ของสัญญาณเสียงที่มีช่วง Attack ที่เปลี่ยนแปลงอย่างรวดเร็ว

เบื้องต้นแล้วสิทธิบัตรในกลุ่มนี้ได้ชี้ถึงปัญหาของวิธีการขยายย่านความถี่ของสิทธิบัตร JP2008139844A ที่ในขั้นตอนประมาณเส้นขอบ (Envelope) ของเสียงย่านความถี่สูงนั้นยังไม่สะท้อนถึงลักษณะสัญญาณในย่านความถี่สูงได้อย่างถูกต้อง โดยเฉพาะกรณีที่เจอเสียงช่วงเริ่มต้น (Attack) ที่มีลักษณะเปลี่ยนแปลงอย่างรวดเร็ว เช่น เสียงตีกลอง ซึ่งสเปกตรัมย่านความถี่สูงมักจะมีลักษณะเป็นแนวราบ แต่เส้นขอบที่ประมาณออกมานั้นมีความชันที่ลดลงตามกราฟตัวอย่างด้านบน ทำให้ความแตกต่างของ Power Spectrum นั้นเพิ่มขึ้นตามความถี่ที่มากขึ้น

sony-us9691410b2

ผังแสดงการทำงานของอุปกรณ์สิทธิบัตร US9691410B2

การทำงานของอุปกรณ์ขยายย่านความถี่ที่ปรับปรุงใหม่นี้ เริ่มต้นจากการนำสัญญาณเสียงมาแบ่งเป็นสัญญาณ Sub-Band ย่อย ๆ หลายสัญญาณด้วย Bandpass Filter (13) เข้ามาคำนวณหาปริมาณจุดเด่นของสัญญาณด้วย Feature Amount Calculating Circuit (14) แล้วนำค่าปริมาณลักษณะเด่นที่คำนวณได้ไปประมาณค่าพลังของสัญญาณ Sub-Band ความถี่สูงด้วย High Frequency Sub-Band Power Estimating Circuit (15)

จากนั้นวงจร High Frequency Signal Generating Circuit จะใช้สัญญาณ Sub-Band ที่มาจาก Bandpass Filter และค่าพลังของ Sub-Band ความถี่สูงที่คำนวณได้มาสร้างสัญญาณเสียงย่านความถี่สูงขึ้นมา ซึ่งสัญญาณเสียงย่านความถี่สูงนี้จะถูกนำไปผ่าน High-Pass Filter เพื่อไปรวมกับสัญญาณเสียงย่านความถี่ต่ำที่ผ่านมาจาก Low-Pass Filter (11) และถูกหน่วงสัญญาณไว้ด้วย Delay Circuit (12) จนได้สัญญาณเสียงที่ถูกขยายย่านความถี่สูงเสร็จเรียบร้อย

จุดที่น่าสนใจของสิทธิบัตรนี้คือการใส่วงจร Feature Amount Calculating Circuit และวงจร High Frequency Sub-Band Power Estimating Circuit เพิ่มเติมจากวงจรในสิทธิบัตรก่อนหน้า โดยวงจรทั้งสองจะทำหน้าที่ในการประมาณค่าพลังของ Sub-Band ความถี่สูงด้วยการดูจากคุณลักษณะอื่น ๆ ของสัญญาณเสียงแทนที่จะสนใจเพียงค่ากำลังของ Sub-Band ในย่านความถี่ต่ำแต่เพียงอย่างเดียว

sony-us9691410b2-dip

กราฟอธิบายการหาค่า Dip ที่อยูในช่วง 4.9 kHz – 11.025 kHz สัญญาณเสียงร้อง

ตัวอย่างที่ยกขึ้นมาในสิทธิบัตร เช่น การคำนวณลักษณะความต่างของกำลังต่ำสุดและสูงสุด (Dip) ของสัญญาณของเสียงร้องที่มักจะปรากฏในย่านความถี่ 4.9 kHz – 11.025 ที่ทางทีมพัฒนาได้สร้างสมการเพื่อใช้แสดงคุณลักษณะนี้แทนการเพิ่มความละเอียดในการแบ่งสัญญาณ Sub-Band ให้มากขึ้นกว่า 16 เท่า ช่วยให้วงจรสามารถสร้างสัญญาณ Sub-Band ย่านความถี่สูงของเสียงร้องได้อย่างแม่นยำโดยไม่ต้องใช้พลังประมวลผลมาก และการคำนวณสัญญาณเสียงที่ช่วง Attack มีการเปลี่ยนแปลงอย่างรวดเร็วด้วยการแปรผันทางเวลาของค่ากำลังของ Sub-Band ความถี่ต่ำแทน เพื่อไม่ให้ค่ากำลังที่ประมาณได้มีลักษณะออกมาราบเรียบตามที่แสดงในกราฟรูปแรกของหน้านี้

sony-us9691410b2-coeff

ผังแสดงการทำงานของอุปกรณ์ Coefficient Learning Device จากสิทธิบัตร US9691410B2

นอกจากการใช้ค่าลักษณะเด่นที่คำนวณจากวงจร Feature Amount Calculating Circuit แล้ว ตัววงจร High Frequency Sub-Band Power Estimating Circuit ยังสามารถใช้ข้อมูลสัมประสิทธิ์ (Coefficient) ที่ได้มาจากการนำสัญญาณเสียงไปผ่านอุปกรณ์ Coefficient Learning Device แล้วคำนวณค่าสัมประสิทธิ์จากลักษณะเด่นของสัญญาณนั้นล่วงหน้า มาใช้ในการประมาณค่ากำลังของ Sub-Band ความถี่สูงที่จะสร้างออกมา ซึ่งสามารถนำไปประยุกต์ใช้ในการสร้างข้อมูลอ้างอิงในการสร้างเสียงย่านความถี่สูงเหมือนกับ SBC ที่ใช้งานในการเข้าและถอดรหัส HE-AAC ได้ด้วย

sony-us10381019b2

ผังแสดงการทำงานของอุปกรณ์สิทธิบัตร US10381019B2

อุปกรณ์ขยายย่านความถี่นี้ได้ถูกปรับปรุงอีกครั้งในปี 2012 ในอุปกรณ์สิทธิบัตร US10381019B2 โดยอ้างถึงปัญหาที่เกิดขึ้นของอุปกรณ์สิทธิบัตร JP2008139844A อย่างการประมวลผลเพื่อหาจุดเริ่มต้นขยายย่านความถี่ด้วยข้อมูลอื่น ๆ จากสัญญาณที่เข้ามา ที่เพิ่มความซับซ้อนในการประมวลผลโดยใช้เหตุ และการที่อุปกรณ์ในสิทธิบัตรดังกล่าวไม่สนใจสัญญาณเสียงย่านความถี่สูงที่อยู่ถัดจากจุดเริ่มต้นขยายย่านความถี่เลย ทำให้ข้อมูลกำลังของย่านความถี่สูงดังกล่าวหายไป ซึ่งอาจส่งผลต่อคุณภาพเสียงได้

sony-us10381019b2-sb-pow

กราฟอธิบายการเปรียบเทียบกำลังของ Sub-Band ความถี่สูงจากสัญญาณขาเข้ากับกำลังของ Sub-Band ความถี่สูงที่ถูกประมาณขึ้นมา

วงจรการทำงานของอุปกรณ์สิทธิบัตร US10381019B2 นั้นเหมือนกับอุปกรณ์สิทธิบัตร US9691410B2 ด้านบน แต่มีการเพิ่มเติมวงจร High Frequency Sub-Band Power Comparing Circuit ลงไปเพื่อทำหน้าที่เปรียบเทียบกำลังของ Sub-Band ความถี่สูงที่เข้ามา (CP) กับกำลังของ Sub-Band ความถี่สูงที่ถูกประมาณขึ้นมา (EP) หากค่ากำลังของ CP มีมากกว่า ก็จะใช้ค่ากำลังของ CP ในการสร้างสัญญาณเสียงย่านความถี่สูงแทนค่ากำลังที่ถูกประมาณขึ้นมา

อย่างไรก็ตามอุปกรณ์ตามสิทธิบัตรที่ว่ามาข้างต้นนั้นถูกออกแบบให้ทำงานกับสัญญาณเสียงที่มีอัตราสุ่มสัญญาณก่อนและหลังประมวลผลที่เท่ากัน จึงยังไม่สามารถที่จะปรับปรุงและยกระดับคุณภาพเสียงให้เทียบเท่าเสียงความละเอียดสูงตามมาตรฐาน Hi-Res Audio ได้

ในตอนหน้า เราจะไปดูสิทธิบัตรของอุปกรณ์ขยายย่านความถี่ที่สามารถปรับปรุงและยกระดับคุณภาพเสียงให้เทียบเท่ากับเสียงความละเอียดสูงตามมาตรฐาน Hi-Res Audio กันครับ

Source

One thought on “มาทำความรู้จัก DSEE เทคโนโลยีปรับปรุงคุณภาพเสียงจาก Sony กันเถอะ ตอนที่ 4

  1. Anonymous

    ซับซ้อนจริงๆครับ แต่จากที่ฟังใน WF-1000XM4 ผมแยกไม่ออกแฮะ

    Reply

Leave a Reply to AnonymousCancel reply