มาทำความรู้จัก รูปแบบสัญญาณเสียง Digital แบบ PCM กันเถอะ (ฉบับปรับปรุง)

british-post-office-technology-commemorative-pcm

ภาพสแตมป์ลาย PCM ในชุด British Post Office Technology ปี 1969

ตอนนี้กระแสของ High Resolution Audio หรือเสียงความละเอียดสูงจัดว่ามาแรงมาก ศัพท์คำนึงที่เรามักจะเห็นประจำก็คือ PCM (Pulse-code modulation) และหน่วยจำนวนนับอย่าง bit หรือ kHz ตามสเปกของฮาร์ดแวร์และไฟล์เพลงต่าง ๆ

วันนี้ RE.V-> เลยจะมาเล่าถึงประวัติและอธิบายรูปแบบสัญญาณเสียงแบบ PCM ให้รู้จักกันมากขึ้นครับ

หมายเหตุ เนื่องจากบทความเวอร์ชันแรกที่โพสไปเมื่อวันที่ 19 ตุลาคม 2014 นั้นยังอ่านแล้วเข้าใจยากอยู่ RE.V-> เลยตัดสินใจเขียนปรับปรุงเพิ่มเติมอีกครั้งในวันที่ 22 กรกฎาคม 2016 ครับ

alec-reeves

ที่มา: www.quantium.plus.com/ahr/

PCM ถูกคิดค้นขึ้นในปี 1937 โดย Alec Reeves นักวิทยาศาสตร์ชาวอังกฤษ แต่กว่าเทคโนโลยีจะถูกนำไปใช้งานจริง ก็ปาเข้าไป 28 ปีให้หลัง เมื่อ PCM ถูกนำไปใช้เข้าสัญญาณภาพของยานอวกาศ Mariner IV จากดาวอังคารมายังโลก และก็ใช้เวลาอีกหลายปีถึงจะสามารถดึงเอาความสามารถของเทคโนโลยีออกมาได้อย่างเต็มที่ ซึ่ง Alec ก็ไม่มีโอกาสได้เห็นความสำเร็จนั้น เพราะเขาได้เสียชีวิตไปก่อนในปี 1971

pcm

ผังอธิบายการเข้ารหัส PCM ทั้ง 3 ขั้นตอน ที่มา: Wikipedia

สำหรับการแปลงสัญญาณแอนะล็อกเป็นดิจิทัลแบบ PCM จะประกอบไปด้วย 3 ขั้นตอน คือ การสุ่มตัวอย่าง (Sampling) การแบ่งนับ (Quantization) และการเข้ารหัส (Coding) ซึ่งเราจะมาดูกันว่าแต่ละขั้นตอนเป็นอย่างไรบ้าง

Sampling

sampling

กราฟสีเขียวคือ continuous signal ส่วนกราฟสีฟ้าคือ discrete signal ที่มา: Wikipedia

การสุ่มตัวอย่าง (Sampling) คือการแปลงสัญญาณที่มีการเปลี่ยนแปลงต่อเนื่องทางเวลา (continuous signal) ให้อยู่ในรูปไม่ต่อเนื่องทางเวลา (discrete signal) ด้วยการสุ่มเก็บตัวอย่าง (sample) ของสัญญาณนั้น ๆ ในช่วงเวลาที่เท่า ๆ กัน ซึ่งช่วงเวลาดังกล่าวก็คือค่าอัตราสุ่มสัญญาณ (sampling rate) นั้นเอง

component-frequencies-in-signal

ภาพแสดงสัญญาณในความถี่ต่าง ๆ ที่ประกอบอยู่ในสัญญาณสีแดง ที่มา: Wikipedia

ในการสุ่มสัญญาณนั้น เราจำเป็นที่จะต้องเลือกอัตราสุ่มสัญญาณที่เหมาะสมกับความถี่ของสัญญาณนั้น ๆ  เพื่อให้เวลาแปลงสัญญาณกลับก็จะได้สัญญาณต้นฉบับที่ถูกต้องและครบถ้วน ซึ่งในสัญญาณเสียงแอนะล็อกนั้น จะประกอบด้วยสัญญาณในความถี่ต่าง ๆ ประกอบกัน หากอัตราที่เลือกใช้นั้นมีความถี่ไม่สูงพอ ก็จะไม่สามารถเก็บ sample ของสัญญาณในความถี่นั้นได้

alising

ตัวอย่าง sample ที่ก่อให้เกิด aliasing ที่มา: Wikipedia

นอกจากนี้การเลือกอัตราสุ่มสัญญาณที่ไม่เหมาะสม ยังก่อให้เกิด aliasing หรือการที่ sample ที่สุ่มมานั้น สามารถแทนสัญญาณได้มากกว่าสัญญาณต้นฉบับที่ถูกสุ่มสัญญาณมา ทำให้สัญญาณที่ได้นั้นแตกต่างจากสัญญาณต้นฉบับที่ถูกสุ่มสัญญาณมา

aliased-spectrum

ที่มา: Wikipedia

จากกราฟสเปกตรัมความถี่ด้านบน เมื่อสัญญาณต้นฉบับถูกสุ่มสัญญาณ (กราฟสีน้ำเงิน) จะทำให้เกิดสัญญาณที่มีลักษณะเหมือนกัน (alias) ที่ความถี่ของอัตราสุ่มสัญญาณขึ้น (กราฟสีเขียว) ซึ่งหากอัตราสุ่มสัญญาณที่ใช้นั้นมีความถี่น้อยเกินไป สัญญาณ alias ที่เกิดขึ้นจะไปหักล้างกับสัญญาณต้นฉบับ ทำให้สัญญาณมีความผิดเพี้ยนไป

reconstruct-filter

ที่มา: Wikipedia

ด้วยเหตุนี้ ทฏษฏีการสุ่มตัวอย่าง (sampling theorem)  จึงระบุให้ใช้ความถี่ของอัตราสุ่มมากเป็น 2 เท่าของความถี่ของสัญญาณต้นฉบับ เพื่อให้สัญญาณ alias ที่เกิดขึ้นไม่ไปทับซ้อนกับสัญญาณต้นฉบับ ทำให้สามารถใช้ low-pass filter (กราฟสีม่วง) เพื่อกรองเอาเฉพาะสัญญาณต้นฉบับเก็บไว้ได้

ค่าความถี่ของการสุ่มสัญญาณดังกล่าวเรียกว่า Nyquist Frequency ซึ่งตั้งชื่อตามชื่อผู้ค้นพบคือ Harry Nyquist วิศวกรไฟฟ้าชาวอเมริกาครับ

ตัวอย่างอัตราสุ่มสัญญาณที่นิยมใช้งาน เช่น

  • 8,000 Hz ใช้ในงานสื่อสารทางโทรศัพท์และวิทยุ ครอบคลุมช่วงความถี่ของเสียงพูดปกติ (4,000 Hz)
  • 44,100 Hz ใช้ในมาตรฐาน Audio CD ครอบคลุมช่วงความถี่เสียงที่มนุษย์ได้ยิน คือประมาณไม่เกิน 20,000 Hz ค่านี้ถูกเลือกใช้โดย Sony ผู้ร่วมประดิษฐ์ Audio CD เพราะสามารถใช้บันทึกเสียงลงในม้วนเทปวิดีโอด้วยอุปกรณ์อัดวิดีโอทั้งมาตรฐาน NTSC และ PAL ได้
  • 48,000 Hz ใช้งานในกล้องวิดีโอและอุปกรณ์ระดับมืออาชีพ เพราะสามารถครอบคลุมความถี่ได้ถึง 22,000 Hz และใช้งานร่วมกับมาตรฐานเฟรมเรตวิดีโอต่าง ๆ ได้ดี
  • 88,200 Hz สำหรับใช้งานกับอุปกรณ์ระดับมืออาชีพ ในอดีตนิยมใช้ เพราะมีความซับซ้อนในการลดอัตราสุ่มสัญญาณลงเหลือ 44,100 Hz เพื่อทำ Audio CD น้อยกว่า
  • 96,000 Hz และ 192,000 Hz ใช้ในมาตรฐาน DVD-Audio เสียงในแผ่น DVD และ Blu-ray และอุปกรณ์ระดับมืออาชีพ
  • 176,400 Hz ใช้ในมาตรฐาน HDCD และอุปกรณ์ระดับมืออาชีพสำหรับทำ Audio CD
  • 352,800 Hz ใช้ในมาตรฐาน Digital eXtreme Definition (DXD) สำหรับบันทึก ตัดต่อและผสมเสียงเพื่อทำแผ่น Super Audio CD

ถึงแม้ว่าการใช้งานอัตราสุมสัญญาณสูง ๆ จะทำให้ต้องใช้กำลังในการประมวลผลสัญญาณ หน่วยความจำ และพื้นที่จัดเก็บมากขึ้น แต่ก็แลกกับการออกแบบ filter เพื่อกรองเอาช่วงความถี่เสียงที่ต้องการเก็บไว้นั้น สามารถทำได้ง่ายกว่า ซึ่งสาเหตุที่ทำได้ง่ายเพราะว่า การสร้าง filter เพื่อกรองช่วงความถี่ที่แคบมาก ๆ จะทำได้ยากกว่าช่วงความถี่ที่กว้างกว่า

ต่อไป เราจะไปดูขั้นตอนที่เหลือในการเข้ารหัสแบบ PCM กันครับ

7 thoughts on “มาทำความรู้จัก รูปแบบสัญญาณเสียง Digital แบบ PCM กันเถอะ (ฉบับปรับปรุง)

  1. Pingback: สัมภาษณ์คุณ Nageno Koji วิศวกรผู้อยู่เบื้องหลังหูฟังของ Sony

  2. Pingback: มารู้จัก มาตรฐาน High Resolution Audio กันเถอะ

  3. Pingback: มาทำความรู้จัก รูปแบบสัญญาณเสียง Direct Stream Digital (DSD) กันเถอะ | RE.V –>

  4. Pingback: พาชมเครื่องเสียงพกพา Signature Series และหูฟังรุ่นใหม่ ๆ ของ Sony ประจำปี 2016 | RE.V –>

  5. Pingback: ลองฟังเครื่องเล่นเพลง DMP-Z1 และหูฟัง IER-Z1R สมาชิกใหม่ Sony Signature Series | RE.V –>

  6. neramit chalermwattananon

    ขอบคุณมากๆเลยครับ กำลังศึกษาแต่อ่านของภาษาอังกฤษแล้วงงมากครับ ต้องขอบคุณมากๆจากใจอีกครั้งครับ

    Reply

Leave a Reply